Международная команда ученых под руководством Джули Макмарри (Julie McMurry) из Орегонского медицинского и научного университета составила свод рекомендаций для присвоения различным биологическим данным в интернете четких и уникальных идентификаторов. Соответствующая статья вышла в журнале PLOS Biology.
В последнее время биология, как и многие другие науки, все активнее использует «большие данные», загружаемые в интернет. Это позволяет проводить исследования такого размаха, подробности и глубины, которые в доинформационную эпоху были невозможны. Однако при этом постоянно встает задача присвоения частям этих «больших данных» — от отдельных измерений до целых статей — таких идентификаторов, с помощью которых эту информацию потом могли бы легко найти другие ученые, и использовать в своих исследованиях.
Обзор уже загруженных в интернет биологических данных показывает, что далеко не все ученые хорошо справляются с этой задачей достаточно хорошо, в результате система идентификаторов слишком пестра и запутана, что мешает правильному использованию данных. Эту проблему и призван решить свой рекомендаций, составленный Макмарри и ее коллегами.
«Этой публикацией мы надеемся вдохновить всех участников научной экосистемы — включая авторов [статей], сборщиков и аналитиков данных, издателей [научных журналов], разработчиков ПО и рецензентов — придерживаться единых правил для максимизации удобства и эффективности научных данных», — сказала ведущий автор статьи.