В новой библиотеке собраны изображения как современных, так и ископаемых листьев. Ресурс, доступный на Figshare Plus, будет полезен для ученых, студентов, а также для программ машинного обучения, сообщает пресс-служба Пенсильванского университета (США). Подробно разработка описана в журнале PhytoKeys.

Набор данных содержит 30252 изображения, в том числе 26176 изображений очищенных и просвеченных рентгеновским излучением листьев и 4076 снимков ископаемых листьев. Очищенные листья представляют собой образцы, которые были химически отбелены и окрашены так, чтобы проявились узоры жилок.

На создание ресурса у ученых ушло 15 лет. Сейчас данные, собранные из нескольких известных коллекций, объединены в удобный каталог, который можно скачать в один клик. В каждое имя файла встроена ключевая информация: семейство, род, вид и номер экземпляра. Имена файлов можно найти в библиотеке за считанные секунды, например, через панель поиска Windows. Все изображения имеют оригинальное разрешение, отмечают авторы работы.

Визуальная библиотека листьев является потенциальным ресурсом не только для обучения студентов, но и для программ машинного обучения. Алгоритмы могут учиться на изображениях библиотеки, что позволит им лучше идентифицировать листья и находить важные визуальные закономерности, которые люди могли упустить из виду или не смогли увидеть. Программы машинного обучения могут быть особенно полезны в работе палеоботаников, которые чаще всего находят изолированные ископаемые листья без семян, плодов или цветов, обычно помогающих идентифицировать растения.

[Фото: PENN STATE]