Программы машинного чтения — это перспективный инструмент для изучения российских исторических документов. Об этом заявил член-корр РАН Алексей Сиренов на заседании президиума РАН, посвященного эпохе Петра I.
По словам, ученого, до недавнего времени в исторической науке почерк Петра I считался очень сложным для чтения, — известно, что создатель Российской Империи писал неразборчиво, это создавало серьезные трудности в изучении документов, вышедших из-под его пера.
Чтобы решить эту проблему, ПАО Сбербанк разработал специальную программу, — Digital Пётр, в основу которой легла технология искусственного интеллекта. Специалисты Санкт-Петербургского института истории РАН предоставили для анализа 681 страницу документов, созданных Петром Великим. Результат оказался впечатляющим: удалось правильно прочитать 97% текста. При этом время распознавания составляет 35 страниц в минуту, тогда как у историков на расшифровку каждой страницы столь сложного почерка уходит по несколько часов.
По мнению А. Сиренова, использование программы открывает новую эпоху в изучении русских исторических документов XVII – XIX вв. С ее помощью можно будет искать нужную информацию в массиве документов. В перспективе ее собираются научить определению подлинности того или иного документа, а также его автора. Кроме того, планируется ее адаптация к другим типам почерков.
Подробнее ознакомиться с программой можно на сайте проекта: https://www.sber.ru/digital-petr/
Фото: Ольга Мерзлякова/Научная Россия