Программы машинного чтения — это перспективный инструмент для изучения российских исторических документов. Об этом заявил член-корр РАН Алексей Сиренов на заседании президиума РАН, посвященного эпохе Петра I.

 

По словам, ученого, до недавнего времени в исторической науке почерк Петра I считался очень сложным для чтения,  — известно, что создатель Российской Империи писал неразборчиво, это создавало серьезные трудности в изучении документов, вышедших из-под его пера.

Чтобы решить эту проблему, ПАО Сбербанк разработал специальную программу,  — Digital Пётр, в основу которой легла технология искусственного интеллекта. Специалисты Санкт-Петербургского института истории РАН предоставили для анализа 681 страницу документов, созданных Петром Великим. Результат оказался впечатляющим: удалось правильно прочитать 97% текста. При этом время распознавания составляет 35 страниц в минуту, тогда как у историков на расшифровку каждой страницы столь сложного почерка уходит по несколько часов.

По мнению А. Сиренова, использование программы открывает новую эпоху в изучении русских исторических документов XVII – XIX вв. С ее помощью можно будет искать нужную информацию в массиве документов. В перспективе ее собираются научить определению подлинности того или иного документа, а также его автора. Кроме того, планируется ее адаптация к другим типам почерков.

Подробнее ознакомиться с программой можно на сайте проекта: https://www.sber.ru/digital-petr/

Фото: Ольга Мерзлякова/Научная Россия