Математики из Санкт-Петербургского государственного университета разработали программу, которая способна распознавать текст, написанный от руки на любом языке. При помощи алгоритма уже проанализирован ряд письменных исторических памятников, сообщается на сайте СПбГУ.

В частности, удалось установить, что двухтомник «Аль-Хитат» («Описание Египта») из собрания Мичиганского университета — это не одна из многочисленных копий, как считалось ранее, а оригинал топографического описания Египта, написанный рукой историка XV века Такиюддина аль-Макризи (1344–1442 гг.).

В искусственной нейронной сети, построенной учеными, как и в живом мозге, нейроны получают входные сигналы, передают их на следующий слой, в результате чего последний ряд нейронов получает результат, который программа затем сравнивает с правильным ответом с помощью специально определенной функции ошибки. После этого она корректирует последовательность реакций и переходит к обучению на других примерах. Обучение считается законченным, когда программа находит минимум функции ошибки.

В качестве обучающего материала ученые использовали рукописи восьми разных авторов. Скользящее окно с параметрами 80 на 80 пикселей шаг за шагом исследовало средневековые манускрипты, в результате чего были получены десятки тысяч маленьких картинок с фрагментами образцов почерка, которые анализировала нейронная сеть. Пропустив информацию через все слои, сеть выдала множество результатов, некоторые из которых были ошибочными. После этого «неудачные ответы» еще раз пропустили через сеть, изменяя ее, чтобы уменьшить вероятность ошибки — это действие повторялось очень много раз.