Источник фото: armmypicca / ru.123rf.com

Ученые исторического факультета МГУ создали новую облачную базу данных архивных материалов Hermitage 1812, объединяющую сведения о произведениях искусства, которые в 1812 году были эвакуированы из Эрмитажа. Ядро системы — это механизм, сводящий такие разрозненные записи в единую карточку произведения: алгоритм связывает их по сквозному ключу (номеру эвакуационного документа и ящика), сопоставляет варианты и выявляет дубликаты авторов, не стирая при этом расхождения, а сохраняя их как часть научного аппарата. Старые пометы на полях, измерения в аршинах и вершках, карандашные приписки вроде «продана» остаются в базе нетронутыми — оцифровка здесь не упрощает источник, а делает его доступным для поиска и анализа. Инструмент решает проблему неоднородности исторических архивных данных и уже помогает исследователям эффективно систематизировать данные о картинах и находить новые связи между источниками.

База доступна по адресу  https://3dhistory.ru/herm.

«Даже различия в регистре, пунктуации или дореформенной орфографии могли создавать ложные дубли, а каталожные номера далеко не всегда удавалось сопоставить автоматически», — рассказывает Максим Мироненко, сотрудник исторического факультета МГУ. 

В основе базы данных лежат материалы исследования сотрудницы исторического факультета МГУ Лии Окрошидзе. На протяжении трех лет в Научном архиве рукописей и документального фонда Государственного Эрмитажа ею последовательно изучались списки картин, отправленных в эвакуацию в 1812 году, где произведения обозначались исключительно номерами, без указания названий и авторов.

В ходе исследования Эрмитаж выступил в качестве уникального архива. В основу научной базы данных легли четыре ключевых архивных источника:

  • список эвакуированных работ — документ военного времени, фиксирующий судьбу коллекции в период Отечественной войны 1812 года;
  • каталог Миниха — один из ранних инвентарных документов императорского собрания;
  • каталог 1797 года Франца Лабенского — составленный по заказу Павла I систематизированный свод произведений;
  • опись 1859 года — развернутая инвентаризация середины XIX века.

Каждый из этих источников охватывает разную эпоху и обладает своим принципом описания коллекции. Сведенные в единую базу, они впервые дают возможность отследить историю конкретного произведения сквозь несколько столетий — от поступления в собрание до наших дней.

«Номера из эвакуационных списков сопоставлялись со старыми инвентарями, описями XVIII–XX веков и современными каталогами. Поиск некоторых произведений шел по инвентарным отметкам, сюжетам и гравюрам, а также по сопоставлению размеров. Это позволило восстановить состав эвакуированных из Эрмитажа произведений, их судьбу и современное местонахождение», — отмечает Лия Окрошидзе.

«База создавалась именно для того, чтобы превратить этот сложный массив сведений в понятный и доступный исследовательский инструмент», — дополняет Максим Мироненко.

Многие из произведений за почти два с половиной столетия сменили свои атрибуции. «В эвакуационных описях фигурирует “Юдифь” Рафаэля, однако в современном собрании Эрмитажа такой работы под именем этого автора нет. Обратившись к каталогу 1797 года и сверив размеры, удалось сопоставить запись с реально существующими в музее изображениями Юдифи. Поиск привел к полотну Джорджоне: произведение попросту сменило атрибуцию — то, что в конце XVIII века считалось Рафаэлем, впоследствии было признано работой другого мастера», — делится Лия Окрошидзе.

Созданный проект представляет собой веб-приложение, а данные хранятся в облачной базе данных, в которой агрегируются сотни записей из таблиц с разной структурой. Для этого была создана система импорта: она распознает нужные поля, находит повторяющиеся записи и сообщает об ошибках до загрузки, полностью исключая случайную перезапись. Отдельной задачей стала разработка гибкого интерфейса: теперь исследователь может самостоятельно настраивать порядок отображаемых данных, вводить новые абстракции и расширять структуру базы, не мешая работе всего портала.  Встроенная аналитика мгновенно строит статистику по местонахождению работ, материалам и источникам. Это превращает архив из статичного списка в рабочий инструмент атрибуции и провенанса.

«Особое внимание в ходе работы потребовалось уделить алгоритмам проверки имен авторов и мест хранения. Чтобы система не воспринимала записи вроде “Рембрандт школа” и “рембрандт (школа)” как разные значения, был разработан инструмент “double checker”. Модуль ищет похожие написания по семантическому совпадению и позволяет применять пакетные исправления после предварительного просмотра», — добавил Максим Мироненко. 

«Отдельный сюжет — поиск. Помимо привычных фильтров, в систему встроен интеллектуальный AI-помощник, который понимает вопросы на естественном языке и отвечает строго в границах базы: технология RAG (retrieval-augmented generation, “генерация с опорой на источник”) сначала находит релевантные записи в архиве и только затем формулирует ответ по ним, что исключает выдумывание фактов», – пояснил ученый. 

В итоге к архиву можно обратиться так же, как к консультанту, — и получить ответ, опирающийся на конкретные документы, а не на общие сведения.

Проект Hermitage 1812 выходит далеко за пределы профессионального сообщества: ресурс будет полезен преподавателям, студентам и всем, кто интересуется историей искусства и судьбами музейных коллекций. «Подобные проекты создаются историками прежде всего как рабочие инструменты, помогающие систематизировать материал и делиться результатами с коллегами», — отмечает Максим Мироненко. 

 

Информация предоставлена пресс-службой МГУ

Источник фото: armmypicca / ru.123rf.com