Центр искусственного интеллекта МГУ имени М.В. Ломоносова совместно с Институтом искусственного интеллекта AIRI разработал подход для адаптации поведенческих моделей искусственного интеллекта к новым условиям среды без дополнительного обучения. Исследование, посвященное проблеме работы ИИ-систем в условиях изменяющейся динамики среды, было представлено на Международной конференции по представлению знаний ICLR 2026.

Современные поведенческие модели способны обучаться на больших массивах данных и затем решать новые задачи без дополнительной настройки. Однако такие системы плохо адаптируются к изменениям среды, например при изменении физических параметров, препятствий или других скрытых условий. Это ограничивает применение подобных моделей в робототехнике и других прикладных задачах, где условия могут меняться во время выполнения задачи.

Ученые исследовали ограничения подхода метода прямых и обратных представлений (Forward-Backward representations), который используется для построения поведенческих моделей. Результаты показали, что при обучении на данных из разных сред модель начинает объединять различные сценарии поведения, из-за чего качество адаптации снижается.

Для решения этой проблемы ученые предложили подходы, в основе которых лежит использование трансформерной модели, которая оценивает скрытые параметры среды на основе наблюдаемой траектории поведения. Это позволяет модели учитывать изменения динамики среды и подбирать более подходящую стратегию действий без дополнительного переобучения.

Авторы также предложили способ разделения пространства представлений поведения на отдельные области, соответствующие различным типам среды. Это позволило уменьшить влияние противоречивых сценариев и повысить устойчивость модели к новым условиям.

Эксперименты проводились как в дискретных, так и в непрерывных средах, включая задачи с изменяющейся конфигурацией пространства и внешними воздействиями. По результатам тестирования предложенный подход показал до двух раз лучшие результаты по сравнению с существующими методами адаптации.

«Мы исследовали, как поведенческие модели могут адаптироваться к изменениям среды без дополнительного обучения. Предложенный подход позволяет учитывать скрытые параметры среды и сохранять устойчивость модели при изменении условий среды», — отметил научный сотрудник Центра ИИ МГУ и AIRI Александр Никулин.

Авторы отмечают, что предложенный подход может использоваться в робототехнике и других системах, работающих в условиях изменяющейся среды.

 

Информация предоставлена пресс-службой МГУ 

Источник фото: munna00b - ru.123rf.com