Российский алгоритм USPEX 25 уже называют революцией в науке. Благодаря ему исследования, для которых раньше требовался суперкомпьютер, теперь могут проводиться на обычном ноутбуке. Ожидается, что это даст возможность заниматься наукой даже школьникам из бедных стран, да и вообще всем, кто раньше не имел доступа к высоким технологиям. Но к такому результату пришли далеко не сразу — разработки алгоритма велись более 20 лет. Через какие тернии пришлось пройти ученым, как весь научный мир выучил русское слово «успех» и как искусственный интеллект меняет науку?

Невыполнимая задача

Молекулярное моделирование — важная и сложная задача для ученых. Ее необходимый первый этап — понять, как атомы будут располагаться относительно друг друга в том или ином соединении. Проблема в том, что число возможных структур бесконечно и все их невозможно перебрать даже на самом мощном компьютере.

Еще 25 лет назад предсказать кристаллическую структуру казалось невозможным, хотя эта задача считается ключевой в теоретической кристаллографии. Попытки ее решить в 1990-е гг. были провальными. Однако в начале 2000-х гг. в научном мире произошли события, давшие мощный стимул для дальнейших исследований. В 2002 г. итальянский физик Микеле Парринелло описал метод, который позволял «путешествовать» по энергетической поверхности молекулярных систем. В первую очередь это было необходимо для изучения химических реакций, изменения структур молекул, например, в процессе фолдинга белков, то есть когда линейная цепочка аминокислот сворачивается в трехмерную структуру.

«Уже через год, в 2003 г. Микеле Парринелло опубликовал адаптацию этого метода для предсказания кристаллических структур. И вот это уже было интересно: получалось, что прогноз кристаллической структуры хотя бы иногда возможен. Метод оказался чрезвычайно ресурсоемким, требующим суперкомпьютеров и большого терпения. Чуть позже выяснилось, что он далеко не всегда предсказывает структуры успешно. Но по крайней мере в некоторых случаях это удается, и это уже был большой прорыв», — рассказал «Научной России» главный разработчик программы USPEX, профессор РАН, доктор физико-математических наук Артем Ромаевич Оганов.

Артем Ромаевич Оганов

Артем Ромаевич Оганов

Фото: Николай Мохначев / «Научная Россия» архив

Ключ в недрах Земли

В тот же период произошло еще одно открытие. Шигеаки Оно, японский геофизик, специалист по минералогии высоких давлений, обнаружил, что оксид железа (Fe₂O₃) при высоком давлении переходит из структуры типа корунда, которая присуща этому веществу при нормальных условиях, в структуру типа перовскита. То есть два атома железа начинают играть в этом веществе разные структурные роли. А затем при еще более высоком давлении из структуры типа перовскита он переходит в новую структуру, которую Оно смог определить. Поскольку японского ученого интересовали минералы на больших глубинах, он задался вопросом: если силикат магния (MgSiO3), из которого состоит около 40% объема нашей планеты, тоже обладает структурой типа перовскита, может ли он под давлением также переходить в новую, постперовскитную модификацию?

«Я провел квантово-механические расчеты и, к своему изумлению, обнаружил, что такой переход действительно должен происходить при давлениях самой нижней мантии Земли. Причем геофизики уже несколько десятилетий отмечали многочисленные аномалии, происходящие именно в этой области мантии. И они долгие годы не могли объяснить эти аномалии, а нам удалось это сделать путем открытия свойств этой новой фазы. Возникла мысль: если обнаружение всего лишь одной новой структуры силиката магния дало такой эффект, что же будет, если мы получим метод, который сможет автоматически предсказывать новые кристаллические структуры? Получается, мы будем совершать по одному великому открытию в неделю?», — продолжил рассказ А.Р. Оганов.

Вскоре после этого началась совместная работа с Микеле Парринелло, в результате которой удалось получить с помощью его метода метадинамики интересные результаты для силиката магния. Этот метод предполагает моделирование переходов между различными состояниями. По словам А.Р. Оганова, «расчеты были неповоротливыми — приходилось ждать чуть ли не месяц, чтобы получить всего три-четыре структуры». Метадинамика, успешно примененная к постперовскитным структурам, оказалась слишком ресурсоемкой и неэффективной для других систем, что заставило исследователя задуматься о поиске своего собственного метода, и создание эволюционного алгоритма стало самым перспективным направлением.

Начало успеха

Эволюционный метод моделирует процессы, описанные в теории Чарлза Дарвина, но на компьютере. Подобно популяции живых организмов, популяция кристаллических структур подвергается естественному отбору, наследует признаки и претерпевает мутации. Цель — поиск структуры с наименьшей энергией. Звучит просто, но на деле, само собой, все гораздо сложнее. Это была совместная работа А.Р. Оганова и студента-программиста Колина Гласса из Швейцарской Высшей технической школы Цюриха (ETH), поначалу около года не дававшая результатов.

«Десятки попыток создать эволюционный метод были безуспешными. Задача, которую мы тогда решали как тестовую, — предсказание структуры алмаза. В принципе, это очень простая структура, но поначалу программа не могла предсказать даже ее. Мы бились над этой задачей около года и уже думали закрывать проект, когда решили все-таки испытать еще одну идею — совместить глобальную оптимизацию с локальной. На следующий день включаем компьютер, заходим в суперкомпьютер, загружаем результаты, визуализируем и… видим структуру алмаза. Это был восторг: на основании простой химической формулы мы смогли предсказать целую структуру! У меня руки сами собой вознеслись к потолку, и я по-русски крикнул: “Успех!”. И понял, что это должно стать названием программы. Это стало аббревиатурой, к которой я довольно быстро придумал английскую расшифровку: Universal Structure Predictor Evolutionary Xtallography. Так в мае 2005 г. родилась первая версия нашего метода успеха», — поделился А.Р. Оганов.

Совмещение глобальной и локальной оптимизации происходит так: каждая новая структура не просто оценивается по энергии, согласно принципу естественного отбора, но перед этим еще и «релаксирует»: атомы продолжают двигаться, пока не обнулятся действующие на них силы. Таким образом структура загоняется в локальную ложбинку. Локальная оптимизация требует больших вычислительных мощностей, поэтому на нее долго не решались. Но именно это в итоге позволило создать первую работающую версию алгоритма USPEX.

Суперкомпьютер

Суперкомпьютер

Фото: Ольга Мерзлякова / «Научная Россия» архив

Годы совершенствований

Конечно, версия 2005 г. была совсем не похожа на современный алгоритм. Но в ней были заложены прорывные для того времени идеи, позволившие понять, в каком направлении двигаться дальше. Больше не нужно было кодировать нулями и единицами — их заменили реальные физические переменные, которые обозначали координаты кристаллической решетки. Работу программы обеспечивали эволюционные вариационные операторы — механизмы, имитирующие процесс эволюции, например, операторы наследственности и мутации. Наконец, разработчикам удалось создать свой оригинальный механизм отбора.

В дальнейшем все эти механизмы дорабатывались и улучшались, вводились и новые идеи — например, фингерпринтинг, который сразу обнаруживал и отсеивал дубликаты структур. Через несколько лет после выхода первой версии метод удалось распространить на системы с переменным составом: теперь, зная лишь элементы, программа находила все их стабильные соединения, даже без точной химической формулы.

Дальше еще амбициознее. Если исследователю были неизвестны даже элементы, из которых образовывается нужное соединение, он мог воспользоваться «менделеевским поиском», то есть программа начинала перебирать комбинации всех элементов таблицы Менделеева в поиске материалов с наилучшими свойствами. Впоследствии появились специальные расширения для поверхностей кристаллов, полимеров, наночастиц и белков.

Новая эра машинного обучения

Хотя эти разработки, безусловно, важны для науки, до поры до времени исследования с программой USPEX были дорогими и доступными только крупным лабораториям, оснащенным суперкомпьютерами. Следующая революция ждала своего часа. И этот час наступил чуть больше года назад, когда позволили нейросети. Раньше моделирование нельзя было представить без квантово-механических расчетов — для этого нужен был суперкомпьютер, оснащенный системой Linux. Дело в том, что операционная система Windows, которая обычно используется на персональных компьютерах, не подходит для таких расчетов, да и мощность самих персональных компьютеров для этого слишком мала. Но с развитием нейросетей стало возможным использовать вместо квантово-механических расчетов машинное обучение, что полностью меняет правила игры. Разработкой новой программы занялся Сергей Владимирович Лепешкин, старший научный сотрудник лаборатории А.Р. Оганова.

«Мы совместили наш эволюционный алгоритм глобальной оптимизации с моделью машинного обучения, которая вместо квантовой механики делает локальную оптимизацию структур и оценивает их энергию. А ведь это было самым ресурсоемким элементом наших расчетов. Избавившись от квантовой механики, мы ускорили расчеты примерно в 200 раз. И теперь то, что раньше делалось неделю на мощном вычислительном кластере, мы можем осуществить за день на обычном персональном компьютере», — отметил А.Р. Оганов.

Поначалу казалось, что расчеты с помощью моделей машинного обучения будут слишком неточными, чтобы быть полезными. Но тесты, по словам А.Р. Оганова, превзошли все ожидания — программа оказалась не только эффективной, но и простой в использовании. Для этого ее адаптировали под Windows и научили автоматически определять ресурсы компьютера, чтобы максимально грамотно их использовать.

В итоге мир получил программу, для которой порог входа — практически нулевой. Сейчас USPEX 25 используют даже те, кто раньше никогда не занимался теоретическими расчетами, программу успешно осваивают и школьники, и студенты.

Переход на новую архитектуру

Конечно, нынешняя версия программы — это еще не конец истории. Уже сейчас разрабатывается версия, которая должна выйти в 2026 г. Детали пока не раскрываются, но, как рассказал А.Р. Оганов, новостей будет много: переход на новую архитектуру, осуществленный в USPEX 25, делает дальнейшую разработку очень удобной.

«USPEX 25 представляет собой переписанную в Python версию программы USPEX, и мы используем в ней более продвинутую и гибкую архитектуру. Прошлая версия программы USPEX 10.5 со временем превратилась в большого и неповоротливого монстра, которого сложно развивать. Поэтому мы переориентировали наши усилия на маленькие девелоперские версии, которые пока не выпускаем в мир. Сейчас мы активно работаем над разработкой USPEX 26.1 — в 2026 г., видимо, будет несколько релизов. Мы перенесем туда как старый функционал, так и то, что было в девелоперских версиях. Развитие программы USPEX будет полностью ориентировано на эту новую архитектуру», — подчеркнул А.Р. Оганов.

 

Не USPEXом единым

Не только USPEX демонстрирует потенциал искусственного интеллекта в химии и моделировании. Одновременно с разработкой новой версии алгоритма, внедрением ИИ в процесс моделирования занимается также Группа теоретической химии Института органической химии (ИОХ) им. Н.Д. Зелинского РАН, в которую входят как опытные исследователи, так и студенты и даже школьники. И у них тоже есть результаты: летом 2025 г. молодые ученые представили механизм поиска потерянных конформаций (так называется уникальное геометрическое расположение атомов в молекуле), где ИИ выступает в роли «умного помощника» для ученого и указывает, какие конформации были пропущены при стандартном конформационном поиске.

«Философия USPEXа тесно перекликается с тем, что мы делаем. Он нужен для глобального поиска структуры кристаллов, а мы занимаемся глобальным поиском структур молекул в растворе — это необходимо для тонкой химии и катализа. Как USPEX, так и наш алгоритм решает две задачи. Прямая задача — предсказать свойства заданной структуры, а обратная — найти такую структуру, которая обладает целевым свойством, в нашем случае — минимальной энергией. В этом смысле USPEX 25 комбинирует в себе два искусственных интеллекта: потенциал машинного обучения для решения прямой задачи и генетический алгоритм для решения обратной», — рассказал корреспонденту «Научной России» руководитель группы, старший научный сотрудник ИОХ РАН, лауреат премии Сбера в номинации «AI в науке. Физический мир» за 2025 г. Михаил Геннадьевич Медведев.

Таким образом, два подхода не конкурируют, а дополняют друг друга: если USPEX более актуален для материаловедения и геологии, то метод химиков-теоретиков ИОХ РАН — для тонкого синтеза, катализа и разработки лекарств. Молодые ученые решили пойти по другому пути: использовать не эволюционный алгоритм, а байесовскую оптимизацию на основе гауссовских процессов. Основываясь на теории вероятности, программа анализирует собранные данные и проведенные эксперименты, чтобы найти наиболее перспективную точку с неисследованными параметрами.

«Эволюционные алгоритмы использовались и ранее для поиска молекул в растворе. Но, имитируя эволюцию, мы не вполне понимаем, на чем основываются их решения и как они вычисляют вероятность в разных точках пространства. Поэтому в нашей работе для решения обратной задачи мы выбрали гауссовы процессы, где мы явно вычисляем функцию вероятности энергии в многомерном пространстве, за счет этого можем добавить физическое информирование и более математически точно сформулировать обратную задачу — поиск глобального минимума», — отметил М.Г. Медведев.

Искусственный интеллект и человек

Сейчас об ИИ говорят с некоторой тревогой. С осторожностью к этой теме подходят и ученые-химики. Но пока можно с уверенностью сказать, что ИИ не заменит ученого, по крайней мере в обозримом будущем. Зато, вполне вероятно, он изменит структуру научной работы: останется меньше времени для работы руками и больше — для работы головой.

«Сейчас мы делаем проект химика-расчетчика на базе ИИ, в котором пытаемся создать мультиагентную систему, способную взять на себя все задачи в моделировании от и до. Каждый агент отвечает за определенную задачу: оптимизацию переходных состояний, выбор уровня теории, конформационный поиск. То есть мы уже приходим к тому, чтобы всю рутинную техническую работу делегировать компьютеру. И в этом случае человек, приходя в лабораторию, сразу попадет на более высокий научный уровень: ему надо будет немедленно принимать решения о глобальных направлениях исследований, изучать процессы и ставить задачи компьютеру. И могу сказать, что молодое поколение к этому готово: в нашей группе есть десятиклассники, которые уже способны брать на себя ответственные научные задачи», — отметил М.Г. Медведев.

Источники:

CNews. Новый метод моделирования кристаллов: выигрыш в скорости

Фото: kjpargeter / Freepikrawpixel.com / FreepikНиколай Мохначев, Ольга Мерзлякова / «Научная Россия» архив; Freepik