Химики МГУ с помощью искусственного интеллекта научились предсказывать спектры сложных органических молекул (ПАУ), которые встречаются как в дыме костра, так и в далеком межзвездном пространстве. Исследование демонстрирует, как методы ИИ помогают в экологических исследованиях на Земле и в разгадке химических тайн Вселенной. Результаты работы опубликованы в Journal of Chemical Information and Modeling.
Рисунок, образно представляющий результаты работы. Источник: Лабутин Т.А., Закускин А.С.
Полициклические ароматические углеводороды (ПАУ) — органические молекулы, содержащие два и более конденсированных бензольных колец, — образуются на Земле в результате природных процессов и деятельности человека при сжигании топлива, мусора и других органических веществ, а также широко распространены в космосе: от пылевых облаков до атмосфер планет. Именно этот факт породил гипотезу, что ПАУ могли участвовать в синтезе РНК в «первичном бульоне» ранней Земли, став основой для зарождения жизни. Как следствие, изучение ПАУ является одной из ключевых задач экологических исследований, при изучении процессов горения и в астрохимии.
Одним из основных методов исследования ПАУ является инфракрасная (ИК) спектроскопия. Однако интерпретация спектров – сигналов из межзвездного пространства, загрязненного воздуха или продуктов сгорания – остается крайне сложной задачей. Это связано с тем, что экспериментальные спектры известны лишь для ограниченного числа молекул ПАУ, а теоретический расчет требует огромных ресурсов.
В новом исследовании, выполненном химиками МГУ, предложен инновационный подход на основе методов машинного обучения для предсказания ИК-спектров ПАУ. Особенностью работы было особое внимание к кодированию структуры молекулы, чтобы учесть и ее заряд.
«Не до конца решенной задачей по-прежнему остается предсказание спектров гетероатомных молекул, т.е. содержащих атомы азота и кислорода, поскольку их спектры сильно отличаются от спектров “обычных” ПАУ, а точных данных для обучения моделей очень мало. Для решения этой проблемы в дальнейшем мы предполагаем использовать transfer learning. Мы надеемся, что это повысит точность предсказаний спектров гетероатомных ПАУ а, возможно, улучшит и общую эффективность модели», – отметил один из авторов статьи, аспирант кафедры лазерной химии химического факультета МГУ Бабкен Бегларян.
В данной работе впервые была решена задача предсказания спектров одновременно и заряженных, и нейтральных молекул. Такая постановка задачи позволила использовать для обучения моделей все известные к настоящему времени спектры ПАУ. Универсальность модели обеспечила высокую точность предсказаний спектров нейтральных и ионизованных молекул ПАУ.
«Полученные результаты открывают путь к более точному моделированию спектров смесей ПАУ, что критически важно для анализа состава межзвездной среды, атмосфер планет и других астрономических объектов», – резюмировал соавтор статьи, младший научный сотрудник кафедры лазерной химии химического факультета МГУ Александр Закускин.
Информация и фото предоставлены пресс-службой МГУ