Ученые используют машинное обучение, чтобы создать простую прогностическую модель белков и определить их функции. Они применяют эволюционные данные о родственных белках и экспериментально изучают их функции, чтобы предсказать, как модифицировать тот или иной белок, передает EurekAlert! со ссылкой на Министерство энергетики США. Результаты работы опубликованы в журнале Nature Biotechnology.
Белки являются неотъемлемыми компонентами всех живых организмов. Они состоят из последовательности строительных блоков – аминокислот. Эта последовательность определяет их функцию: одни определяют структуру клеток, другие регулируют метаболизм. Ученые могут изменить последовательность белка и экспериментально проверить, влияет ли это изменение на его функцию и каким образом. Однако существует слишком много возможных изменений аминокислотной последовательности – и проверить их все в лаборатории невозможно. Вместо этого исследователи строят очень сложные вычислительные модели, которые предсказывают, какая функция проявится у белка с той или иной последовательностью.
В этой работе ученые объединили регрессионный анализ и эволюционные данные для машинного обучения – и построили более простую прогностическую модель. Регрессионный анализ связывает заданную аминокислотную последовательность с функциональным свойством белка, который был проверен экспериментально. Чтобы увеличить объем данных, исследователи включили эволюционно родственные белки, так как они могут обладать теми же свойствами, что и интересующий белок.
Новый подход позволит ученым легко перепроектировать белки для широкого спектра применений. Например, они смогут создавать новые ферменты для преобразования растительного вещества в биотопливо или биопродукты или для создания новых биоматериалов.
[Фото: Image courtesy of University of California, Berkeley]