Команда биологов из США изучила все известные последовательности генов дрожжей и – с помощью метода машинного обучения – получила подробную информацию о белковых взаимодействиях почти для каждого основного процесса в клетках эукариот. Сюда входит более сотни взаимодействий, которые раньше никогда не наблюдались, сообщает EurekAkert!. Результаты работы опубликованы в журнале Science.
Белки в клетках редко действуют в одиночку. Различные белки часто должны соответствовать друг другу, чтобы сформировать точные комплексы, которые выполняют определенные задачи. Они могут запускать чтение генов, переваривание питательных веществ и реакцию на сигналы от соседних клеток и внешнего мира. Когда белковые комплексы не работают, это может привести к развитию болезней.
«Эта работа показывает, что глубокое обучение теперь может дать реальное представление о вопросах биологии, которым уже несколько десятилетий, – не только о том, как выглядит конкретный белок, но и о том, какие белки объединяются для взаимодействия», – сказал старший автор исследования Цянь Конг из Юго-западного медицинского центра Техасского университета.
Чтобы полностью составить карту взаимодействий, которые приводят к возникновению белковых комплексов, ученые использовали расширенный статистический анализ. Они определили пары генов, которые естественным образом приобретают мутации сцепленным образом. Исследователи пришли к выводу, что такие общие мутации являются признаком того, что белки, кодируемые генами, должны физически взаимодействовать.
Команда использовала новое программное обеспечение глубокого обучения, чтобы создать 3D-модели форм этих взаимодействующих белков. RoseTTAFold, разработанный в Институт дизайна белка Вашингтонского университета, и AlphaFold – изобретение DeepMind, дочерней компанией Alphabet, – были задействованы для создания подробных изображений белковых комплексов.
Сотни недавно идентифицированных белковых комплексов дают глубокое понимание того, как функционируют клетки. Например, один комплекс содержит белок RAD51, который играет ключевую роль в репарации ДНК и развитии рака у людей. Другой включает в себя плохо изученный фермент гликозилфосфатидилинозитол трансамидазу, который участвует в нарушениях развития нервной системы и развития опухолевых заболеваний у людей. Понимание того, как взаимодействуют эти и другие белки, может открыть дверь к разработке новых лекарств от широкого спектра заболеваний.
[Фото: IAN HAYDON/UW MEDICINE INSTITUTE FOR PROTEIN DESIGN]