По мере повышения глобальной температуры учёные из лаборатории Колд-Спринг-Харбор (CSHL) работают над выращиванием более сильных и устойчивых культур. Однако этот процесс сопряжён с трудностями. У растений часто есть несколько родственных генов, которые отвечают за желаемые свойства, такие как размер или устойчивость к засухе. Найти гены с частично совпадающими функциями, или «дублирующие гены», — задача не из лёгких.

«В большинстве случаев существуют серьёзные препятствия на пути к улучшению сельскохозяйственных культур, — говорит Якопо Джентиле, автор работы. — Это связано с тем, что генные семейства эволюционируют и компенсируют друг друга очень сложным и избыточным образом».

Джентиле и его коллеги проследили за одним важным семейством генов у цветковых растений, чтобы понять, как оно изменилось за 140 миллионов лет эволюции. Используя эти данные, они обучили модели выявлять избыточные элементы и прогнозировать, какие гены нужно редактировать для изменения определённых признаков.

«Речь идет о понимании того, что происходит после дупликации генов, — объяснил Джентиле. — У вас есть один ген, который дублируется. Затем их становится два. Что происходит после этого? Теория говорит о том, что они будут отличаться друг от друга. Главный вопрос — как именно».

Чтобы ответить на него, команда сосредоточилась на CLE — семействе генов, участвующих в передаче клеточных сигналов и развитии растений. Пептиды CLE распространены у всех видов растений. Однако многие их функции остаются неизвестными. Изучать их сложно из-за короткой длины, быстрой эволюции и избыточности.

Используя новые достижения в области искусственного интеллекта, команда выявила тысячи ранее неизвестных CLE генов у 1000 видов. Исследователи ввели эти данные в компьютерные модели, которые выделили гены, которые могут быть избыточными. Избыточные гены, скорее всего, имеют сходство в одном или двух местах: в вырабатываемых ими пептидах или в промоторах генов — участках ДНК, которые контролируют экспрессию.

Чтобы подтвердить прогнозы моделей, лаборатория Липпмана с помощью CRISPR отключила отмеченные гены в томатах. Как и предполагалось, отключение только одного дублирующегося гена не дало никакого эффекта. Однако отключение всех генов привело к видимым изменениям в растениях. «Впервые в случае с томатами мы воздействовали на такое большое количество генов одновременно, — сказал Джентиле. — Мы изменили 10 генов».

Примечательно, что у большинства избыточных генов схожие промоторы, даже если пептидные последовательности различаются. Модель не только выявила возможные избыточные гены, но и предсказала, какое влияние на растения окажут определённые CLE мутации: положительное, отрицательное или нейтральное.

Разработанный метод можно легко масштабировать для любого семейства генов. В результате у селекционеров появилась «дорожная карта» для прогнозирования того, как можно использовать скрытые гены в своих интересах. Работа опубликована в журнале Molecular Biology and Evolution.

[Фото: Lippman lab/CSHL]