Биологи МГУ имени М.В. Ломоносова с помощью ИИ и анализа данных о 3000 белках раскрыли, какие молекулы управляют работой генома человека. Ученые объединили данные из многочисленных экспериментов, создав первую полную классификацию хроматома – совокупности белков хроматина.
Последовательность нуклеотидов в геноме человека была «прочитана» уже более четверти века назад, однако до сих пор мы плохо понимаем, как работает геном. Геном — это не просто последовательность букв, это набор физически существующих молекул ДНК, которые формируют сложные динамические структуры, взаимодействуя с молекулами белков. Посредством этих взаимодействий информация, закодированная в геноме, превращается в инструкции по синтезу новых молекул, и рождается жизнь. С помощью всестороннего анализа накопленных мировым сообществом данных о роли белков в работе генома человека и применении технологий искусственного интеллекта ученые биологического факультета МГУ смогли дать наиболее авторитетный на данный момент ответ на вопрос о том, какие белки участвуют в работе генома человека. Проанализировав более трех тысяч белков, ученые выяснили, какими свойствами они обладают и как управляют работой наших генов.
Результаты работы опубликованы в престижном международном научном журнале Nucleic Acids Research.
В каждой клетке человека хранится геном — полный набор генетической информации, записанной в молекулах ДНК. От того, какие гены включаются и выключаются в конкретный момент, зависят работа клетки, развитие организма и возникновение многих заболеваний. Поэтому одна из главных задач современной биологии — понять, как именно регулируется активность генов.
ДНК — это молекулы общей длиной около двух метров, в которых закодированы инструкции для синтеза других молекул — РНК и белков. Однако в клетке ДНК помещается сравнительно небольшое клеточное ядро диаметром всего около десяти микрометров. Ядро можно представить как своеобразный «компьютер» клетки: именно здесь хранится генетическая информация и принимаются решения о том, какие гены будут работать.
Чтобы длинная молекула ДНК могла поместиться в ядре, она упакована вместе со специальными белками. Белки — это биологические молекулы, построенные из цепочек аминокислот. Они выполняют почти всю работу в клетке: ускоряют химические реакции, передают сигналы, распознают другие молекулы и формируют клеточные структуры. В комплексе с ДНК такие белки образуют хроматин. Они не только компактно укладывают генетический материал, но и управляют доступом к генам — фактически решают, какие из них будут активны.
В ядре клетки находятся тысячи различных белков, связанных с хроматином. Многие из них взаимодействуют с ДНК напрямую, другие — через сложные белковые комплексы. Они могут перемещаться между ядром и цитоплазмой, работать на разных участках генома и на разных стадиях клеточного цикла. Из-за такого разнообразия получить целостную картину состава и функций этих белков крайне сложно. При этом существующие экспериментальные методы дают лишь фрагментарную информацию. Методы геномики и 3D-геномики позволяют изучать трехмерную организацию генома, но часто не учитывают роль белков. С другой стороны, методы структурной биологии хорошо работают для отдельных белковых молекул, но плохо подходят для изучения сложной и динамичной среды клеточного ядра.
В современной биологии накоплены огромные массивы данных — результаты микроскопии, масс-спектрометрии, геномных экспериментов и тысяч научных исследований. Однако эти сведения часто остаются разрозненными и плохо сопоставимыми между собой. Чтобы получить целостное представление о белках хроматина человека, ученые провели масштабный биоинформатический мета-анализ и объединили данные из разных источников: экспериментальных работ, биологических баз данных и научной литературы. Сопоставив эту информацию, исследователи смогли систематизировать знания о белках, участвующих в работе генома. В результате была создана классификация белков хроматина, включающая 40 функциональных категорий, а также составлен референсный список примерно из трех тысяч белков, связанных с хроматином человека.
Используя эту классификацию, ученые сравнили белки из разных групп: их размеры, аминокислотный состав, электростатический заряд и другие физико-химические характеристики. Это позволило лучше понять, какими особенностями обладают белки, участвующие в организации и регуляции генома.
Отдельное внимание исследователи уделили структуре белков. Большинство белков состоит из структурных доменов — компактных участков, выполняющих определенные функции. С помощью методов машинного обучения ученые смогли обнаружить в белках хроматина ранее неописанные домены, которые могут стать объектами дальнейших исследований.
Интересный результат связан и с так называемыми неупорядоченными регионами белков. Долгое время в биологии считалось, что ключ к пониманию функций белка — это его четкая трехмерная структура. Однако оказалось, что многие белки, особенно связанные с регуляцией генов, содержат участки без фиксированной формы. Такие гибкие фрагменты могут взаимодействовать сразу с несколькими партнерами и образовывать временные молекулярные объединения. Иногда они формируют внутри клетки особые структуры — биомолекулярные конденсаты, напоминающие крошечные «капли», которые помогают организовывать сложные процессы, например регуляцию транскрипции. Исследование показало, что белки хроматина особенно богаты такими неупорядоченными регионами, что может объяснять их способность участвовать во множестве взаимодействий и тонко настраивать работу генов.
Результаты работы и систематизированные данные о белках хроматина человека собраны на интерактивном веб-ресурсе SimChrom. Платформа позволяет изучать локализацию белков внутри ядра, их доменную организацию и функциональную классификацию. Созданная база данных и предложенная система анализа помогают сформировать целостное представление о так называемом хроматоме — совокупности всех белков, взаимодействующих с хроматином.
Понимание того, как эти белки организуют геном и регулируют активность генов, важно не только для фундаментальной биологии. Нарушения в работе белков хроматина могут приводить к различным заболеваниям, включая онкологические. Поэтому такие исследования могут помочь в поиске молекулярных механизмов болезней и разработке новых подходов к их диагностике и профилактике.
«Мы объединили разнородные данные о белках хроматина и клеточного ядра человека и, проведя комплексный анализ, выявили общие принципы организации и ключевые свойства как хроматома человека в целом, так и его отдельных функциональных классов. Более того, особое внимание в работе было уделено структурной характеризации хроматома человека и описанию стратегий мультивалентного взаимодействия в хроматине посредством белковых доменов», — отмечает первый автор статьи, м.н.с. биологического факультета МГУ Анна Грибкова.
«В организме человека насчитывается порядка 30 триллионов клеток, и в каждой из них функционирует геном. В общих чертах, набор активно работающих генов различается между клетками, что обуславливает их функции и судьбу. В то же время активность экспрессии генов регулируется белками хроматина. Механизмам работы отдельных белков хроматина было посвящено много исследований. Однако они не позволяли охарактеризовать работу хроматома системно», — рассказывает декан биологического факультета МГУ академик РАН Михаил Кирпичников.
«Мы рассматриваем эту работу как фундамент для построения системных моделей функционирования генома. В дополнение к подходам геномики и 3D-геномики результаты хроматомики окажут существенное влияние на понимание того, как физические свойства и доменная организация белков определяют устройство и принципы функционирования хроматина. Результаты работы представляют собой основу для формирования более полных количественных моделей функционирования хроматина и генома человека, а также открывают новые возможности для интерпретации эпигенетических данных и поиска молекулярных мишеней для терапии заболеваний человека», — подчеркивает руководитель исследования, профессор биологического факультета МГУ чл.-корр. РАН Алексей Шайтан.
Исследование выполнено при поддержке Российского научного фонда, Министерства науки и высшего образования, расчеты проведены с использованием Суперкомпьютера «МГУ-270».
Информация предоставлена пресс-службой МГУ
Источник фото: ru.123rf.com




















