Команда российских исследователей разработала новый способ для изучения пространственной организации генома. Он позволит снизить погрешности и даст возможность легче анализировать данные, которые получили исследователи из разных лабораторий. Работа была выполнена при поддержке Минобрнауки России в рамках проекта «Наука и университеты», а результаты опубликованы в журнале Briefings in Bioinformatics.
ДНК – молекула, которая в длину может быть равна росту взрослого человека. Чтобы поместить ее в клетку, существуют различные способы «упаковки». Сначала она наматывается, как нитка на йо-йо, на нуклеосомы – структуры, состоящие из 8 специальных белков – гистонов. После в некоторых местах специфические белки связываются с ДНК, в результате чего формируются петли. Далее молекула становится еще более компактной – образуются хроматиды и хромосомы. Все эти структуры формируют пространственную организацию генома.
Изучение пространственной организации генома человека помогает лучше понимать, как именно регулируется работа генов. Для таких исследований используется метод Hi-C. Он позволяет получить картину контактов всех фрагментов генома друг с другом на всех структурных уровнях. От самого низкого: петель между регуляторными участками до самого высокого: хромосомных территорий и целого ядра.
Хотя Hi-C считается довольно точным методом изучения трехмерного генома, он не лишен недостатков. Сейчас для проведения Hi-C существуют уже готовые наборы со всеми необходимыми реагентами и прописью процедур. Но провести исследование по стандартному протоколу не всегда представляется возможным. Поскольку иногда материала бывает значительно меньше, чем требуется по стандарту, или – наоборот – требуется изучить слишком «объемный» объект, например, ткани мозга или образцы, полученные при биопсии. В таких случаях исследователи дорабатывают протоколы с учётом особенностей материала и своих нужд, но полученные результаты становятся сложнее сравнивать с теми, что были получены по стандартным протоколам. Некоторые группы исследователей уже разработали подходы, которые учитывали бы такие погрешности, однако они все еще недостаточно точны.
Сотрудники биологического факультета МГУ в составе междисциплинарной команды исследователей из Сколтеха и НИЦ «Курчатовский институт» разработали новый метод нормализации данных Hi-C. Новый метод заметно снижает погрешность и ее влияние на результаты. Это биоинформатический алгоритм HiConfidence. Особенность подхода заключается в том, что он учитывает силу и устойчивость взаимодействия внутри каждой отдельно взятой пары фрагментов генома. В результате данные, которые плохо воспроизводятся в повторах эксперимента, практически не влияют на финальные результаты. Это позволяет значительно повысить качество получаемых карт пространственной организации генома и облегчить их интерпретацию.
Проверку качества работы HiConfidence проводили на данных, полученных при анализе пространственной организации генома клеток человека и плодовой мушки (Drosophila melanogaster). Применение инструмента HiConfidence позволило заметно снизить уровень «шума» в исходных данных. В результате удалось проанализировать влияние изменений ацетилирования (присоединения ацетиленовых групп) гистонов на плотность укладки геномной ДНК на масштабе отдельных геномных областей и хромосом в целом.
«Анализ больших данных в геномике и сравнение результатов, полученных в разных лабораториях, часто осложнены погрешностями, вносимыми при проведении экспериментов. Наличие биоинформатического инструмента, нивелирующего эти погрешности – вне зависимости от их конкретной природы, – значительно облегчит выполнение проектов, в которых необходимо перекрестное сравнение большого числа данных, полученных разными людьми в разное время», – прокомментировал исследование один из авторов, ведущий научный сотрудник кафедры молекулярной биологии биологического факультета МГУ Сергей Ульянов.
Информация предоставлена пресс-службой МГУ
Источник фото: ria.ru