В ИТМО представили алгоритм Strainy, который позволяет с высокой точностью выделить имеющиеся в микробиоме вариации ДНК бактерий и разделить близкородственные штаммы. С помощью разработки ученые смогут быстрее определять уровень патогенности и устойчивости к антибиотикам конкретных сообществ бактерий, а также больше узнать об их эволюции. Результаты исследования были опубликованы в журнале Nature Methods.
Сообщество бактерий, или микробиом, — это скопление сотен микроорганизмов, обитающих в одной среде, например, в почве или кишечнике. Каждый микроорганизм в таком сообществе по-разному воздействует на человека и окружающую среду: одни бактерии могут быть вредными, другие — полезными. Чтобы определить «характеристики» микробиома, ученые «составляют» цепочки генов сообществ — метагеном. Это уникальный набор отрезков ДНК в виде последовательности букв, кодирующих определенные молекулы. Чем длиннее этот код, тем он полнее описывает микроорганизм. И хотя все современные алгоритмы могут «собирать» довольно длинные цепочки генов, в них отражаются лишь усредненные данные об организмах. В таких данных в основном видны сходства между фрагментами ДНК разных бактерий, а не различия. Это затрудняет выделение конкретных штаммов внутри сообществ и определение их уникальных свойств.
Ученые из ИТМО разработали алгоритм для сборки цепочек генов микробиома на уровне штаммов, в которых отображается большинство мутаций в ДНК микроорганизмов. Алгоритм Strainy работает с данными метагенома в два этапа. На первом он кластеризует их. Входные данные, полученные в результате работы метагеномного сборщика, используются в качестве референсного генома — цепочки с основными схожими последовательностями генов бактерий в микробиоме. Алгоритм сравнивает отрезки ДНК с референсным геномом и, если находит в какой-то части различия, добавляет новую вариацию к уже имеющейся цепочке. Таким образом в геном удается «записать» информацию о почти всех мутациях бактерий.
«На втором этапе алгоритм пересобирает исходный метагеном, учитывая все выявленные варианты относительно референсного генома. На выходе мы получаем преобразованную сборку в виде графа — цифровую запись, кодирующую гены бактерий, — значительно большего размера, в которой содержится информация о бактериях на уровне штаммов. Так, если в изначальном метагеноме у нас был только один вариант определенного отрезка ДНК бактерий, то после преобразования появляется несколько его вариаций. Также Strainy выдает статистические данные о количестве подобных фрагментов ДНК, их длине и покрытии», — отмечает один из авторов исследования, выпускница Института биоинформатики ИТМО Екатерина Казанцева.
Полученные в ходе анализа данные могут быть использованы не только для выявления штаммов в микробиоме, но и определения свойств бактерий в нем. Например, патогенности, то есть способности вызывать заболевания у других организмов, и устойчивости к антибиотикам. Также эта информация поможет глубже изучить эволюцию и процесс мутации бактерий, а также научиться прогнозировать возможные изменения в геноме. Это поможет предсказать, какие мутации могут произойти у конкретных видов бактерий и какие новые свойства они смогут приобрести в ходе этих изменений.
Пока алгоритм тестировали только на данных метагенома бактерий почвы. В будущем исследователи планируют проверить, насколько эффективен Strainy в работе с другим типом геномных данных, например, с образцами раковой опухоли человека.
Соавтором Екатерины Казанцевой в этом исследовании выступил Атабрек Донмез, аспирант Мэрилендского университета.
Информация предоставлена пресс-службой Университета ИТМО
Источник фото: ru.123rf.com