Биоинформатики СПбГУ помогли обнаружить 130 000 новых вирусов в недрах публичных геномных данных

31.01.2022 16:30

2858

Международное сотрудничество ученых СПбГУ (Центр биоинформатики и алгоритмической биотехнологии), Института Пастера (Франция), Университета Британской Колумбии (Канада), Калифорнийского университета в Беркли (США), Гейдельбергского института теоретических исследований (Германия) и других исследователей по всему миру позволило обнаружить в недрах существующих открытых геномных данных более 130 000 новых, ранее неизвестных вирусов.

По мнению ученых, в природе существуют триллионы до сих пор неизвестных вирусов, многие из которых могут быть смертельными и потенциально способными спровоцировать следующие пандемии. Однако далеко не все они столь опасны.

Опубликованная в журнале Nature работа может служить основой так называемой петабайтной геномики, оперирующей ранее непостижимым количеством данных ДНК и РНК (в опубликованном исследовании проанализировано 16 петабайт геномных последовательностей). Единица измерения количества информации петабайт равна 1015 (квадриллиону) байт.

«Чтобы справиться с такими объемами информации, была создана платформа Serratus, содержащая целый набор компьютерных инструментов, специально предназначенных для эффективной работы с данными в облаке, — отметил участник международного проекта, ведущий сотрудник Центра биоинформатики и алгоритмической биотехнологии СПбГУ Антон Коробейников. — Однако без созданного в Центре совместно с моим коллегой Дмитрием Мелешко сборщика РНК-вирусов coronaSPAdes качественно "пересобрать" геномные вирусные данные было бы гораздо сложнее».

«Главная задача коллаборации Serratus заключалась в том, чтобы создать мощное, очень точное и чувствительное "сито" для обработки огромных количеств данных, отобрать данные, относящиеся к РНК-вирусам, сузив масштабы от петабайтов до гигабайтов, доступных для относительно быстрой обработки с применением обычных вычислительных мощностей. Созданный же сборщик coronaSPAdes — наш кирпичик в уникальной конструкции Serratus, каждый из участников которой занимался своим делом, которое хорошо знает, поэтому у нас все и получилось», — считает сотрудник Центра алгоритмической биотехнологии СПбГУ Дмитрий Мелешко.

Несмотря на то что далеко не всегда удавалось собрать полный геном всех вирусов, даже частичные последовательности позволили построить генеалогические деревья, которые показывают, как разные вирусы связаны между собой и как они развиваются.

«Созданная в результате совместных усилий платформа способна обрабатывать один миллион наборов данных в день при вычислительных затратах менее одного цента на набор данных. Это ли не мечта всех генетиков — быстро и качественно!» — отметил Антон Коробейников.

В ходе исследования было обнаружено более 250 гигантских вирусов, поражающих бактерии и похожих на вирусы, обнаруженные ранее в водорослях. Близкие родственники этих «огромных фагов» были обнаружены, например, у человека из Бангладеш, а также у кошек и собак в Соединенном Королевстве.

До появления Serratus ученым было известно порядка 13 500 РНК-вирусов (это примерно треть от общего количества различных существующих вирусов), а проект позволил увеличить это количество почти в десять раз.

«Созданный на данный момент общедоступный репозиторий разработанных инструментов и уже полученных результатов таит в себе множество новых открытий, особенно с учетом того, что количество облачных общедоступных последовательностей ДНК и РНК растет экспоненциально изо дня в день. Мы бы хотели идентифицировать к концу десятилетия более 100 миллионов РНК-вирусов», — отметил Дмитрий Мелешко.

Информация предоставлена пресс-службой СПбГУ

Источник фото: ru.123rf.com

Разместила Наталья Сафронова

Информация предоставлена Информационным агентством "Научная Россия". Свидетельство о регистрации СМИ: ИА № ФС77-62580, выдано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций 31 июля 2015 года.

Партнеры

Показать всех

Карельский научный центр Российской академии наук

Государственная корпорация по атомной энергии "Росатом"

Физический Институт им. П.Н. Лебедева РАН (ФИАН)

Объединенный институт ядерных исследований

ФГУП Всероссийская государственная телевизионная и радиовещательная компания

Совет при Президенте по науке и образованию

Объединенный институт высоких температур РАН

Пермская научно-производственная приборостроительная компания

Национальный исследовательский Томский государственный университет

Федеральный исследовательский центр Институт прикладной физики Российской академии наук (ИПФ РАН)

Государственный геологический музей им. В.И. Вернадского Российской академии наук

Палеонтологический музей им. Ю.А. Орлова РАН

Наше мобильное приложение

Установить с RuStore

Мы в соцсетях

НАУКА ДЕТЯМ

Недавнее

Технологию алмазного шлифования пластин для полупроводников разработали в РТУ МИРЭА

14:00 / Инженерия

Гигантские китайские моллюски продолжают стремительно расселяться в водоемах России

12:00 / Биология

Прослушивание «звенящих» черных дыр открывает возможности для гравитационно-волновой астрономии

20:00 / Астрономия, Астрофизика

Обнаружена новая форма наследственного рака предстательной железы

19:30 / Биология, Медицина

Углеродная «шуба». Ученые представили новый способ синтеза нанодисперсных материалов

15:00 / Химия

Международный коллектив ученых завершил этап исследования инновационного препарата против рака легкого

14:30 / Медицина

Отечественный прибор для обсерватории «Спектр-УФ» может регистрировать отдельные фотоны

14:00 / Астрономия, Космонавтика

Клинические испытания инновационного метода лечения остеоартрита готовятся провести в России

13:00 / Здравоохранение, Медицина, Наука и общество

Какие промоакции действительно увеличивают прибыль в розничной торговле?

12:30 / Наука и общество, Экономика

Новый детектор дыхания определит начало сжигания жира вашим телом

20:00 / Биология, Здравоохранение, Новые технологии

Лекции

15.09.2025 14:00

5800

Как звучит хаос: акустическая турбулентность. Лекция физика Евгения Кочурина

Звуковая турбулентность представляет собой чистый хаос, противоположный музыкальной гармонии. Как он возникает и в чем отличие хаотических траекторий частиц от обычного регулярного движения? Как ученым удается моделировать эти процессы? Как звучит хаос: восстановленный звуковой сигнал, который мог бы услышать наблюдатель, оказавшись в эпицентре акустической турбулентности?

Смотреть все