Как изменилась бы медицина, если бы можно было предсказывать развитие наследственных заболеваний, просто посмотрев на генетический код человека? Какой стала бы электроника, если бы устройства конструировались из молекул ДНК? Это не идеи из футуристического романа про кибербудущее. Современные биология и математика дополняют друг друга в совершенно неожиданных областях: так называемая вычислительная биология помогает найти источник боли внутри тела, поместить в молекулу ДНК огромную библиотеку и сохранить ее на столетия или заранее проверить, срастется ли протез с живой тканью. Об этих и других направлениях деятельности Института математических проблем биологии РАН — в разговоре с руководителем лаборатории квантово-механических систем Виктором Дмитриевичем Лахно. 

— Расскажите об основных направлениях деятельности института и о том, что такое в целом вычислительная биология.

— Институт математических проблем биологии (ИМПБ) РАН основан по инициативе президента Академии наук СССР (1975–1978) Мстислава Всеволодовича Келдыша в Пущине. Тогда институт назывался Научно-исследовательским вычислительным центром Академии наук СССР (НИВЦ АН СССР). 

Институт математических проблем биологии РАН (ИМПБ), г. Пущино. 

Институт математических проблем биологии РАН (ИМПБ), г. Пущино. 

Фото: Елена Либрик, «Научная Россия»

В конце 1960-х гг. английскими биохимиками Максом Перуцем и Джоном Кендрю были расшифрованы первые структуры белков. К этому времени была уже установлена структура ДНК. Стало очевидно, что для дальнейшего развития необходима математика, прежде всего вычислительная. И в 1972 г. был организован наш институт. Тогда в уставе ИМПБ РАН были указаны три направления деятельности: «помощь вычислительными средствами биологическим исследованиям; исследование математических моделей и разработка математического аппарата для биологии». В настоящее время к ним добавилась биоинформатика. 

— Как раз биоинформатике была посвящена последняя международная конференция, организованная институтом. Можете рассказать об этом направлении?

— Биоинформатика — крупное направление. Оно появилось, когда по всему миру стартовал международный проект «Геном человека» (1990–2000) по расшифровке генома. В Советском союзе М.С. Горбачев выделил на его финансирование около 1 млн руб. По тем временам это были очень серьезные деньги. ИМПБ РАН входил в число институтов, работающих в направлении биоинформатики. Но из-за перестройки в СССР проект закрылся ввиду отсутствия финансирования. Поэтому вклад России в расшифровку генома такой маленький — всего одна сотая или одна десятая процента. 

Проект «Геном человека» длился десять лет и должен был завершиться в миллениум. Интересно, что исследователи не успевали закончить эксперименты, поэтому пришлось понизить точность расшифровки генома. Тогда успели: в 2000 г. президент США Билл Клинтон объявил о завершении проекта. 

Для расшифровки генома требовались серьезные вычисления. Самые мощные суперкомпьютеры были задействованы не у физиков, а у молекулярных биологов. И до сих пор самые мощные компьютеры — это те, которые в основном заняты под биологические задачи. 

— Назовите самые значимые результаты в биоинформатике. И как повлияло на расшифровку генома снижение ее точности?

— В 1990-х гг. вышел бестселлер о молодой девушке, которая отрезала себе обе груди. По биоинформационным данным, у нее обнаружились гены, предсказывающие появление рака. У нее была соответствующая наследственность — мама и бабушка умерли от рака груди. И она решилась на операцию, будучи совершенно здоровым человеком. Известно, что актриса Анджелина Джоли тоже сделала операцию на груди, чтобы избежать развития опухоли. Сегодня частные клиники занимаются такими расшифровками заболеваний. И все это — биоинформатика. 

— Она предупреждает болезни?

— Да. Существуют тандемные повторы в генах, которые могут указать на то, что заболевание будет гарантированно развиваться. На тему расшифровки геномов проходят многочисленные конференции, как теоретические, так и прикладные. Они собирают по полторы тысячи участников. Медицинская биоинформатика — это огромнейшее направление. 

— Насколько точна расшифровка этих геномов? 

— Сейчас расшифровка достаточно точная. А главное — быстрая. В проекте «Геном человека» ученые исследовали абстрактного человека. Первым настоящим человеком, которому расшифровали геном, был Джеймс Уотсон, соавтор Фрэнсиса Крика. Расшифровка его генома стоила $100 млн. Сейчас цена — всего $300, а выполняется анализ за двое суток. 

Вы платите клинике, специалисты проводят обследование и выдают расшифровку генома. На основе этих результатов биоинформатики выделяют потенциально опасные участки. Дальше лечащий врач на основе полученных данных назначает индивидуальную терапию. Это называется «персонализированная медицина».

— Звучит так, словно за этим будущее.

— За этим и есть будущее. Когда началась расшифровка генома, случился бум в технологиях. В середине нулевых я прочитал, что ученые предложили пропускать ДНК через мембрану и считывать нуклеотидную последовательность. Я подумал: это что-то из области фантастики, если бы был бизнесменом, не стал бы вкладывать в это деньги. 

Оказалось, что через шесть лет специалисты Оксфордского университета представили новое устройство — секвенатор, который способен считывать нуклеотидную последовательность ДНК, протягивая молекулу через мембрану. Уже сейчас это многомиллионный бизнес, а секвенатор умещается на ладони. Вы можете купить его и персонально расшифровать свой геном. Вот насколько быстро развиваются технологии. То, что еще недавно казалось фантастикой, сейчас воплощается. 

— Каковы дальнейшие прогнозы развития? Вы видите какие-то перспективы, которые в ближайшем будущем могут быть освоены в биоинформатике?

В.Д. Лахно в стенах ИМПБ РАН. 

В.Д. Лахно в стенах ИМПБ РАН. 

Фото: Елена Либрик, «Научная Россия»

— Я вижу грандиозное будущее. Это граничит с трансгуманизмом, который сейчас обсуждают политики. Биоинформатика — это будущее человечества. И в нашем институте есть это направление. Хотя мы теоретический институт, мы тоже раздумывали, не завести ли нам секвенатор с собственными программами. Но тогда мы бы превратились в медицинское учреждение: к нам приходили бы пациенты, выстраивались бы в очереди, пришлось бы закрыть всю математику и заниматься лечением.

— Давайте поговорим про еще одну интересную область — моделирование для биологии. Что это?

— Это все, что не связано с экспериментами. Раньше биология была на 99% экспериментальной наукой, математические модели были не нужны. Но когда началось бурное развитие молекулярной биологии, потребовалось моделирование. Расшифровать структуру белка — очень сложная задача. Если знать структуру, можно лечить разные заболевания. Этим занимаются крупнейшие фармацевтические фирмы.

Разработка нового лекарства стоит миллиарды долларов. Лечение абсолютно неизведанного заболевания основывается на биоинформационных данных. Так, например, был разработан комплекс лекарств для ВИЧ. Моделирование иначе называется «драг-дизайн». Эти расчеты стоят около $100 млн, а создание лекарства — $1 млрд. 

В настоящее время моделирование находит широкое применение. Наша лаборатория квантово-механических систем, а также лаборатории молекулярной динамики и биоинформатики моделируют ДНК. Когда руководство выбирало название институту, началась дискуссия. Его хотели назвать институтом математического моделирования в биологии. Но поскольку среди сотрудников было больше математиков-теоретиков, решили дать более камерное название — институт математических проблем биологии.

Рис. 1. Результаты моделирования и компьютерных исследований пептидных нанотрубок. 

Рис. 1. Результаты моделирования и компьютерных исследований пептидных нанотрубок. 

Изображение предоставлено В.Д. Лахно

— Расскажите в целом о направлениях института. 

— Наша лаборатория квантово-механических систем акцентируется на молекуле ДНК. Раньше думали, что нужно делать электронику на основе белковых биологических элементов, потому что белки могут переносить заряды. Но когда в конце прошлого века ученые выяснили, что ДНК проводит ток, случилась революция.

ДНК — это единственная молекула, которая может себя воспроизводить и самособираться в разные структуры. Не нужно создавать сложные конструкции из кремния, достаточно запустить программу сборки, и из ДНК в растворе соберется нужная схема. Вопрос в том, достаточно ли хорошо она будет проводить ток. Ведь в компьютере главное — проводники. И до сих пор пока не удалось сделать из ДНК эффективный проводник, потому что молекула очень чувствительна к внешним воздействиям. 

При определенных условиях ДНК может быть диэлектриком, металлом, полупроводником и сверхпроводником. Экспериментально трудно работать с одной молекулой. Самое сложное — аккуратно положить ее на подложку. Поэтому гораздо проще моделировать эксперименты на компьютере. Наша лаборатория занимается как раз этим. 

Моделирование заменяет натурный эксперимент. Например, молекулярно-динамические исследования моделируются на компьютере. На основе полученных данных можно сделать вывод, какими должны быть благоприятные условия для эксперимента. 

В нашем институте есть лаборатория молекулярной динамики. Ее возглавляет Николай Кириллович Балабаев, которого называют дедушкой молекулярной динамики в России. Еще в Советском Союзе он работал в Институте прикладной математики им. М.В. Келдыша. Он начинал заниматься моделированием с простых моделей, а сегодня у него уже свои программы. Можно рассчитать, например, что будет, если потянуть белок за одну частичку, и узнать, расплетется он или нет. Экспериментально это сделать очень сложно, а на компьютере можно смоделировать этот процесс. 

Одна из старейших лабораторий нашего института — это лаборатория кристаллографии белков. Сотрудники занимаются расшифровкой белков. Они расшифровали в том числе такие крупнейшие системы, как липопротеин низкой плотности. Из липопротеина собираются бляшки на стенках сосуда и возникает атеросклероз. Очень важно знать структуру липопротеина, чтобы лечить это заболевание. 

Наши сотрудники сделали также первичную расшифровку рибосомальной частицы. Она осуществляет процесс транскрипции и на основе кода ДНК и РНК формирует белки.

Сейчас в этой работе есть разделение труда.

— Что это подразумевает?

— Есть специализированные лаборатории, которые готовят белковые кристаллы. Другие лаборатории эти кристаллы измеряют, помещают их в рентгеновский пучок и получают изображение. Изображения передают лабораториям типа нашей, и мы определяем, какая структура кроется за этими картинками. Затем расшифрованная структура отдается модельерам, драг-дизайнерам, которые работают в фармацевтических фирмах. Они берут конкретную структуру белка и смотрят, функциональна ли она, может ли использоваться для лечения какого-то заболевания, как можно ее ингибировать. Следующий этап — экспериментальный. После чего создается лекарство. Получается такая цепочка, в которой наш институт занимает математическую нишу. 

В нашей лаборатории биоинформатики есть свои программы по поиску опасных геномов. С помощью расшифровки генома можно было бы просчитывать и предупреждать заболевания. 

В институте есть также отдел перспективных информационных технологий. Сотрудники отдела работают во многих направлениях. Одно из самых ярких — создание беспленочной рентгеновской системы. В обычных больницах рентгенологи снимают на пленку. 

— Это дорого? 

— Да, это дорого. И потом эти снимки нужно где-то хранить, они занимают место. К тому же врач может не найти пленку и придется заново проводить исследование. А специалисты нашего отдела перспективных информационных технологий создают рентгеновские системы, которые делают снимки с люминесцентного экрана без использования пленки. Рентген сразу обрабатывается на компьютере. С него же потом можно отправить снимок ведущим специалистам для постановки диагноза. Не нужно ничего хранить в физическом виде. Это называется телемедициной. 

Рис. 2. Беспленочные компьютерные приставки к рентгеновскому аппарату. 

Рис. 2. Беспленочные компьютерные приставки к рентгеновскому аппарату. 

Изображение предоставлено В.Д. Лахно

Такие системы можно применять при медицинских исследованиях в отдаленных регионах — привозить установку, проводить на месте диагностику населения и отправлять через компьютер результаты обследования специалистам, удаленным на тысячи километров от этого региона. Это актуально и в военном деле, когда солдату нужно мгновенно установить степень ранения.   

В нашем институте производили такие рентгеновские устройства. Специалисты выпустили малую серию — пять или шесть установок. Телемедицина бурно развивается, но когда доходит до создания конкретных аппаратов, появляется колоссальная конкуренция. В конце 1990-х гг. производство рентгеновских установок не пошло. В стране наблюдалось высокое социальное расслоение, и богатые предпочитали поехать, скажем, в Германию, заплатить за исследование $1 млн и сделать снимки. На немецких аппаратах изображения получались четче. 

В отделе перспективных информационных технологий есть еще одно направление — исследование мозга. Как это происходит? По показаниям магнитных датчиков, установленных на голове, можно измерять магнитное поле в динамике и определять его источники. Оказывается, у больного источники работают иначе. По этим показаниям можно анализировать работу мозга, внутренних органов и определять источник боли. У нас есть программы, которые расшифровывают сложные магнитные энцефалограммы мозга и данные о функционировании всего организма. 

Рис. 3. Анализ магнитных энцефалограмм. 

Рис. 3. Анализ магнитных энцефалограмм. 

Изображение предоставлено В.Д. Лахно

Есть и другие направления. Например, моделирование гидроксиапатита. Когда ставят протезы, очень важно, чтобы ткань сращивалась с ними. Этот процесс тоже можно промоделировать. Зная характеристики титана, строение гидроксиапатита, можно посмотреть, как он будет сращиваться с протезом и какие нужны условия.

Мы занимаемся не только биологией. В институте есть направление, связанное с изучением рельефа местности. Ученые снимают ландшафт с самолета, после чего цифровой массив превращается в картинку, на которой видно то, чего не увидеть глазом. Например, на местности течет река, но ее ареала не видно. Компьютерная программа может показать объемную картинку расположения всего пространства, и вы увидите русло. 

Рис. 4. Многомасштабное математико-картографическое моделирование рельефа. 

Рис. 4. Многомасштабное математико-картографическое моделирование рельефа. 

Изображение предоставлено В.Д. Лахно

— Столько разных направлений, это очень интересно. Вы упомянули методы определения боли, и я сразу представила младенцев, которые не могут сказать, что у них болит. Эти технологии сейчас находят какое-то применение в медицине? 

— Магнитный энцефалограф в России всего один. Его цена составляет от €1,5 млн до €10 млн, поэтому сейчас мы переключаемся на более дешевую электроэнцефалографию. Магнитное поле измеряет внутренние источники, а электроэнцефалография — поверхностные. Такие исследования не могут показать, что находится внутри организма. По электроэнцефалографии боль зафиксировать нельзя. Когда источник находится внутри, его никак не обнаружить.

Сейчас эксперименты в области магнитной энцефалографии настолько ограничены, что мы выходим из этой области. Раньше исследования проводились в сотрудничестве с Нью-Йоркским университетом, а сейчас такое сотрудничество невозможно. Поэтому мы переключаемся на то, что можно использовать. Но, конечно, исследование мозга, организма, боли — это очень интересно. 

— То есть магнитный энцефалограф никак не используется?

— Я не знаю, как сейчас обстоят дела на Западе. У них сотни установок, а у нас всего одна. Зато есть фундаментальные заделы. Математика для этого и нужна: если появится техническая возможность, математический аппарат будет готов. 

— Стремится ли нанобиоэлектроника решить проблемы нехватки электронных устройств? 

— С 1970-х гг. российские исследователи отказались от собственных направлений и пошли по пути западного мейнстрима. Но когда следуешь за кем-то, всегда будешь вторым. Поэтому у нас очень большой цифровой разрыв и колоссальная нехватка суперкомпьютеров. А любая серьезная задача считается на суперкомпьютере, поэтому очень сложно конкурировать с мощностями других стран. 

Мы пользуемся суперкомпьютером, находящимся в ИПМ. Используем также российский суперкомпьютер «Ломоносов». Но к нему стоит в очереди вся страна. Еще мы пользуемся межведомственным суперкомпьютером в МСЦ. Дубна дает нам вычислительные ресурсы. Но, конечно, собственный суперкомпьютер необходим. 

— Этих мощностей все равно не хватает для развития? 

— Я бы не стал бить здесь тревогу, потому что я вижу более узкую причину: во всем биоцентре у нас никто не применяет суперкомпьютер. Это сложная технология, с которой должны работать профессионалы. Решая свою конкретную биологическую задачу, никто не будет заниматься такими сложными вычислениями. Для этого и был создан наш институт. 

— На помощь приходят математики?

— Да. На суперкомпьютерную задачу человек тратит жизнь. А у нас жизней мало, это главная проблема. Даже если будет достаточно техники, кто будет на ней работать? Нужно решать задачу комплексно, в первую очередь привлекать молодежь. Поскольку мы живем и работаем в маленьком городе, у нас проблема стоит очень остро. 

В области нанобиоэлектроники тоже заметно отставание, потому что вся техника, которой мы пользуемся, импортная. Тем не менее кризис всей цифровой отрасли связан с тем, что развитие технологий упирается в миниатюризацию и скорость вычислений. И одна из важнейших проблем, которая полностью не осознается, — это хранение информации. 

Сегодня все зафиксировано на пленке, дисках и имеет ограниченное время хранения. А объем информации при этом постоянно растет. Здесь актуален аналог закона Мура для информации: каждые два года человечество удваивает объем информации, а хранить ее негде. Память любого хранилища не справляется с таким нарастающим массивом информации.

Оказалось, что решить проблему может ДНК. Плотность хранения в молекуле в миллиарды раз больше, чем на любом носителе. К тому же это еще и самый надежный способ хранения информации. Уже расшифрован геном мамонта. В найденных в окаменелостях бактериях информация хранится сотни миллионов лет. Получается, что при определенной температуре ДНК очень хорошо сохраняется даже при наличии химических реакций в среде.

Это направление быстро развивается: в 2012 г. на ДНК записали порядка сотни КБ информации, в 2019 г. — уже 16 ГБ. Это целая библиотека книг в маленькой молекуле. 

— А как ее хранить? В одной из лекций вы говорили, что при комнатной температуре ДНК погибает. 

— В 2012 г. в английском журнале The Royal Society впервые была опубликована количественная статья, содержащая данные о сроках хранения ДНК. Исследуя остров в Новой Зеландии, на котором нашли останки древней птицы моа, английские ученые провели анализ взятых проб и вывели формулу для расчета срока хранения информации. Оказалось, что ДНК распадается по закону радиоактивного распада. Константа распада зависит от температуры, внешних условий, кислотности и того, что происходит рядом с захоронением. По этой формуле можно вычислить, сколько будет жить записанная информация в конкретных условиях. 

Но запись на ДНК очень дорогая: около $1 тыс. за 1 МБ. Значит, должна существовать настолько важная информация, которую нужно стремиться сохранить на столетия вперед.  

Роль таких бесед, как наша с вами, принципиальна. Специалисты разных областей посмотрят это интервью и, возможно, уделят направлению больше внимания. 

— Это не для массового использования, если есть особые условия хранения и высокая цена.

— Если будет развитие, то прогресс здесь будет большой. Когда направление станет конкурентным, тогда и войдет в массовое употребление. Но это трудоемкое дело под конкретную задачу. 

— «Нанобиоэлектроника» звучит как нечто фантастическое, а вы на самом деле этим занимаетесь. 

— Моделируем. 

Рис. 5. Моделирование молекулярных объектов и явлений. 

Рис. 5. Моделирование молекулярных объектов и явлений. 

Изображение предоставлено В.Д. Лахно

— В завершение разговора я хочу процитировать А.М. Молчанова, основателя Научно-исследовательского вычислительного центра Академии наук СССР:

Затянувшаяся осторожность оборачивается трусостью. Настало время (и, может быть, мы даже два-три года уже упустили), когда мы должны математикой и вычислительной техникой смелее, решительнее вторгаться в биологическую науку. Мы должны перейти к равноправному сотрудничеству — это крайне важный момент. Он труден, прежде всего, психологически. Вычислительная математика возникла из задач физики, а мы выросли на том, что биология много сложнее, много объемнее, много красочнее, много труднее физики. 

Как вы думаете, спустя столько лет методам вычислительной математики удалось решительнее вторгнуться в биологическую науку?

— Я думаю, что это сильно устаревшее высказывание. Вычислительная математика не только вторглась в биологию, но и остается одним из мейнстримных направлений. Это радикально меняет всю нашу жизнь, физика здесь становится второстепенной наукой. Вселенная, конечно, интересна, но человека в первую очередь интересует он сам. Главное — наука о его жизни. И прогресс в этом направлении будет колоссальный. 

— Представляется, что он уже огромный. 

— Не совсем. Как это происходило с биоэлектроникой: когда открыли, что ДНК проводит электричество, ученые были уверены, что сейчас полностью заменят кремниевую электронику. Но созданные ДНК-транзисторы были неконкурентоспособны по сравнению с обычными. Тогда бизнес сказал: «Поработайте еще». И направление перешло в спокойное академическое русло. То же и с хранением информации в ДНК. Здесь нет фантастического быстрого развития. Пока область неконкурентна, нет финансирования со стороны бизнеса. 

Поэтому нужны фундаментальные исследования. Существовать фундаментальной науке всегда помогала академия. А сейчас многие исследования не поддерживаются, фонды закрыты. Российский научный фонд — это всего 850 проектов на всю страну, этого мало. Конечно, у нас есть свои интересные направления. Мы могли бы заняться бизнесом и продавать услуги. Но не будем, у нас другой жанр. Пускай это делают бизнесмены.