Считается, что количество соединений, похожих по структуре на лекарства синтетического происхождения, больше, чем число звезд на небе. Как среди этого необозримого множества найти молекулы, которые лягут в основу медицинских препаратов? В этом деле на помощь ученым приходят методы компьютерного конструирования лекарств. Один из основателей подобных подходов — академик РАН Владимир Васильевич Поройков — рассказал нам о перспективах и сложностях поиска и разработки новых лекарств in silico, а также о том, как работает российская компьютерная программа PASS, предсказывающая тысячи биологических активностей.

Справка: Владимир Васильевич Поройков — кандидат физико-математических наук, доктор биологических наук, академик Российской академии наук, главный научный сотрудник и заведующий отделом биоинформатики ФГБНУ «Научно-исследовательский институт биомедицинской химии им. В.Н. Ореховича» (ИБМХ), профессор кафедры биохимии Медико-биологического факультета Российского национального исследовательского медицинского университета им. Н.И. Пирогова (1996–2016).

— Правда ли, что гипотетических химических веществ, на основе которых можно было бы создавать лекарства будущего, по количеству больше, чем атомов во Вселенной?

— Обычно в качестве аллегории приводят не атомы, а количество звезд во Вселенной. Говорят, что число лекарственно подобных соединений составляет 10⁶⁰. Это действительно огромная величина. Но насколько они синтезируемы — отдельный вопрос. Максимальные оценки реально синтезируемых веществ составляют несколько миллиардов или десятки миллиардов. Такие базы данных существуют, и на их основе ведут отбор соединений, которые потенциально могут обладать нужным фармакологическим действием и рассматриваться как кандидаты в новые лекарства.

— А каков разрыв между тем, сколько веществ существует потенциально и сколько уже синтезировано на данный момент?

— Самая крупная свободно доступная база данных PubChem содержит около 130 млн соединений, которые уже синтезированы, мы знаем их свойства. Количество данных о биологической активности тех или иных веществ тоже составляет примерно 300 млн. Но если сравнивать эти цифры с возможным числом видов активности, то разрыв будет огромен: многие порядки величин! Если же говорить о фармацевтических субстанциях, уже введенных в медицинскую практику, то их примерно 12–15 тыс.

Ежегодно в клинику вводятся сотни новых лекарств. И тем не менее это все равно лишь капля по сравнению с тем, что теоретически возможно.

— Среди этого огромного количества есть как полезные для нас вещества, так и бесполезные? Или даже опасные?

— Да, это так. Многие вещества могут вызывать побочные или токсические эффекты. Отбор кандидатов в лекарственные препараты осуществляется на основе комплекса критериев, включая отсутствие токсичности. Но даже если вещество нетоксично при терапевтических дозах, оно может не стать лекарством: его синтез может быть неоправданно дорогим или при пероральном приеме оно не будет обладать достаточной биодоступностью, чтобы достичь нужной мишени и произвести терапевтический эффект. Поэтому много лет ведутся исследования, тратятся огромные деньги и усилия, чтобы из гигантского числа веществ отобрать те, которые обладают комплексом желательных свойств: нужной активностью, отсутствием побочных эффектов, подходящей фармакокинетикой.

— Как компьютерный дизайн лекарств помогает в этом отборе? Какие методы используются?

— Есть разные подходы. Классические методы компьютерного дизайна лекарств основаны на структуре либо макромолекулы-мишени, либо лигандов (веществ, которые с этой мишенью взаимодействуют). В первом случае сначала расшифровывают трехмерную структуру белка-мишени с помощью рентгеноструктурного анализа, ядерного магнитного резонанса высокого разрешения или криоэлектронной микроскопии. В последние годы используют и компьютерные модели, такие как AlphaFold (Нобелевская премия по химии 2024 г.). Затем с помощью молекулярного докинга, молекулярной динамики, сочетания квантовой химии и молекулярной механики подбирают вещества, которые могут избирательно связаться с мишенью. Второй подход, как я уже сказал, базируется на структуре лигандов. У исследователя есть обучающая выборка веществ с известной биологической активностью. С помощью методов машинного обучения (их сегодня часто называют искусственным интеллектом) строят модели зависимости «структура — активность», которые затем используют для прогноза активности новых соединений. Еще один подход — системная фармакология.

Даже если вещество действует на нужную мишень, оно не всегда производит требуемый эффект. В организме сигнальные пути устроены сложно: блокируя один узел, вы можете активировать цепочки обратных связей или альтернативные пути передачи сигнала, что нивелирует эффект. Системная фармакология учитывает эти особенности. Все три подхода сегодня широко используются.

Молекулярное моделирование. Фото: Елена Либрик / «Научная Россия»

Молекулярное моделирование. Фото: Елена Либрик / «Научная Россия»

 

— Вы хорошо известны как один из авторов компьютерной программы PASS, которая предсказывает более 9 тыс. биологических активностей с высокой точностью. Это и есть второй подход, верно?

— Верно. Программа PASS была создана впервые нашим коллективом в 1990-х гг., мы занимаемся ее развитием на протяжении многих лет, постоянно расширяя число прогнозируемых видов активности и совершенствуя алгоритмы расчетов. Сегодня мы прогнозируем свыше 9 тыс. видов биологической активности: фармакотерапевтические эффекты, механизмы действия, побочные и токсические эффекты, влияние на систему метаболизма, транспортеры, генную экспрессию, а также воздействие на нежелательные мишени. Программа активно используется учеными по всему миру. В 1999 г. мы реализовали первый в мире свободно доступный веб-ресурс PASS Online. Сегодня у нас более 80 тыс. пользователей из 100 с лишним стран, из них около 15 тыс. — из России.

С помощью программы PASS исследователи оценивают, стоит ли синтезировать то или иное вещество, и выясняют, на какие виды биологической активности его тестировать.

— К слову о тестах. Если соединение уже получено, на какие активности его следует тестировать в первую очередь? И достаточно ли для такого анализа мощности обычных компьютеров или без суперкомпьютеров не обойтись?

— Для подходов, основанных на структуре лигандов, обычно хватает обычных компьютеров. Иногда для более серьезных задач мы используем параллельные расчеты на нескольких компьютерах или графических процессорах. Пример: в 2020 г. во время пандемии COVID-19 европейские коллеги пригласили нас в проект Grand Challenge Against COVID-19. Нам предстояло провести виртуальный скрининг не менее 1 млрд структур (включая уже разрешенные лекарства) на три мишени, связанные с терапией COVID-19, причем используя три различных компьютерных метода. Суперкомпьютеры мы не задействовали, но справились с задачей за несколько дней. В проекте участвовали 130 команд со всего мира. Мы вошли в число 20 групп, чьи результаты были отобраны для синтеза и тестирования. Были синтезированы 36 предложенных нами молекул, и одна из них проявила активность против папаиноподобной протеазы вируса SARS-CoV-2. Всего по итогам проекта 28 молекул оказались активными, статья с более чем 100 авторами вошла в число наиболее цитируемых в журнале Molecular Informatics.

— Правда ли, что методы in silico, которым посвящено наше интервью, могут принести государству и здравоохранению триллионы рублей за счет того, что благодаря им можно значительно сократить лабораторные испытания?

— Здесь я могу сослаться на статью доктора химических наук Андрея Владимировича Погребняка (Пятигорский медико-фармацевтический институт — филиал Волгоградского государственного медицинского университета), который как раз писал, что использование ИИ даст триллионы долларов фармацевтической промышленности. На самом деле точно оценить, сколько принесет использование ИИ, довольно сложно, ведь мы находимся еще в начале пути. Но есть некоторые примеры, проливающие свет на этот вопрос. Так, специалисты международной компании Insilico Medicine сгенерировали на компьютере вещества для терапии идиопатического легочного фиброза, ускорив доклинические испытания в три раза. Это вещество пока находится во второй фазе клинических испытаний, то есть его эффективность еще не доказана окончательно.

На стадии доклиники методы in silico действительно помогают удешевить и ускорить процесс, а также снизить риск получения отрицательных результатов. Но затраты на вычислительную инфраструктуру тоже огромны: компании, разрабатывающие методы ИИ, скупают компьютерную память по всему миру, и за последнее время цены на нее выросли втрое!

Позитивные прогнозы невероятной экономической эффективности методов in silico часто исходят от заинтересованных фирм. Поэтому давайте подождем и убедимся сами, так ли это.

В кабинете В.В. Поройкова в НИИ биомедицинской химии им. В.Н. Ореховича. Фото: Елена Либрик / «Научная Россия»

В кабинете В.В. Поройкова в НИИ биомедицинской химии им. В.Н. Ореховича. Фото: Елена Либрик / «Научная Россия»

 

— Как происходит выбор целей исследований? Сосредоточены ли ученые на социально значимых недугах или работают в том числе и над редкими (орфанными) заболеваниями?

— Фармацевтическая промышленность традиционно не очень заинтересована в редких заболеваниях: рынок мал, и затраты могут не окупиться. Однако некоторые правительства стимулируют поиск препаратов для орфанных болезней. Компьютерные методы тоже привлекаются, имеется несколько примеров их вклада в решение проблемы редких болезней. Но есть объективные сложности: пациентов мало, они рассеяны по разным странам, трудно набрать статистически достоверные выборки для клинических испытаний. Кроме того, редкие заболевания бывают моногенными (одна мутация) и полигенными (множество причин). Персонализировать лечение под каждую причину — задача очень сложная.

Тем временем более 300 млн человек в мире страдают от редких заболеваний, и только для 5–6% из них есть лекарства. Исследования будут продолжаться, но добиться стремительного прогресса вряд ли удастся.

— Если редкие заболевания не в приоритете, то на что в основном что брошены все силы в этой области? Наверное, это борьба с раком?

— Действительно, фармацевтические компании больше заинтересованы в распространенных, социально значимых заболеваниях: сердечно-сосудистых, онкологических, неврологических, инфекционных. Этот рынок гораздо больше, и из-за этого подходы in silico также имеют соответствующий крен. Кроме того, экспериментальные методы тестирования тоже в основном разрабатываются для таких заболеваний.

— Кем прежде всего должен быть ученый, занимающийся компьютерным дизайном лекарств: биологом, физиком, математиком или всеми вместе?

— В первую очередь важна мультидисциплинарность. Есть два пути: собрать команду специалистов разного профиля или найти уникальных людей, сочетающих в себе знания химика, биолога, медика, математика. Таких мало, но они есть. Мой коллектив — это именно такая команда с взаимодополняющими компетенциями: химики, физики, математики и специалисты медико-биологического профиля, владеющие информационно-компьютерными технологиями. Я сам окончил физический факультет МГУ, кафедру биофизики. Вместе, как коллектив, мы можем сделать то, на что каждый по отдельности неспособен.

Оснащение рабочего места биохимика в лаборатории межмолекулярных взаимодействий НИИ биомедицинской химии им. В.Н. Ореховича. Фото: Елена Либрик / «Научная Россия»

Оснащение рабочего места биохимика в лаборатории межмолекулярных взаимодействий НИИ биомедицинской химии им. В.Н. Ореховича. Фото: Елена Либрик / «Научная Россия»

 

— Какой самый большой камень преткновения существует в вашей области? Может быть, не хватает мощностей компьютеров… или что-то иное?

— Компьютерная мощность — это технический предел. Но есть более важная, принципиальная проблема: для эффективного использования методов машинного обучения нужны высококачественные обучающие выборки. К сожалению, их качество не всегда высокое. Например, для противовирусного препарата «Ремдесивира» база данных содержала около 100 измерений полуэффективной концентрации с тысячекратным разбросом. А в большинстве публикаций данные измерены однократно, и неизвестно, насколько им можно верить. Кроме того, каждый исследователь создает свою тест-систему, считая ее лучшей. Возникает дрейф, и результаты из разных лабораторий становятся несопоставимыми.

Для методов ИИ нужны выборки из десятков тысяч соединений, протестированных в одинаковых условиях. Типичная же научная статья оперирует, как правило, не более чем 50–60 веществами. Поэтому классические методы машинного обучения часто работают лучше, чем нейросети. Нейросети могут «галлюцинировать», давать ложные результаты.

На 100% спрогнозировать биологическую активность нельзя. Поэтому компьютерные предсказания обязательно должны проверяться в экспериментах in vitro на животных и в конце концов в клинике.

Статистика такова: лишь 10% веществ, дошедших до клиники, проходят все испытания (для орфанных заболеваний — около 6%). Наша задача — снизить риск неудачи на поздних стадиях, когда уже потрачены огромные деньги.

— Чем сейчас занимается ваш отдел биоинформатики в Институте биомедицинской химии?

— В отделе несколько лабораторий. Моя лаборатория структурно-функционального конструирования лекарств сосредоточена на подходе, основанном на структуре лигандов. Есть молодежная лаборатория анализа больших данных для цифровой фармакологии, лаборатория структурной биоинформатики (молекулярное моделирование), лаборатория анализа постгеномных данных (транскриптомика, протеомика, метаболомика для поиска мишеней и биомаркеров). Раньше российская фарма обращала на нас мало внимания, заказчиками были в основном зарубежные компании. Но в последние годы мы выполнили около десяти договоров с российскими фармкомпаниями, и некоторые приходят к нам вновь. Из-за политики конфиденциальности я не могу раскрывать детали, но приведу один пример: компания предложила нам 15–20 молекул, мы выстроили приоритеты синтеза. Синтезировали только три, из них одна оказалась очень активной. Тогда заказчик отказался от остальных 17 и дал нам 15 аналогов активной молекулы для дальнейшей оценки. Это полностью оригинальная российская разработка, и в будущем эти соединения могут стать лекарствами.

— Есть ли что-то, о чем я не спросила, но что вы хотели бы донести до слушателей?

— Хочу подчеркнуть, что в нашем институте есть полный комплекс исследований: это не только in silico, но и лаборатории, где проверяют связывание молекул с мишенями на биосенсорах (in vitro). Есть сертифицированный производственный участок GMP, где нарабатывают лекарственные препараты. Например, разработанный в институте лекарственный препарат «Фосфоглив» в двух лекарственных формах (капсулы и инъекции), отмеченный премией Правительства Российской Федерации, уже продается в аптеках. Препарат «Витофосфолип» для лечения гиперхолестеринемии находится на завершающей стадии регистрации. Помимо этого, в институте создана универсальная фосфолипидная транспортная система. У встроенных в нее известных лекарственных соединений появляются новые свойства: улучшается растворимость в воде, повышается биодоступность, снижаются побочные эффекты. Таким образом, старым лекарствам может быть дана новая жизнь.

Мы оцениваем физико-химические характеристики веществ и отбираем те, которые лучше всего подходят для этой системы. Институт охватывает весь путь: от компьютерного дизайна до готовой лекарственной формы.

— А если говорить не об институте, а лично о вас: какая у вас научная мечта? Может быть, есть конкретное заболевание, от которого вы мечтаете создать лекарство?

— Изначально мы задумывали программу PASS для прогнозирования всех возможных видов биологической активности, а не только для одного заболевания. Поэтому у меня нет стремления ограничиться какой-то одной болезнью. Моя мечта — расширить наши информационные, вычислительные и человеческие ресурсы как основу для создания экосистемы, в рамках которой российские химики и фармакологи смогут эффективно разрабатывать лекарства для терапии самых разных и социально значимых, и редких заболеваний. Если бы это удалось реализовать, для меня это было бы счастьем.

Интервью проведено при поддержке Министерства науки и высшего образования РФ