Когда и как образовалась наша Вселенная? Что было до Большого взрыва? По каким законам живут галактики? Как могут помочь ответить на эти вопросы цифровые технологии? Какие они дают преимущества и какие таят опасности? Об этом мы беседуем с профессором РАН Григорием Игоревичем Рубцовым, заместителем директора Института ядерных исследований РАН, заведующим молодежной лабораторией обработки больших данных.

Григорий Игоревич Рубцов. Фото Ольги Мерзляковой / Научная Россия

Григорий Игоревич Рубцов. Фото Ольги Мерзляковой / Научная Россия

 

Рубцов Григорий Игоревич — доктор физико-математических наук, профессор РАН, заместитель директора Института ядерных исследований РАН, заведующий молодежной лабораторией обработки больших данных. Среди научных интересов — изучение Вселенной с помощью цифровых технологий, в том числе измеренной спутниками WMAP и Planck карты температуры реликтового излучения. Лауреат Премии Правительства Москвы молодым ученым 2015 г., Медали Российской академии наук для молодых ученых 2013 г. Член Совета директоров международной коллаборации Telescope Array, член Японского физического общества.

— Вы руководите в ИЯИ РАН молодежной лабораторией обработки больших данных. Что это за данные?

— В конце 2018 г. при поддержке Министерства науки и высшего образования РФ в ИЯИ РАН была создана лаборатория обработки больших данных физики частиц и астрофизики, и я стал ее руководителем. Началось с того, что взяли на работу десять молодых ученых. С тех пор лаборатория значительно развилась, было получено много научных результатов. Приходят новые люди.

Дело в том, что в физике произошла смена парадигмы. Если раньше ученый записывал наблюдения, потом делал простые вычисления и получал результат, то сейчас мы имеем дело с данными такого объема и такой сложности, что их обработка стала не просто технической работой, а отдельной областью знания. Причем качество обработки данных влияет на качество результата. Если мы обработаем данные с помощью более сильных алгоритмов, мы добьемся большей точности экспериментов. Возникает выбор: мы строим либо более дорогой эксперимент, либо чуть менее масштабный, но при этом совершенствуем методы так, чтобы с их помощью достигнуть большей точности восстановления информации о тех частицах, которые в этом эксперименте регистрируются.

— Что вы регистрируете?

— У нас широкая группа экспериментов. Например, могу сказать об экспериментах по астрофизике частиц в Баксанской нейтринной обсерватории ИЯИ РАН, об установке «Ковер-3» или телескопе Array в США. Мы также работаем с установкой TAIGA в Республике Бурятия. ИЯИ РАН совместно с ОИЯИ и другими научными организациями проводит эксперимент масштаба мегасайенс «Байкальский нейтринный телескоп», который регистрирует нейтрино высоких энергий. По своей методике он похож на эксперименты, которые регистрируют космические лучи, только сложнее, потому что в этом эксперименте под водой находится трехмерная система оптических модулей. А установки, регистрирующие космические лучи, обычно покрывают Землю и содержат на поверхности двумерную систему регистрирующих модулей. Мы сразу определили для себя задачу: для всех экспериментов, которые проводят в нашем институте и, возможно, для других (мы работаем, в частности, с ОИЯИ), будут разработаны алгоритмы, которые улучшат существующую точность.

— Почему это стало возможным?

— Люди давно мечтали о машинном обучении, о том, что роботы станут заменять их на какой-то работе. И этот момент настал.

— Люди так ленятся делать эту работу или в этом есть необходимость?

— Дело в том, что люди — не очень хорошие вычислители. Я за секунду могу умножить какие-то два двузначных числа, и то это довольно сложно сделать в уме. А машина может за секунду произвести миллиард таких операций даже с самым простым процессором, который находится в мобильном телефоне. У нас сейчас в распоряжении современные системы на базе видеокарт, которые изначально были сделаны для 3D-графики. Но есть и специализированные устройства, это уже триллионы операций в секунду. Когда имеется большой объем данных, то выполнить эту работу вручную совершенно невозможно.

Более того. Человек обладает низкой прямой вычислительной способностью, но у него есть сильные ассоциативные способности: он может видеть закономерности. Но если у нас в данных триллионы чисел, то человеку очень трудно увидеть в них закономерность просто потому, что он даже не может охватить в памяти этот объем данных.

— Наверняка создать алгоритмы, которые все это могут, было совсем не просто…

— Конечно, люди работали над этим очень долго. Еще в XIX в. была предложена модель мозга как системы нейронов, потом была разработана некая радиотехническая модель нейронной сети, но она не обучалась. Резкий скачок, прогресс произошел в 1986 г., когда с участием Джеффри Хинтона, который в этом году получил Нобелевскую премию по физике, был разработан алгоритм обратного распространения ошибок, позволивший обучить нейронную сеть, причем достаточно быстро. В 1986 г. было показано, что компьютер различает написанные рукой цифры, и к началу 1990-х гг. были сделаны первые алгоритмы.

Но все это достигло промышленных масштабов в 2000-х гг. Тогда мы получили грант РНФ на машинное обучение, я был руководителем этой научной группы. Мы с коллегами — ведущим научным сотрудником отдела теоретической физики ИЯИ РАН профессором РАН Олегом Евгеньевичем Калашевым, заведующим отделом радиоастрономии ГАИШ МГУ профессором РАН Максимом Сергеевичем Пширковым и научным сотрудником лаборатории обработки больших данных ИЯИ РАН Иваном Вячеславовичем Харуком — ведем спецкурс по методам машинного обучения для старшего курса студентов физического факультета МГУ. Мы одни из первых, кто ведет такой курс. Сейчас, наверное, почти во всех университетах есть такой курс, потому что тема очень актуальная и нужная. Мы начали его вести с 2017 г. и постоянно развиваем. Каждый год курс должен быть немного другим, потому что технологии, представления и знания развиваются очень быстро, хотя база одна и та же.

Эта база и легла в основу лаборатории. Если есть понимание, как устроены и как работают алгоритмы, то мы можем взять существующие данные из экспериментов и улучшить точность. Например, наш алгоритм для Байкальского нейтринного телескопа позволяет отличить сигнальные события от шумовых.

— Что такое сигнальное событие?

— Начну немного издалека. Байкальский нейтринный телескоп — это установка крупного масштаба. Огромный объем воды на глубине около 1 км используется как действующее вещество, как основное тело детектора. В эту воду погружены оптические модули.

— В соседнем зале как раз идет работа над усовершенствованием этих систем, которые потом будут погружены под воду.

— Да, там идут производство и разработка новых технологий, более совершенных и качественных оптических модулей, потому что технология очень сложная. На глубине 1 км давление в 100 атмосфер, они должны не только находиться там, но и передавать информацию, а значит, должны быть разъемы, которые не будут протекать при таком давлении. Установка рассчитана на десятилетия работы, поэтому технологии отрабатываются в ИЯИ с большим вниманием. Над ней работали около 40 лет, пока добились того, что есть сейчас. Когда мы получаем данные, каждое событие стоит очень много. Про некоторые события можно сказать, что каждое из них обошлось в несколько миллионов рублей.

— А что это за события?

— Установка нужна для регистрации нейтрино высоких энергий, которые пришли к нам из очень далеких источников.

— Иначе говоря, это галактические нейтрино?

— Это могут быть галактические или экстрагалактические нейтрино. Это нейтрино происхождением либо из нашей Галактики, либо из других галактик — в том числе далеких, более мощных, где в центре находится сверхтяжелая черная дыра и которые обладают очень мощной способностью излучать частицы больших энергий. Такие нейтрино приходят крайне редко. На Байкальском нейтринном телескопе это буквально порядка десятка событий в год.

Григорий Игоревич Рубцов. Фото Ольги Мерзляковой / Научная Россия

Григорий Игоревич Рубцов. Фото Ольги Мерзляковой / Научная Россия

 

— Почему так важно получать информацию о нейтрино, которые приходят из отдаленных галактик?

— Нейтрино — это единственная частица, которая может прийти, не поглощаясь, из некоторых мест, например из окрестностей черной дыры или от взрыва сверхновой. Она может нести информацию о самом взрыве, а не о том, что произошло потом, из тех областей, где плотность материи и излучение так велики, что другие частицы не проходят. Мы про многие явления природы не можем узнать по-другому, кроме как зарегистрировав нейтрино. Это уникальный носитель информации. На Земле мы ограничены размерами ускорителей. А в космосе есть гораздо более масштабные объекты, которые фактически представляют собой такие ускорители. Если они становятся нашими экспериментами, тогда мы, по сути, выходим на новый уровень познания.

— А что за объекты в космосе?

— Это разные катастрофические события, например взрыв сверхновой или слияние двойной системы, или сверхмассивные черные дыры, джеты блазаров, то есть большие потоки заряженных частиц, которые образуются вблизи сверхмассивных черных дыр. Эти явления огромны по энергии, по своим масштабам. Некоторые из них могут действовать только короткое время, поэтому, если мы все это считаем своими экспериментами, своей лабораторией, то наши возможности будут простираться очень далеко.

— Какие вы самонадеянные!

— Физика для нас — это набор законов. Хотя на самом деле это не совсем так. Это в математике аксиомы и постулаты, а в физике законы имеют эмпирический характер, выводятся из эксперимента. Когда был открыт закон Ньютона, произошел большой прорыв. Поняли, что есть инерциальная система отсчета и закон сложения скоростей, а потом оказалось, что существуют пределы применимости теории Ньютона. Были открыты преобразования Лоренца и специальная теория относительности Эйнштейна, которые противоречат теории Ньютона и показывают, что при больших скоростях тела двигаются не так и закон сложения скоростей имеет принципиально другой вид.

Но сейчас мы думаем о том, что, наверное, фундаментальный закон симметрии Лоренца на более высоких энергиях может перестать действовать. Пока что у нас нет квантовой гравитации, теории при больших энергиях. Поэтому мы можем предполагать, что эта теория устроена как-то по-другому. Может оказаться, что гравитационная теория и теория относительности нарушаются при каких-то больших скоростях. Физик ничему не должен верить на слово. Если в учебнике написано, что преобразование действует при любой скорости, то физик должен уточнить: а при каких скоростях это проверили? Но оказывается, что до недавних времен это проверялось только на ускорителях. Это десятки тераэлектронвольт. А потом стало понятно, что проверка с помощью космических излучений и частиц более высоких энергий может сказать об этих фундаментальных законах гораздо больше. Надо сказать, что мы очень сильно продвинулись в понимании того, насколько далеко действует симметрия Лоренца, насколько эта симметрия справедлива, именно благодаря космическим лучам самых высоких энергий. Это вторая интересная тема, которой занимается наша лаборатория.

— Поговорим про машинное обучение. Без него, как я понимаю, в науке сегодня невозможно развиваться?

— Машинное обучение — это инструмент. Не надо его идеализировать. Когда мы писали грант РНФ, у нас был отзыв рецензента с критикой. Нам написал рецензент, специалист в машинном обучении: Machine learning is not a magic — «Машинное обучение — не магия».

— А что вы такого написали, побудившее его дать такой отзыв?

— Мы написали, что возьмем методы машинного обучения, которые сейчас стали доступными, и применим к тем экспериментам, которые уже есть, с которыми живем и работаем: по космическим лучам, в том числе гамма-астрономии. Конечно, он прав в том, что это не магическая вещь, решающая все проблемы, но это очень сильный инструмент, который нельзя игнорировать. До появления телескопов тоже были открытия, но в основной части открытий использовали телескоп. И не потому, что телескоп — это волшебство. Это инструмент, который очень сильно расширяет наши возможности. Машинное обучение — также инструмент, усиливающий возможность обработки больших данных. А сейчас все эксперименты должны быть очень большими, объемными. У них много каналов записи информации, это тысячи, десятки и сотни тысяч каналов. Конечно, для обработки таких данных обязательно нужны методы машинного обучения, мощные компьютеры и очень сложные алгоритмы. Это необходимый инструмент, который сейчас как рабочая вещь используется во всех крупных экспериментах в России и в мире.

— Ясно, что эти технологии будут совершенствоваться и ученые смогут получать все больше возможностей с помощью машинного обучения. Наступит ли момент, когда не получится двигаться дальше? Существует ли предел познания?

— До сих пор строятся более мощные телескопы. Поэтому я думаю, что предел познаний для человека очень подвижен. Когда людям кажется, что уже все понятно, приходит кто-то, кто смотрит по-новому и предлагает какой-то еще подход. Эта область только сейчас вступила в стадию бурного развития. Я думаю, что у нее очень долгий путь. Конечно, будут и другие подходы, новые большие прорывы, но этот инструмент останется. Он будет совершенствоваться, и мы будем узнавать о нем какие-то новые вещи. Я думаю, что через десятки лет будут продолжаться открытия, связанные именно с машинным обучением.

— Как вы считаете, есть ли у человека какие-то преимущества, в которых искусственный интеллект никогда за ним не угонится?

— Мне кажется, что самое сильное преимущество перед ИИ, где он нас никогда не догонит, — это любовь к жизни, стремление жить, обязательно выжить, продолжить свой род. У нас все-таки миллиарды лет эволюции, которые сделали нас оптимальными, начиная от простейших и заканчивая человеком. Человек — не такая уж давняя история, но он ступень на длинном пути эволюции организмов, которые также тренировались в выживании. Очень многие сильные организмы, будто бы хорошо выживающие, трилобиты, например, вымерли, а человек остался. И мне кажется, что в этом сила, которую мы не можем передать ИИ. У него не будет такого стремления. У него нет мотивации. Даже если ему в алгоритме это написать.

— Но ведь можно в алгоритм заложить мотивацию, любопытство, что-то типа интуиции?

— В алгоритмы это напрямую не закладывается. Можно научить побеждать на конкурсе стихов, например, чтобы он старался читать такие стихи, которые победят на конкурсе. Машины учатся тому, какую задачу им поставили. Конечно, можно сделать из них агентов, которые будут действовать как люди. Они будут двигаться, распоряжаться деньгами, заниматься какой-то деятельностью. Но они все равно будут привязаны к тому, что их чему-то обучили. У них нет природной силы, страсти, которая движет людьми и которая позволяет людям добиться всего, чего они добились. Мне кажется, что в этом должно быть наше преимущество, которое мы не можем передать машинам.

Григорий Игоревич Рубцов. Фото Ольги Мерзляковой / Научная Россия

Григорий Игоревич Рубцов. Фото Ольги Мерзляковой / Научная Россия

 

— Есть ли опасности, исходящие из машинного обучения?

— Физика вообще работает с опасностью. Везде пишут: «Осторожно, высокое напряжение!», «Опасно, радиация!» Все, что мы делаем, опасно.

— Процесс познания как таковой опасен.

— В принципе любая деятельность. Самая опасная вещь в лаборатории — стремянка. С ней больше всего производственных аварий. Даже простой инструмент может быть опасен в определенных случаях, а ИИ — это очень мощный инструмент. Если ИИ, который реально универсален, многое может, то, конечно, он может оказаться опасным. Мы говорим о том, что это инструмент в руках человека. Поэтому он опасен при условии использования в целях совершения преступлений. В этом смысле это еще один инструмент — как топор у Ф.М. Достоевского.

— Как вы думаете, у человечества получится предотвратить такого рода опасности?

— С топором не получилось. Со стремянкой — тоже. Но, думаю, этому будет уделено большое внимание. Естественно, когда у вас есть ИИ, это же автоматы, роботы, машины, которые могут двигаться сами по заложенной в них программе. Это, по сути, топор, который самостоятельно передвигается. Но люди так или иначе будут регулировать эту область. Эта область юридически более сложная: если раньше преступление начиналось там, где кто-то взял в руку топор и задумал недоброе, то сейчас преступления будут другие — когда этот топор двигается по определенной программе. Все это дает новые, колоссальные возможности для юристов приобрести опыт в этой теме. Это новая быстро развивающаяся тема, которая будет широко востребована. Сейчас во всех странах обсуждается законодательство по этой части.

Но это не то машинное обучение, которое используют физики. Мы применяем его к данным. Оно работает с числами и выдает на выходе число. Оно не может навредить, как та же логарифмическая линейка, если ей никого не ударить по голове. Поэтому то, что мы делаем в физике, — это самое безопасное применение алгоритмов, хотя мы понимаем, что это мощные инструменты.

— Какие фундаментальные законы физики вы бы хотели понять с помощью этих алгоритмов? Что лично для вас научная мечта?

— Моя мечта — открыть происхождение космических лучей предельно высоких энергий. Понять, как они происходят, как образуются частицы с энергией порядка 1020 эВ.

— А это неизвестно?

— Неизвестно до сих пор. Мы получили очень важные результаты в этой области. В 2023 г. мы в составе международной коллаборации Telescope Array опубликовали статью в Science, в которой описали обнаружение одной из самых высокоэнергичных из зарегистрированных в истории частиц — частицу с энергией 2,4 * 1020 эВ. Событие назвали «частица Аматерасу» в честь японской богини Солнца. Это популистский подход, но даже ученые называют ее именно так. С помощью нейронных сетей мы смогли установить, что это не гамма-квант. Это частица адронной природы — либо протон, либо ядро какого-то химического элемента. И дальше мы смогли установить, что, вероятно, это тяжелое ядро — такое, как ядро железа. Последний результат требует дополнительного подтверждения. Проблема в том, что в той области неба, из которой пришла эта частица, мы не видим известных нам достаточно близких, ярких источников. Как только мы поймем природу происхождения таких частиц, мы сразу узнаем физику на энергиях, на несколько порядков превышающих энергии, достижимые на БАКе. И, возможно, мы обнаружим какие-то новые фундаментальные законы, которые могут изменить в будущем наши технологии.

— Если вы не видите источник, откуда же берутся эти бешеные энергии? Что это может быть — параллельная Вселенная или темная материя?

— Есть разные гипотезы. Одна из гипотез — это распад сверхтяжелой темной материи. Эта гипотеза почти исключена из-за того, что это не гамма-квант, а адронная частица. С помощью нашей адронной сети мы смогли данную гипотезу сделать не предпочтительной. Скорее всего, это какие-то катастрофические события: либо взрывы сверхновых, либо какие-то сильно отличающиеся от обычных аномальные магнитары с огромными магнитными и электрическими полями. Такие магнитары могут появляться в галактиках и существовать некоторое небольшое время. Они могут быть источниками.

Другая загадка, моя вторая мечта — понять, какие магнитные поля между галактиками. Дело в том, что между галактиками почти пустое пространство. Но там есть магнитные поля. Причем они огромны по масштабу. Это турбулентные поля с колмогоровским спектром, которые имеют случайный характер. И никто не может их измерить. Считается, что, согласно современным данным, эти поля есть, но диапазон их амплитуды от 10-15 гауссов до 10-9 гауссов, то есть шесть порядков по величине! Никто не знает, какого они масштаба, как образовались. Предполагают, что они возникли либо в ранней Вселенной, когда появлялись галактики, либо позже. Но масштаб и пустота внегалактического пространства настолько громадны, что сейчас наполнить это пространство магнитными полями — это неподъемная задача, даже несмотря на множество катастрофических процессов, которые протекают во Вселенной. Решение вопроса может пролить свет на происхождение Вселенной и наших галактик.

— Вы сказали, что в вашей молодежной лаборатории работают десять человек. Что это за люди?

— Мы провели внутренний конкурс в институте, отобрали людей на уровне аспирантуры, достаточно сильных, чтобы они могли в течение трех лет защититься. Конкурс был больше двух человек на место. Специалисты такого уровня — вообще «штучный товар», сейчас очень серьезная нехватка кадров, идет борьба между организациями за талантливых молодых людей. Поэтому, когда мы смогли найти и принять их на работу, были очень рады. Мы продолжаем принимать новых людей, у нас бóльшая часть сотрудников защитили диссертации, сейчас это кандидаты наук, которые уже обладают высокой квалификацией и ведут самостоятельную научную работу. Например, научный сотрудник лаборатории Иван Вячеславович Харук руководит проектом Российского научного фонда по внедрению нейронных сетей в анализ данных Байкальского нейтринного телескопа. Старший научный сотрудник лаборатории Михаил Юрьевич Кузнецов занимается обработкой данных экспериментов KASCADE и Telescope Array, получил ряд известных в мире результатов по происхождению космических лучей, по их составу. Результаты лаборатории обработки больших данных ИЯИ РАН звучат на ключевых российских и международных конференциях. Самые серьезные результаты у нас, конечно, впереди.

— В какой области вы ожидаете результатов?

— Я думаю, что это будут результаты по космическим лучам ультравысоких энергий. Мы должны наконец узнать окончательный состав и найти источники этих лучей. Мы должны в рамках коллаборации Baikal-GVD, в которую входят ИЯИ РАН, ОИЯИ, ИГУ, МГУ и другие научные организации, определить источники нейтрино сверхвысоких энергий, понять, какая их часть имеет галактическое происхождение, а какая — внегалактическое. Для этого нужен более сильный и точный анализ, и машинное обучение тут поможет.

У нас ведутся исследования по магнитным полям в ранней Вселенной, по космологии, по моделям гравитации: как можно модифицировать гравитацию, объяснить рождение нашей Вселенной, само ее существование.

— Как же объяснить существование нашей Вселенной?

— Дело в том, что мы наблюдаем Вселенную с помощью многих телескопов и в целом понимаем, как она устроена. Сейчас ее возраст — около 13–14 млрд лет. С возраста Вселенной 300 тыс. лет она относительно прозрачна, и мы ее видим. Карта реликтового излучения — это практически фотография Вселенной в том возрасте. Если говорить о более ранних временах, то с помощью свойств наблюдаемого реликтового излучения мы понимаем динамику плазмы и то, как все было устроено в «первые три минуты», когда происходил нуклеосинтез, синтез первичных элементов из нейтронов и протонов, образовывался гелий. Мы понимаем это довольно хорошо.

Но что происходило до этой горячей стадии? Большой взрыв — этим словосочетанием называют более позднюю эволюцию, начиная с нескольких секунд или долей секунды. А то, что происходило в первые аттосекунды, когда Вселенная должна была иметь планковские плотности, этого мы не знаем. Это как-то странно. Как она могла иметь планковские плотности? Есть разные механизмы — механизм инфляции, альтернативные механизмы, один из которых — механизм конформного скатывания — был предложен академиком Валерием Анатольевичем Рубаковым. Во всех этих механизмах есть разные предсказания. Мы сейчас обрабатываем данные спутника по реликтовому излучению и можем различить разные процессы, которые происходили именно в первые аттосекунды жизни Вселенной. А если мы вернемся к фундаментальным проблемам, тогда надо будет задать вопрос: «Как же она возникла из ничего?»

— Вопрос, который приходит на ум даже дилетанту. Что было раньше 10 млрд лет назад? Ничего не было? А ничего — это как?

— Эти вопросы задавали еще Аврелий Августин и Луций Сенека. Существование вещей — насколько оно вечно? У них был выработан ответ: они говорили, что Бог существует вечно, а предметы материального мира таким качеством не обладают, а значит, когда-то возникли и когда-то исчезнут. Не для всех это исчерпывающий ответ. Поэтому рассматриваются такие модели, в которых Вселенная не родилась из точки: она существовала до того, потом сжималась, а потом стала снова расширяться.

— И так все время?

— Да. Таким образом она может существовать вечно. Но чтобы построить такое решение, которое называют решением типа отскока, нужно модифицировать теорию гравитации. Этим направлением занимается научный сотрудник лаборатории Виктория Евгеньевна Волкова. В ближайшее время можно ожидать новых интересных результатов.