Источник фото: ru.123rf.com

Ученые из Московского физико-технического института (МФТИ) сделали важный шаг в развитии нейроморфных систем, создав новую архитектуру нейронной сети на основе экситон-поляритонных конденсатов. Эта инновационная система показала впечатляющие результаты, превзойдя уже существующие поляритонные нейроморфные технологии. Результаты их работы опубликованы в журнале Light: Science & Applications.

С каждым годом искусственные нейронные сети и искусственный интеллект играют все более заметную роль в экономике, финансах, городской среде и других областях жизни общества. Однако традиционные нейронные сети сталкиваются с проблемами, связанными с ограниченной вычислительной скоростью и энергоэффективностью. В связи с этим растет интерес к нейроморфным системам, которые имитируют структуру и функциональность человеческого мозга.

Экситон-поляритоны — квазичастицы, представляющие собой «жидкий свет», открывают новые перспективы для создания эффективных нейроморфных систем. Они возникают в результате взаимодействия фотонов и экситонов, сочетая в себе свойства света и вещества. Их уникальные характеристики позволяют создавать высокоскоростные нейроморфные системы, способные обрабатывать информацию с невероятной эффективностью. Впервые термин «поляритонный нейрон» был введен в исследовании группы А.В. Кавокина (МФТИ), посвященном плоским волноводным структурам, которые передают когерентность поляритонов на большие расстояния (2008 год). Они стали основой для разработки бинарных логических вентилей на полупроводниковых микрорезонаторах, что, в свою очередь, открыло путь к нейроморфным вычислениям.

В своей работе, опубликованной в 2025 году, ученые из Международного центра теоретической физики им. А.А. Абрикосова МФТИ изучили решетку, состоящую из пар связанных поляритонных конденсатов, которыми можно управлять с помощью внешнего оптического воздействия.

Одним из ключевых аспектов новой архитектуры является использование оптической накачки для создания решеток поляритонов. Каждая область, где образуются поляритоны, формируется отдельным лазерным лучом, который не резонирует с ними и не «навязывает» им свою фазу. Это позволяет поляритонам независимо взаимодействовать друг с другом, обеспечивая согласованность между различными участками решетки. Лазерная накачка не только создает поляритоны, но и удерживает их в определенных местах, формируя эффективный потенциал.

Исследователи предложили применять пространственные модуляторы света (SLMs), которые позволяют точно управлять интенсивностью и распределением света. Это дает возможность контролировать расположение поляритонов и их взаимодействия в решетке, что значительно увеличивает эффективность системы.

Дизайн сети использует бинарную структуру, где каждый «нейрон» работает на основе пространственной когерентности парно связанных конденсатов и выполняет бинарные операции (то есть операции, которые имеют два возможных конечных состояния, например, 0 и 1). Структура решетки позволяет одновременно загружать и обрабатывать множество сигналов, что делает систему более эффективной и быстрой.

Исследователи стремились определить, как использование бинарных операций в таких сетях может улучшить вычислительную эффективность и масштабируемость по сравнению с традиционными нейронными сетями.

При разработке структуры нейронной сети ученые опирались на множество исследований, посвященных установлению и контролю пространственной когерентности в решетках поляритонных конденсатов.

Поляритонная диада — это пара поляритонных конденсатов, которые возбуждаются локализованными оптическими пучками в плоскости микрорезервуара и находятся на расстоянии d друг от друга. Возбуждение происходит в нерезонансном режиме, когда энергия возбуждающего пучка значительно выше энергии поляритона (на десятки мэВ). Описываемый процесс создает резервуар некогерентных высокоэнергетических экситонов, который питает поляритонный конденсат. Поддержка этого процесса осуществляется за счет стимулированного рассеяния квазичастиц, что приводит к понижению их энергии. Кроме того, резервуар экситонов создает потенциальный барьер для конденсата из-за сильного отталкивающего взаимодействия поляритонов с экситонами. Поляритоны, срок жизни которых может сокращаться в зависимости от добротности микрорезонатора, в основном локализуются вокруг пучка накачки, участвуя в режиме диссипативной задержки.

Однако в каждом конкретном конденсате поляритоны демонстрируют радиальное движение, вызванное их отталкиванием от потенциального барьера, созданного резервуаром. Связь и когерентность накапливаются в пределах диады конденсата благодаря быстрому распространению поляритонов, которые могут преодолевать расстояние между конденсатами.

Исследование показало, что новая нейроморфная сеть способна достигать высокой точности распознавания образов. Например, на наборе данных MNIST система продемонстрировала точность классификации до 97,5%. В распознавании голоса на наборе данных Speech Commands точность составила около 68% для подмножества из десяти классов, что также превзошло результаты существующих поляритонных нейроморфных систем.

«Наше исследование демонстрирует значительный потенциал экситон-поляритонных сетей как эффективных инструментов для сложных задач распознавания образов и обработки данных. В отличие от предыдущих подходов, где нелинейность возникала на уровне взаимодействия нейронов входного слоя, в нашей новой архитектуре входные нейроны не взаимодействуют друг с другом. Нелинейность достигается за счет взаимодействия между входными нейронами и нейронами в скрытом слое, что позволяет существенно увеличить скорость обработки информации, — объясняет Алексей Кавокин, директор Международного центра теоретической физики имени А. А. Абрикосова МФТИ. — Предложенная нами архитектура нейронной сети обладает значительными преимуществами, так как она позволяет объединить оба подхода для улучшения нелинейных взаимодействий между нейронами разных слоев. Интеграция была достигнута благодаря введению процедуры индентирования входного сигнала, что привело к рекордным показателям точности в поляритонных нейронных сетях, значительно превосходящим результаты ранее предложенных моделей».

Ученые также предложили несколько путей для дальнейшего улучшения архитектуры нейронных сетей. Например, добавление дополнительных скрытых слоев может повысить вычислительную мощность сети. Выходные сигналы из одного слоя могут использоваться в качестве шаблона для создания входных сигналов для следующего слоя. Кроме того, интегрированные оптические волноводы могут связывать нейроны между скрытыми слоями, что позволяет сохранить высокую скорость работы и использовать уникальные физические свойства поляритонов для быстрой передачи сигналов.

Изменение структуры сети с квадратной на шестиугольную решетку также может улучшить ее производительность, увеличивая количество нейронов, которые могут быть активированы каждым входным сигналом. Это усиливает структурную нелинейность сети и открывает новые возможности для ее применения. Замена логического элемента или на элемент исключающие или может добавить новый уровень нелинейности. Элемент исключающие или может переключать состояние каждого нейрона в ответ на парные входные сигналы, что добавляет динамичность в реакцию нейронов.

Кроме того, исследователи предложили учитывать непрерывные входные сигналы вместе с бинарными выходами, что позволит использовать изменяющиеся интенсивности сигналов для более тонкой настройки входных данных. Это значительно расширит пространство входных признаков, не теряя преимуществ бинарных систем, таких как низкая загрузка памяти и высокая скорость обработки.

Наконец, исследование контролируемых взаимодействий между нейронами, которые обычно рассматриваются как нежелательный эффект перекрестных связей, может быть использовано с пользой. Тщательно настраивая коэффициенты взаимодействия между парами нейронов, можно повысить устойчивость и точность всей сети.

Потенциальные приложения данной архитектуры многообразны. Это может включать улучшение распознавания образов, разработку более сложных нейроморфных систем и создание интеллектуальных помощников, использующих поляритонные технологии для обработки естественного языка. Исследования в этой области открывают новые горизонты для создания систем голосового управления с низкой задержкой и высокой точностью, а также для автоматизированных систем распознавания образов в медицинской диагностике.

Таким образом, работа ученых из МФТИ не только расширяет границы науки, но и открывает новые возможности для практического применения нейроморфных технологий в нашей повседневной жизни.

 

Информация предоставлена пресс-службой МФТИ

Источник фото: ru.123rf.com