Ученые Санкт-Петербургского государственного университета разработали поляритонные нейроны для ультрабыстрых нейроморфных систем, способных распознавать рукописные цифры и голосовые команды эффективнее аналогов. Результаты исследования опубликованы в научном журнале Light: Science & Applications.

За короткий срок искусственные нейронные сети стали одним из ключевых драйверов технологического развития во всем мире. Они привлекают внимание специалистов и находят применение в широком перечне направлений, поскольку эффективно справляются с задачами распознавания образов, принятия решений и анализа больших объемов данных. Все это не только стимулирует, но и значительно ускоряет развитие здравоохранения, автономной робототехники и других отраслей.

Традиционные нейросети используют архитектуру фон Неймана — модель компьютерной структуры, где данные и программы хранятся в общей памяти, а обработка информации происходит последовательно через центральный процессор. Такая система налагает ряд ограничений, главное из которых связано с физическим разделением вычислительного и запоминающего блоков — центрального процессора и оперативной памяти. Это приводит к существенному снижению скорости обмена данными и увеличению энергопотребления. Именно поэтому ученые считают, что потенциал нейросетей раскрыт не до конца.

Руководитель лаборатории оптики спина Санкт-Петербургского государственного университета, главный научный сотрудник Университета Алексей Кавокин и старший научный сотрудник лаборатории Евгений Седов разработали нейроморфную архитектуру на основе двумерных решеток «световых капель», которая способна быстро и достоверно распознавать рукописные и голосовые команды.

«Строительными блоками для такой системы служат бозонные конденсаты экситон-поляритонов (или просто поляритоны — частицы, образованные при взаимодействии фотонов и экситонов, возбуждений в полупроводниках). Они обладают свойствами света и способны контактировать друг с другом, поэтому их иногда называют "квантами жидкого света". Когда поляритоны собираются вместе, они могут образовать особое коллективное состояние — конденсат Бозе — Эйнштейна. Если два таких конденсата находятся рядом, они начинают обмениваться частицами и создают узор из светлых и темных полос. Лазерный луч может изменить этот узор, превращая светлые полосы в темные — и наоборот. Это изменение используется как выходной сигнал, поэтому такие структуры работают как искусственные нейроны в нейронной сети», — рассказал Алексей Кавокин.

Предложенная физиками СПбГУ архитектура относится к классу бинарных нейросетей (Binary Neural Networks, BNN), работающих с двоичными входными и выходными сигналами нейронов. В отличие от традиционных решений, оперирующих непрерывными переменными, BNN быстрее обрабатывают информацию и требуют меньше памяти, чем обычные нейронные сети. Благодаря этому такие сети потребляют меньше энергии и лучше масштабируются. Эти особенности делают их подходящими для устройств с ограниченным энергоресурсом — например, для интернета вещей или периферийных вычислений, где важна скорость и эффективность, а высокая точность не так критична.

Данную архитектуру протестировали на основе решения двух задач. Первая из них заключается в распознавании рукописных цифр крупнейшей базы данных MNIST. Точность распознания системы, разработанной учеными СПбГУ, превысила 97,5%. Для оценки адаптивности и универсальности сети при работе с различными типами данных она была проверена на наборе Speech Commands для распознавания голосовых команд. Разработка ученых Санкт-Петербургского университета здесь также превзошла все существующие решения и методы.

 

Информация предоставлена пресс-службой СПбГУ

Источник фото: ru.123rf.com