Исследователи EPFL (Швейцария) создали программируемую структуру, которая решает ключевую проблему в системах искусственного интеллекта на основе оптики. В серии экспериментов по классификации изображений был использован рассеянный свет маломощного лазера для выполнения точных и масштабируемых вычислений с использованием лишь малой части энергии электроники. Результаты исследования опубликованы в журнале Nature Photonics.
По мере роста размеров и влияния цифровых систем ИИ увеличивается и количество энергии, необходимой для его обучения, не говоря уже о сопутствующих выбросах углекислого газа. Недавние исследования показывают, что если производство серверов ИИ будет продолжаться нынешними темпами, то к 2027 году их годовое потребление энергии может превысить потребление небольшой страны. Глубокие нейронные сети, созданные на основе архитектуры человеческого мозга, особенно энергоемки из-за миллионов или даже миллиардов связей между несколькими слоями нейроноподобных процессоров.
Чтобы противостоять растущему спросу на энергию, исследователи удвоили усилия по внедрению оптических вычислительных систем, которые экспериментально существуют с 1980-х годов. Для обработки данных в этих системах используются фотоны, и хотя теоретически свет может использоваться для выполнения вычислений гораздо быстрее и эффективнее электронов, одна ключевая проблема мешает оптическим системам превзойти электронную технику.
«Чтобы классифицировать данные в нейронной сети, каждый узел, или “нейрон”, должен принять “решение” — срабатывать или нет, основываясь на взвешенных входных данных. Это решение приводит к так называемому нелинейному преобразованию данных, то есть выходной сигнал не прямо пропорционален входному», — говорит Кристоф Мозер, руководитель лаборатории прикладных фотонных устройств инженерной школы EPFL.
Мозер объясняет, что если цифровые нейронные сети могут легко выполнять нелинейные преобразования с помощью транзисторов, то в оптических системах для этого требуются очень мощные лазеры. Ученые разработали энергоэффективный метод выполнения нелинейных вычислений оптическим путем. Новый подход предполагает кодирование данных, таких как пиксели изображения, в пространственной модуляции маломощного лазерного луча. Луч несколько раз отражается от самого себя, что приводит к нелинейному умножению пикселей.
«Эксперименты по классификации изображений на трех различных наборах данных показали, что наш метод масштабируется и до 1000 раз более энергоэффективен, чем современные глубокие цифровые сети, что делает его перспективной платформой для реализации оптических нейронных сетей», — говорит Псалтис, автор работы.
В природе фотоны не взаимодействуют друг с другом напрямую, как это делают заряженные электроны. Поэтому для достижения нелинейных преобразований в оптических системах ученым приходится «заставлять» фотоны взаимодействовать опосредованно, например, используя достаточно интенсивный свет, чтобы изменить оптические свойства стекла или другого материала, через который он проходит.
Исследователи обошли необходимость в мощном лазере с помощью простого решения: они закодировали пиксели изображения пространственно на поверхности маломощного лазерного луча. Выполнив это кодирование дважды, путем изменения траектории луча в кодере, пиксели умножаются сами на себя, т.е. возводятся в квадрат. Поскольку возведение в квадрат является нелинейным преобразованием, эта структурная модификация позволяет добиться нелинейности, необходимой для вычислений нейронной сети, при меньших затратах энергии. Такое кодирование можно проводить два, три или даже десять раз, увеличивая нелинейность преобразования и точность вычислений.
«По нашим оценкам, при использовании этой системы энергия, необходимая для оптического вычисления умножения, на восемь порядков меньше, чем при использовании электронной», — говорит Псалтис.
Ученые подчеркивают, что масштабируемость их подхода с низким энергопотреблением является главным преимуществом, поскольку конечной целью было бы использование гибридных электронно-оптических систем для снижения энергопотребления цифровых нейронных сетей. Однако для достижения такого масштаба необходимы дальнейшие инженерные исследования. Например, поскольку в оптических системах используется иное оборудование, чем в электронных, следующим шагом, над которым уже работают ученые, станет разработка компилятора для перевода цифровых данных в код, который смогут использовать оптические системы.
[Фото: Alain Herzog / EPFL]