Ученые придумали, как ускорить сетевой искусственный интеллект

04.12.2023 16:40

2529

Разработка международного коллектива исследователей увеличит быстродействие и качество рекомендательных систем, поисковых сервисов, онлайн-переводчиков и многих других программных комплексов, которые задействуют алгоритмы машинного обучения. Кроме того, новшество позволит снять нагрузку с пользовательских устройств (смартфонов, планшетов, компьютеров), которые участвуют в процессе.

Исследователи из Московского физико-технического института в соавторстве с коллегами из ОАЭ предложили решение, которое позволяет значительно улучшить производительность систем сетевого искусственного интеллекта и сократить расходы на их эксплуатацию. Результаты работ исследователи представили в качестве постерного доклада для публикации на конференции NeurIPS-2023. Это мировой форум по нейронным системам обработки информации, который пройдет в период с 10 по 16 декабря в Новом Орлеане, США.

Сетевые искусственные интеллекты — это программные комплексы, которые обладают способностью к обработке больших объемов данных и выявлению в них закономерностей. На основе этих умений они формируют рекомендации для принятия решений и предлагают ответы на различные задачи. Одно из главных преимуществ таких комплексов — их способность к самообучению и улучшению своих навыков с течением времени. Это позволяет им постоянно совершенствоваться и становиться более эффективными.

В настоящее время сетевые искусственные интеллекты применяют во многих отраслях промышленности и сферах общественной жизни. Например, их используют при анализе социальных сетей, в рекомендательных системах, в алгоритмах по распознаванию речи, в автоматических переводчиках и многих других приложениях.

Для развития таких комплексов специалисты используют алгоритмы машинного обучения. При этом результативность процесса во многом зависит от того, насколько оптимально выстроена коммуникация между устройствами конечных пользователей и серверами, на которых происходит обработка данных. Неэффективная коммуникация замедляет анализ и обновление моделей.

«С увеличением размера данных и моделей̆ сегодня требуется большее количество параллельных и распределенных вычислений для решения реальных задач машинного обучения. Между тем у распределенных подходов есть существенное узкое место — это стоимость коммуникаций», — прокомментировал предпосылки своей научной работы соавтор исследования, заведующий лабораторией фундаментальных исследований МФТИ — Яндекса Александр Безносиков.

Он добавил, что в основе машинного обучения находятся вариационные неравенства. Это математический инструмент, который вбирает в себя различные классы задач оптимизации. Такие задачи многим знакомы еще со школы. Например, в них находят минимальное значение некоторой целевой функции. В машинном обучении необходимо решать такие же, но значительно более сложные задачи.

«Большинство задач реального машинного обучения может быть представлено в виде вариационных неравенств. При этом основные способы, которые используют специалисты для уменьшения количества раундов связи и стоимости каждого раунда при решении вариационных неравенств распределенным образом, — это методы со сжатием посылок, методы, использующие похожесть локальных данных и методы локальных шагов», — рассказал Александр Безносиков.

Он пояснил, что первый из этих способов подразумевает пересылку не полного пакета информации, а только его части (например, пересылку случайной части посылки или округление чисел). Второй — основан на предположении, что если данные на вычислительных устройствах похожи, то для успешной коммуникации можно передавать только различия между ними. Третий способ ускоряет процесс машинного обучения за счет обновления данных на каждом узле перед обменом с другими узлами.

В некотором смысле, отметил специалист, второй и третий способы — противоположность первому. При сжатиях трафик снижается за счет уменьшения «посылок». А в подходах на основе схожести данных и локальных шагов стоимость обмена данными уменьшается, потому что коммуникации происходят реже.

По словам Александра Безносикова, каждый из перечисленных способов имеет свои преимущества и недостатки. Однако в исследовании ученые объединили три метода в один и получили мощный синергетический эффект.

«Суть нашего способа заключается в том, что на одном из устройств — условно, главном, некоем сервере — данные должны быть в некотором смысле похожи на те, которые имеются во всей сети. При этом на всех остальных устройствах данные могут быть сильно разнородными», — пояснил ученый.

По его словам, реализация такого способа позволяет ускорить сетевые коммуникации в десять раз по сравнению с базовыми алгоритмами и примерно в два раза по отношению к наиболее продвинутым из них. Кроме того, алгоритм хорош тем, что большинство вычислительных операций происходит на сервере. При этом пользовательские устройства (телефоны, планшеты и компьютеры) остаются незагруженными и, следовательно, могут спокойно выполнять свои прямые задачи.

Такой способ соотносится с одной из наиболее перспективных технологий машинного обучения — Federated learning (федеративным обучением). Эта методика подразумевает, что данные остаются на устройствах пользователей, а модель обновляется на сервере путем агрегации обученных моделей с различных устройств.

Александр Безносиков подчеркнул, что в ходе исследования новый метод был протестирован на простых экспериментальных задачах. В дальнейшем ученые намерены испытать его на более сложных программных комплексах. В том числе на языковых моделях — системах искусственного интеллекта, которые применяются для предсказания следующих слов и фраз на основе предыдущих.

Информация предоставлена Центром научной коммуникации МФТИ

Источник фото: ru.123rf.com

Разместила Наталья Сафронова

Информация предоставлена Информационным агентством "Научная Россия". Свидетельство о регистрации СМИ: ИА № ФС77-62580, выдано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций 31 июля 2015 года.

Партнеры

Показать всех

Карельский научный центр Российской академии наук

Государственная корпорация по атомной энергии "Росатом"

Физический Институт им. П.Н. Лебедева РАН (ФИАН)

Объединенный институт ядерных исследований

ФГУП Всероссийская государственная телевизионная и радиовещательная компания

Совет при Президенте по науке и образованию

Объединенный институт высоких температур РАН

Пермская научно-производственная приборостроительная компания

Национальный исследовательский Томский государственный университет

Федеральный исследовательский центр Институт прикладной физики Российской академии наук (ИПФ РАН)

Государственный геологический музей им. В.И. Вернадского Российской академии наук

Палеонтологический музей им. Ю.А. Орлова РАН

Наше мобильное приложение

Установить с RuStore

Мы в соцсетях

НАУКА ДЕТЯМ

Недавнее

Почему некоторые космические объекты похожи на снеговиков?

20:00 / Астрономия, Астрофизика

Рыбы-чистильщики демонстрируют характерные для млекопитающих когнитивные способности

19:30 / Биология

Рекордная высота снежного покрова за 72 года наблюдений зафиксирована в МГУ

17:00 / География

Композиты с ИИ: новый шаг к интеллектуальным материалам сделали уральские ученые

14:45 / Наука и общество, Физика

Новый подход к электроразведке на шельфе и в океане предложили новосибирские ученые

11:30 / Физика, Геология

Изображения в соцсетях помогают заполнить пробелы в данных о биоразнообразии

20:00 / Биология, Климат, Экология

Эритроциты поглощают сахар на большой высоте, защищая от диабета

19:30 / Биология, Медицина

Скрытый «орган» здоровья: как изучают микробиоту? Главное из заседания Совета РАН «Науки о жизни»

18:10 / Биология, Здравоохранение, Медицина

Ученые создали эффективные катализаторы для очистки воды с помощью солнечного света

17:30 / Физика

В МГУ научились более точно оценивать работу алгоритмов с базами данных

13:30 / Математика

Лекции

17.11.2025 14:00

2906

Проблемы зеленой энергетики. Лекция профессора МЭИ Михаила Тягунова

Какие глобальные энергетические системы существуют сегодня в мире и с какими сложностями приходится сталкиваться в ходе их реализации? Какие решения в этой области может предложить современная наука? В каких регионах России лучше всего развивать солнечную энергетику? В чем основное преимущество гибридных энергетических комплексов и гибридных накопительных систем?

Смотреть все