Цунео Нитта (Tsuneo Nitta), профессор Юнгси Хорикава (Junsei Horikawa) и Шуньи Сугимото (Shunji Sugimoto) из Технологического университета Тоёхаси и Коичи Кацурада (Koichi Katsurada) из Токийского университета науки разработали технологию, которая может распознавать произносимые цифры от 0 до 9 с точностью до 90%, используя мозговые волны с помощью электроэнцефалограммы (ЭЭГ). Кроме того, технология позволяет распознавать 18 типов односложных японских сигналов с точностью 60%. Возможно, эта разработка станет основой «ЭЭГ-пишущей машинки». Подробности будут представлены на Interspeech 2017 в Стокгольме в августе.
До сих пор декодирование речи с помощью сигналов ЭЭГ встречалось с трудностями с получение достаточного объема данных для использования мощные алгоритмы, основанные на «глубоком обучении» или других типах машинного обучения. Исследовательская группа разработала другой метод, дающий возможность получить высокую производительность при использовании небольшого набора данных для обучения. Он основан на целостном распознавании образцов с использованием теории категорий или составного отображения, в котором вводятся двойное пространство и тензорное пространство, включающее внешнюю алгебру (aka алгебру Грассмана).
Профессор Нитта и его группа стремятся разработать интерфейс «мозг-компьютер», который распознает высказывания без озвучивания или речевых образов. Эта технология может позволить людям с ограниченными возможностями, которые потеряли способность общаться с помощью голоса, снова получить возможность ею пользоваться. Также ожидается, что технология также даст и здоровым людям самый естественный интерфейс без каких-либо ограничений.
Кроме того, исследовательская группа планирует в течение следующих пяти лет разработать устройство, которое может быть использовано при меньшем количестве электродов и быть подключено к смартфону.
[Фотография: Toyohashi University of Technology]