Группа китайских ученых разработала новый алгоритм, который считывает жесты рук в режиме реального времени в точностью выше 93%, сообщает пресс-служба Общества оптики и фотоники SPIE. Подробно инновация описана в Journal of Electronic Imaging.

Новый алгоритм распознает разные типы ладоней. Сначала он пытается классифицировать тип: тонкая, нормальная или широкая – на основе трех измерений, учитывающих взаимосвязь между шириной ладони, ее длиной и длиной пальцев. После этого он сравнивает показанный жест с сохраненными образцами жестов того же типа руки. 

«Традиционные простые алгоритмы, как правило, страдают от низкой скорости распознавания, потому что они не могут справиться с разными типами ладоней. Сперва классифицируя вводный жест по типу ладони, а затем используя образцы библиотек, которые соответствуют этому типу, мы можем улучшить общую скорость распознавания с почти незначительным ресурсом потребления», – поясняют авторы работы.

Другая особенность нового алгоритма – распознавание в несколько этапов. На предварительном этапе он вычисляет площадь ладони, которая задействована, – и по ней выбирает три наиболее вероятных варианта жестов из возможных девяти. Далее алгоритм работает уже с этими тремя вариантами – и определяет нужный по более тонким признакам. Такой метод позволяет значительно сократить количество вычислений, экономит ресурсы машины и повышает скорость распознавания, не теряя качества. 

В тестовом эксперименте 40 добровольцев несколько раз сделали девять жестов руками, чтобы создать библиотеку образцов, и еще 40 добровольцев проверяли систему. В целом результаты показали, что алгоритм может распознавать жесты в реальном времени с точностью, превышающей 93%, даже если изображения вводных жестов перевернули, увеличили или уменьшили. 

[Фото: ZHANG ET AL]