Материалы портала «Научная Россия»

Microsoft создаст голосовой переводчик

Microsoft создаст голосовой переводчик
Лидер мировой ИТ-индустрии работает над программой перевода речи с сохранением голоса

Корпорация Microsoft работает над технологией, которая позволяет распознавать речь, переводить её на другой язык и воспроизводить на новом языке с сохранением особенностей голоса говорящего; как сообщает РИА Новости, об этом написал в корпоративном блоге директор Microsoft по разработкам Рик Рашид (Rick Rashid).

Рашид впервые продемонстрировал работу технологии, выступая на презентации в Китае. Сперва его речь на мероприятии распознавалась в реальном времени и выводилась на экран в виде обновляемого текста на английском языке. Далее он показал, что новая программная технология Microsoft позволяет переводить содержание этой речи на китайский язык с учётом его лексических и грамматических особенностей – при этом перевод шёл также в реальном времени.

Наконец, финальным этапом стал собственно голосовой перевод: Рашид произносил предложение на английском языке, а программа воспроизводила его на китайском с сохранением особенностей голоса топ-менеджера Microsoft.

«Наиболее значительным является то, что мы добились важной цели – смогли позволить англоговорящему человеку, подобному мне, провести презентацию на китайском, сохраняя свой голос», – отмечает Рашид.

По его словам, компания-пионер мировой ИТ-индустрии ведёт разработки в этой области совместно с университетом Торонто около двух лет. В то же время, несмотря на достигнутые успехи, «машина» по-прежнему делает ошибки в одном слове из 7-8.

«Результаты по-прежнему не идеальны, и предстоит серьёзная работа в этой области, однако технология является весьма многообещающей. Мы надеемся, что через несколько лет у нас будут системы, которые смогут полностью разрушить языковые барьеры», – заявил Рашид.

Когда технология распознавания и перевода речи с сохранением голоса поступит в коммерческое использование, и поступит ли вообще, топ-менеджер Microsoft не уточнил.

По мнению обозревателей, подобная технология может быть востребована среди туристов, однако не найдёт применения в сфере бизнес-переговоров, где важны интонация и другие нюансы речи.

Распознавание устной речи и перевод её в текстовый формат – одна из важнейших проблем, занимающих сегодня разработчиков программного обеспечения. Над соответствующими технологиями и способами их применения, помимо Microsoft, работают компании Apple (система голосового управления Siri), Samsung (голосовой помощник S Voice), Google и другие. В частности, сервис Google Translate позволяет ввести нужное слово или выражение при помощи голоса и прослушать перевод на нужном языке (правда, эта функция доступна не для всех языков, имеющихся в переводчике).

apple google microsoft информационные технологии перевод распознавание речи языки мира

Назад

Социальные сети

Комментарии

Авторизуйтесь, чтобы оставить комментарий