Устройство от резидента Сколково считает информацию по губам

26 июля 2012 г.

Вас услышат даже если вы будете говорить шёпотом.

Сюжет о разработке компании резидента Сколково - ООО "РеалСпикер Лаб

В: Специалисты из Татарстана разработали систему, которая позволяет с максимальной точностью переводить речь в цифровой формат. К уже известной технологии обработки звука прибавили веб-камеру, которая фиксирует малейшее движение губ говорящего. Разработку уже поддержали в подмосковном Сколково. Но вот когда система заработает в привычных потребительских приборах, расскажет Полина Крикун.

КОР: Расшифровать речь без единой ошибки, теперь возможно. Достаточно установить на компьютер программу-анализатор и подключить самую простенькую веб-камеру. Дальше система работает в автономном режиме.

ВИКТОР ОСЕТРОВ (РУКОВОДИТЕЛЬ ПРОЕКТА REAL SPEAKER): Система позволяет идентифицировать диктора, находить его лицо, находить область губ и анализировать активно движение губ пользователя, за счет этого система фиксирует отдельные слова, выражения, предложения, и таким образом эти фрагменты отправляются для распознавания.

КОР: Это сейчас просто, когда программа работает, говорят молодые резиденты казанского IT-парка. Чтобы добиться результата им пришлось собрать миллионы лиц, скомпоновать мимику. Компьютер должен распознавать текст, вплоть до междометий и делать это за доли секунды.

АЙДАР ЗАМИРОВ (РАЗРАБОТЧИК REAL SPEAKER): У всех людей лицо и губы разные, нужно, чтобы... адаптация вот нужна под конкретного человека.

КОР: 5 миллионов на дальнейшую разработку. Такой контракт буквально на днях молодые специалисты заключили со Сколково. В разработчиков поверили, даже несмотря на обилие всевозможных переводчиков на мировом рынке. Слишком уж высок процент погрешности аудиоустройств.

ВИКТОР ОСЕТРОВ (РУКОВОДИТЕЛЬ ПРОЕКТА REAL SPEAKER): Система аудио распознавания речи неэффективны в шумной обстановке, на улице, когда общаются люди, когда включен телевизор, когда музыка работает. Наше решение направлено на увеличение точности распознавания за счет как раз помимо определения звуковой частоты голоса, также определение диктора по губам. <…>