08 Ноября 2012 | 14:00

Субтитры на федеральных каналах будет писать робот

Объявлен конкурс на создание системы распознавания речи и трансляции и автоматической подготовки скрытых субтитров

Картинка Субтитры на федеральных каналах будет писать робот

Через два года на федеральных телеканалах должна заработать система распознавания речи. Благодаря ей удастся обеспечить субтитрами практически все передачи, по крайней мере новостные. Однако специалисты высказывают опасения, что в эфир вместо субтитров на русском языке пойдут «крякозябры», ведь технология, которая могла бы полноценно передавать устную речь в письменной форме, пока не изобретена.

Правительство готово выделить 317 млн рублей на создание аппаратно-программного комплекса, который будет автоматически в реальном времени выдавать скрытые субтитры на общероссийские обязательные общедоступные телеканалы. Причем речь пока идет только об опытной модели. Далее последует заказ на промышленный образец. В итоге объемы видео, доступного для слабослышащих или глухих зрителей, на федеральных каналах должны значительно возрасти. Заказчиком разработки, конкурс на которую на днях был объявлен на сайте госзакупок, выступает Министерство связи и массовых коммуникаций. Работы выполняются в рамках ФЦП «Доступная среда» на 2011–2015 годы.

Скрытые субтитры отличаются от обычных возможностью их отключения.

По сути исполнителям госзаказа предстоит создать настоящую интеллектуальную систему — робот будет не просто слушать и расшифровывать все подряд, а анализировать эфир. Программа отследит изменения акустической обстановки в том месте, откуда ведет передачу новостной или спортивный комментатор, автоматически оценит соотношение «сигнал/шум» и время реверберации, найдет участки, записанные с перегрузкой, распознает музыку и тональные помехи. После этого классифицирует аудиосигнал и передаст в систему распознавания речи только голосовую часть информации. Таким образом будет исключена ошибочная обработка информации.

Более того, программа будет определять точки смены диктора в диалоге, обеспечивая читаемость субтитров «по ролям». Предусмотрено и автоматическое определение тематики телевизионного сюжета для подключения соответствующих словарей и языковых моделей.

— Сейчас субтитры готовят редакторы, часть текста они получают от редакции, но приходится его корректировать, так как в эфире бывают неожиданности, замены, исправления и т.п. Программа значительно упростила бы труд этих редакторов, увеличилось бы число передач с субтитрами. Но отказаться от обслуживающего персонала полностью все равно в ближайшее время не получится, потому что с частью информации программе не справиться. Также, например, может потребоваться пояснение картинки, — говорит собеседник «Известий» в Минкомсвязи, — поэтому программный комплекс предусматривает возможность надиктовки респикером, человеком, голос которого он «узнает».

Эксперты сомневаются, что можно быстро получить продукт, который позволит в режиме реального времени преобразовывать звуковую информацию в текстовую.

— Ведущие IT-компании мира работают над технологиями распознавания речи, и хотя они продвинулись далеко, до создания универсальной программы, точно расшифровывающей речь, разработчикам тоже очень и очень неблизко. Ключевая проблема как раз в том, чтобы сделать программу, которая могла бы расшифровать слова каждого человека, а не только того, который приучил программу к своему голосу, — сказал «Известиям» Николай Торчинский, разработчик из IB-Insoft — компании, занимающейся технологиями «Умный дом», для которых распознавание речи — также актуальная задача.

По его мнению, в лучшем случае, разработчики повторят уже имеющиеся технологии с учетом специфики ТВ и русского языка.

Источник: Известия

Рейтинги
Лидеры рейтингов AdIndex
# Компания Рейтинг
1 MGCom №1 Digital Index 2023
2 Росст №1 Digital Index в Фармкатегории 2023
3 Arrow Media №1 Performance в недвижимости 2023
–ейтинг@Mail.ru
Этот сайт использует cookie-файлы и рекомендательные технологии. Оставаясь на сайте, вы даете согласие на использование cookie-файлов и соглашаетесь с правилами применения рекомендательных систем на сайте.