31 Мая 2022 | 10:30
Партнерский материал

Видеоаватары и рост роли Китая: перспективы развития машинного обучения

Технологии распознавания и синтеза речи развивают компании по всему миру — в такие проекты вкладываются Сбербанк, Google, Nvidia, Tencent и другие крупнейшие цифровые корпорации. В каком направлении движется эта сфера и что мешает развитию рынка, рассказал генеральный директор «АЦ Технологии» Николай Шмырев на ежегодной конференции «СПО: от обучения до разработки», организуемой компанией «Базальт СПО»

Индустрия машинного обучения движется в сторону создания виртуальной реальности, где люди смогут общаться не только друг с другом, но и с машинами. Последние технологии в этой области сегодня интегрирует, например, проект Soul Machines, с 2016 г. создающий цифровых «сотрудников» для компаний. Проект вбирает в себя новейшие разработки в области распознавания, синтеза речи и создания видеоаватаров.



Основную работу в этой области делают такие большие корпорации, как Google, Facebook*, Nvidia, Mozilla, Baidu, Tencent, Сбербанк, Bytdance и другие. Появление китайских проектов в этой области — тенденция последних лет, которая может занять главенствующую роль. Американские же компании начинают сдавать позиции в части создания открытых кодов для этой области. Например, большие проекты закрыли Facebook* и Mozilla. «Таким образом весь открытый код в области машинного обеспечения перетекает в китайские руки», — заключил Шмырев.

Один из векторов развития для небольших компаний — распознавание речи на мобильных устройствах. К этой области крупные корпорации пока не проявили интереса.

Отдельное направление, на которое стоит обратить внимание разработчикам, — глобализация. «Развитие программного обеспечения невозможно без ориентации на глобальный рынок. С чем у многих разработчиков большие проблемы», — подчеркнул Шмырев. Даже китайские компании, имеющие шансы стать лидерами в этой области, создают проекты, ориентированные только на китайский рынок. Эта же проблема есть и в России. Например, проект такой большой корпорации как Сбербанк, Golos, ориентирован только на русский язык.

«В то же время мы видим, что наиболее перспективна и полезна для открытого проекта – ориентация на глобальный рынок. В частности, поддержка большого количества языков. Для нас актуальны Китай, Индия и мы видим большой интерес к открытому исходному коду в Латинской Америке. Поддержка всех глобальных языков приоритет для современных проектах», — отмечает Николай Шмырев.

Говоря о российском рынке, Шмырев отметил, что сегодня спрос на распознавание речи растет в таких компаниях как телеком, медицина и дистанционное обучение. В этих областях компании также будут заинтересованы в переходе технологий на следующий уровень и внедрении видеоаватаров. Эффективность такого взаимодействия несравнима с нынешней коммуникацией, которую обеспечивают роботы. «Если раньше вам звонил бот на телефон, то теперь с вами будет общаться видеоаватар. Такие проекты появляются и будут популярны», — говорит Шмырев.

*Facebook признана экстремистской организацией и запрещена на территории России

Как правильно подобрать инфлюенсера для вашего бренда и что ждет индустрию в будущем Замещение платформ и локальный контент — что ждет российский видеостриминг
Рейтинги
Лидеры рейтингов AdIndex
# Компания Рейтинг
1 MGCom №1 Digital Index 2023
2 Росст №1 Digital Index в Фармкатегории 2023
3 Arrow Media №1 Performance в недвижимости 2023
–ейтинг@Mail.ru