08 Апреля 2024 | 18:51

SberDevices создала ИИ-модель для распознавания речи и эмоций

Команды разработки сервисов GigaChat и SaluteSpeech в SberDevices представили нейросеть GigaAM (Giga Acoustic Model) — семейство акустических моделей для русского языка, которые позволяют распознавать речь и эмоции.

В семейство вошли три модели: GigaAM, GigaAM-CTC и GigaAM-Emo.

Технология GigaAM предобучена на разнообразной русской речи. Она может подойти для адаптации под различные задачи работы со звуком, включая распознавание речи и эмоций, определение диктора и другие. GigaAM-CTC — открытая модель для распознавания русскоязычных запросов. А GigaAM-Emo — акустическая модель для определения эмоций. 

«Улучшенные версии этих моделей бизнесу доступны на нашей платформе для синтеза и распознавания речи SaluteSpeech API, а физические лица также могут ими воспользоваться в приложении SaluteSpeech App», — рассказали в компании. 

Ранее сообщалось, что SberDevices начала применять ИИ в рекламных форматах. Сервис внедряет нейросети в виджеты, смарт-баннеры и Out-Steam Video.

Рейтинги
Лидеры рейтингов AdIndex
# Компания Рейтинг
1 MGCom №1 Digital Index 2023
2 Росст №1 Digital Index в Фармкатегории 2023
3 Arrow Media №1 Performance в недвижимости 2023
–ейтинг@Mail.ru
Этот сайт использует cookie-файлы и рекомендательные технологии. Оставаясь на сайте, вы даете согласие на использование cookie-файлов и соглашаетесь с правилами применения рекомендательных систем на сайте.