19 Апреля 2024 | 09:04

Нейросети «Яндекса» столкнулись с дефицитом текстов на различных языках

Нейросети «Яндекса» испытывают нехватку текстов на экзотических языках, что ухудшает качество работы ИИ, пишут «Ведомости» со ссылкой на директора по развитию технологий ИИ «Яндекса» Александра Крайнова. Разработчики моделей машинного обучения (LLM) сталкиваются с проблемой во время работы.

Чтобы обучить языковую модель, нужно найти много хороших текстов, поясняет Крайнов. Он уточняет, что такого объема нет физически. На английском языке их достаточно, даже избыточно. На русском компания собирает все, что может получить. Однако если говорить об узбекском, таджикском или казахском языках, то «их не просто недостаточно — их нет».

Наличие такой проблемы подтверждает менеджер ИИ-продуктов Just AI Алексей Борщов. Он акцентирует внимание на том, что есть сложности с диалектами, редкими языками и языками с ограниченным объемом текстовых данных. Крайнов допускает, что уровень и качество работы языковых моделей могут стать ниже, если не будет хватать обучающих данных.

Еще материалы

Новостная картина дня. Коротко и по делу.

AdIndex

Реклама и маркетинг в России и мире. Новости, кейсы, интервью, исследования, рейтинги.

«Больше джобсов»

Канал о работе в маркетинге и рекламе.

Рекламные кейсы / AdIndex

Канал, в котором публикуются самые интересные и актуальные кейсы в маркетинге, рекламе, PR, digital и технологиях

Shkulev Media Holding приобрел долю в онлайн-сервисе психологии Правительство может не поддержать законопроект о маркетплейсах

Лидеры рейтингов AdIndex

#	Компания	Рейтинг
1	MGCom №1	Digital Index 2023
2	Росст №1	Digital Index в Фармкатегории 2023
3	Arrow Media №1	Performance в недвижимости 2023

Нейросети «Яндекса» столкнулись с дефицитом текстов на различных языках

Еще материалы

Estée Lauder начнет применять ИИ от Microsoft для разработки новых продуктов

Доходы Google от рекламы выросли на 13%

«Авито» добавил в приложение нейросеть для генерации описания товара

Meta* увеличила прибыль от рекламы на 27% в первом квартале

Почти 90% телеграм-каналов не маркируют рекламу

«Яндекс» планирует создать приложение с планировщиком

Microsoft добавила рекламу в меню «Пуск»