«Яндекс» создал нейросеть YandexART для генерации изображений и анимации
«Яндекс» представил диффузионную нейросеть Yandex AI Rendering Technology (YandexART), которая создает изображения и анимацию в ответ на текстовые запросы пользователей. Технология интегрирована в приложение «Шедеврум», а также работает в «Яндекс Бизнесе» для создания иллюстраций к рекламным объявлениям. Скоро нейросеть появится в «Клавиатуре» и других сервисах компании, сообщила пресс-служба «Яндекса».
YandexART формирует изображения и анимацию методом каскадной диффузии: сначала нейросеть генерирует картинки и кадры в соответствии с запросом пользователя, а затем поэтапно увеличивает их разрешение, насыщая деталями.
Новая технология понимает российский культурный код — знает известные места и города страны, выдающихся личностей разных эпох и персонажей мультфильмов и сказок. Например, Чебурашку, богатырей и Бабу-Ягу.
Для улучшения работы нейросети «Яндекс» увеличил размер обучающего набора данных в 1,5 раза — до 330 млн картинок с текстовым описанием. Для обучения YandexART картинки отбирались при помощи трех режимов фильтрации.
«Для улучшения качества генерации используется дообучение с подкреплением. Специалисты компании отсматривают, например, сразу несколько сотен или тысяч созданных с помощью YandexART капибар и отмечают удачные и неудачные изображения», — рассказали в компании.
При создании рекламных объявлений в «Яндекс Бизнесе» можно выбрать подходящую иллюстрацию из числа уже сгенерированных YandexART. В нейростоке сервиса представлено около 3 тыс. картинок для 650 видов деятельности. Они доступны для 82% рекламных кампаний.
Ранее «Яндекс» представил новую версию генеративной модели YandexGPT 2. И компания начала использовать нейросеть для создания быстрых ответов в «Поиске».