16 Февраля 2024 | 14:37

Новая нейросеть от OpenAI Sora превратит изображения и текст в видео

Нейросеть преобразует текстовые задания в видеоролики. На форуме разработчиков OpenAI уже начались разговоры о риске потери работы моушен-дизайнеров

Картинка Новая нейросеть от OpenAI Sora превратит изображения и текст в видео

OpenAI представила нейросеть Sora для преобразования текста в видео. С ее помощью можно генерировать ролики длительностью до минуты, сообщается на сайте компании.

ИИ-модель способна создавать сложные сцены с несколькими персонажами и точной детализацией, сохраняя при этом визуальное качество и следование подсказкам пользователя, говорится в описании Sora. Также нейросеть умеет генерировать видео на основе статичного изображения, добавляя недостающие кадры.

В одной из веток форума разработчиков OpenAI сегодня началось обсуждение возможностей Sora. Один из пользователей, представившийся как моушен-дизайнер, американской анимационной студии Laika, выразил опасение, что Sora может лишить работы «огромное количество людей, работающих в кино и анимации».

«Как профессиональный аниматор, я поражен возможностями, которые демонстрирует Sora. Я заинтригован и одновременно напуган. Долгое время аниматоры покадровой анимации боялись, что на нашу работу придут CG-аниматоры. Вместо этого теперь кажется, что ИИ придет за их работой, а потом и займет места всех моушен-дизайнеров. Я заинтересован в том, чтобы поделиться своим уникальным взглядом на OpenAI, насколько это возможно. Я также хочу предупредить OpenAI, что у Sora действительно есть потенциал, который может лишить работы огромное количество людей, работающих в кино и анимации», — говорится в комментарии.

Пока Sora находится на этапе тестирования. Доступ к ней открыт ограниченному количеству пользователей: дизайнерам, художникам, кинорежиссерам — для получения обратной связи и доработки ИИ. 

Создатели технологии также предупредили, что у нейросети все еще есть слабые стороны, среди которых — отсутствие причинно-следственных связей. Например, в одном из сгенерированных роликов женщина задувает свечи на торте, но они не потухают.

Сгенерированные Sora ролики


Промт: камера направлена прямо на красочные здания в Бурано, Италия. Очаровательный далматинец смотрит в окно здания на первом этаже. Множество людей прогуливаются пешком или на велосипеде по улицам канала перед зданиями.


Промт: стильная женщина идет по улице Токио, наполненной теплым светящимся неоном. Она носит черную кожаную куртку, длинное красное платье и черные сапоги, а также черную сумочку. 


Промт: исторические кадры Калифорнии во времена золотой лихорадки.

Разработчики OpenAI создают классификатор обнаружения, с помощью которого можно определить, когда видео сгенерировано Sora. В том числе планируется использовать метаданные C2PA для определения происхождения ролика. 

Ранее на этой неделе OpenAI объявила о тестировании функции ChatGPT — возможности запоминать информацию о взаимодействии с пользователем с прошлого момента использования. До этого в ИИ использовалась контекстная память, которая сохранялась только на протяжении одного разговора. 

Рейтинги
Лидеры рейтингов AdIndex
# Компания Рейтинг
1 MGCom №1 Digital Index 2023
2 Росст №1 Digital Index в Фармкатегории 2023
3 Arrow Media №1 Performance в недвижимости 2023
–ейтинг@Mail.ru
Этот сайт использует cookie-файлы и рекомендательные технологии. Оставаясь на сайте, вы даете согласие на использование cookie-файлов и соглашаетесь с правилами применения рекомендательных систем на сайте.