11 Марта 2024 | 16:46

Huawei создал конкурента Midjourney для генерации изображений в 4К

Бренд сравнил качество нейросети PixArt-Σ с ИИ-моделями других компаний

Компания Huawei представила новую нейросеть PixArt-Σ, которая основана на более ранних технологиях PixArt-α (Alpha) и PixArt-δ (Delta), сообщают разработчики.

Главное отличие PixArt-Σ от других инструментов — высокое разрешение изображений. Нейросеть может генерировать картинки размером до 3840 x 2560 пикселей без промежуточного масштабирования даже в необычных соотношениях сторон. Предыдущие модели PixArt были ограничены размером 1024 x 1024 пикселя.

Как сообщают разработчики, для того чтобы снизить вычислительные затраты, они использовали стратегию «от слабого к сильному». Путем настройки модели от более простых этапов к более сложным достигается высокая эффективность без ущерба для качества. Этот подход в сочетании с более мощным автокодировщиком переменных и сжатием токенов сокращает время обработки на 34%.

Компания Huawei продемонстрировала возможности PixArt-Σ, сравнив ее с другими нейросетями. 

Промт: 3D-анимация маленького круглого пушистого существа с большими выразительными глазами, который исследует яркий заколдованный лес. Существо, представляющее собой причудливую смесь кролика и белки с мягким голубым мехом и густым полосатым хвостом. Он прыгает по сверкающему ручью, его глаза широко раскрыты от удивления. Цветы, которые светятся и меняют цвет, деревья с листьями фиолетовых и серебристых оттенков, а также маленькие плавающие огоньки, напоминающие светлячков. Существо останавливается, чтобы игриво пообщаться с группой крошечных сказочных существ, танцующих вокруг грибного кольца. 

Промт: очень крупный план седовласого мужчины с бородой лет 60. Он глубоко задумался, размышляя над историей Вселенной. Он сидит в кафе в Париже, его глаза сосредоточены на людях за кадром, когда они идут. Он сидит почти неподвижно и одет в шерстяное пальто, рубашку на пуговицах. Он носит коричневый берет и очки и имеет очень профессорский вид.

Другие сгенерированные PixArt-Σ изображения:

Промт: фотографии моделей крупным планом, туманный свет и тень, аксессуары для волос из лазерного металла, мягкие и красивые, светло-золотые зрачки, белые ресницы, низкая насыщенность, реальные детали кожи, четкие поры и тонкие линии, отражение и преломление света, сверхчеткость, кинематография, отмеченные наградами работы.

Промт: современный роскошный интерьер современного роскошного дома, имитирующий разрушенные материалы, трассировку лучей, дома с привидениями и камень, передает суть природы, серых и бронзовых, динамичных снимков на открытом воздухе.

Промт: снимок в полный рост, француженка, фотография, фон французских улиц, подсветка, контурный свет, Fujifilm. 

Промт: автомобиль из овощей.

Промт: модель Lego, ракетная станция будущего, сложные детали, высокое разрешение, нереальный двигатель, UHD.

Ранее OpenAI выпустил нейросеть Sora для преобразования текста в видео. Технология позволяет создавать сложные сцены с несколькими персонажами и точной детализацией, сохраняя при этом визуальное качество и следование подсказкам пользователя.

Рейтинги
Лидеры рейтингов AdIndex
# Компания Рейтинг
1 Realweb Digital Index 2024
2 OMD Optimum Media №1 Медиабайеры 2023
3 MGCom №1 Digital Index 2023
–ейтинг@Mail.ru
Этот сайт использует cookie-файлы и рекомендательные технологии. Оставаясь на сайте, вы даете согласие на использование cookie-файлов и соглашаетесь с правилами применения рекомендательных систем на сайте.