Huawei создал конкурента Midjourney для генерации изображений в 4К
Бренд сравнил качество нейросети PixArt-Σ с ИИ-моделями других компаний
Компания Huawei представила новую нейросеть PixArt-Σ, которая основана на более ранних технологиях PixArt-α (Alpha) и PixArt-δ (Delta), сообщают разработчики.
Главное отличие PixArt-Σ от других инструментов — высокое разрешение изображений. Нейросеть может генерировать картинки размером до 3840 x 2560 пикселей без промежуточного масштабирования даже в необычных соотношениях сторон. Предыдущие модели PixArt были ограничены размером 1024 x 1024 пикселя.
Как сообщают разработчики, для того чтобы снизить вычислительные затраты, они использовали стратегию «от слабого к сильному». Путем настройки модели от более простых этапов к более сложным достигается высокая эффективность без ущерба для качества. Этот подход в сочетании с более мощным автокодировщиком переменных и сжатием токенов сокращает время обработки на 34%.
Компания Huawei продемонстрировала возможности PixArt-Σ, сравнив ее с другими нейросетями.
Промт: 3D-анимация маленького круглого пушистого существа с большими выразительными глазами, который исследует яркий заколдованный лес. Существо, представляющее собой причудливую смесь кролика и белки с мягким голубым мехом и густым полосатым хвостом. Он прыгает по сверкающему ручью, его глаза широко раскрыты от удивления. Цветы, которые светятся и меняют цвет, деревья с листьями фиолетовых и серебристых оттенков, а также маленькие плавающие огоньки, напоминающие светлячков. Существо останавливается, чтобы игриво пообщаться с группой крошечных сказочных существ, танцующих вокруг грибного кольца.
Промт: очень крупный план седовласого мужчины с бородой лет 60. Он глубоко задумался, размышляя над историей Вселенной. Он сидит в кафе в Париже, его глаза сосредоточены на людях за кадром, когда они идут. Он сидит почти неподвижно и одет в шерстяное пальто, рубашку на пуговицах. Он носит коричневый берет и очки и имеет очень профессорский вид.
Другие сгенерированные PixArt-Σ изображения:
Промт: фотографии моделей крупным планом, туманный свет и тень, аксессуары для волос из лазерного металла, мягкие и красивые, светло-золотые зрачки, белые ресницы, низкая насыщенность, реальные детали кожи, четкие поры и тонкие линии, отражение и преломление света, сверхчеткость, кинематография, отмеченные наградами работы.
Промт: современный роскошный интерьер современного роскошного дома, имитирующий разрушенные материалы, трассировку лучей, дома с привидениями и камень, передает суть природы, серых и бронзовых, динамичных снимков на открытом воздухе.
Промт: снимок в полный рост, француженка, фотография, фон французских улиц, подсветка, контурный свет, Fujifilm.
Промт: автомобиль из овощей.
Промт: модель Lego, ракетная станция будущего, сложные детали, высокое разрешение, нереальный двигатель, UHD.
Ранее OpenAI выпустил нейросеть Sora для преобразования текста в видео. Технология позволяет создавать сложные сцены с несколькими персонажами и точной детализацией, сохраняя при этом визуальное качество и следование подсказкам пользователя.