


Особый интерес вызывает версия Turbo, которая создаёт конечное изображение всего за восемь вычислительных шагов. На производительном железе этот процесс может занимать доли секунды. При такой скорости система сохраняет способность понимать сложные описания и прорабатывать детали, включая текст на английском и китайском языках.
В основе модели лежит архитектура S3-DiT, которая обрабатывает текстовые и визуальные данные как единый поток, что повышает её эффективность. Согласно внутренним оценкам, Z-Image демонстрирует качество на уровне ведущих коммерческих аналогов с открытым исходным кодом. Исходный код и инструкции по установке уже опубликованы в открытом доступе, что позволяет любому желающему опробовать технологию.

Ранее Microsoft представила собственный генератор изображений MAI-Image-1, который работает через онлайн-сервисы компании. В отличие от этого подхода, Z-Image предлагает альтернативу для тех, кто предпочитает запускать подобные модели локально на своём компьютере.
📌 Авторы Palworld издадут кооперативный лутер-шутер в эстетике тёмного фэнтези и ранней 3D-графики
+4
Поделиться:
PC НовостиЖелезо и технологииАнонсынейросети
Об авторе

Почему нейросети врут: OpenAI объяснила природу галлюцинаций ИИ

Нейросеть Sora добралась до Android

Турнир нейросетей по Among Us выявил лидера по социальному интеллекту

Ужасы нейронных сетей. Часть 7: История нейросетевой генерация речи. Часть 1: От поющего IBM до разговорчивой Алисы

Рекламная модель интернета под угрозой из-за развития нейросетей
По материалам: vgtimes.ru





