Published May 8, 2026Updated May 8, 2026

Z-Image Turbo — Texto a imagen 6B de código abierto de Alibaba Tongyi Lab

Presentamos Z-Image Turbo

Z-Image Turbo es un modelo de texto a imagen con 6 mil millones de parámetros del Tongyi Lab de Alibaba — el equipo detrás de Qwen —, lanzado como código abierto el 26 de noviembre de 2025 bajo la licencia Apache 2.0. Destilado a solo ocho pasos de muestreo mediante Decoupled-DMD, genera imágenes de alta calidad en segundos, ofrece representación bilingüe nativa de texto en chino e inglés, y ocupa el puesto n.º 1 entre los modelos de imagen de código abierto en el ranking de Artificial Analysis.

Z-Image Turbo está construido sobre una arquitectura Scalable Single-Stream DiT (S3-DiT) que concatena tokens de texto, tokens de visión semántica y tokens de imagen VAE en un flujo de entrada unificado, maximizando la eficiencia de parámetros a escala 6B. El modelo base Z-Image se destila en Z-Image Turbo mediante Decoupled-DMD, reduciendo la inferencia a ocho evaluaciones de función, y se alinea con la preferencia estética humana con DPO y GRPO. El resultado es latencia inferior al segundo en GPUs de centro de datos e inferencia cómoda en tarjetas de consumo con 16 GB de VRAM.

La representación de texto bilingüe nativa es el mayor diferenciador del modelo. Z-Image Turbo maneja tipografía china compleja — señalización, carteles, envases — junto con texto en inglés en la misma imagen, algo con lo que la mayoría de los modelos occidentales aún tiene dificultades. A principios de 2026, ocupa el n.º 1 entre modelos de imagen de código abierto en el Artificial Analysis Leaderboard y el mejor puesto open source en Alibaba AI Arena, con pesos disponibles en Hugging Face y ModelScope bajo Apache 2.0.

En LoveGen AI, Z-Image Turbo acepta prompts de hasta 2000 caracteres, nueve relaciones de aspecto predefinidas — 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1 y 1:2 — y dimensiones personalizadas en el rango 376–1536 píxeles. Un parámetro de semilla determinista (1 a 2.147.483.647) hace las salidas reproducibles. La generación suele completarse en unos diez segundos por 0,1 crédito por imagen. Las URLs de imágenes generadas permanecen válidas durante 24 horas.

Cómo usar Z-Image Turbo

Escribe tu prompt

Describe la imagen que deseas en hasta 2000 caracteres. Sé específico sobre sujeto, estilo, iluminación y composición.

Elige una relación de aspecto

Selecciona una de las nueve relaciones predefinidas — cuadrado para redes sociales, 16:9 para miniaturas, 9:16 para portadas de vídeo vertical.

Genera y guarda

Haz clic en Generar. Tu imagen llegará en aproximadamente diez segundos. Descárgala en 24 horas antes de que el enlace caduque.

Especificaciones técnicas de Z-Image Turbo

Desarrollador	Alibaba Tongyi Lab (Tongyi-MAI)
Fecha de lanzamiento	26 de noviembre de 2025
Licencia	Apache 2.0 (código abierto, uso comercial permitido)
Arquitectura	Scalable Single-Stream DiT (S3-DiT)
Parámetros	6 mil millones
Pasos de inferencia	8 (destilado mediante Decoupled-DMD)
Modo	Texto a imagen
Idiomas nativos	Representación de texto en chino + inglés
Tiempo de generación estimado	~10 segundos de extremo a extremo
Longitud del prompt	Hasta 2000 caracteres
Relaciones de aspecto	1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1, 1:2
Dimensiones personalizadas	376–1536 px (ancho × alto)
Reproducibilidad	Parámetro de semilla (1 a 2.147.483.647)
Moderación de contenido	Filtro base siempre activo + filtro NSFW estricto
Validez de la salida	24 horas (guardar salidas con prontitud)
Costo	0,1 crédito por imagen

Por qué elegir Z-Image Turbo

Representación de texto bilingüe nativa

Tipografía precisa en chino e inglés en la misma imagen — señales, carteles y envases — una capacidad de la que aún carecen la mayoría de los modelos occidentales.

Código abierto de Alibaba Tongyi Lab

Creado por el equipo detrás de Qwen, lanzado bajo Apache 2.0 en noviembre de 2025. Modelo de imagen open source mejor clasificado en Artificial Analysis.

Arquitectura 6B destilada

Single-Stream DiT (S3-DiT) con 6 mil millones de parámetros, destilado a 8 pasos de muestreo via Decoupled-DMD para inferencia sub-segundo.

El menor costo por imagen

0,1 crédito por generación — la opción más eficiente de LoveGen AI para trabajo de alto volumen.

Reproducible con semillas

Un parámetro de semilla determinista fija los resultados. Mismo prompt más misma semilla produce salida consistente en cada ejecución.

Z-Image Turbo vs. otros generadores de imágenes con IA

Feature	Z-Image Turbo	GPT Image 2	Flux 2 Pro	Ideogram v3
Desarrollador	Alibaba Tongyi Lab	OpenAI	Black Forest Labs	Ideogram
Licencia	Apache 2.0 (código abierto)	Cerrado	Cerrado	Cerrado
Parámetros	6B	No revelado	No revelado	No revelado
Principal fortaleza	Texto bilingüe + código abierto	Edición multi-imagen	Calidad de estudio	Tipografía y branding
Tiempo de generación	~10 segundos	~30 segundos	~30 segundos	~15 segundos
Relaciones de aspecto	9 presets + personalizado	3 presets + auto	Múltiples	Múltiples
Dimensiones personalizadas	Sí (376–1536 px)	No	Sí	Limitado
Entrada de imagen	No	Hasta 4 imágenes	Hasta 8 imágenes	No
Costo por imagen	0,1 crédito	Mayor	Mayor	Mayor
Ideal para	Contenido bilingüe e iteración rápida	Edición y mezcla	Trabajo de estudio	Logos y carteles

Usos populares de Z-Image Turbo

Exploración rápida de conceptos

Genera muchas variaciones rápidamente para explorar direcciones visuales para branding, campañas o ideas de productos.

Contenido para redes sociales a escala

Produce publicaciones, historias y creatividades publicitarias en cualquier relación de aspecto a bajo costo por imagen.

Miniaturas y banners

Usa los presets 16:9 y 9:16 para miniaturas de vídeo y portadas verticales, o dimensiones personalizadas para banners de sitios web.

Explorar generadores de imágenes con IA relacionados

GPT Image 2

El modelo de imagen de OpenAI con edición de referencia multi-imagen y prompts en lenguaje natural.

Nano Banana Pro

El modelo de imagen de Google con mezcla de hasta 14 imágenes y comprensión de prompts de clase Gemini.

Flux 2 Pro

Generador de nivel estudio de Black Forest Labs con resolución 4MP.

Ideogram v3

Tipografía y representación de texto líderes del sector para logos y carteles.

Qwen Image

El modelo de imagen hermano de Alibaba de la familia Qwen, con fuerte comprensión multilingüe de prompts.

Midjourney V7

Generación de imágenes estéticas líder del sector que devuelve cuatro candidatos por tarea.

Preguntas frecuentes sobre Z-Image Turbo

¿Quién creó Z-Image Turbo?

Z-Image Turbo fue desarrollado por el Tongyi Lab de Alibaba — el mismo equipo detrás de la familia Qwen — y lanzado como código abierto bajo Apache 2.0 el 26 de noviembre de 2025.

¿Qué tan rápido es Z-Image Turbo?

Destilado a 8 pasos de muestreo via Decoupled-DMD, ofrece latencia inferior al segundo en GPUs de centro de datos. En LoveGen AI la generación suele completarse en unos diez segundos.

¿Puede Z-Image Turbo representar texto en chino e inglés?

Sí — la representación bilingüe nativa es uno de los mayores diferenciadores de Z-Image Turbo. Maneja tipografía china compleja, texto inglés y layouts mixtos con los que muchos modelos occidentales aún luchan.

¿Qué relaciones de aspecto admite Z-Image Turbo?

En LoveGen AI, Z-Image Turbo ofrece nueve relaciones de aspecto predefinidas — 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1 y 1:2 — y dimensiones personalizadas de 376–1536 px.

¿Puedo reproducir una imagen específica con Z-Image Turbo?

Sí. Acepta un parámetro de semilla numérico (1 a 2.147.483.647). El mismo prompt con la misma semilla produce resultados consistentes.

¿Cuánto cuesta Z-Image Turbo en LoveGen AI?

0,1 crédito por imagen generada — nuestro modelo de texto a imagen más rentable. Las URLs permanecen válidas 24 horas.