
Z-Image Turbo — Texto a imagen 6B de código abierto de Alibaba Tongyi Lab
Presentamos Z-Image Turbo
Z-Image Turbo es un modelo de texto a imagen con 6 mil millones de parámetros del Tongyi Lab de Alibaba — el equipo detrás de Qwen —, lanzado como código abierto el 26 de noviembre de 2025 bajo la licencia Apache 2.0. Destilado a solo ocho pasos de muestreo mediante Decoupled-DMD, genera imágenes de alta calidad en segundos, ofrece representación bilingüe nativa de texto en chino e inglés, y ocupa el puesto n.º 1 entre los modelos de imagen de código abierto en el ranking de Artificial Analysis.
Z-Image Turbo está construido sobre una arquitectura Scalable Single-Stream DiT (S3-DiT) que concatena tokens de texto, tokens de visión semántica y tokens de imagen VAE en un flujo de entrada unificado, maximizando la eficiencia de parámetros a escala 6B. El modelo base Z-Image se destila en Z-Image Turbo mediante Decoupled-DMD, reduciendo la inferencia a ocho evaluaciones de función, y se alinea con la preferencia estética humana con DPO y GRPO. El resultado es latencia inferior al segundo en GPUs de centro de datos e inferencia cómoda en tarjetas de consumo con 16 GB de VRAM.
La representación de texto bilingüe nativa es el mayor diferenciador del modelo. Z-Image Turbo maneja tipografía china compleja — señalización, carteles, envases — junto con texto en inglés en la misma imagen, algo con lo que la mayoría de los modelos occidentales aún tiene dificultades. A principios de 2026, ocupa el n.º 1 entre modelos de imagen de código abierto en el Artificial Analysis Leaderboard y el mejor puesto open source en Alibaba AI Arena, con pesos disponibles en Hugging Face y ModelScope bajo Apache 2.0.
En LoveGen AI, Z-Image Turbo acepta prompts de hasta 2000 caracteres, nueve relaciones de aspecto predefinidas — 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1 y 1:2 — y dimensiones personalizadas en el rango 376–1536 píxeles. Un parámetro de semilla determinista (1 a 2.147.483.647) hace las salidas reproducibles. La generación suele completarse en unos diez segundos por 0,1 crédito por imagen. Las URLs de imágenes generadas permanecen válidas durante 24 horas.
Cómo usar Z-Image Turbo
Escribe tu prompt
Describe la imagen que deseas en hasta 2000 caracteres. Sé específico sobre sujeto, estilo, iluminación y composición.
Elige una relación de aspecto
Selecciona una de las nueve relaciones predefinidas — cuadrado para redes sociales, 16:9 para miniaturas, 9:16 para portadas de vídeo vertical.
Genera y guarda
Haz clic en Generar. Tu imagen llegará en aproximadamente diez segundos. Descárgala en 24 horas antes de que el enlace caduque.
Especificaciones técnicas de Z-Image Turbo
| Desarrollador | Alibaba Tongyi Lab (Tongyi-MAI) |
| Fecha de lanzamiento | 26 de noviembre de 2025 |
| Licencia | Apache 2.0 (código abierto, uso comercial permitido) |
| Arquitectura | Scalable Single-Stream DiT (S3-DiT) |
| Parámetros | 6 mil millones |
| Pasos de inferencia | 8 (destilado mediante Decoupled-DMD) |
| Modo | Texto a imagen |
| Idiomas nativos | Representación de texto en chino + inglés |
| Tiempo de generación estimado | ~10 segundos de extremo a extremo |
| Longitud del prompt | Hasta 2000 caracteres |
| Relaciones de aspecto | 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1, 1:2 |
| Dimensiones personalizadas | 376–1536 px (ancho × alto) |
| Reproducibilidad | Parámetro de semilla (1 a 2.147.483.647) |
| Moderación de contenido | Filtro base siempre activo + filtro NSFW estricto |
| Validez de la salida | 24 horas (guardar salidas con prontitud) |
| Costo | 0,1 crédito por imagen |
Por qué elegir Z-Image Turbo
Representación de texto bilingüe nativa
Tipografía precisa en chino e inglés en la misma imagen — señales, carteles y envases — una capacidad de la que aún carecen la mayoría de los modelos occidentales.
Código abierto de Alibaba Tongyi Lab
Creado por el equipo detrás de Qwen, lanzado bajo Apache 2.0 en noviembre de 2025. Modelo de imagen open source mejor clasificado en Artificial Analysis.
Arquitectura 6B destilada
Single-Stream DiT (S3-DiT) con 6 mil millones de parámetros, destilado a 8 pasos de muestreo via Decoupled-DMD para inferencia sub-segundo.
El menor costo por imagen
0,1 crédito por generación — la opción más eficiente de LoveGen AI para trabajo de alto volumen.
Reproducible con semillas
Un parámetro de semilla determinista fija los resultados. Mismo prompt más misma semilla produce salida consistente en cada ejecución.
Z-Image Turbo vs. otros generadores de imágenes con IA
| Feature | Z-Image Turbo | GPT Image 2 | Flux 2 Pro | Ideogram v3 |
|---|---|---|---|---|
| Desarrollador | Alibaba Tongyi Lab | OpenAI | Black Forest Labs | Ideogram |
| Licencia | Apache 2.0 (código abierto) | Cerrado | Cerrado | Cerrado |
| Parámetros | 6B | No revelado | No revelado | No revelado |
| Principal fortaleza | Texto bilingüe + código abierto | Edición multi-imagen | Calidad de estudio | Tipografía y branding |
| Tiempo de generación | ~10 segundos | ~30 segundos | ~30 segundos | ~15 segundos |
| Relaciones de aspecto | 9 presets + personalizado | 3 presets + auto | Múltiples | Múltiples |
| Dimensiones personalizadas | Sí (376–1536 px) | No | Sí | Limitado |
| Entrada de imagen | No | Hasta 4 imágenes | Hasta 8 imágenes | No |
| Costo por imagen | 0,1 crédito | Mayor | Mayor | Mayor |
| Ideal para | Contenido bilingüe e iteración rápida | Edición y mezcla | Trabajo de estudio | Logos y carteles |
Usos populares de Z-Image Turbo
Exploración rápida de conceptos
Genera muchas variaciones rápidamente para explorar direcciones visuales para branding, campañas o ideas de productos.
Contenido para redes sociales a escala
Produce publicaciones, historias y creatividades publicitarias en cualquier relación de aspecto a bajo costo por imagen.
Miniaturas y banners
Usa los presets 16:9 y 9:16 para miniaturas de vídeo y portadas verticales, o dimensiones personalizadas para banners de sitios web.
Explorar generadores de imágenes con IA relacionados

GPT Image 2
El modelo de imagen de OpenAI con edición de referencia multi-imagen y prompts en lenguaje natural.

Nano Banana Pro
El modelo de imagen de Google con mezcla de hasta 14 imágenes y comprensión de prompts de clase Gemini.

Flux 2 Pro
Generador de nivel estudio de Black Forest Labs con resolución 4MP.

Ideogram v3
Tipografía y representación de texto líderes del sector para logos y carteles.

Qwen Image
El modelo de imagen hermano de Alibaba de la familia Qwen, con fuerte comprensión multilingüe de prompts.

Midjourney V7
Generación de imágenes estéticas líder del sector que devuelve cuatro candidatos por tarea.
Preguntas frecuentes sobre Z-Image Turbo
¿Quién creó Z-Image Turbo?
Z-Image Turbo fue desarrollado por el Tongyi Lab de Alibaba — el mismo equipo detrás de la familia Qwen — y lanzado como código abierto bajo Apache 2.0 el 26 de noviembre de 2025.
¿Qué tan rápido es Z-Image Turbo?
Destilado a 8 pasos de muestreo via Decoupled-DMD, ofrece latencia inferior al segundo en GPUs de centro de datos. En LoveGen AI la generación suele completarse en unos diez segundos.
¿Puede Z-Image Turbo representar texto en chino e inglés?
Sí — la representación bilingüe nativa es uno de los mayores diferenciadores de Z-Image Turbo. Maneja tipografía china compleja, texto inglés y layouts mixtos con los que muchos modelos occidentales aún luchan.
¿Qué relaciones de aspecto admite Z-Image Turbo?
En LoveGen AI, Z-Image Turbo ofrece nueve relaciones de aspecto predefinidas — 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1 y 1:2 — y dimensiones personalizadas de 376–1536 px.
¿Puedo reproducir una imagen específica con Z-Image Turbo?
Sí. Acepta un parámetro de semilla numérico (1 a 2.147.483.647). El mismo prompt con la misma semilla produce resultados consistentes.
¿Cuánto cuesta Z-Image Turbo en LoveGen AI?
0,1 crédito por imagen generada — nuestro modelo de texto a imagen más rentable. Las URLs permanecen válidas 24 horas.