Published May 8, 2026Updated May 8, 2026

Z-Image Turbo — Texte-vers-image 6B open source d'Alibaba Tongyi Lab

Présentation de Z-Image Turbo

Z-Image Turbo est un modèle texte-vers-image de 6 milliards de paramètres développé par le Tongyi Lab d'Alibaba — l'équipe derrière Qwen —, publié en open source le 26 novembre 2025 sous la licence Apache 2.0. Distillé à seulement huit étapes d'échantillonnage via Decoupled-DMD, il génère des images de haute qualité en quelques secondes, offre un rendu de texte bilingue natif en chinois et en anglais, et se classe n°1 parmi les modèles d'image open source sur le classement Artificial Analysis.

Z-Image Turbo repose sur une architecture Scalable Single-Stream DiT (S3-DiT), dans laquelle les tokens texte, les tokens de vision sémantique et les tokens d'image VAE sont concaténés dans un flux d'entrée unifié — une conception qu'utilise Tongyi Lab pour maximiser l'efficacité des paramètres à l'échelle 6B. Le modèle de base Z-Image est distillé en Z-Image Turbo via Decoupled-DMD, réduisant l'inférence à huit évaluations de fonctions, et aligné sur les préférences esthétiques humaines avec DPO et GRPO. Le résultat : une latence inférieure à la seconde sur les GPU de centre de données et une inférence confortable sur des cartes grand public de 16 Go de VRAM.

Le rendu de texte bilingue natif est le principal différenciateur du modèle. Z-Image Turbo gère la typographie chinoise complexe — enseignes, affiches, emballages — aux côtés du texte anglais dans la même image, une capacité avec laquelle la plupart des modèles d'image occidentaux peinent encore. Début 2026, Z-Image Turbo occupe la première place parmi les modèles d'image open source sur l'Artificial Analysis Text-to-Image Leaderboard et le meilleur rang open source dans l'Alibaba AI Arena, avec des poids librement disponibles sur Hugging Face et ModelScope sous Apache 2.0 (usage commercial autorisé).

Sur LoveGen AI, Z-Image Turbo accepte des prompts jusqu'à 2000 caractères et propose neuf ratios d'aspect prédéfinis — 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1 et 1:2 — ainsi que des dimensions personnalisées dans la plage 376–1536 pixels. Un paramètre de graine déterministe (de 1 à 2 147 483 647) rend les sorties reproductibles pour l'itération et le travail en batch. La génération de bout en bout s'achève généralement en environ dix secondes pour 0,1 crédit par image, ce qui fait de Z-Image Turbo notre option texte-vers-image la plus rentable — idéale pour le contenu social à fort volume, les créations en chinois et l'exploration rapide de concepts. Les URL des images générées restent valides pendant 24 heures.

Comment utiliser Z-Image Turbo

Rédigez votre prompt

Décrivez l'image souhaitée en jusqu'à 2000 caractères. Soyez précis sur le sujet, le style, l'éclairage et la composition pour de meilleurs résultats.

Choisissez un ratio d'aspect

Sélectionnez l'un des neuf ratios d'aspect prédéfinis adapté à votre usage — carré pour les réseaux sociaux, 16:9 pour les miniatures, 9:16 pour les couvertures vidéo verticales.

Générez et enregistrez

Cliquez sur Générer. Votre image arrive en environ dix secondes. Téléchargez-la dans les 24 heures car le lien généré expire ensuite.

Spécifications techniques de Z-Image Turbo

Développeur	Alibaba Tongyi Lab (Tongyi-MAI)
Date de sortie	26 novembre 2025
Licence	Apache 2.0 (open source, usage commercial autorisé)
Architecture	Scalable Single-Stream DiT (S3-DiT)
Paramètres	6 milliards
Étapes d'inférence	8 (distillé via Decoupled-DMD)
Mode	Texte-vers-image
Langues natives	Rendu de texte chinois + anglais
Temps de génération estimé	~10 secondes de bout en bout
Longueur du prompt	Jusqu'à 2000 caractères
Ratios d'aspect	1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1, 1:2
Dimensions personnalisées	376–1536 px (largeur × hauteur)
Reproductibilité	Paramètre de graine (1 à 2 147 483 647)
Modération du contenu	Filtre de base permanent + filtre NSFW strict
Validité des sorties	24 heures (enregistrez les sorties rapidement)
Coût	0,1 crédit par image

Pourquoi choisir Z-Image Turbo

Rendu de texte bilingue natif

Typographie chinoise et anglaise précise dans la même image — y compris enseignes, affiches et emballages — une capacité dont la plupart des modèles occidentaux sont encore dépourvus.

Open source par Alibaba Tongyi Lab

Construit par l'équipe derrière Qwen et publié sous Apache 2.0 en novembre 2025. Modèle d'image open source le mieux classé sur le classement Artificial Analysis.

Architecture 6B distillée

Un Single-Stream DiT (S3-DiT) avec 6 milliards de paramètres, distillé à seulement 8 étapes d'échantillonnage via Decoupled-DMD pour une inférence inférieure à la seconde sur GPU.

Coût par image le plus bas

0,1 crédit par génération — l'option texte-vers-image la plus efficace de LoveGen AI pour les travaux à fort volume.

Reproductible avec les graines

Un paramètre de graine déterministe fixe les résultats. Le même prompt avec la même graine produit une sortie cohérente à chaque exécution.

Z-Image Turbo vs autres générateurs d'images IA

Feature	Z-Image Turbo	GPT Image 2	Flux 2 Pro	Ideogram v3
Développeur	Alibaba Tongyi Lab	OpenAI	Black Forest Labs	Ideogram
Licence	Apache 2.0 (open source)	Fermé	Fermé	Fermé
Paramètres	6B	Non divulgué	Non divulgué	Non divulgué
Point fort principal	Texte bilingue + open source	Édition multi-images	Qualité studio	Typographie et branding
Temps de génération	~10 secondes	~30 secondes	~30 secondes	~15 secondes
Ratios d'aspect	9 préréglages + personnalisé	3 préréglages + auto	Multiples	Multiples
Dimensions personnalisées	Oui (376–1536 px)	Non	Oui	Limité
Entrée image	Non	Jusqu'à 4 images	Jusqu'à 8 images	Non
Coût par image	0,1 crédit	Plus élevé	Plus élevé	Plus élevé
Idéal pour	Contenu bilingue et itération rapide	Édition et fusion	Travail studio	Logos et affiches

Utilisations populaires de Z-Image Turbo

Exploration rapide de concepts

Générez de nombreuses variations rapidement pour explorer des directions visuelles pour le branding, les campagnes ou les idées de produits.

Contenu pour les réseaux sociaux à grande échelle

Produisez des publications, des stories et des créations publicitaires dans n'importe quel ratio d'aspect à faible coût par image pour des calendriers de contenu à fort volume.

Miniatures et bannières

Utilisez les préréglages 16:9 et 9:16 pour les miniatures vidéo et les couvertures verticales, ou des dimensions personnalisées pour les bannières de site.

Explorer les générateurs d'images IA associés

GPT Image 2

Le modèle d'image d'OpenAI avec l'édition de référence multi-images et des prompts en langage naturel.

Nano Banana Pro

Le modèle d'image de Google avec fusion jusqu'à 14 images et compréhension de prompts de classe Gemini.

Flux 2 Pro

Le générateur studio de Black Forest Labs avec une résolution 4MP.

Ideogram v3

Typographie et rendu de texte de référence dans l'industrie pour logos et affiches.

Qwen Image

Le modèle d'image sœur d'Alibaba de la famille Qwen, avec une forte compréhension multilingue des prompts.

Midjourney V7

Génération d'images esthétiques de référence qui retourne quatre candidats par tâche.

Questions fréquentes sur Z-Image Turbo

Qui a créé Z-Image Turbo ?

Z-Image Turbo a été développé par le Tongyi Lab d'Alibaba — la même équipe derrière la famille de modèles Qwen — et publié en open source sous la licence Apache 2.0 le 26 novembre 2025.

Quelle est la rapidité de Z-Image Turbo ?

Z-Image Turbo est distillé à seulement 8 étapes d'échantillonnage via Decoupled-DMD, offrant une latence inférieure à la seconde sur les GPU de centre de données. De bout en bout sur LoveGen AI, la génération s'achève généralement en environ dix secondes.

Z-Image Turbo peut-il rendre du texte en chinois et en anglais ?

Oui — le rendu de texte bilingue natif est l'un des plus grands différenciateurs de Z-Image Turbo. Le modèle gère la typographie chinoise complexe, le texte anglais et les mises en page multilingues avec lesquelles de nombreux modèles d'image occidentaux peinent encore.

Quels ratios d'aspect Z-Image Turbo supporte-t-il ?

Sur LoveGen AI, Z-Image Turbo propose neuf ratios d'aspect prédéfinis — 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1 et 1:2 — et des dimensions personnalisées dans la plage 376–1536 pixels.

Puis-je reproduire une image spécifique avec Z-Image Turbo ?

Oui. Z-Image Turbo accepte un paramètre de graine numérique (de 1 à 2 147 483 647). Le même prompt avec la même graine produit des résultats cohérents, utile pour itérer ou créer des séries d'images liées.

Quel est le coût de Z-Image Turbo sur LoveGen AI ?

Z-Image Turbo coûte 0,1 crédit par image générée — notre modèle texte-vers-image le plus rentable. Les URL des images générées restent valides pendant 24 heures, téléchargez donc les sorties rapidement.