Loading

Z-Image Turbo — Texte-vers-image 6B open source d'Alibaba Tongyi Lab

Présentation de Z-Image Turbo

Z-Image Turbo est un modèle texte-vers-image de 6 milliards de paramètres développé par le Tongyi Lab d'Alibaba — l'équipe derrière Qwen —, publié en open source le 26 novembre 2025 sous la licence Apache 2.0. Distillé à seulement huit étapes d'échantillonnage via Decoupled-DMD, il génère des images de haute qualité en quelques secondes, offre un rendu de texte bilingue natif en chinois et en anglais, et se classe n°1 parmi les modèles d'image open source sur le classement Artificial Analysis.

Z-Image Turbo repose sur une architecture Scalable Single-Stream DiT (S3-DiT), dans laquelle les tokens texte, les tokens de vision sémantique et les tokens d'image VAE sont concaténés dans un flux d'entrée unifié — une conception qu'utilise Tongyi Lab pour maximiser l'efficacité des paramètres à l'échelle 6B. Le modèle de base Z-Image est distillé en Z-Image Turbo via Decoupled-DMD, réduisant l'inférence à huit évaluations de fonctions, et aligné sur les préférences esthétiques humaines avec DPO et GRPO. Le résultat : une latence inférieure à la seconde sur les GPU de centre de données et une inférence confortable sur des cartes grand public de 16 Go de VRAM.

Le rendu de texte bilingue natif est le principal différenciateur du modèle. Z-Image Turbo gère la typographie chinoise complexe — enseignes, affiches, emballages — aux côtés du texte anglais dans la même image, une capacité avec laquelle la plupart des modèles d'image occidentaux peinent encore. Début 2026, Z-Image Turbo occupe la première place parmi les modèles d'image open source sur l'Artificial Analysis Text-to-Image Leaderboard et le meilleur rang open source dans l'Alibaba AI Arena, avec des poids librement disponibles sur Hugging Face et ModelScope sous Apache 2.0 (usage commercial autorisé).

Sur LoveGen AI, Z-Image Turbo accepte des prompts jusqu'à 2000 caractères et propose neuf ratios d'aspect prédéfinis — 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1 et 1:2 — ainsi que des dimensions personnalisées dans la plage 376–1536 pixels. Un paramètre de graine déterministe (de 1 à 2 147 483 647) rend les sorties reproductibles pour l'itération et le travail en batch. La génération de bout en bout s'achève généralement en environ dix secondes pour 0,1 crédit par image, ce qui fait de Z-Image Turbo notre option texte-vers-image la plus rentable — idéale pour le contenu social à fort volume, les créations en chinois et l'exploration rapide de concepts. Les URL des images générées restent valides pendant 24 heures.

Comment utiliser Z-Image Turbo

01

Rédigez votre prompt

Décrivez l'image souhaitée en jusqu'à 2000 caractères. Soyez précis sur le sujet, le style, l'éclairage et la composition pour de meilleurs résultats.

02

Choisissez un ratio d'aspect

Sélectionnez l'un des neuf ratios d'aspect prédéfinis adapté à votre usage — carré pour les réseaux sociaux, 16:9 pour les miniatures, 9:16 pour les couvertures vidéo verticales.

03

Générez et enregistrez

Cliquez sur Générer. Votre image arrive en environ dix secondes. Téléchargez-la dans les 24 heures car le lien généré expire ensuite.

Spécifications techniques de Z-Image Turbo

DéveloppeurAlibaba Tongyi Lab (Tongyi-MAI)
Date de sortie26 novembre 2025
LicenceApache 2.0 (open source, usage commercial autorisé)
ArchitectureScalable Single-Stream DiT (S3-DiT)
Paramètres6 milliards
Étapes d'inférence8 (distillé via Decoupled-DMD)
ModeTexte-vers-image
Langues nativesRendu de texte chinois + anglais
Temps de génération estimé~10 secondes de bout en bout
Longueur du promptJusqu'à 2000 caractères
Ratios d'aspect1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1, 1:2
Dimensions personnalisées376–1536 px (largeur × hauteur)
ReproductibilitéParamètre de graine (1 à 2 147 483 647)
Modération du contenuFiltre de base permanent + filtre NSFW strict
Validité des sorties24 heures (enregistrez les sorties rapidement)
Coût0,1 crédit par image

Pourquoi choisir Z-Image Turbo

Rendu de texte bilingue natif

Typographie chinoise et anglaise précise dans la même image — y compris enseignes, affiches et emballages — une capacité dont la plupart des modèles occidentaux sont encore dépourvus.

Open source par Alibaba Tongyi Lab

Construit par l'équipe derrière Qwen et publié sous Apache 2.0 en novembre 2025. Modèle d'image open source le mieux classé sur le classement Artificial Analysis.

Architecture 6B distillée

Un Single-Stream DiT (S3-DiT) avec 6 milliards de paramètres, distillé à seulement 8 étapes d'échantillonnage via Decoupled-DMD pour une inférence inférieure à la seconde sur GPU.

Coût par image le plus bas

0,1 crédit par génération — l'option texte-vers-image la plus efficace de LoveGen AI pour les travaux à fort volume.

Reproductible avec les graines

Un paramètre de graine déterministe fixe les résultats. Le même prompt avec la même graine produit une sortie cohérente à chaque exécution.

Z-Image Turbo vs autres générateurs d'images IA

FeatureZ-Image TurboGPT Image 2Flux 2 ProIdeogram v3
DéveloppeurAlibaba Tongyi LabOpenAIBlack Forest LabsIdeogram
LicenceApache 2.0 (open source)FerméFerméFermé
Paramètres6BNon divulguéNon divulguéNon divulgué
Point fort principalTexte bilingue + open sourceÉdition multi-imagesQualité studioTypographie et branding
Temps de génération~10 secondes~30 secondes~30 secondes~15 secondes
Ratios d'aspect9 préréglages + personnalisé3 préréglages + autoMultiplesMultiples
Dimensions personnaliséesOui (376–1536 px)NonOuiLimité
Entrée imageNonJusqu'à 4 imagesJusqu'à 8 imagesNon
Coût par image0,1 créditPlus élevéPlus élevéPlus élevé
Idéal pourContenu bilingue et itération rapideÉdition et fusionTravail studioLogos et affiches

Utilisations populaires de Z-Image Turbo

01

Exploration rapide de concepts

Générez de nombreuses variations rapidement pour explorer des directions visuelles pour le branding, les campagnes ou les idées de produits.

02

Contenu pour les réseaux sociaux à grande échelle

Produisez des publications, des stories et des créations publicitaires dans n'importe quel ratio d'aspect à faible coût par image pour des calendriers de contenu à fort volume.

03

Miniatures et bannières

Utilisez les préréglages 16:9 et 9:16 pour les miniatures vidéo et les couvertures verticales, ou des dimensions personnalisées pour les bannières de site.

Explorer les générateurs d'images IA associés

Questions fréquentes sur Z-Image Turbo

Qui a créé Z-Image Turbo ?

Z-Image Turbo a été développé par le Tongyi Lab d'Alibaba — la même équipe derrière la famille de modèles Qwen — et publié en open source sous la licence Apache 2.0 le 26 novembre 2025.

Quelle est la rapidité de Z-Image Turbo ?

Z-Image Turbo est distillé à seulement 8 étapes d'échantillonnage via Decoupled-DMD, offrant une latence inférieure à la seconde sur les GPU de centre de données. De bout en bout sur LoveGen AI, la génération s'achève généralement en environ dix secondes.

Z-Image Turbo peut-il rendre du texte en chinois et en anglais ?

Oui — le rendu de texte bilingue natif est l'un des plus grands différenciateurs de Z-Image Turbo. Le modèle gère la typographie chinoise complexe, le texte anglais et les mises en page multilingues avec lesquelles de nombreux modèles d'image occidentaux peinent encore.

Quels ratios d'aspect Z-Image Turbo supporte-t-il ?

Sur LoveGen AI, Z-Image Turbo propose neuf ratios d'aspect prédéfinis — 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1 et 1:2 — et des dimensions personnalisées dans la plage 376–1536 pixels.

Puis-je reproduire une image spécifique avec Z-Image Turbo ?

Oui. Z-Image Turbo accepte un paramètre de graine numérique (de 1 à 2 147 483 647). Le même prompt avec la même graine produit des résultats cohérents, utile pour itérer ou créer des séries d'images liées.

Quel est le coût de Z-Image Turbo sur LoveGen AI ?

Z-Image Turbo coûte 0,1 crédit par image générée — notre modèle texte-vers-image le plus rentable. Les URL des images générées restent valides pendant 24 heures, téléchargez donc les sorties rapidement.