
Z-Image Turbo — Öppen källkod 6B text-till-bild från Alibaba Tongyi Lab
Presentation av Z-Image Turbo
Z-Image Turbo är en text-till-bild-modell med 6 miljarder parametrar från Alibabas Tongyi Lab — teamet bakom Qwen —, utgiven som öppen källkod den 26 november 2025 under Apache 2.0-licensen. Destillerad till bara åtta samplingsteg via Decoupled-DMD genererar den högkvalitetsbilder på sekunder, levererar inbyggd tvåspråkig kinesisk och engelsk textrendering och rankas som nr 1 bland öppen källkod-bildmodeller på Artificial Analysis-ranglistan.
Z-Image Turbo är byggt på en Scalable Single-Stream DiT (S3-DiT)-arkitektur, där text-, semantiska visions- och VAE-bildtoken sammanlänkas i en enhetlig indataström — en design Tongyi Lab använder för att maximera parametereffektiviteten i 6B-skala. Basmodellen Z-Image destilleras till Z-Image Turbo via Decoupled-DMD, vilket reducerar inferensen till åtta funktionsutvärderingar, och anpassas till mänskliga estetiska preferenser med DPO och GRPO. Resultatet är under-sekund-latens på datacenter-GPU:er och bekväm inferens på konsumentkort med 16 GB VRAM.
Inbyggd tvåspråkig textrendering är modellens starkaste differentierare. Z-Image Turbo hanterar komplex kinesisk typografi — skyltar, affischer, förpackningar — bredvid engelsk text i samma bild, en förmåga de flesta västerländska bildmodeller fortfarande kämpar med. Från och med tidigt 2026 innehar Z-Image Turbo förstaplatsen bland öppen källkod-bildmodeller på Artificial Analysis Text-to-Image Leaderboard och den bästa öppen källkod-positionen på Alibaba AI Arena, med vikter som är fritt tillgängliga på Hugging Face och ModelScope under Apache 2.0.
På LoveGen AI accepterar Z-Image Turbo promptar på upp till 2000 tecken och erbjuder nio förinställda bildförhållanden — 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1 och 1:2 — samt anpassade dimensioner i intervallet 376–1536 pixlar. En deterministisk frö-parameter (1 till 2 147 483 647) gör utdata reproducerbart. Generering från start till slut tar vanligtvis ungefär tio sekunder för 0,1 kredit per bild. Genererade bild-URL:er är giltiga i 24 timmar.
Så här använder du Z-Image Turbo
Skriv din prompt
Beskriv bilden du vill ha i upp till 2000 tecken. Var specifik om motiv, stil, belysning och komposition för bästa resultat.
Välj ett bildförhållande
Välj ett av de nio förinställda bildförhållandena som passar ditt ändamål — kvadratiskt för sociala medier, 16:9 för miniatyrbilder, 9:16 för vertikala videoomslag.
Generera och spara
Klicka på Generera. Din bild är klar om ungefär tio sekunder. Ladda ned den inom 24 timmar eftersom den genererade länken löper ut efter det.
Tekniska specifikationer för Z-Image Turbo
| Utvecklare | Alibaba Tongyi Lab (Tongyi-MAI) |
| Utgivningsdatum | 26 november 2025 |
| Licens | Apache 2.0 (öppen källkod, kommersiell användning tillåten) |
| Arkitektur | Scalable Single-Stream DiT (S3-DiT) |
| Parametrar | 6 miljarder |
| Inferenssteg | 8 (destillerat via Decoupled-DMD) |
| Läge | Text till bild |
| Inbyggda språk | Kinesisk + engelsk textrendering |
| Uppskattad genereringstid | ~10 sekunder från start till slut |
| Promptlängd | Upp till 2000 tecken |
| Bildförhållanden | 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1, 1:2 |
| Anpassade dimensioner | 376–1536 px (bredd × höjd) |
| Reproducerbarhet | Frö-parameter (1 till 2 147 483 647) |
| Innehållsmoderering | Alltid aktiv basfilter + strikt NSFW-filter |
| Utdatans giltighet | 24 timmar (spara utdata omgående) |
| Kostnad | 0,1 kredit per bild |
Varför välja Z-Image Turbo
Inbyggd tvåspråkig textrendering
Exakt kinesisk och engelsk typografi i samma bild — inklusive skyltar, affischer och förpackningar — en förmåga de flesta västerländska bildmodeller fortfarande saknar.
Öppen källkod från Alibaba Tongyi Lab
Byggt av teamet bakom Qwen och utgivet under Apache 2.0 i november 2025. Topprankat öppen källkod-bildmodell på Artificial Analysis-ranglistan.
Destillerad 6B-arkitektur
En Single-Stream DiT (S3-DiT) med 6 miljarder parametrar, destillerad till bara 8 samplingsteg via Decoupled-DMD för under-sekund-inferens på GPU.
Lägsta kostnad per bild
0,1 kredit per generering — LoveGen AI:s mest effektiva text-till-bild-alternativ för arbete i stor volym.
Reproducerbar med frön
En deterministisk frö-parameter låser resultaten. Samma prompt plus samma frö ger konsistent utdata vid varje körning.
Z-Image Turbo vs andra AI-bildgeneratorer
| Feature | Z-Image Turbo | GPT Image 2 | Flux 2 Pro | Ideogram v3 |
|---|---|---|---|---|
| Utvecklare | Alibaba Tongyi Lab | OpenAI | Black Forest Labs | Ideogram |
| Licens | Apache 2.0 (öppen källkod) | Stängd | Stängd | Stängd |
| Parametrar | 6B | Ej angiven | Ej angiven | Ej angiven |
| Primär styrka | Tvåspråkig text + öppen källkod | Flerbild-redigering | Studiokvalitet | Typografi och varumärkesbyggande |
| Genereringstid | ~10 sekunder | ~30 sekunder | ~30 sekunder | ~15 sekunder |
| Bildförhållanden | 9 förinställningar + anpassat | 3 förinställningar + automatisk | Flera | Flera |
| Anpassade dimensioner | Ja (376–1536 px) | Nej | Ja | Begränsat |
| Bildingång | Nej | Upp till 4 bilder | Upp till 8 bilder | Nej |
| Kostnad per bild | 0,1 kredit | Högre | Högre | Högre |
| Bäst för | Tvåspråkigt innehåll och snabb iteration | Redigering och blandning | Studioarbete | Logotyper och affischer |
Populära användningsområden för Z-Image Turbo
Snabb konceptutforskning
Generera många variationer snabbt för att utforska visuella riktningar för varumärkesbyggande, kampanjer eller produktidéer.
Innehåll för sociala medier i stor skala
Producera inlägg, berättelser och annonskreaturer i valfritt bildförhållande till låg kostnad per bild för innehållsscheman med hög volym.
Miniatyrbilder och banners
Använd förinställningarna 16:9 och 9:16 för videominiatyrbilder och vertikala omslag, eller anpassade dimensioner för webbplatsbanners.
Utforska relaterade AI-bildgeneratorer

GPT Image 2
OpenAI:s bildmodell med flerreferens-redigering och promptar på naturligt språk.

Nano Banana Pro
Googles bildmodell med blandning av upp till 14 bilder och Gemini-klassad promptförståelse.

Flux 2 Pro
Black Forest Labs' studiogenerator med 4MP-upplösning.

Ideogram v3
Branschledande typografi och textrendering för logotyper och affischer.

Qwen Image
Alibabas systerbildmodell från Qwen-familjen med stark flerspråkig promptförståelse.

Midjourney V7
Branschledande estetisk bildgenerering som returnerar fyra kandidater per uppgift.
Vanliga frågor om Z-Image Turbo
Vem har byggt Z-Image Turbo?
Z-Image Turbo har utvecklats av Alibabas Tongyi Lab — samma team bakom Qwen-modellfamiljen — och getts ut som öppen källkod under Apache 2.0-licensen den 26 november 2025.
Hur snabb är Z-Image Turbo?
Z-Image Turbo är destillerad till bara 8 samplingsteg via Decoupled-DMD, vilket ger under-sekund-latens på datacenter-GPU:er. Från start till slut på LoveGen AI tar generering vanligtvis ungefär tio sekunder.
Kan Z-Image Turbo rendera kinesisk och engelsk text?
Ja — inbyggd tvåspråkig textrendering är en av Z-Image Turbos största differentierare. Modellen hanterar komplex kinesisk typografi, engelsk text och blandade språklayouter som många västerländska modeller fortfarande kämpar med.
Vilka bildförhållanden stöder Z-Image Turbo?
På LoveGen AI erbjuder Z-Image Turbo nio förinställda bildförhållanden — 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1 och 1:2 — och anpassade dimensioner i intervallet 376–1536 pixlar.
Kan jag reproducera en specifik bild med Z-Image Turbo?
Ja. Z-Image Turbo accepterar en numerisk frö-parameter (1 till 2 147 483 647). Samma prompt med samma frö ger konsistenta resultat, användbart för iteration eller skapande av serier av relaterade bilder.
Vad kostar Z-Image Turbo på LoveGen AI?
Z-Image Turbo kostar 0,1 kredit per genererad bild — vår mest kostnadseffektiva text-till-bild-modell. Genererade bild-URL:er är giltiga i 24 timmar, så ladda ned utdata omgående.