Published May 8, 2026Updated May 8, 2026

Z-Image Turbo — Öppen källkod 6B text-till-bild från Alibaba Tongyi Lab

Presentation av Z-Image Turbo

Z-Image Turbo är en text-till-bild-modell med 6 miljarder parametrar från Alibabas Tongyi Lab — teamet bakom Qwen —, utgiven som öppen källkod den 26 november 2025 under Apache 2.0-licensen. Destillerad till bara åtta samplingsteg via Decoupled-DMD genererar den högkvalitetsbilder på sekunder, levererar inbyggd tvåspråkig kinesisk och engelsk textrendering och rankas som nr 1 bland öppen källkod-bildmodeller på Artificial Analysis-ranglistan.

Z-Image Turbo är byggt på en Scalable Single-Stream DiT (S3-DiT)-arkitektur, där text-, semantiska visions- och VAE-bildtoken sammanlänkas i en enhetlig indataström — en design Tongyi Lab använder för att maximera parametereffektiviteten i 6B-skala. Basmodellen Z-Image destilleras till Z-Image Turbo via Decoupled-DMD, vilket reducerar inferensen till åtta funktionsutvärderingar, och anpassas till mänskliga estetiska preferenser med DPO och GRPO. Resultatet är under-sekund-latens på datacenter-GPU:er och bekväm inferens på konsumentkort med 16 GB VRAM.

Inbyggd tvåspråkig textrendering är modellens starkaste differentierare. Z-Image Turbo hanterar komplex kinesisk typografi — skyltar, affischer, förpackningar — bredvid engelsk text i samma bild, en förmåga de flesta västerländska bildmodeller fortfarande kämpar med. Från och med tidigt 2026 innehar Z-Image Turbo förstaplatsen bland öppen källkod-bildmodeller på Artificial Analysis Text-to-Image Leaderboard och den bästa öppen källkod-positionen på Alibaba AI Arena, med vikter som är fritt tillgängliga på Hugging Face och ModelScope under Apache 2.0.

På LoveGen AI accepterar Z-Image Turbo promptar på upp till 2000 tecken och erbjuder nio förinställda bildförhållanden — 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1 och 1:2 — samt anpassade dimensioner i intervallet 376–1536 pixlar. En deterministisk frö-parameter (1 till 2 147 483 647) gör utdata reproducerbart. Generering från start till slut tar vanligtvis ungefär tio sekunder för 0,1 kredit per bild. Genererade bild-URL:er är giltiga i 24 timmar.

Så här använder du Z-Image Turbo

Skriv din prompt

Beskriv bilden du vill ha i upp till 2000 tecken. Var specifik om motiv, stil, belysning och komposition för bästa resultat.

Välj ett bildförhållande

Välj ett av de nio förinställda bildförhållandena som passar ditt ändamål — kvadratiskt för sociala medier, 16:9 för miniatyrbilder, 9:16 för vertikala videoomslag.

Generera och spara

Klicka på Generera. Din bild är klar om ungefär tio sekunder. Ladda ned den inom 24 timmar eftersom den genererade länken löper ut efter det.

Tekniska specifikationer för Z-Image Turbo

Utvecklare	Alibaba Tongyi Lab (Tongyi-MAI)
Utgivningsdatum	26 november 2025
Licens	Apache 2.0 (öppen källkod, kommersiell användning tillåten)
Arkitektur	Scalable Single-Stream DiT (S3-DiT)
Parametrar	6 miljarder
Inferenssteg	8 (destillerat via Decoupled-DMD)
Läge	Text till bild
Inbyggda språk	Kinesisk + engelsk textrendering
Uppskattad genereringstid	~10 sekunder från start till slut
Promptlängd	Upp till 2000 tecken
Bildförhållanden	1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1, 1:2
Anpassade dimensioner	376–1536 px (bredd × höjd)
Reproducerbarhet	Frö-parameter (1 till 2 147 483 647)
Innehållsmoderering	Alltid aktiv basfilter + strikt NSFW-filter
Utdatans giltighet	24 timmar (spara utdata omgående)
Kostnad	0,1 kredit per bild

Varför välja Z-Image Turbo

Inbyggd tvåspråkig textrendering

Exakt kinesisk och engelsk typografi i samma bild — inklusive skyltar, affischer och förpackningar — en förmåga de flesta västerländska bildmodeller fortfarande saknar.

Öppen källkod från Alibaba Tongyi Lab

Byggt av teamet bakom Qwen och utgivet under Apache 2.0 i november 2025. Topprankat öppen källkod-bildmodell på Artificial Analysis-ranglistan.

Destillerad 6B-arkitektur

En Single-Stream DiT (S3-DiT) med 6 miljarder parametrar, destillerad till bara 8 samplingsteg via Decoupled-DMD för under-sekund-inferens på GPU.

Lägsta kostnad per bild

0,1 kredit per generering — LoveGen AI:s mest effektiva text-till-bild-alternativ för arbete i stor volym.

Reproducerbar med frön

En deterministisk frö-parameter låser resultaten. Samma prompt plus samma frö ger konsistent utdata vid varje körning.

Z-Image Turbo vs andra AI-bildgeneratorer

Feature	Z-Image Turbo	GPT Image 2	Flux 2 Pro	Ideogram v3
Utvecklare	Alibaba Tongyi Lab	OpenAI	Black Forest Labs	Ideogram
Licens	Apache 2.0 (öppen källkod)	Stängd	Stängd	Stängd
Parametrar	6B	Ej angiven	Ej angiven	Ej angiven
Primär styrka	Tvåspråkig text + öppen källkod	Flerbild-redigering	Studiokvalitet	Typografi och varumärkesbyggande
Genereringstid	~10 sekunder	~30 sekunder	~30 sekunder	~15 sekunder
Bildförhållanden	9 förinställningar + anpassat	3 förinställningar + automatisk	Flera	Flera
Anpassade dimensioner	Ja (376–1536 px)	Nej	Ja	Begränsat
Bildingång	Nej	Upp till 4 bilder	Upp till 8 bilder	Nej
Kostnad per bild	0,1 kredit	Högre	Högre	Högre
Bäst för	Tvåspråkigt innehåll och snabb iteration	Redigering och blandning	Studioarbete	Logotyper och affischer

Populära användningsområden för Z-Image Turbo

Snabb konceptutforskning

Generera många variationer snabbt för att utforska visuella riktningar för varumärkesbyggande, kampanjer eller produktidéer.

Innehåll för sociala medier i stor skala

Producera inlägg, berättelser och annonskreaturer i valfritt bildförhållande till låg kostnad per bild för innehållsscheman med hög volym.

Miniatyrbilder och banners

Använd förinställningarna 16:9 och 9:16 för videominiatyrbilder och vertikala omslag, eller anpassade dimensioner för webbplatsbanners.

Utforska relaterade AI-bildgeneratorer

GPT Image 2

OpenAI:s bildmodell med flerreferens-redigering och promptar på naturligt språk.

Nano Banana Pro

Googles bildmodell med blandning av upp till 14 bilder och Gemini-klassad promptförståelse.

Flux 2 Pro

Black Forest Labs' studiogenerator med 4MP-upplösning.

Ideogram v3

Branschledande typografi och textrendering för logotyper och affischer.

Qwen Image

Alibabas systerbildmodell från Qwen-familjen med stark flerspråkig promptförståelse.

Midjourney V7

Branschledande estetisk bildgenerering som returnerar fyra kandidater per uppgift.

Vanliga frågor om Z-Image Turbo

Vem har byggt Z-Image Turbo?

Z-Image Turbo har utvecklats av Alibabas Tongyi Lab — samma team bakom Qwen-modellfamiljen — och getts ut som öppen källkod under Apache 2.0-licensen den 26 november 2025.

Hur snabb är Z-Image Turbo?

Z-Image Turbo är destillerad till bara 8 samplingsteg via Decoupled-DMD, vilket ger under-sekund-latens på datacenter-GPU:er. Från start till slut på LoveGen AI tar generering vanligtvis ungefär tio sekunder.

Kan Z-Image Turbo rendera kinesisk och engelsk text?

Ja — inbyggd tvåspråkig textrendering är en av Z-Image Turbos största differentierare. Modellen hanterar komplex kinesisk typografi, engelsk text och blandade språklayouter som många västerländska modeller fortfarande kämpar med.

Vilka bildförhållanden stöder Z-Image Turbo?

På LoveGen AI erbjuder Z-Image Turbo nio förinställda bildförhållanden — 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1 och 1:2 — och anpassade dimensioner i intervallet 376–1536 pixlar.

Kan jag reproducera en specifik bild med Z-Image Turbo?

Ja. Z-Image Turbo accepterar en numerisk frö-parameter (1 till 2 147 483 647). Samma prompt med samma frö ger konsistenta resultat, användbart för iteration eller skapande av serier av relaterade bilder.

Vad kostar Z-Image Turbo på LoveGen AI?

Z-Image Turbo kostar 0,1 kredit per genererad bild — vår mest kostnadseffektiva text-till-bild-modell. Genererade bild-URL:er är giltiga i 24 timmar, så ladda ned utdata omgående.