Published May 8, 2026Updated May 8, 2026

Z-Image Turbo — Alibaba Tongyi Labのオープンソース6Bテキスト→画像モデル

Z-Image Turboのご紹介

Z-Image Turboは、Qwenを手掛けるAlibabaのTongyi Labが開発した60億パラメータのテキスト→画像モデルです。2025年11月26日にApache 2.0ライセンスのオープンソースとして公開されました。Decoupled-DMDによってわずか8ステップのサンプリングに蒸留され、数秒で高品質な画像を生成します。中国語と英語のネイティブバイリンガルテキストレンダリングを実現し、Artificial Analysisのリーダーボードではオープンソース画像モデルの第1位を獲得しています。

Z-Image Turboは、Scalable Single-Stream DiT（S3-DiT）アーキテクチャを採用しています。テキストトークン、セマンティックビジョントークン、VAE画像トークンを統合ストリームに連結することで、6Bスケールでのパラメータ効率を最大化するTongyi Lab独自の設計です。ベースモデルZ-ImageをDecoupled-DMDで蒸留してZ-Image Turboとし、推論を8回の関数評価に圧縮しています。さらにDPOとGRPOで人間の審美的好みに合わせて調整されており、データセンターGPUではサブ秒レイテンシ、16GB VRAMのコンシューマ向けカードでも快適に推論できます。

ネイティブバイリンガルテキストレンダリングはこのモデル最大の差別化ポイントです。看板・ポスター・パッケージングなど複雑な中国語タイポグラフィを、英語テキストと同じ画像内で処理できます。この能力はほとんどの欧米画像モデルが今も苦手とするものです。2026年初頭現在、Z-Image TurboはArtificial Analysis Text-to-Image LeaderboardのオープンソースモデルNo.1を維持し、Alibaba AI Arenaでもオープンソーストップのポジションにあります。モデルの重みはHugging FaceとModelScopeでApache 2.0（商用利用可）として無償提供されています。

LoveGen AI上では、最大2000文字のプロンプトに対応し、9種類のプリセットアスペクト比（1:1、16:9、9:16、4:3、3:4、3:2、2:3、2:1、1:2）とカスタム寸法（376〜1536ピクセル範囲）をサポートします。決定論的シードパラメータ（1〜2,147,483,647）により再現性も担保されます。生成は通常約10秒、1枚あたり0.1クレジットと、最もコスト効率の高いテキスト→画像オプションです。生成された画像URLは24時間有効です。

Z-Image Turboの使い方

プロンプトを入力

最大2000文字で欲しい画像を説明します。被写体・スタイル・照明・構図を具体的に指定するほど良い結果が得られます。

アスペクト比を選択

用途に合わせて9つのプリセットから選びます。SNS投稿には1:1、サムネイルには16:9、縦型動画カバーには9:16がおすすめです。

生成して保存

「生成」をクリックします。約10秒で画像が届きます。生成リンクは24時間で失効するため、速やかにダウンロードしてください。

Z-Image Turboの技術仕様

開発者	Alibaba Tongyi Lab（Tongyi-MAI）
リリース日	2025年11月26日
ライセンス	Apache 2.0（オープンソース、商用利用可）
アーキテクチャ	Scalable Single-Stream DiT（S3-DiT）
パラメータ数	60億
推論ステップ数	8（Decoupled-DMDで蒸留）
モード	テキスト→画像
ネイティブ言語	中国語＋英語テキストレンダリング
推定生成時間	約10秒（エンドツーエンド）
プロンプト長	最大2000文字
アスペクト比	1:1、16:9、9:16、4:3、3:4、3:2、2:3、2:1、1:2
カスタム寸法	376〜1536 px（幅 × 高さ）
再現性	シードパラメータ（1〜2,147,483,647）
コンテンツモデレーション	常時有効ベースフィルター＋厳格なNSFWフィルター
出力有効期限	24時間（速やかに保存してください）
料金	1枚あたり0.1クレジット

Z-Image Turboを選ぶ理由

ネイティブバイリンガルテキストレンダリング

同一画像内で正確な中国語・英語タイポグラフィを実現。看板・ポスター・パッケージングの文字入れも対応しており、大半の欧米モデルが苦手とする領域です。

Alibaba Tongyi Labのオープンソース

Qwenを手掛けたチームが開発し、2025年11月にApache 2.0でリリース。Artificial Analysisリーダーボードでオープンソースモデルトップを誇ります。

蒸留された6Bアーキテクチャ

60億パラメータのSingle-Stream DiT（S3-DiT）をDecoupled-DMDで8ステップに蒸留し、GPUでサブ秒推論を実現。

最低コスト

1生成あたり0.1クレジット。LoveGen AIで最もコスト効率の高いテキスト→画像オプションです。

シードで再現可能

決定論的シードパラメータにより結果を固定。同じプロンプト＋同じシードで毎回一貫した出力が得られます。

Z-Image Turbo vs 他のAI画像生成モデル

Feature	Z-Image Turbo	GPT Image 2	Flux 2 Pro	Ideogram v3
開発者	Alibaba Tongyi Lab	OpenAI	Black Forest Labs	Ideogram
ライセンス	Apache 2.0（オープンソース）	クローズド	クローズド	クローズド
パラメータ数	6B	非公開	非公開	非公開
主な強み	バイリンガルテキスト＋オープンソース	複数画像編集	スタジオ品質	タイポグラフィ＆ブランディング
生成時間	約10秒	約30秒	約30秒	約15秒
アスペクト比	9プリセット＋カスタム	3プリセット＋自動	複数	複数
カスタム寸法	あり（376〜1536 px）	なし	あり	限定的
画像入力	なし	最大4枚	最大8枚	なし
1枚あたりの料金	0.1クレジット	より高い	より高い	より高い
最適な用途	バイリンガルコンテンツ＆高速反復	編集＆ブレンド	スタジオ制作	ロゴ＆ポスター

Z-Image Turboの主な活用シーン

コンセプトの高速探索

ブランディング・キャンペーン・製品アイデアのビジュアル方向性を探るために、多くのバリエーションを素早く生成。

SNSコンテンツの大量制作

あらゆるアスペクト比で投稿・ストーリー・広告クリエイティブを低コストで量産し、大量のコンテンツスケジュールに対応。

サムネイル＆バナー

動画サムネイルや縦型カバーには16:9・9:16プリセット、サイトバナーにはカスタム寸法を活用。

Z-Image Turboについてよくある質問

Z-Image Turboを開発したのは誰ですか？

Z-Image TurboはAlibabaのTongyi Labが開発しました。Qwenモデルファミリーを手掛けた同チームが2025年11月26日にApache 2.0ライセンスのオープンソースとして公開しました。

Z-Image Turboはどのくらい高速ですか？

Decoupled-DMDによる8ステップサンプリングへの蒸留により、データセンターGPUでサブ秒の推論を実現しています。LoveGen AIでのエンドツーエンドの生成は通常約10秒です。

Z-Image Turboは中国語と英語のテキストをレンダリングできますか？

はい。ネイティブバイリンガルテキストレンダリングはZ-Image Turbo最大の差別化ポイントです。複雑な中国語タイポグラフィ、英語テキスト、混合言語レイアウトを処理でき、多くの欧米モデルが苦手とする領域です。

Z-Image Turboはどのアスペクト比に対応していますか？

LoveGen AIでは、1:1、16:9、9:16、4:3、3:4、3:2、2:3、2:1、1:2の9種類のプリセットと、376〜1536ピクセル範囲のカスタム寸法に対応しています。

Z-Image Turboで特定の画像を再現できますか？

はい。数値シードパラメータ（1〜2,147,483,647）を指定できます。同じプロンプトと同じシードで一貫した結果が得られ、反復作業や関連画像のシリーズ制作に役立ちます。

LoveGen AIでのZ-Image Turboの料金は？

生成1枚あたり0.1クレジットです。最もコスト効率の高いテキスト→画像モデルです。生成された画像URLは24時間有効ですので、速やかにダウンロードしてください。