Loading

Z-Image Turbo — Alibaba Tongyi Labのオープンソース6Bテキスト→画像モデル

Z-Image Turboのご紹介

Z-Image Turboは、Qwenを手掛けるAlibabaのTongyi Labが開発した60億パラメータのテキスト→画像モデルです。2025年11月26日にApache 2.0ライセンスのオープンソースとして公開されました。Decoupled-DMDによってわずか8ステップのサンプリングに蒸留され、数秒で高品質な画像を生成します。中国語と英語のネイティブバイリンガルテキストレンダリングを実現し、Artificial Analysisのリーダーボードではオープンソース画像モデルの第1位を獲得しています。

Z-Image Turboは、Scalable Single-Stream DiT(S3-DiT)アーキテクチャを採用しています。テキストトークン、セマンティックビジョントークン、VAE画像トークンを統合ストリームに連結することで、6Bスケールでのパラメータ効率を最大化するTongyi Lab独自の設計です。ベースモデルZ-ImageをDecoupled-DMDで蒸留してZ-Image Turboとし、推論を8回の関数評価に圧縮しています。さらにDPOとGRPOで人間の審美的好みに合わせて調整されており、データセンターGPUではサブ秒レイテンシ、16GB VRAMのコンシューマ向けカードでも快適に推論できます。

ネイティブバイリンガルテキストレンダリングはこのモデル最大の差別化ポイントです。看板・ポスター・パッケージングなど複雑な中国語タイポグラフィを、英語テキストと同じ画像内で処理できます。この能力はほとんどの欧米画像モデルが今も苦手とするものです。2026年初頭現在、Z-Image TurboはArtificial Analysis Text-to-Image LeaderboardのオープンソースモデルNo.1を維持し、Alibaba AI Arenaでもオープンソーストップのポジションにあります。モデルの重みはHugging FaceとModelScopeでApache 2.0(商用利用可)として無償提供されています。

LoveGen AI上では、最大2000文字のプロンプトに対応し、9種類のプリセットアスペクト比(1:1、16:9、9:16、4:3、3:4、3:2、2:3、2:1、1:2)とカスタム寸法(376〜1536ピクセル範囲)をサポートします。決定論的シードパラメータ(1〜2,147,483,647)により再現性も担保されます。生成は通常約10秒、1枚あたり0.1クレジットと、最もコスト効率の高いテキスト→画像オプションです。生成された画像URLは24時間有効です。

Z-Image Turboの使い方

01

プロンプトを入力

最大2000文字で欲しい画像を説明します。被写体・スタイル・照明・構図を具体的に指定するほど良い結果が得られます。

02

アスペクト比を選択

用途に合わせて9つのプリセットから選びます。SNS投稿には1:1、サムネイルには16:9、縦型動画カバーには9:16がおすすめです。

03

生成して保存

「生成」をクリックします。約10秒で画像が届きます。生成リンクは24時間で失効するため、速やかにダウンロードしてください。

Z-Image Turboの技術仕様

開発者Alibaba Tongyi Lab(Tongyi-MAI)
リリース日2025年11月26日
ライセンスApache 2.0(オープンソース、商用利用可)
アーキテクチャScalable Single-Stream DiT(S3-DiT)
パラメータ数60億
推論ステップ数8(Decoupled-DMDで蒸留)
モードテキスト→画像
ネイティブ言語中国語+英語テキストレンダリング
推定生成時間約10秒(エンドツーエンド)
プロンプト長最大2000文字
アスペクト比1:1、16:9、9:16、4:3、3:4、3:2、2:3、2:1、1:2
カスタム寸法376〜1536 px(幅 × 高さ)
再現性シードパラメータ(1〜2,147,483,647)
コンテンツモデレーション常時有効ベースフィルター+厳格なNSFWフィルター
出力有効期限24時間(速やかに保存してください)
料金1枚あたり0.1クレジット

Z-Image Turboを選ぶ理由

ネイティブバイリンガルテキストレンダリング

同一画像内で正確な中国語・英語タイポグラフィを実現。看板・ポスター・パッケージングの文字入れも対応しており、大半の欧米モデルが苦手とする領域です。

Alibaba Tongyi Labのオープンソース

Qwenを手掛けたチームが開発し、2025年11月にApache 2.0でリリース。Artificial Analysisリーダーボードでオープンソースモデルトップを誇ります。

蒸留された6Bアーキテクチャ

60億パラメータのSingle-Stream DiT(S3-DiT)をDecoupled-DMDで8ステップに蒸留し、GPUでサブ秒推論を実現。

最低コスト

1生成あたり0.1クレジット。LoveGen AIで最もコスト効率の高いテキスト→画像オプションです。

シードで再現可能

決定論的シードパラメータにより結果を固定。同じプロンプト+同じシードで毎回一貫した出力が得られます。

Z-Image Turbo vs 他のAI画像生成モデル

FeatureZ-Image TurboGPT Image 2Flux 2 ProIdeogram v3
開発者Alibaba Tongyi LabOpenAIBlack Forest LabsIdeogram
ライセンスApache 2.0(オープンソース)クローズドクローズドクローズド
パラメータ数6B非公開非公開非公開
主な強みバイリンガルテキスト+オープンソース複数画像編集スタジオ品質タイポグラフィ&ブランディング
生成時間約10秒約30秒約30秒約15秒
アスペクト比9プリセット+カスタム3プリセット+自動複数複数
カスタム寸法あり(376〜1536 px)なしあり限定的
画像入力なし最大4枚最大8枚なし
1枚あたりの料金0.1クレジットより高いより高いより高い
最適な用途バイリンガルコンテンツ&高速反復編集&ブレンドスタジオ制作ロゴ&ポスター

Z-Image Turboの主な活用シーン

01

コンセプトの高速探索

ブランディング・キャンペーン・製品アイデアのビジュアル方向性を探るために、多くのバリエーションを素早く生成。

02

SNSコンテンツの大量制作

あらゆるアスペクト比で投稿・ストーリー・広告クリエイティブを低コストで量産し、大量のコンテンツスケジュールに対応。

03

サムネイル&バナー

動画サムネイルや縦型カバーには16:9・9:16プリセット、サイトバナーにはカスタム寸法を活用。

関連するAI画像生成モデルを探す

Z-Image Turboについてよくある質問

Z-Image Turboを開発したのは誰ですか?

Z-Image TurboはAlibabaのTongyi Labが開発しました。Qwenモデルファミリーを手掛けた同チームが2025年11月26日にApache 2.0ライセンスのオープンソースとして公開しました。

Z-Image Turboはどのくらい高速ですか?

Decoupled-DMDによる8ステップサンプリングへの蒸留により、データセンターGPUでサブ秒の推論を実現しています。LoveGen AIでのエンドツーエンドの生成は通常約10秒です。

Z-Image Turboは中国語と英語のテキストをレンダリングできますか?

はい。ネイティブバイリンガルテキストレンダリングはZ-Image Turbo最大の差別化ポイントです。複雑な中国語タイポグラフィ、英語テキスト、混合言語レイアウトを処理でき、多くの欧米モデルが苦手とする領域です。

Z-Image Turboはどのアスペクト比に対応していますか?

LoveGen AIでは、1:1、16:9、9:16、4:3、3:4、3:2、2:3、2:1、1:2の9種類のプリセットと、376〜1536ピクセル範囲のカスタム寸法に対応しています。

Z-Image Turboで特定の画像を再現できますか?

はい。数値シードパラメータ(1〜2,147,483,647)を指定できます。同じプロンプトと同じシードで一貫した結果が得られ、反復作業や関連画像のシリーズ制作に役立ちます。

LoveGen AIでのZ-Image Turboの料金は?

生成1枚あたり0.1クレジットです。最もコスト効率の高いテキスト→画像モデルです。生成された画像URLは24時間有効ですので、速やかにダウンロードしてください。