Published May 8, 2026Updated May 8, 2026

Z-Image Turbo — 阿里通义实验室开源 60 亿参数文生图模型

Z-Image Turbo 是什么

Z-Image Turbo 是阿里巴巴通义实验室（Qwen 团队）于 2025 年 11 月 26 日发布的 60 亿参数文生图模型，采用 Apache 2.0 协议完全开源。模型通过 Decoupled-DMD 蒸馏将推理压缩至 8 步，几秒钟即可生成高质量图像，原生支持中英文双语文字渲染，并在 Artificial Analysis 文生图榜单中位居开源模型第一。

Z-Image Turbo 基于可扩展单流扩散 Transformer（Scalable Single-Stream DiT，简称 S3-DiT）架构，将文本、视觉语义 token 与 VAE 图像 token 拼接为统一输入序列——这是通义实验室在 60 亿参数规模下追求最高参数效率的核心设计。其 Turbo 版本通过 Decoupled-DMD 从基础 Z-Image 蒸馏而来，把推理过程压缩到 8 次函数评估，并通过 DPO 与 GRPO 阶段对齐人类美学偏好。在数据中心 GPU 上可实现亚秒级推理，在 16 GB 显存的消费级显卡上也能流畅运行。

原生中英文双语文字渲染是该模型最突出的差异化优势：Z-Image Turbo 能够在同一张图中准确渲染复杂的中文版式（招牌、海报、包装）与英文文字，这是大多数西方图像模型仍难以企及的能力。截至 2026 年初，Z-Image Turbo 在 Artificial Analysis 文生图榜单中保持开源模型第一的位置，在阿里 AI Arena 上同样位列开源榜首；模型权重已在 Hugging Face 与 ModelScope（魔搭）平台以 Apache 2.0 协议公开发布，允许商用。

在 LoveGen AI 上，Z-Image Turbo 支持最长 2000 字符的提示词，并提供九种预设比例——1:1、16:9、9:16、4:3、3:4、3:2、2:3、2:1、1:2——以及 376–1536 像素范围内的自定义尺寸。确定性种子参数（1 至 2,147,483,647）让结果可复现，方便迭代与批量生产。端到端生成通常约 10 秒完成，每张图仅需 0.1 积分，是 LoveGen AI 上最具性价比的文生图选择，特别适合高频社媒创作、中文创意工作和快速概念探索。生成的图片链接有效期为 24 小时。

如何使用 Z-Image Turbo

撰写提示词

用最多 2000 个字符描述你想要的画面。明确写出主体、风格、光线和构图，可以得到更佳效果。

选择图像比例

从九种预设比例中挑选合适的版式——社交内容选 1:1，缩略图选 16:9，竖屏视频封面选 9:16。

生成并保存

点击生成。约 10 秒后即可拿到图片。请在 24 小时内下载，链接到期后将失效。

Z-Image Turbo 技术规格

开发团队	阿里巴巴通义实验室（Tongyi-MAI）
发布时间	2025 年 11 月 26 日
开源协议	Apache 2.0（开源，允许商用）
模型架构	可扩展单流扩散 Transformer（S3-DiT）
参数规模	60 亿
推理步数	8 步（Decoupled-DMD 蒸馏）
模式	文生图
原生语言	中文 + 英文文字渲染
预计生成时间	约 10 秒（端到端）
提示词长度	最长 2000 字符
图像比例	1:1、16:9、9:16、4:3、3:4、3:2、2:3、2:1、1:2
自定义尺寸	376–1536 像素（宽 × 高）
可复现性	种子参数（1 至 2,147,483,647）
内容审核	默认基础过滤 + 严格 NSFW 过滤
输出有效期	24 小时（请及时下载）
费用	每张 0.1 积分

为什么选择 Z-Image Turbo

原生中英双语文字渲染

在同一张图中准确渲染中英文版式——包括招牌、海报、包装文案——这是大多数西方图像模型尚未具备的能力。

阿里通义实验室开源出品

由 Qwen 千问背后的团队打造，2025 年 11 月以 Apache 2.0 协议开源。Artificial Analysis 文生图榜单上排名第一的开源模型。

60 亿参数蒸馏架构

可扩展单流扩散 Transformer（S3-DiT），60 亿参数经 Decoupled-DMD 蒸馏至仅 8 步采样，在 GPU 上实现亚秒级推理。

最低单张成本

每张仅需 0.1 积分——LoveGen AI 上最具性价比的文生图选择，特别适合高产量的创作工作。

种子可复现

确定性种子参数让结果可锁定。相同提示词配合相同种子，多次运行都能得到一致输出。

Z-Image Turbo 与其他 AI 图像生成器对比

Feature	Z-Image Turbo	GPT Image 2	Flux 2 Pro	Ideogram v3
开发团队	阿里通义实验室	OpenAI	Black Forest Labs	Ideogram
开源协议	Apache 2.0（开源）	闭源	闭源	闭源
参数规模	60 亿	未公开	未公开	未公开
核心优势	中英双语文字 + 开源	多图编辑	影棚级画质	排版与品牌设计
生成时间	约 10 秒	约 30 秒	约 30 秒	约 15 秒
图像比例	9 种预设 + 自定义	3 种预设 + 自动	多种	多种
自定义尺寸	支持（376–1536 像素）	不支持	支持	受限
图像输入	不支持	最多 4 张	最多 8 张	不支持
单张费用	0.1 积分	更高	更高	更高
适用场景	中英双语内容与快速迭代	图像编辑与融合	影棚级创作	Logo 与海报

Z-Image Turbo 的常见用途

快速概念探索

短时间内生成大量变体，为品牌、campaign 或产品创意快速探索视觉方向。

规模化社媒内容

以低单价生成各种比例的贴文、Stories 与广告创意，轻松支撑高频内容排期。

缩略图与横幅

用 16:9、9:16 预设制作视频缩略图与竖屏封面，或通过自定义尺寸输出网站横幅。

了解相关 AI 图像生成器

GPT Image 2

OpenAI 的图像模型，支持多图参考编辑与自然语言提示。

Nano Banana Pro

Google 的图像模型，支持最多 14 张图融合与 Gemini 级提示理解。

Flux 2 Pro

Black Forest Labs 的影棚级生成器，支持 4MP 分辨率。

Ideogram v3

业内领先的排版与文字渲染能力，适合 Logo 和海报。

Qwen Image

阿里通义千问家族的姊妹图像模型，多语言提示理解出色。

Midjourney V7

业内领先的美学图像生成模型，每次任务返回 4 张候选图。

关于 Z-Image Turbo 的常见问题

Z-Image Turbo 是谁开发的？

Z-Image Turbo 由阿里巴巴通义实验室开发，与 Qwen 千问大模型出自同一团队。模型于 2025 年 11 月 26 日以 Apache 2.0 协议开源发布。

Z-Image Turbo 速度有多快？

模型经 Decoupled-DMD 蒸馏后仅需 8 步采样，在数据中心 GPU 上可达亚秒级推理。在 LoveGen AI 上，端到端生成通常约 10 秒完成。

Z-Image Turbo 能渲染中英文文字吗？

可以——原生中英文双语文字渲染是 Z-Image Turbo 最大的差异化优势之一。模型能够处理复杂中文版式、英文文字以及中英混排的图文，这是许多西方图像模型仍然难以做到的。

Z-Image Turbo 支持哪些图像比例？

在 LoveGen AI 上，Z-Image Turbo 提供九种预设比例——1:1、16:9、9:16、4:3、3:4、3:2、2:3、2:1、1:2——同时支持 376–1536 像素范围内的自定义尺寸。

Z-Image Turbo 生成的图片可以复现吗？

可以。Z-Image Turbo 支持数字种子参数（1 至 2,147,483,647）。相同的提示词配合相同的种子会产出一致的结果，便于反复迭代或制作系列图片。

在 LoveGen AI 上使用 Z-Image Turbo 多少钱？

每张图仅需 0.1 积分，是 LoveGen AI 上最具性价比的文生图模型。生成的图片链接有效期为 24 小时，请及时下载。