Loading

Z-Image Turbo — 阿里通义实验室开源 60 亿参数文生图模型

Z-Image Turbo 是什么

Z-Image Turbo 是阿里巴巴通义实验室(Qwen 团队)于 2025 年 11 月 26 日发布的 60 亿参数文生图模型,采用 Apache 2.0 协议完全开源。模型通过 Decoupled-DMD 蒸馏将推理压缩至 8 步,几秒钟即可生成高质量图像,原生支持中英文双语文字渲染,并在 Artificial Analysis 文生图榜单中位居开源模型第一。

Z-Image Turbo 基于可扩展单流扩散 Transformer(Scalable Single-Stream DiT,简称 S3-DiT)架构,将文本、视觉语义 token 与 VAE 图像 token 拼接为统一输入序列——这是通义实验室在 60 亿参数规模下追求最高参数效率的核心设计。其 Turbo 版本通过 Decoupled-DMD 从基础 Z-Image 蒸馏而来,把推理过程压缩到 8 次函数评估,并通过 DPO 与 GRPO 阶段对齐人类美学偏好。在数据中心 GPU 上可实现亚秒级推理,在 16 GB 显存的消费级显卡上也能流畅运行。

原生中英文双语文字渲染是该模型最突出的差异化优势:Z-Image Turbo 能够在同一张图中准确渲染复杂的中文版式(招牌、海报、包装)与英文文字,这是大多数西方图像模型仍难以企及的能力。截至 2026 年初,Z-Image Turbo 在 Artificial Analysis 文生图榜单中保持开源模型第一的位置,在阿里 AI Arena 上同样位列开源榜首;模型权重已在 Hugging Face 与 ModelScope(魔搭)平台以 Apache 2.0 协议公开发布,允许商用。

在 LoveGen AI 上,Z-Image Turbo 支持最长 2000 字符的提示词,并提供九种预设比例——1:1、16:9、9:16、4:3、3:4、3:2、2:3、2:1、1:2——以及 376–1536 像素范围内的自定义尺寸。确定性种子参数(1 至 2,147,483,647)让结果可复现,方便迭代与批量生产。端到端生成通常约 10 秒完成,每张图仅需 0.1 积分,是 LoveGen AI 上最具性价比的文生图选择,特别适合高频社媒创作、中文创意工作和快速概念探索。生成的图片链接有效期为 24 小时。

如何使用 Z-Image Turbo

01

撰写提示词

用最多 2000 个字符描述你想要的画面。明确写出主体、风格、光线和构图,可以得到更佳效果。

02

选择图像比例

从九种预设比例中挑选合适的版式——社交内容选 1:1,缩略图选 16:9,竖屏视频封面选 9:16。

03

生成并保存

点击生成。约 10 秒后即可拿到图片。请在 24 小时内下载,链接到期后将失效。

Z-Image Turbo 技术规格

开发团队阿里巴巴通义实验室(Tongyi-MAI)
发布时间2025 年 11 月 26 日
开源协议Apache 2.0(开源,允许商用)
模型架构可扩展单流扩散 Transformer(S3-DiT)
参数规模60 亿
推理步数8 步(Decoupled-DMD 蒸馏)
模式文生图
原生语言中文 + 英文文字渲染
预计生成时间约 10 秒(端到端)
提示词长度最长 2000 字符
图像比例1:1、16:9、9:16、4:3、3:4、3:2、2:3、2:1、1:2
自定义尺寸376–1536 像素(宽 × 高)
可复现性种子参数(1 至 2,147,483,647)
内容审核默认基础过滤 + 严格 NSFW 过滤
输出有效期24 小时(请及时下载)
费用每张 0.1 积分

为什么选择 Z-Image Turbo

原生中英双语文字渲染

在同一张图中准确渲染中英文版式——包括招牌、海报、包装文案——这是大多数西方图像模型尚未具备的能力。

阿里通义实验室开源出品

由 Qwen 千问背后的团队打造,2025 年 11 月以 Apache 2.0 协议开源。Artificial Analysis 文生图榜单上排名第一的开源模型。

60 亿参数蒸馏架构

可扩展单流扩散 Transformer(S3-DiT),60 亿参数经 Decoupled-DMD 蒸馏至仅 8 步采样,在 GPU 上实现亚秒级推理。

最低单张成本

每张仅需 0.1 积分——LoveGen AI 上最具性价比的文生图选择,特别适合高产量的创作工作。

种子可复现

确定性种子参数让结果可锁定。相同提示词配合相同种子,多次运行都能得到一致输出。

Z-Image Turbo 与其他 AI 图像生成器对比

FeatureZ-Image TurboGPT Image 2Flux 2 ProIdeogram v3
开发团队阿里通义实验室OpenAIBlack Forest LabsIdeogram
开源协议Apache 2.0(开源)闭源闭源闭源
参数规模60 亿未公开未公开未公开
核心优势中英双语文字 + 开源多图编辑影棚级画质排版与品牌设计
生成时间约 10 秒约 30 秒约 30 秒约 15 秒
图像比例9 种预设 + 自定义3 种预设 + 自动多种多种
自定义尺寸支持(376–1536 像素)不支持支持受限
图像输入不支持最多 4 张最多 8 张不支持
单张费用0.1 积分更高更高更高
适用场景中英双语内容与快速迭代图像编辑与融合影棚级创作Logo 与海报

Z-Image Turbo 的常见用途

01

快速概念探索

短时间内生成大量变体,为品牌、campaign 或产品创意快速探索视觉方向。

02

规模化社媒内容

以低单价生成各种比例的贴文、Stories 与广告创意,轻松支撑高频内容排期。

03

缩略图与横幅

用 16:9、9:16 预设制作视频缩略图与竖屏封面,或通过自定义尺寸输出网站横幅。

了解相关 AI 图像生成器

关于 Z-Image Turbo 的常见问题

Z-Image Turbo 是谁开发的?

Z-Image Turbo 由阿里巴巴通义实验室开发,与 Qwen 千问大模型出自同一团队。模型于 2025 年 11 月 26 日以 Apache 2.0 协议开源发布。

Z-Image Turbo 速度有多快?

模型经 Decoupled-DMD 蒸馏后仅需 8 步采样,在数据中心 GPU 上可达亚秒级推理。在 LoveGen AI 上,端到端生成通常约 10 秒完成。

Z-Image Turbo 能渲染中英文文字吗?

可以——原生中英文双语文字渲染是 Z-Image Turbo 最大的差异化优势之一。模型能够处理复杂中文版式、英文文字以及中英混排的图文,这是许多西方图像模型仍然难以做到的。

Z-Image Turbo 支持哪些图像比例?

在 LoveGen AI 上,Z-Image Turbo 提供九种预设比例——1:1、16:9、9:16、4:3、3:4、3:2、2:3、2:1、1:2——同时支持 376–1536 像素范围内的自定义尺寸。

Z-Image Turbo 生成的图片可以复现吗?

可以。Z-Image Turbo 支持数字种子参数(1 至 2,147,483,647)。相同的提示词配合相同的种子会产出一致的结果,便于反复迭代或制作系列图片。

在 LoveGen AI 上使用 Z-Image Turbo 多少钱?

每张图仅需 0.1 积分,是 LoveGen AI 上最具性价比的文生图模型。生成的图片链接有效期为 24 小时,请及时下载。