Published May 8, 2026Updated May 8, 2026

Z-Image Turbo — โมเดลแปลงข้อความเป็นภาพ 6B โอเพนซอร์สจาก Alibaba Tongyi Lab

แนะนำ Z-Image Turbo

Z-Image Turbo คือโมเดลแปลงข้อความเป็นภาพที่มี 6 พันล้านพารามิเตอร์ จาก Tongyi Lab ของ Alibaba — ทีมเดียวกับที่สร้าง Qwen — เผยแพร่เป็นโอเพนซอร์สเมื่อวันที่ 26 พฤศจิกายน 2025 ภายใต้ใบอนุญาต Apache 2.0 ผ่านการสลัดเหลือเพียงแปดขั้นตอนการสุ่มตัวอย่างด้วย Decoupled-DMD จึงสร้างภาพคุณภาพสูงได้ในไม่กี่วินาที มอบการแสดงผลข้อความสองภาษาแบบเนทีฟทั้งภาษาจีนและอังกฤษ และครองอันดับ 1 ในบรรดาโมเดลภาพโอเพนซอร์สบนลีดเดอร์บอร์ดของ Artificial Analysis

Z-Image Turbo ถูกสร้างบนสถาปัตยกรรม Scalable Single-Stream DiT (S3-DiT) ซึ่งรวมโทเค็นข้อความ โทเค็นวิสัยทัศน์เชิงความหมาย และโทเค็นภาพ VAE เข้าไว้ในสตรีมอินพุตเดียว — การออกแบบที่ Tongyi Lab ใช้เพื่อเพิ่มประสิทธิภาพพารามิเตอร์สูงสุดในระดับ 6B โมเดลพื้นฐาน Z-Image ถูกสลัดเป็น Z-Image Turbo ผ่าน Decoupled-DMD ทำให้การอนุมานเหลือเพียงแปดการประเมินฟังก์ชัน และปรับให้สอดคล้องกับความชอบด้านความสวยงามของมนุษย์ด้วย DPO และ GRPO ผลลัพธ์คือความหน่วงต่ำกว่าหนึ่งวินาทีบน GPU ศูนย์ข้อมูล และการอนุมานที่สบายบนการ์ดผู้บริโภคที่มี VRAM 16 GB

การแสดงผลข้อความสองภาษาแบบเนทีฟคือจุดเด่นที่แข็งแกร่งที่สุดของโมเดล Z-Image Turbo จัดการตัวอักษรจีนที่ซับซ้อน — ป้าย โปสเตอร์ บรรจุภัณฑ์ — ควบคู่กับข้อความภาษาอังกฤษในภาพเดียวกัน ซึ่งเป็นความสามารถที่โมเดลภาพตะวันตกส่วนใหญ่ยังคงประสบปัญหา ณ ต้นปี 2026 Z-Image Turbo ครองอันดับ 1 ในบรรดาโมเดลภาพโอเพนซอร์สบน Artificial Analysis Text-to-Image Leaderboard และตำแหน่งสูงสุดโอเพนซอร์สบน Alibaba AI Arena พร้อมน้ำหนักที่ให้บริการฟรีบน Hugging Face และ ModelScope ภายใต้ Apache 2.0 (อนุญาตใช้งานเชิงพาณิชย์)

บน LoveGen AI Z-Image Turbo รับพรอมต์ได้สูงสุด 2000 อักขระ และมีอัตราส่วนภาพที่ตั้งค่าไว้ล่วงหน้าเก้าแบบ — 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1 และ 1:2 — พร้อมขนาดที่กำหนดเองในช่วง 376–1536 พิกเซล พารามิเตอร์ซีดแบบดีเทอร์มินิสติก (1 ถึง 2,147,483,647) ทำให้ผลลัพธ์สามารถทำซ้ำได้สำหรับการวนซ้ำและงานแบบแบตช์ การสร้างภาพจากต้นจนจบโดยทั่วไปใช้เวลาประมาณสิบวินาทีที่ 0.1 เครดิตต่อภาพ URL ภาพที่สร้างขึ้นยังคงใช้งานได้นาน 24 ชั่วโมง

วิธีใช้ Z-Image Turbo

เขียนพรอมต์ของคุณ

อธิบายภาพที่ต้องการด้วยอักขระสูงสุด 2000 ตัว ระบุวัตถุ สไตล์ แสง และการจัดองค์ประกอบอย่างเฉพาะเจาะจงเพื่อผลลัพธ์ที่ดีที่สุด

เลือกอัตราส่วนภาพ

เลือกหนึ่งในอัตราส่วนภาพที่ตั้งค่าไว้ล่วงหน้าเก้าแบบที่เหมาะกับปลายทางของคุณ — สี่เหลี่ยมจัตุรัสสำหรับโซเชียลมีเดีย 16:9 สำหรับภาพขนาดย่อ 9:16 สำหรับปกวิดีโอแนวตั้ง

สร้างและบันทึก

คลิกสร้าง ภาพของคุณจะมาถึงในประมาณสิบวินาที ดาวน์โหลดภายใน 24 ชั่วโมงเนื่องจากลิงก์ที่สร้างขึ้นจะหมดอายุหลังจากนั้น

ข้อมูลจำเพาะทางเทคนิคของ Z-Image Turbo

ผู้พัฒนา	Alibaba Tongyi Lab (Tongyi-MAI)
วันที่เผยแพร่	26 พฤศจิกายน 2568
ใบอนุญาต	Apache 2.0 (โอเพนซอร์ส อนุญาตใช้งานเชิงพาณิชย์)
สถาปัตยกรรม	Scalable Single-Stream DiT (S3-DiT)
จำนวนพารามิเตอร์	6 พันล้าน
ขั้นตอนการอนุมาน	8 (สลัดผ่าน Decoupled-DMD)
โหมด	แปลงข้อความเป็นภาพ
ภาษาเนทีฟ	การแสดงผลข้อความจีน + อังกฤษ
เวลาสร้างภาพโดยประมาณ	~10 วินาที (ต้นจนจบ)
ความยาวพรอมต์	สูงสุด 2000 อักขระ
อัตราส่วนภาพ	1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1, 1:2
ขนาดที่กำหนดเอง	376–1536 พิกเซล (กว้าง × สูง)
ความสามารถในการทำซ้ำ	พารามิเตอร์ซีด (1 ถึง 2,147,483,647)
การกลั่นกรองเนื้อหา	ฟิลเตอร์พื้นฐานเปิดตลอดเวลา + ฟิลเตอร์ NSFW เข้มงวด
ความถูกต้องของผลลัพธ์	24 ชั่วโมง (บันทึกผลลัพธ์ทันที)
ค่าใช้จ่าย	0.1 เครดิตต่อภาพ

ทำไมต้องเลือก Z-Image Turbo

การแสดงผลข้อความสองภาษาแบบเนทีฟ

ตัวพิมพ์ภาษาจีนและอังกฤษที่แม่นยำในภาพเดียวกัน — รวมถึงป้าย โปสเตอร์ และบรรจุภัณฑ์ — ความสามารถที่โมเดลตะวันตกส่วนใหญ่ยังขาด

โอเพนซอร์สจาก Alibaba Tongyi Lab

สร้างโดยทีมเบื้องหลัง Qwen และเผยแพร่ภายใต้ Apache 2.0 ในเดือนพฤศจิกายน 2025 โมเดลภาพโอเพนซอร์สที่มีอันดับสูงสุดบนลีดเดอร์บอร์ดของ Artificial Analysis

สถาปัตยกรรม 6B ที่ถูกสลัด

Single-Stream DiT (S3-DiT) ที่มี 6 พันล้านพารามิเตอร์ ถูกสลัดเหลือเพียง 8 ขั้นตอนการสุ่มตัวอย่างผ่าน Decoupled-DMD สำหรับการอนุมานต่ำกว่าหนึ่งวินาทีบน GPU

ค่าใช้จ่ายต่อภาพต่ำที่สุด

0.1 เครดิตต่อการสร้าง — ตัวเลือกแปลงข้อความเป็นภาพที่มีประสิทธิภาพสูงสุดของ LoveGen AI สำหรับงานปริมาณสูง

ทำซ้ำได้ด้วยซีด

พารามิเตอร์ซีดแบบดีเทอร์มินิสติกล็อกผลลัพธ์ พรอมต์เดิมบวกซีดเดิมจะให้ผลลัพธ์ที่สม่ำเสมอในทุกการรัน

Z-Image Turbo เทียบกับตัวสร้างภาพ AI อื่นๆ

Feature	Z-Image Turbo	GPT Image 2	Flux 2 Pro	Ideogram v3
ผู้พัฒนา	Alibaba Tongyi Lab	OpenAI	Black Forest Labs	Ideogram
ใบอนุญาต	Apache 2.0 (โอเพนซอร์ส)	ปิด	ปิด	ปิด
จำนวนพารามิเตอร์	6B	ไม่เปิดเผย	ไม่เปิดเผย	ไม่เปิดเผย
จุดแข็งหลัก	ข้อความสองภาษา + โอเพนซอร์ส	แก้ไขหลายภาพ	คุณภาพสตูดิโอ	ตัวพิมพ์และแบรนดิ้ง
เวลาสร้างภาพ	~10 วินาที	~30 วินาที	~30 วินาที	~15 วินาที
อัตราส่วนภาพ	9 พรีเซ็ต + กำหนดเอง	3 พรีเซ็ต + อัตโนมัติ	หลายแบบ	หลายแบบ
ขนาดที่กำหนดเอง	ได้ (376–1536 พิกเซล)	ไม่ได้	ได้	จำกัด
รับภาพอินพุต	ไม่ได้	สูงสุด 4 ภาพ	สูงสุด 8 ภาพ	ไม่ได้
ค่าใช้จ่ายต่อภาพ	0.1 เครดิต	สูงกว่า	สูงกว่า	สูงกว่า
เหมาะที่สุดสำหรับ	เนื้อหาสองภาษาและการวนซ้ำเร็ว	การแก้ไขและผสม	งานสตูดิโอ	โลโก้และโปสเตอร์

การใช้งานยอดนิยมของ Z-Image Turbo

การสำรวจแนวคิดอย่างรวดเร็ว

สร้างรูปแบบต่างๆ มากมายอย่างรวดเร็วเพื่อสำรวจทิศทางภาพสำหรับการสร้างแบรนด์ แคมเปญ หรือแนวคิดผลิตภัณฑ์

เนื้อหาโซเชียลมีเดียในระดับขนาดใหญ่

ผลิตโพสต์ สตอรี่ และสื่อโฆษณาในอัตราส่วนภาพใดก็ได้ด้วยค่าใช้จ่ายต่อภาพที่ต่ำสำหรับกำหนดการเนื้อหาปริมาณสูง

ภาพขนาดย่อและแบนเนอร์

ใช้พรีเซ็ต 16:9 และ 9:16 สำหรับภาพขนาดย่อของวิดีโอและปกแนวตั้ง หรือขนาดที่กำหนดเองสำหรับแบนเนอร์ไซต์

สำรวจตัวสร้างภาพ AI ที่เกี่ยวข้อง

GPT Image 2

โมเดลภาพของ OpenAI พร้อมการแก้ไขอ้างอิงหลายภาพและพรอมต์ภาษาธรรมชาติ

Nano Banana Pro

โมเดลภาพของ Google พร้อมการผสมสูงสุด 14 ภาพและความเข้าใจพรอมต์ระดับ Gemini

Flux 2 Pro

ตัวสร้างภาพระดับสตูดิโอจาก Black Forest Labs ที่มีความละเอียด 4MP

Ideogram v3

ตัวพิมพ์และการแสดงผลข้อความชั้นนำของอุตสาหกรรมสำหรับโลโก้และโปสเตอร์

Qwen Image

โมเดลภาพน้องของ Alibaba จากตระกูล Qwen พร้อมความเข้าใจพรอมต์หลายภาษาที่แข็งแกร่ง

Midjourney V7

การสร้างภาพเชิงสุนทรียะชั้นนำของอุตสาหกรรมที่ส่งคืนสี่ผู้สมัครต่องาน

คำถามที่พบบ่อยเกี่ยวกับ Z-Image Turbo

ใครสร้าง Z-Image Turbo?

Z-Image Turbo พัฒนาโดย Tongyi Lab ของ Alibaba — ทีมเดียวกับที่อยู่เบื้องหลังตระกูลโมเดล Qwen — และเผยแพร่เป็นโอเพนซอร์สภายใต้ใบอนุญาต Apache 2.0 เมื่อวันที่ 26 พฤศจิกายน 2025

Z-Image Turbo เร็วแค่ไหน?

Z-Image Turbo ถูกสลัดเหลือเพียง 8 ขั้นตอนการสุ่มตัวอย่างผ่าน Decoupled-DMD ทำให้มีความหน่วงต่ำกว่าหนึ่งวินาทีบน GPU ศูนย์ข้อมูล บน LoveGen AI การสร้างภาพจากต้นจนจบโดยทั่วไปใช้เวลาประมาณสิบวินาที

Z-Image Turbo สามารถแสดงผลข้อความภาษาจีนและอังกฤษได้หรือไม่?

ได้ — การแสดงผลข้อความสองภาษาแบบเนทีฟคือหนึ่งในจุดเด่นที่ยิ่งใหญ่ที่สุดของ Z-Image Turbo โมเดลจัดการตัวอักษรจีนที่ซับซ้อน ข้อความภาษาอังกฤษ และเลย์เอาต์หลายภาษาที่โมเดลตะวันตกหลายตัวยังคงประสบปัญหา

Z-Image Turbo รองรับอัตราส่วนภาพใดบ้าง?

บน LoveGen AI Z-Image Turbo มีอัตราส่วนภาพที่ตั้งค่าไว้ล่วงหน้าเก้าแบบ — 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1 และ 1:2 — และขนาดที่กำหนดเองในช่วง 376–1536 พิกเซล

ฉันสามารถทำซ้ำภาพที่เฉพาะเจาะจงด้วย Z-Image Turbo ได้หรือไม่?

ได้ Z-Image Turbo รับพารามิเตอร์ซีดตัวเลข (1 ถึง 2,147,483,647) พรอมต์เดิมกับซีดเดิมจะให้ผลลัพธ์ที่สม่ำเสมอ เหมาะสำหรับการวนซ้ำหรือสร้างชุดภาพที่เกี่ยวข้อง

Z-Image Turbo บน LoveGen AI ราคาเท่าไหร่?

Z-Image Turbo มีค่าใช้จ่าย 0.1 เครดิตต่อภาพที่สร้างขึ้น — โมเดลแปลงข้อความเป็นภาพที่คุ้มค่าที่สุดของเรา URL ภาพที่สร้างขึ้นยังคงใช้งานได้นาน 24 ชั่วโมง ดังนั้นดาวน์โหลดผลลัพธ์ทันที