
Z-Image Turbo — โมเดลแปลงข้อความเป็นภาพ 6B โอเพนซอร์สจาก Alibaba Tongyi Lab
แนะนำ Z-Image Turbo
Z-Image Turbo คือโมเดลแปลงข้อความเป็นภาพที่มี 6 พันล้านพารามิเตอร์ จาก Tongyi Lab ของ Alibaba — ทีมเดียวกับที่สร้าง Qwen — เผยแพร่เป็นโอเพนซอร์สเมื่อวันที่ 26 พฤศจิกายน 2025 ภายใต้ใบอนุญาต Apache 2.0 ผ่านการสลัดเหลือเพียงแปดขั้นตอนการสุ่มตัวอย่างด้วย Decoupled-DMD จึงสร้างภาพคุณภาพสูงได้ในไม่กี่วินาที มอบการแสดงผลข้อความสองภาษาแบบเนทีฟทั้งภาษาจีนและอังกฤษ และครองอันดับ 1 ในบรรดาโมเดลภาพโอเพนซอร์สบนลีดเดอร์บอร์ดของ Artificial Analysis
Z-Image Turbo ถูกสร้างบนสถาปัตยกรรม Scalable Single-Stream DiT (S3-DiT) ซึ่งรวมโทเค็นข้อความ โทเค็นวิสัยทัศน์เชิงความหมาย และโทเค็นภาพ VAE เข้าไว้ในสตรีมอินพุตเดียว — การออกแบบที่ Tongyi Lab ใช้เพื่อเพิ่มประสิทธิภาพพารามิเตอร์สูงสุดในระดับ 6B โมเดลพื้นฐาน Z-Image ถูกสลัดเป็น Z-Image Turbo ผ่าน Decoupled-DMD ทำให้การอนุมานเหลือเพียงแปดการประเมินฟังก์ชัน และปรับให้สอดคล้องกับความชอบด้านความสวยงามของมนุษย์ด้วย DPO และ GRPO ผลลัพธ์คือความหน่วงต่ำกว่าหนึ่งวินาทีบน GPU ศูนย์ข้อมูล และการอนุมานที่สบายบนการ์ดผู้บริโภคที่มี VRAM 16 GB
การแสดงผลข้อความสองภาษาแบบเนทีฟคือจุดเด่นที่แข็งแกร่งที่สุดของโมเดล Z-Image Turbo จัดการตัวอักษรจีนที่ซับซ้อน — ป้าย โปสเตอร์ บรรจุภัณฑ์ — ควบคู่กับข้อความภาษาอังกฤษในภาพเดียวกัน ซึ่งเป็นความสามารถที่โมเดลภาพตะวันตกส่วนใหญ่ยังคงประสบปัญหา ณ ต้นปี 2026 Z-Image Turbo ครองอันดับ 1 ในบรรดาโมเดลภาพโอเพนซอร์สบน Artificial Analysis Text-to-Image Leaderboard และตำแหน่งสูงสุดโอเพนซอร์สบน Alibaba AI Arena พร้อมน้ำหนักที่ให้บริการฟรีบน Hugging Face และ ModelScope ภายใต้ Apache 2.0 (อนุญาตใช้งานเชิงพาณิชย์)
บน LoveGen AI Z-Image Turbo รับพรอมต์ได้สูงสุด 2000 อักขระ และมีอัตราส่วนภาพที่ตั้งค่าไว้ล่วงหน้าเก้าแบบ — 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1 และ 1:2 — พร้อมขนาดที่กำหนดเองในช่วง 376–1536 พิกเซล พารามิเตอร์ซีดแบบดีเทอร์มินิสติก (1 ถึง 2,147,483,647) ทำให้ผลลัพธ์สามารถทำซ้ำได้สำหรับการวนซ้ำและงานแบบแบตช์ การสร้างภาพจากต้นจนจบโดยทั่วไปใช้เวลาประมาณสิบวินาทีที่ 0.1 เครดิตต่อภาพ URL ภาพที่สร้างขึ้นยังคงใช้งานได้นาน 24 ชั่วโมง
วิธีใช้ Z-Image Turbo
เขียนพรอมต์ของคุณ
อธิบายภาพที่ต้องการด้วยอักขระสูงสุด 2000 ตัว ระบุวัตถุ สไตล์ แสง และการจัดองค์ประกอบอย่างเฉพาะเจาะจงเพื่อผลลัพธ์ที่ดีที่สุด
เลือกอัตราส่วนภาพ
เลือกหนึ่งในอัตราส่วนภาพที่ตั้งค่าไว้ล่วงหน้าเก้าแบบที่เหมาะกับปลายทางของคุณ — สี่เหลี่ยมจัตุรัสสำหรับโซเชียลมีเดีย 16:9 สำหรับภาพขนาดย่อ 9:16 สำหรับปกวิดีโอแนวตั้ง
สร้างและบันทึก
คลิกสร้าง ภาพของคุณจะมาถึงในประมาณสิบวินาที ดาวน์โหลดภายใน 24 ชั่วโมงเนื่องจากลิงก์ที่สร้างขึ้นจะหมดอายุหลังจากนั้น
ข้อมูลจำเพาะทางเทคนิคของ Z-Image Turbo
| ผู้พัฒนา | Alibaba Tongyi Lab (Tongyi-MAI) |
| วันที่เผยแพร่ | 26 พฤศจิกายน 2568 |
| ใบอนุญาต | Apache 2.0 (โอเพนซอร์ส อนุญาตใช้งานเชิงพาณิชย์) |
| สถาปัตยกรรม | Scalable Single-Stream DiT (S3-DiT) |
| จำนวนพารามิเตอร์ | 6 พันล้าน |
| ขั้นตอนการอนุมาน | 8 (สลัดผ่าน Decoupled-DMD) |
| โหมด | แปลงข้อความเป็นภาพ |
| ภาษาเนทีฟ | การแสดงผลข้อความจีน + อังกฤษ |
| เวลาสร้างภาพโดยประมาณ | ~10 วินาที (ต้นจนจบ) |
| ความยาวพรอมต์ | สูงสุด 2000 อักขระ |
| อัตราส่วนภาพ | 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1, 1:2 |
| ขนาดที่กำหนดเอง | 376–1536 พิกเซล (กว้าง × สูง) |
| ความสามารถในการทำซ้ำ | พารามิเตอร์ซีด (1 ถึง 2,147,483,647) |
| การกลั่นกรองเนื้อหา | ฟิลเตอร์พื้นฐานเปิดตลอดเวลา + ฟิลเตอร์ NSFW เข้มงวด |
| ความถูกต้องของผลลัพธ์ | 24 ชั่วโมง (บันทึกผลลัพธ์ทันที) |
| ค่าใช้จ่าย | 0.1 เครดิตต่อภาพ |
ทำไมต้องเลือก Z-Image Turbo
การแสดงผลข้อความสองภาษาแบบเนทีฟ
ตัวพิมพ์ภาษาจีนและอังกฤษที่แม่นยำในภาพเดียวกัน — รวมถึงป้าย โปสเตอร์ และบรรจุภัณฑ์ — ความสามารถที่โมเดลตะวันตกส่วนใหญ่ยังขาด
โอเพนซอร์สจาก Alibaba Tongyi Lab
สร้างโดยทีมเบื้องหลัง Qwen และเผยแพร่ภายใต้ Apache 2.0 ในเดือนพฤศจิกายน 2025 โมเดลภาพโอเพนซอร์สที่มีอันดับสูงสุดบนลีดเดอร์บอร์ดของ Artificial Analysis
สถาปัตยกรรม 6B ที่ถูกสลัด
Single-Stream DiT (S3-DiT) ที่มี 6 พันล้านพารามิเตอร์ ถูกสลัดเหลือเพียง 8 ขั้นตอนการสุ่มตัวอย่างผ่าน Decoupled-DMD สำหรับการอนุมานต่ำกว่าหนึ่งวินาทีบน GPU
ค่าใช้จ่ายต่อภาพต่ำที่สุด
0.1 เครดิตต่อการสร้าง — ตัวเลือกแปลงข้อความเป็นภาพที่มีประสิทธิภาพสูงสุดของ LoveGen AI สำหรับงานปริมาณสูง
ทำซ้ำได้ด้วยซีด
พารามิเตอร์ซีดแบบดีเทอร์มินิสติกล็อกผลลัพธ์ พรอมต์เดิมบวกซีดเดิมจะให้ผลลัพธ์ที่สม่ำเสมอในทุกการรัน
Z-Image Turbo เทียบกับตัวสร้างภาพ AI อื่นๆ
| Feature | Z-Image Turbo | GPT Image 2 | Flux 2 Pro | Ideogram v3 |
|---|---|---|---|---|
| ผู้พัฒนา | Alibaba Tongyi Lab | OpenAI | Black Forest Labs | Ideogram |
| ใบอนุญาต | Apache 2.0 (โอเพนซอร์ส) | ปิด | ปิด | ปิด |
| จำนวนพารามิเตอร์ | 6B | ไม่เปิดเผย | ไม่เปิดเผย | ไม่เปิดเผย |
| จุดแข็งหลัก | ข้อความสองภาษา + โอเพนซอร์ส | แก้ไขหลายภาพ | คุณภาพสตูดิโอ | ตัวพิมพ์และแบรนดิ้ง |
| เวลาสร้างภาพ | ~10 วินาที | ~30 วินาที | ~30 วินาที | ~15 วินาที |
| อัตราส่วนภาพ | 9 พรีเซ็ต + กำหนดเอง | 3 พรีเซ็ต + อัตโนมัติ | หลายแบบ | หลายแบบ |
| ขนาดที่กำหนดเอง | ได้ (376–1536 พิกเซล) | ไม่ได้ | ได้ | จำกัด |
| รับภาพอินพุต | ไม่ได้ | สูงสุด 4 ภาพ | สูงสุด 8 ภาพ | ไม่ได้ |
| ค่าใช้จ่ายต่อภาพ | 0.1 เครดิต | สูงกว่า | สูงกว่า | สูงกว่า |
| เหมาะที่สุดสำหรับ | เนื้อหาสองภาษาและการวนซ้ำเร็ว | การแก้ไขและผสม | งานสตูดิโอ | โลโก้และโปสเตอร์ |
การใช้งานยอดนิยมของ Z-Image Turbo
การสำรวจแนวคิดอย่างรวดเร็ว
สร้างรูปแบบต่างๆ มากมายอย่างรวดเร็วเพื่อสำรวจทิศทางภาพสำหรับการสร้างแบรนด์ แคมเปญ หรือแนวคิดผลิตภัณฑ์
เนื้อหาโซเชียลมีเดียในระดับขนาดใหญ่
ผลิตโพสต์ สตอรี่ และสื่อโฆษณาในอัตราส่วนภาพใดก็ได้ด้วยค่าใช้จ่ายต่อภาพที่ต่ำสำหรับกำหนดการเนื้อหาปริมาณสูง
ภาพขนาดย่อและแบนเนอร์
ใช้พรีเซ็ต 16:9 และ 9:16 สำหรับภาพขนาดย่อของวิดีโอและปกแนวตั้ง หรือขนาดที่กำหนดเองสำหรับแบนเนอร์ไซต์
สำรวจตัวสร้างภาพ AI ที่เกี่ยวข้อง

GPT Image 2
โมเดลภาพของ OpenAI พร้อมการแก้ไขอ้างอิงหลายภาพและพรอมต์ภาษาธรรมชาติ

Nano Banana Pro
โมเดลภาพของ Google พร้อมการผสมสูงสุด 14 ภาพและความเข้าใจพรอมต์ระดับ Gemini

Flux 2 Pro
ตัวสร้างภาพระดับสตูดิโอจาก Black Forest Labs ที่มีความละเอียด 4MP

Ideogram v3
ตัวพิมพ์และการแสดงผลข้อความชั้นนำของอุตสาหกรรมสำหรับโลโก้และโปสเตอร์

Qwen Image
โมเดลภาพน้องของ Alibaba จากตระกูล Qwen พร้อมความเข้าใจพรอมต์หลายภาษาที่แข็งแกร่ง

Midjourney V7
การสร้างภาพเชิงสุนทรียะชั้นนำของอุตสาหกรรมที่ส่งคืนสี่ผู้สมัครต่องาน
คำถามที่พบบ่อยเกี่ยวกับ Z-Image Turbo
ใครสร้าง Z-Image Turbo?
Z-Image Turbo พัฒนาโดย Tongyi Lab ของ Alibaba — ทีมเดียวกับที่อยู่เบื้องหลังตระกูลโมเดล Qwen — และเผยแพร่เป็นโอเพนซอร์สภายใต้ใบอนุญาต Apache 2.0 เมื่อวันที่ 26 พฤศจิกายน 2025
Z-Image Turbo เร็วแค่ไหน?
Z-Image Turbo ถูกสลัดเหลือเพียง 8 ขั้นตอนการสุ่มตัวอย่างผ่าน Decoupled-DMD ทำให้มีความหน่วงต่ำกว่าหนึ่งวินาทีบน GPU ศูนย์ข้อมูล บน LoveGen AI การสร้างภาพจากต้นจนจบโดยทั่วไปใช้เวลาประมาณสิบวินาที
Z-Image Turbo สามารถแสดงผลข้อความภาษาจีนและอังกฤษได้หรือไม่?
ได้ — การแสดงผลข้อความสองภาษาแบบเนทีฟคือหนึ่งในจุดเด่นที่ยิ่งใหญ่ที่สุดของ Z-Image Turbo โมเดลจัดการตัวอักษรจีนที่ซับซ้อน ข้อความภาษาอังกฤษ และเลย์เอาต์หลายภาษาที่โมเดลตะวันตกหลายตัวยังคงประสบปัญหา
Z-Image Turbo รองรับอัตราส่วนภาพใดบ้าง?
บน LoveGen AI Z-Image Turbo มีอัตราส่วนภาพที่ตั้งค่าไว้ล่วงหน้าเก้าแบบ — 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1 และ 1:2 — และขนาดที่กำหนดเองในช่วง 376–1536 พิกเซล
ฉันสามารถทำซ้ำภาพที่เฉพาะเจาะจงด้วย Z-Image Turbo ได้หรือไม่?
ได้ Z-Image Turbo รับพารามิเตอร์ซีดตัวเลข (1 ถึง 2,147,483,647) พรอมต์เดิมกับซีดเดิมจะให้ผลลัพธ์ที่สม่ำเสมอ เหมาะสำหรับการวนซ้ำหรือสร้างชุดภาพที่เกี่ยวข้อง
Z-Image Turbo บน LoveGen AI ราคาเท่าไหร่?
Z-Image Turbo มีค่าใช้จ่าย 0.1 เครดิตต่อภาพที่สร้างขึ้น — โมเดลแปลงข้อความเป็นภาพที่คุ้มค่าที่สุดของเรา URL ภาพที่สร้างขึ้นยังคงใช้งานได้นาน 24 ชั่วโมง ดังนั้นดาวน์โหลดผลลัพธ์ทันที