Google DeepMind

Gemini Omni

Segera Hadir

API publik sedang diluncurkan dalam minggu-minggu setelah Google I/O 2026

Gemini Omni Flash diluncurkan pada 19 Mei 2026. LoveGen AI akan menambahkannya segera setelah API Vertex AI publik diluncurkan.

Published May 12, 2026Updated May 12, 2026

Generator Video AI Gemini Omni Flash

Buat dan Edit Video AI dengan Omni-Model Terpadu Google

Gemini Omni Flash adalah model pembuatan video terpadu baru Google DeepMind, diumumkan dan diluncurkan di Google I/O 2026 pada 19 Mei 2026. Berbeda dengan model Veo yang khusus, Gemini Omni Flash dibangun di atas arsitektur omni berbasis transformer tunggal yang secara native menerima input teks, gambar, audio, dan video serta menghasilkan video resolusi tinggi dengan audio tersinkronisasi dalam satu pass. Mendukung pengeditan multi-giliran berbasis percakapan — ubah sudut kamera, ganti objek, tulis ulang adegan, atau modifikasi latar belakang menggunakan prompt bahasa sederhana.

Gemini Omni diperkenalkan di Google I/O 2026, dengan varian pertama yang dirilis — Gemini Omni Flash — mulai diluncurkan pada hari yang sama (19 Mei 2026). Google mendeskripsikannya sebagai model yang dapat membuat apa saja dari input apa pun, dimulai dengan video, menggabungkan penalaran Gemini dengan media generatif untuk pemahaman dunia yang lebih kuat, multimodalitas, dan pengeditan.

Saat peluncuran, Gemini Omni Flash menghasilkan klip resolusi tinggi 10 detik yang dipasangkan dengan audio tersinkronisasi native — dialog dengan sinkronisasi bibir, efek suara yang diselaraskan dengan aksi di layar, dan ambient latar belakang — semuanya dihasilkan dalam satu forward pass. Google telah mengkonfirmasi bahwa batas 10 detik adalah keputusan deployment, bukan kendala model. Pemahaman fisika yang ditingkatkan, termasuk gravitasi, energi kinetik, dan dinamika fluida, memungkinkan gerakan yang lebih realistis.

Fitur unggulan yang dirilis adalah pengeditan multi-giliran berbasis percakapan. Setelah memiliki klip, Anda mendeskripsikan perubahan dalam bahasa sederhana — "geser sudut kamera ke kiri", "buat patung dari gelembung", "ketika orang menyentuh cermin, buat beriak seperti cairan" — dan Omni mengerjakan ulang elemen yang ditargetkan sambil mempertahankan sisanya. Reference stacking memungkinkan Anda menggabungkan gambar karakter, file audio, dan referensi gaya dalam satu prompt, dan pembuatan berbasis template dengan aplikasi satu klik sudah terintegrasi ke dalam aplikasi Gemini dan Google Flow.

Gemini Omni Flash sedang diluncurkan secara global kepada pelanggan Google AI Plus, Pro, dan Ultra melalui aplikasi Gemini dan Google Flow, serta gratis untuk pengguna 18+ di YouTube Shorts Remix dan aplikasi YouTube Create. Setiap video yang dihasilkan membawa watermark SynthID yang tidak terdeteksi ditambah C2PA Content Credentials. Akses API publik untuk developer dan enterprise melalui Vertex AI sedang diluncurkan dalam minggu-minggu setelah I/O; LoveGen AI akan mengintegrasikan Gemini Omni Flash segera setelah API tersebut tersedia untuk umum.

Cara Menggunakan Gemini Omni Flash

Langkah 1: Pilih Mode Pembuatan

Buat dari prompt teks, animasikan gambar, gabungkan beberapa referensi (gambar, audio, gaya), atau pilih template bawaan untuk pembuatan satu klik.

Langkah 2: Deskripsikan Video atau Pengeditan Anda

Tulis prompt terperinci atau deskripsikan pengeditan dalam bahasa sederhana — Gemini Omni Flash memahami gerakan kamera, penggantian objek, perubahan latar belakang, dan pergeseran gaya melalui percakapan.

Langkah 3: Buat dan Sempurnakan

Klik Buat. Gemini Omni Flash mengembalikan klip resolusi tinggi 10 detik dengan audio tersinkronisasi native. Gunakan percakapan multi-giliran untuk menyempurnakan elemen tertentu tanpa memulai dari awal.

Spesifikasi Teknis Gemini Omni Flash

Penyedia	Google DeepMind
Tanggal Rilis	19 Mei 2026 (Google I/O 2026)
Varian	Gemini Omni Flash (model pertama yang dirilis dalam keluarga Omni)
Arsitektur	Omni-model berbasis transformer terpadu (input teks + gambar + audio + video → output video + audio)
Mode Input	Teks, gambar, audio, video — termasuk reference stacking multi-referensi
Output	Video resolusi tinggi dengan audio tersinkronisasi native
Durasi Maks.	10 detik per klip (batas deployment, bukan kendala model)
Audio Native	Dialog (sinkronisasi bibir), SFX, ambient — dihasilkan dalam satu pass
Pengeditan	Multi-giliran berbasis percakapan — kamera, latar belakang, objek, aksi, gaya
Fisika	Gravitasi, energi kinetik, dan dinamika fluida yang ditingkatkan
Provenance	Watermark SynthID + C2PA Content Credentials (wajib)
Ketersediaan	Aplikasi Gemini & Google Flow (AI Plus/Pro/Ultra); YouTube Shorts Remix & aplikasi Create (gratis, 18+)
Akses API	API Vertex AI publik sedang diluncurkan dalam minggu-minggu setelah I/O 2026

Mengapa Gemini Omni Flash Menonjol

Arsitektur Omni-Model Terpadu

Gemini Omni Flash adalah model video pertama Google yang dirilis dibangun di atas arsitektur omni berbasis transformer terpadu — satu model menangani teks, gambar, audio, dan video dalam satu pass, menghilangkan celah antar modalitas yang diperkenalkan oleh sistem pipeline terpisah. Reference stacking memungkinkan Anda menggabungkan gambar karakter, file audio, dan referensi gaya dalam satu prompt.

Pengeditan Multi-Giliran Berbasis Percakapan

Deskripsikan perubahan dalam bahasa sederhana dan Gemini Omni Flash menerapkannya langsung — geser kamera, ganti objek, tulis ulang adegan, atau ubah latar belakang — sambil mempertahankan sisa klip. Pengeditan multi-giliran dibangun atas konteks sebelumnya sehingga Anda dapat mengulang tanpa memulai dari awal.

Audio Tersinkronisasi Native + Fisika yang Ditingkatkan

Dialog dengan sinkronisasi bibir, efek suara di layar, dan audio ambient latar belakang diproduksi bersama video dalam satu forward pass — tanpa tahap TTS atau Foley terpisah. Pemahaman gravitasi, energi kinetik, dan dinamika fluida yang ditingkatkan menghasilkan gerakan yang lebih realistis, dan setiap output membawa provenance SynthID dan C2PA.

Gemini Omni Flash vs Generator Video AI Lainnya

Feature	Gemini Omni Flash	Veo 3.1	Sora 2	Grok Imagine
Penyedia	Google DeepMind	Google DeepMind	OpenAI	xAI
Arsitektur	Omni-model transformer terpadu	Difusi	Difusi	Aurora (autoregresif)
Pengeditan Berbasis Percakapan	Ya — multi-giliran	Tidak	Tidak	Tidak
Resolusi Maks.	Resolusi tinggi	1080p	1080p	720p
Durasi Maks.	10d (batas deployment)	8d (dapat diperpanjang)	20d	15d
Audio Native	Ya — satu pass	Ya	Ya	Ya
Mode Input	Teks, gambar, audio, video	Teks, gambar (hingga 3)	Teks, gambar + Cameos	Teks, 1 gambar
Template	Ya	Tidak	Tidak	Tidak
Provenance	SynthID + C2PA	SynthID	C2PA	—
Ketersediaan	Aplikasi Gemini, Flow, YouTube	Tersedia	Tersedia	Tersedia

Apa yang Bisa Anda Buat dengan Gemini Omni Flash

Pengeditan Video Berbasis Percakapan

Lewati editor timeline sepenuhnya — deskripsikan perubahan yang Anda inginkan dalam bahasa sederhana dan Gemini Omni Flash menerapkannya langsung. Geser sudut kamera, ganti objek, ubah latar belakang, atau tulis ulang seluruh aksi dengan satu prompt.

Konten Sosial Berbasis Template

Pilih template bawaan, masukkan prompt Anda, dan dapatkan klip 10 detik yang sepenuhnya tersusun dengan audio tersinkronisasi — dirancang untuk format YouTube Shorts, Reels, dan TikTok tanpa pengalaman produksi yang diperlukan.

Pembuatan Adegan Dialog

Hasilkan adegan percakapan realistis dengan sinkronisasi bibir yang akurat dan audio ambient dalam satu pass — ideal untuk skrip pemasaran, konten pendidikan, atau dialog film pendek.

Pembuatan dengan Reference Stacking

Gabungkan gambar karakter, file audio, dan referensi gaya dalam satu prompt untuk menghasilkan karakter yang konsisten yang cocok dengan tampilan, suara, dan estetika tertentu di seluruh klip.

Storyboarding Adegan

Visualisasikan dengan cepat beat skrip sebagai klip pendek dengan audio native. Gunakan pengeditan percakapan multi-giliran untuk menyesuaikan framing, mengganti objek, atau menulis ulang aksi di seluruh shot tanpa regenerasi dari awal.

Produksi Video Merek

Gunakan template untuk pembuatan video merek yang cepat, lalu sempurnakan dengan pengeditan berbasis percakapan — ganti shot produk, ubah latar belakang, atau sesuaikan nada visual agar cocok dengan merek Anda.

Jelajahi Generator Video AI Terkait

Veo 3.1

Model video 1080p Google DeepMind dengan frames-to-video dan pembuatan audio native.

Sora 2

Generator video sinematik OpenAI dengan gerakan akurat fisika dan durasi 20 detik.

Grok Imagine

Model video mesin Aurora xAI dengan mode gaya Fun/Normal/Spicy dan audio native.

Happy Horse 1.0

Generator video AI #1 dengan gerakan sinematik dan sinkronisasi bibir dalam 7 bahasa.

Seedance 2.0

Model video ByteDance dengan integrasi pencarian web dan audio tersinkronisasi.

Kling 3.0

Video 4K berkualitas sutradara dengan sinematografi AI multi-shot dan audio native.

Pertanyaan yang Sering Diajukan Tentang Gemini Omni Flash

Apa itu Gemini Omni Flash?

Gemini Omni Flash adalah model pembuatan video terpadu baru Google DeepMind, diumumkan dan diluncurkan di Google I/O 2026 pada 19 Mei 2026. Ini adalah model pertama yang dirilis dalam keluarga Gemini Omni — dibangun di atas arsitektur omni berbasis transformer tunggal yang secara native menangani input teks, gambar, audio, dan video serta menghasilkan video resolusi tinggi dengan audio tersinkronisasi dalam satu pass. Fitur unggulan mencakup pengeditan multi-giliran berbasis percakapan, pemahaman fisika yang ditingkatkan, dan reference stacking.

Apa perbedaan Gemini Omni Flash dengan Veo 3.1?

Veo 3.1 adalah model difusi video khusus yang berfokus murni pada teks- dan gambar-ke-video. Gemini Omni Flash dibangun di atas arsitektur omni berbasis transformer terpadu — satu model menangani teks, gambar, audio, dan video dalam satu pass, mirip konsepnya dengan GPT-4o — dan menghubungkan pembuatan video dengan penalaran Gemini. Hal ini membuka pengeditan multi-giliran berbasis percakapan, reference stacking, dan pembuatan berbasis template yang tidak ditawarkan Veo 3.1. Veo 3.1 saat ini menyediakan klip yang lebih panjang dan kontrol input multi-gambar yang lebih kaya.

Apa itu pengeditan berbasis percakapan di Gemini Omni Flash?

Setelah memiliki klip, Anda mendeskripsikan perubahan dalam bahasa sederhana — "geser sudut kamera ke kiri", "buat patung dari gelembung", "ganti gelas merah dengan mug kopi", atau "tulis ulang adegan ini agar karakternya berada di luar" — dan Gemini Omni Flash mengerjakan ulang elemen yang ditargetkan sambil mempertahankan sisanya. Pengeditan multi-giliran dibangun atas konteks sebelumnya sehingga Anda dapat mengulang tanpa memulai ulang. Pengeditan audio pada video yang ada sengaja ditahan saat peluncuran.

Apakah Gemini Omni Flash menghasilkan audio tersinkronisasi?

Ya. Gemini Omni Flash menghasilkan audio tersinkronisasi native — dialog dengan sinkronisasi bibir, efek suara yang diselaraskan dengan aksi di layar, dan ambient latar belakang — dalam satu forward pass bersama video, tanpa tahap TTS atau Foley terpisah. Semua output yang dihasilkan secara otomatis diberi tag dengan watermark SynthID dan C2PA Content Credentials.

Kapan Gemini Omni Flash tersedia di LoveGen AI?

Gemini Omni Flash diluncurkan pada 19 Mei 2026 di dalam aplikasi Gemini, Google Flow, YouTube Shorts Remix, dan aplikasi YouTube Create. Akses API publik untuk developer dan enterprise melalui Vertex AI sedang diluncurkan dalam minggu-minggu setelah Google I/O 2026. LoveGen AI akan mengintegrasikan Gemini Omni Flash segera setelah API tersebut tersedia untuk umum.

Template video apa yang disertakan Gemini Omni Flash?

Gemini Omni Flash hadir dengan pembuatan video berbasis template, diterapkan dengan satu klik di dalam aplikasi Gemini dan Google Flow. Template menangani komposisi, ritme, dan audio untuk pembuatan cepat, dan alur pembuatan avatar AI kustom juga tersedia. Katalog template saat ini berada di dalam permukaan produk aplikasi Gemini dan Flow.