
Google DeepMind
Gemini Omni
API publik sedang diluncurkan dalam minggu-minggu setelah Google I/O 2026
Gemini Omni Flash diluncurkan pada 19 Mei 2026. LoveGen AI akan menambahkannya segera setelah API Vertex AI publik diluncurkan.
Generator Video AI Gemini Omni Flash
Buat dan Edit Video AI dengan Omni-Model Terpadu Google
Gemini Omni Flash adalah model pembuatan video terpadu baru Google DeepMind, diumumkan dan diluncurkan di Google I/O 2026 pada 19 Mei 2026. Berbeda dengan model Veo yang khusus, Gemini Omni Flash dibangun di atas arsitektur omni berbasis transformer tunggal yang secara native menerima input teks, gambar, audio, dan video serta menghasilkan video resolusi tinggi dengan audio tersinkronisasi dalam satu pass. Mendukung pengeditan multi-giliran berbasis percakapan — ubah sudut kamera, ganti objek, tulis ulang adegan, atau modifikasi latar belakang menggunakan prompt bahasa sederhana.
Gemini Omni diperkenalkan di Google I/O 2026, dengan varian pertama yang dirilis — Gemini Omni Flash — mulai diluncurkan pada hari yang sama (19 Mei 2026). Google mendeskripsikannya sebagai model yang dapat membuat apa saja dari input apa pun, dimulai dengan video, menggabungkan penalaran Gemini dengan media generatif untuk pemahaman dunia yang lebih kuat, multimodalitas, dan pengeditan.
Saat peluncuran, Gemini Omni Flash menghasilkan klip resolusi tinggi 10 detik yang dipasangkan dengan audio tersinkronisasi native — dialog dengan sinkronisasi bibir, efek suara yang diselaraskan dengan aksi di layar, dan ambient latar belakang — semuanya dihasilkan dalam satu forward pass. Google telah mengkonfirmasi bahwa batas 10 detik adalah keputusan deployment, bukan kendala model. Pemahaman fisika yang ditingkatkan, termasuk gravitasi, energi kinetik, dan dinamika fluida, memungkinkan gerakan yang lebih realistis.
Fitur unggulan yang dirilis adalah pengeditan multi-giliran berbasis percakapan. Setelah memiliki klip, Anda mendeskripsikan perubahan dalam bahasa sederhana — "geser sudut kamera ke kiri", "buat patung dari gelembung", "ketika orang menyentuh cermin, buat beriak seperti cairan" — dan Omni mengerjakan ulang elemen yang ditargetkan sambil mempertahankan sisanya. Reference stacking memungkinkan Anda menggabungkan gambar karakter, file audio, dan referensi gaya dalam satu prompt, dan pembuatan berbasis template dengan aplikasi satu klik sudah terintegrasi ke dalam aplikasi Gemini dan Google Flow.
Gemini Omni Flash sedang diluncurkan secara global kepada pelanggan Google AI Plus, Pro, dan Ultra melalui aplikasi Gemini dan Google Flow, serta gratis untuk pengguna 18+ di YouTube Shorts Remix dan aplikasi YouTube Create. Setiap video yang dihasilkan membawa watermark SynthID yang tidak terdeteksi ditambah C2PA Content Credentials. Akses API publik untuk developer dan enterprise melalui Vertex AI sedang diluncurkan dalam minggu-minggu setelah I/O; LoveGen AI akan mengintegrasikan Gemini Omni Flash segera setelah API tersebut tersedia untuk umum.
Cara Menggunakan Gemini Omni Flash
Langkah 1: Pilih Mode Pembuatan
Buat dari prompt teks, animasikan gambar, gabungkan beberapa referensi (gambar, audio, gaya), atau pilih template bawaan untuk pembuatan satu klik.
Langkah 2: Deskripsikan Video atau Pengeditan Anda
Tulis prompt terperinci atau deskripsikan pengeditan dalam bahasa sederhana — Gemini Omni Flash memahami gerakan kamera, penggantian objek, perubahan latar belakang, dan pergeseran gaya melalui percakapan.
Langkah 3: Buat dan Sempurnakan
Klik Buat. Gemini Omni Flash mengembalikan klip resolusi tinggi 10 detik dengan audio tersinkronisasi native. Gunakan percakapan multi-giliran untuk menyempurnakan elemen tertentu tanpa memulai dari awal.
Spesifikasi Teknis Gemini Omni Flash
| Penyedia | Google DeepMind |
| Tanggal Rilis | 19 Mei 2026 (Google I/O 2026) |
| Varian | Gemini Omni Flash (model pertama yang dirilis dalam keluarga Omni) |
| Arsitektur | Omni-model berbasis transformer terpadu (input teks + gambar + audio + video → output video + audio) |
| Mode Input | Teks, gambar, audio, video — termasuk reference stacking multi-referensi |
| Output | Video resolusi tinggi dengan audio tersinkronisasi native |
| Durasi Maks. | 10 detik per klip (batas deployment, bukan kendala model) |
| Audio Native | Dialog (sinkronisasi bibir), SFX, ambient — dihasilkan dalam satu pass |
| Pengeditan | Multi-giliran berbasis percakapan — kamera, latar belakang, objek, aksi, gaya |
| Fisika | Gravitasi, energi kinetik, dan dinamika fluida yang ditingkatkan |
| Provenance | Watermark SynthID + C2PA Content Credentials (wajib) |
| Ketersediaan | Aplikasi Gemini & Google Flow (AI Plus/Pro/Ultra); YouTube Shorts Remix & aplikasi Create (gratis, 18+) |
| Akses API | API Vertex AI publik sedang diluncurkan dalam minggu-minggu setelah I/O 2026 |
Mengapa Gemini Omni Flash Menonjol
Arsitektur Omni-Model Terpadu
Gemini Omni Flash adalah model video pertama Google yang dirilis dibangun di atas arsitektur omni berbasis transformer terpadu — satu model menangani teks, gambar, audio, dan video dalam satu pass, menghilangkan celah antar modalitas yang diperkenalkan oleh sistem pipeline terpisah. Reference stacking memungkinkan Anda menggabungkan gambar karakter, file audio, dan referensi gaya dalam satu prompt.
Pengeditan Multi-Giliran Berbasis Percakapan
Deskripsikan perubahan dalam bahasa sederhana dan Gemini Omni Flash menerapkannya langsung — geser kamera, ganti objek, tulis ulang adegan, atau ubah latar belakang — sambil mempertahankan sisa klip. Pengeditan multi-giliran dibangun atas konteks sebelumnya sehingga Anda dapat mengulang tanpa memulai dari awal.
Audio Tersinkronisasi Native + Fisika yang Ditingkatkan
Dialog dengan sinkronisasi bibir, efek suara di layar, dan audio ambient latar belakang diproduksi bersama video dalam satu forward pass — tanpa tahap TTS atau Foley terpisah. Pemahaman gravitasi, energi kinetik, dan dinamika fluida yang ditingkatkan menghasilkan gerakan yang lebih realistis, dan setiap output membawa provenance SynthID dan C2PA.
Gemini Omni Flash vs Generator Video AI Lainnya
| Feature | Gemini Omni Flash | Veo 3.1 | Sora 2 | Grok Imagine |
|---|---|---|---|---|
| Penyedia | Google DeepMind | Google DeepMind | OpenAI | xAI |
| Arsitektur | Omni-model transformer terpadu | Difusi | Difusi | Aurora (autoregresif) |
| Pengeditan Berbasis Percakapan | Ya — multi-giliran | Tidak | Tidak | Tidak |
| Resolusi Maks. | Resolusi tinggi | 1080p | 1080p | 720p |
| Durasi Maks. | 10d (batas deployment) | 8d (dapat diperpanjang) | 20d | 15d |
| Audio Native | Ya — satu pass | Ya | Ya | Ya |
| Mode Input | Teks, gambar, audio, video | Teks, gambar (hingga 3) | Teks, gambar + Cameos | Teks, 1 gambar |
| Template | Ya | Tidak | Tidak | Tidak |
| Provenance | SynthID + C2PA | SynthID | C2PA | — |
| Ketersediaan | Aplikasi Gemini, Flow, YouTube | Tersedia | Tersedia | Tersedia |
Apa yang Bisa Anda Buat dengan Gemini Omni Flash
Pengeditan Video Berbasis Percakapan
Lewati editor timeline sepenuhnya — deskripsikan perubahan yang Anda inginkan dalam bahasa sederhana dan Gemini Omni Flash menerapkannya langsung. Geser sudut kamera, ganti objek, ubah latar belakang, atau tulis ulang seluruh aksi dengan satu prompt.
Konten Sosial Berbasis Template
Pilih template bawaan, masukkan prompt Anda, dan dapatkan klip 10 detik yang sepenuhnya tersusun dengan audio tersinkronisasi — dirancang untuk format YouTube Shorts, Reels, dan TikTok tanpa pengalaman produksi yang diperlukan.
Pembuatan Adegan Dialog
Hasilkan adegan percakapan realistis dengan sinkronisasi bibir yang akurat dan audio ambient dalam satu pass — ideal untuk skrip pemasaran, konten pendidikan, atau dialog film pendek.
Pembuatan dengan Reference Stacking
Gabungkan gambar karakter, file audio, dan referensi gaya dalam satu prompt untuk menghasilkan karakter yang konsisten yang cocok dengan tampilan, suara, dan estetika tertentu di seluruh klip.
Storyboarding Adegan
Visualisasikan dengan cepat beat skrip sebagai klip pendek dengan audio native. Gunakan pengeditan percakapan multi-giliran untuk menyesuaikan framing, mengganti objek, atau menulis ulang aksi di seluruh shot tanpa regenerasi dari awal.
Produksi Video Merek
Gunakan template untuk pembuatan video merek yang cepat, lalu sempurnakan dengan pengeditan berbasis percakapan — ganti shot produk, ubah latar belakang, atau sesuaikan nada visual agar cocok dengan merek Anda.
Jelajahi Generator Video AI Terkait

Veo 3.1
Model video 1080p Google DeepMind dengan frames-to-video dan pembuatan audio native.

Sora 2
Generator video sinematik OpenAI dengan gerakan akurat fisika dan durasi 20 detik.

Grok Imagine
Model video mesin Aurora xAI dengan mode gaya Fun/Normal/Spicy dan audio native.
Happy Horse 1.0
Generator video AI #1 dengan gerakan sinematik dan sinkronisasi bibir dalam 7 bahasa.

Seedance 2.0
Model video ByteDance dengan integrasi pencarian web dan audio tersinkronisasi.
Kling 3.0
Video 4K berkualitas sutradara dengan sinematografi AI multi-shot dan audio native.
Pertanyaan yang Sering Diajukan Tentang Gemini Omni Flash
Apa itu Gemini Omni Flash?
Gemini Omni Flash adalah model pembuatan video terpadu baru Google DeepMind, diumumkan dan diluncurkan di Google I/O 2026 pada 19 Mei 2026. Ini adalah model pertama yang dirilis dalam keluarga Gemini Omni — dibangun di atas arsitektur omni berbasis transformer tunggal yang secara native menangani input teks, gambar, audio, dan video serta menghasilkan video resolusi tinggi dengan audio tersinkronisasi dalam satu pass. Fitur unggulan mencakup pengeditan multi-giliran berbasis percakapan, pemahaman fisika yang ditingkatkan, dan reference stacking.
Apa perbedaan Gemini Omni Flash dengan Veo 3.1?
Veo 3.1 adalah model difusi video khusus yang berfokus murni pada teks- dan gambar-ke-video. Gemini Omni Flash dibangun di atas arsitektur omni berbasis transformer terpadu — satu model menangani teks, gambar, audio, dan video dalam satu pass, mirip konsepnya dengan GPT-4o — dan menghubungkan pembuatan video dengan penalaran Gemini. Hal ini membuka pengeditan multi-giliran berbasis percakapan, reference stacking, dan pembuatan berbasis template yang tidak ditawarkan Veo 3.1. Veo 3.1 saat ini menyediakan klip yang lebih panjang dan kontrol input multi-gambar yang lebih kaya.
Apa itu pengeditan berbasis percakapan di Gemini Omni Flash?
Setelah memiliki klip, Anda mendeskripsikan perubahan dalam bahasa sederhana — "geser sudut kamera ke kiri", "buat patung dari gelembung", "ganti gelas merah dengan mug kopi", atau "tulis ulang adegan ini agar karakternya berada di luar" — dan Gemini Omni Flash mengerjakan ulang elemen yang ditargetkan sambil mempertahankan sisanya. Pengeditan multi-giliran dibangun atas konteks sebelumnya sehingga Anda dapat mengulang tanpa memulai ulang. Pengeditan audio pada video yang ada sengaja ditahan saat peluncuran.
Apakah Gemini Omni Flash menghasilkan audio tersinkronisasi?
Ya. Gemini Omni Flash menghasilkan audio tersinkronisasi native — dialog dengan sinkronisasi bibir, efek suara yang diselaraskan dengan aksi di layar, dan ambient latar belakang — dalam satu forward pass bersama video, tanpa tahap TTS atau Foley terpisah. Semua output yang dihasilkan secara otomatis diberi tag dengan watermark SynthID dan C2PA Content Credentials.
Kapan Gemini Omni Flash tersedia di LoveGen AI?
Gemini Omni Flash diluncurkan pada 19 Mei 2026 di dalam aplikasi Gemini, Google Flow, YouTube Shorts Remix, dan aplikasi YouTube Create. Akses API publik untuk developer dan enterprise melalui Vertex AI sedang diluncurkan dalam minggu-minggu setelah Google I/O 2026. LoveGen AI akan mengintegrasikan Gemini Omni Flash segera setelah API tersebut tersedia untuk umum.
Template video apa yang disertakan Gemini Omni Flash?
Gemini Omni Flash hadir dengan pembuatan video berbasis template, diterapkan dengan satu klik di dalam aplikasi Gemini dan Google Flow. Template menangani komposisi, ritme, dan audio untuk pembuatan cepat, dan alur pembuatan avatar AI kustom juga tersedia. Katalog template saat ini berada di dalam permukaan produk aplikasi Gemini dan Flow.
