Google Kenalkan Gemini Omni, Edit Video AI Kini Tinggal Ketik Prompt

Ajang tahunan Google I/O kembali membawa kejutan besar bagi dunia kreatif. Google secara resmi meluncurkan Gemini Omni, model kecerdasan buatan (AI) generasi terbaru yang menggabungkan kemampuan penalaran mendalam dengan pemrosesan video tingkat lanjut. Lewat teknologi ini, proses editing video tidak lagi membutuhkan software rumit atau pengaturan timeline yang membingungkan—cukup lewat percakapan alami menggunakan teks atau suara.

1. Edit Video via Percakapan (Conversational Video Editing)

Fitur paling revolusioner dari Gemini Omni adalah kemampuannya melakukan multi-turn editing. Pengguna cukup mengunggah video atau foto, lalu memberikan instruksi dalam bahasa sehari-hari.

Hebatnya, Gemini Omni mengingat konteks perintah sebelumnya. Jika Anda meminta AI mengubah latar belakang menjadi suasana malam hari, lalu di perintah berikutnya meminta untuk menambahkan efek hujan, Gemini Omni akan memprosesnya secara bertahap tanpa merusak elemen karakter utama atau mengubah sudut kamera yang sudah ada.

2. Memahami Hukum Fisika Dunia Nyata

Berbeda dengan model generator video AI biasa yang sekadar mencocokkan pola visual (sering kali berujung pada distorsi visual yang aneh), Gemini Omni dirancang sebagai sebuah World Model.

AI ini memiliki pemahaman intuitif terhadap hukum fisika di dunia nyata, seperti gravitasi, dinamika fluida (aliran zat cair), pencahayaan, hingga interaksi objek. Hasilnya, pergerakan benda, pantulan cermin, atau transisi visual di dalam video buatan Gemini Omni terlihat jauh lebih realistis dan natural.

3. Fitur Avatar AI dan Input Multimodal

Gemini Omni adalah model multimodal murni. Anda bisa mencampurkan teks, suara, gambar referensi, bahkan klip video lain dalam satu perintah tunggal untuk menciptakan karya baru. Selain itu, Google juga menyematkan fitur AI Avatar, yang memungkinkan kreator membuat versi digital dari diri mereka sendiri yang dapat bergerak dan berbicara menggunakan suara asli mereka secara aman untuk kebutuhan konten.

Ketersediaan dan Akses Pengguna

Saat peluncuran, versi pertama yang digulirkan adalah Gemini Omni Flash. Distribusi fitur ini dibagi ke dalam beberapa kategori pengguna:

Kategori PenggunaJalur AksesBiayaPelanggan Premium (Google AI Plus, Pro, Ultra)Aplikasi Gemini (Tab “Videos”) & Google FlowTermasuk dalam paket langgananKreator Konten UmumYouTube Shorts & YouTube CreateGratis (dirilis secara bertahap)Developer & PerusahaanAPI GoogleBerdasarkan penggunaan (segera hadir)

Catatan Keamanan: Untuk mengantisipasi bahaya deepfake dan penyalahgunaan identitas, Google menanamkan teknologi SynthID pada setiap video yang dihasilkan oleh Gemini Omni. Watermark digital ini tidak terlihat oleh mata manusia, tetapi dapat dideteksi oleh sistem Google untuk memverifikasi apakah video tersebut merupakan hasil rekayasa AI atau bukan.

Dengan kehadiran Gemini Omni, batas antara ide kreatif dan hasil akhir visual kini menjadi semakin tipis. Mengedit video sinematik berkualitas tinggi kini benar-benar semudah mengetik pesan teks.

Bagikan postingan ini:

Komentar (2)

A
Avatar

Budi Santoso

2 jam yang lalu

Artikel yang sangat informatif! Sangat membantu saya dalam memahami topik ini. Terima kasih admin.

A

Admin

1 jam yang lalu

Terima kasih Budi! Semoga bermanfaat ya.