Google telah mulai meluncurkan akses pribadi ke model AI generatif Veo dan Imagen 3. Mulai hari ini, pelanggan paket Google Cloud Vertex AI milik perusahaan dapat mulai menggunakan Veo untuk menghasilkan video dari perintah teks dan gambar. Kemudian, mulai minggu depan, Google akan membuat Imagen 3, kerangka kerja teks-ke-gambar terbaru, tersedia untuk pengguna yang sama.
Dengan peluncuran Veo, Google menyatakan bahwa mereka adalah penyedia cloud skala besar pertama yang menawarkan model gambar-ke-video. Hingga saat ini, model Sora OpenAI masih hanya tersedia untuk seniman, akademisi, dan peneliti terpilih — meskipun hal ini dapat berubah dengan cepat karena perusahaan tersebut akan mengadakan demo produk selama 12 hari mulai tanggal 5 Desember.
Tentang Veo, Google mengatakan model tersebut menghasilkan rekaman 1080p “yang konsisten dan koheren” dan dapat berjalan “lebih dari satu menit.” Alat ini juga mampu bekerja dengan perintah teks dan gambar. Dalam kasus terakhir, gambar yang dihasilkan AI atau buatan manusia dapat digunakan sebagai titik awal untuk sebuah video.
Melihat contoh rekaman yang dibagikan Google, jelas bahwa Veo, seperti semua model AI, dapat kesulitan dengan sebab dan akibat. Misalnya, dalam klip marshmallow yang sedang dipanggang, camilannya tidak menguning dan hangus karena terkena panas api unggun. Artefak juga merupakan sebuah masalah, seperti yang terlihat jika Anda melihat lebih dekat pada tangan-tangan dalam rekaman konser.
Sedangkan untuk Imagen 3, Google mengatakan model tersebut menghasilkan “gambar paling realistis dan berkualitas tertinggi dari perintah teks sederhana, melampaui versi Imagen sebelumnya dalam hal detail, pencahayaan, dan pengurangan artefak.” Namun, sekali lagi, Anda tidak perlu melihat terlalu dekat untuk mengetahui bahwa Google memiliki lebih banyak pekerjaan yang harus dilakukan.
Pada contoh pertama tentang sekelompok teman yang duduk di bagasi mobil, perintah aslinya menyertakan penyebutan “fotografi flash”, namun subjeknya memiliki cahaya latar yang jelas. Ada yang berpendapat bahwa lampu kilat digunakan untuk menciptakan cahaya latar yang intens, namun jika ide di balik petunjuk ini adalah untuk menciptakan sesuatu yang mewakili fotografi lampu kilat dari tahun 1960an, maka gambar ini bukanlah jawabannya.
Namun, Google ingin menarik lebih banyak pelanggan perusahaannya menggunakan AI generatif. Mengutip penelitiannya sendiri, raksasa teknologi tersebut mengatakan di antara perusahaan yang menggunakan AI generatif dalam produksinya, 86 persen melaporkan peningkatan pendapatan. Namun, survei Appen baru-baru ini menemukan laba atas investasi dari proyek AI turun sebesar 4,6 poin persentase dari tahun 2023 hingga 2024.
Jika Anda membeli sesuatu melalui tautan di artikel ini, kami dapat memperoleh komisi.