Di event Google I/O 2024 lalu, Google mengumumkan sebuah produk AI terbaru mereka yang diberi nama Gemini Live. Mirip dengan GPT-4o yang juga baru saja diluncurkan oleh OpenAI, Gemini Live adalah model AI multi-modal dengan kemampuan pengenalan suara dan video yang mengagumkan.
Gemini Live ini merupakan salah satu bagian dari “Project Astra” yang sedang dirancang oleh Google yang salah satu potensinya adalah menghasilkan sebuah smart glasses atau kacamata pintar. Untuk saat ini, Gemini Live yang hadir di smartphone adalah perwujudan pertamanya. Bagaimana fitur dan penggunaannya secara langsung telah didemokan di Google I/O 2024. Meski demikian, Gemini Live belum tersedia untuk saat ini.
Apa Saja Fitur-Fiturnya?

Google baru saja menyediakan Gemini 1.5 untuk pengguna Gemini Advanced berbayar. Hal yang baru dari update ini adalah memperluas kemampuannya, misalnya membaca sejumlah dokumen besar atau membuat ringkasan dari 100 email.
Gemini 1.5 juga dapat memahami gambar dan membuat visualisasi dan bagan. Tidak seperti GPT-4o, Gemini mengandalkan model lain seperti Imagen 3 dan Google Veo untuk menghasilkan gambar dan video. Selain itu, update terbaru ini juga memungkinkan pengguna untuk mengupload Google Docs, PDF, dan format dokumen lainnya sebagai prompt.
Gemini Live akan menjadi bagian dari update tersebut. Pengguna Gemini Advanced yang berbayar akan dapat menggunakan Gemini Live secara gratis selama dua bulan secara gratis. Namun, setelahnya Gemini Advanced akan memerlukan biaya berlangganan seharga 19.99 USD per bulannya.
Ke depannya, Gemini Live akan dapat diakses di aplikasi Gemini versi Android dan iOS melalui ikon suara di aplikasi tersebut. Tampilannya akan berupa full screen dan memungkinkan pengguna untuk memiliki percakapan dua arah dengan Gemini.
Mirip dengan GPT-4o, pengguna akan dapat berbicara sesuai keinginan mereka dan menyela Gemini untuk menambahkan informasi baru atau memperjelas perintah. Sebagian besar demo dan video yang dipamerkan di Google I/O 2024 menampilkan satu suara perempuan dan satu suara laki-laki. Nantinya, akan ada 10 jenis pilihan suara berbeda yang dapat dipilih.
Fitur istimewa yang menjadi sorotannya adalah penggunaan kamera yang mirip dengan Google Lens. Gemini akan berinteraksi dengan pengguna dan “melihat dunia” melalui lensa kamera selagi mendengarkan prompt atau memberikan jawaban.
Kapan Gemini Live Akan Tersedia?

Untuk pengguna Gemini Advanced sekalipun, saat ini Gemini Live belum tersedia. Sebuah postingan blog dari Google menyatakan bahwa fitur AI terbaru ini akan tersedia dalam “beberapa bulan ke depan.” Kemudian, ada juga sebuah tweet dari Google yang mengklaim bahwa fitur ini akan diluncurkan “musim panas ini.” Tampaknya, Gemini Live baru akan tersedia paling cepat di akhir bulan Juli tahun ini.
Selain itu, Gemini Live dengan kemampuan kameranya juga belum akan tersedia hingga “akhir tahun ini,” yang kemungkinan besar artinya datang di update akhir musim gugur nanti.
Baca juga:























