HOLOPIS.COM, JAKARTA – Google beberapa waktu lalu telah resmi meluncurkan versi terbaru dari model kecerdasan buatan atau artificial intelegence (AI), yakni Gemini 1.5 Pro.
Kehadiran model AI ini membawa sejumlah pembaruan, dimana salah satunya terdapat penambahan limit di jendela konteks hingga satu juta token.
Selain itu, model ini juga tergolong model multimodal yang mampu mengolah berbagai format data seperti teks, audio, gambar, hingga video sekalipun. Berikut sederet fakta menarik dari Gemini 1.5 Pro dari Google ini :
Jendela Konteks Jadi Lebih Luas
Hal paling menarik dari Gemini 1.5 Pro ini adalah limit jendela konteksnya. Sebab jendela konteks ini merujuk pada seberapa banyak informasi yang dapat diproses oleh AI dalam satu waktu.
Secara umum, Gemini 1.5 Pro sendiri memiliki jendela konteks standar sebesar 128 ribu token. Namun ini dapat ditingkatkan hingga satu juta token.
Mengapa ini penting? Jadi, semakin besar jendela konteks suatu model AI maka semakin banyak informasi yang dapat diproses. Langkah ini akan membuat output dari AI tersebut semakin konsisten, bermanfaat, dan relevan.
Gemini 1.5 Pro disebut mampu menganalisis, mengklasifikasi, dan merangkum dokumen panjang dengan baik. Kemampuan ini ditunjukkan dalam demonstrasi Google yang memberi input berupa dokumen transkrip dari misi Apollo 11 ke bulan.
Hasilnya, model ini mampu menganalisis detail percakapan dan peristiwa yang tercatat dalam dokumen sepanjang 402 halaman tersebut. Bahkan, dalam penelitannya, Google mengklaim berhasil mengetes model ini dengan 10 juta token.
Jadi Model AI yang Multimodal
Gemini 1.5 Pro adalah sebuah model AI yang multimodal. Artinya, model ini dapat menerima berbagai jenis input, seperti teks, gambar, audio, hingga video, dengan durasi hingga satu jam untuk video, 11 jam audio dan 30 ribu baris kode.
Google menggunakan film bisu berjudul “Sherlock Jr.” yang berdurasi sekitar 45 menit untuk mengetes model ini. Hasilnya, Gemini berhasil mencari adegan spesifik dari film tersebut dengan baik.
Tak hanya itu, model ini juga berhasil mencari skenario yang mirip dengan sketsa sederhana yang diberi oleh tim peneliti.
Punya Kemampuan Pecahkan Masalah
Gemini juga memiliki kemampuan pemecahan masalah yang sangat baik. Dalam demonstrasinya, peneliti Google memberikan gambaran bagaimana model ini dapat mengerjakan berbagai tugas coding kompleks dengan input hingga 100 ribu baris kode.
Model ini juga memiliki kemampuan belajar yang impresif. Hal itu terlihat dalam suatu pengujian, dimana peneliti Google memberi input berupa buku panduan bahasa Kalamang, yakni bahasa langka dari Papua Nugini yang hanya memiliki sekitar 200 penutur ke Gemini.
Hasilnya, Gemini berhasil belajar bahasa tersebut dengan cukup baik hanya dari satu buku. Model ini juga berhasil menerjemahkan bahasa Inggris ke Kalamang dengan level yang sama baiknya dengan orang yang belajar dari buku sama.
Saat ini, Gemini 1.5 Pro masih belum dirilis untuk publik, dimana model ini baru tersedia secara terbatas untuk kalangan pengembang melalui Google AI Studio dan Vertex AI.