Google Gemini 2.5 Pro Menambahkan Fitur Analisis Video dan Pencarian Riwayat Obrolan

BigGo Editorial Team
Google Gemini 2.5 Pro Menambahkan Fitur Analisis Video dan Pencarian Riwayat Obrolan

Asisten AI Google Gemini terus berkembang pesat dengan kemampuan baru yang signifikan yang terus ditemukan dan diluncurkan. Temuan terbaru mengungkapkan kemampuan analisis video yang akan datang dan fungsionalitas pencarian riwayat obrolan, sementara model Gemini 2.5 Pro terbaru telah mengesankan pengguna sehingga bergabung dengan jajaran alat AI berbayar yang layak untuk berlangganan.

Analisis Video Hadir di Gemini

Sebuah pembongkaran APK Gemini untuk Android (versi 16.15.38.sa.arm64 beta) telah mengungkapkan bahwa Google sedang mempersiapkan untuk menambahkan kemampuan analisis video ke asisten AI-nya. Para pengembang berhasil mengaktifkan fitur yang belum dirilis ini, memungkinkan pengguna untuk mengunggah video dan mengajukan pertanyaan kepada Gemini tentang konten video tersebut. Implementasinya tampaknya dapat menangani konten video hingga lima menit, dengan AI yang secara akurat menganalisis elemen visual, mengidentifikasi lokasi berdasarkan petunjuk arsitektur, dan memberikan informasi kontekstual tentang rekaman tersebut.

Fungsionalitas ini bisa terbukti berguna untuk merangkum rapat yang direkam, memecahkan masalah teknis melalui rekaman layar, atau menganalisis konten visual untuk berbagai tujuan. Fitur ini tampaknya berada dalam tahap pengujian akhir, yang menunjukkan pengumuman resmi bisa datang segera, kemungkinan pada acara I/O Google yang akan datang.

Fitur Gemini yang Akan Datang

  • Analisis video dengan batas unggahan 5 menit
  • Fungsi pencarian riwayat chat
  • Peningkatan kemampuan analisis dokumen

Fungsionalitas Pencarian untuk Riwayat Obrolan

Peningkatan penting lainnya yang ditemukan dalam versi beta yang sama mengatasi kesenjangan kegunaan yang signifikan di Gemini. Saat ini, meskipun AI mempertahankan riwayat komprehensif dari percakapan sebelumnya, tidak ada cara efisien untuk mencari di antara mereka. Kelalaian ini telah menjadi sangat membuat frustasi bagi pengguna berat yang mencoba menemukan informasi spesifik dari interaksi sebelumnya.

Pembongkaran APK mengungkapkan string terkait dengan SEARCH_CHAT_HISTORY, yang menunjukkan Google sedang mengembangkan solusi untuk masalah ini. Meskipun fitur ini tampaknya berada dalam tahap pengembangan awal dengan belum ada implementasi fungsional yang terlihat, ini merepresentasikan peningkatan kualitas hidup yang penting yang selaras dengan kompetensi inti Google dalam teknologi pencarian.

Gemini 2.5 Pro Mengesankan Pengguna

Di luar fitur-fitur yang akan datang ini, peluncuran terbaru Google Gemini 2.5 Pro telah membuat gelombang di antara para penggemar AI. Model ini mewakili kemajuan signifikan dibandingkan versi sebelumnya, dengan kemampuan yang mencakup penalaran kompleks, pengkodean, dan menganalisis dokumen besar. Jendela konteksnya yang besar hingga 1 juta token (dengan rencana untuk memperluas hingga 2 juta) memungkinkannya memproses dan memahami informasi jauh lebih banyak sekaligus dibandingkan versi sebelumnya.

Bersamaan dengan Gemini 2.5 Pro, Google juga memperkenalkan Gemini 2.5 Flash, yang dioptimalkan untuk kecepatan dan efisiensi biaya dalam aplikasi volume tinggi seperti layanan pelanggan. Kedua model mendukung input multimodal meliputi teks, gambar, audio, dan video, dengan fitur seperti Manual Reasoning Control untuk menyesuaikan seberapa menyeluruh model berpikir melalui masalah.

Peningkatan ini telah cukup substansial sehingga bahkan pengguna AI selektif yang biasanya membatasi langganan berbayar mereka menambahkan Gemini ke toolkit mereka. Kunci untuk mendapatkan hasil maksimal dari model-model canggih ini tampaknya terletak pada bagaimana pengguna mendekati mereka—dengan komunikasi yang jelas, prompt yang spesifik, dan ekspektasi realistis tentang kemampuan dan keterbatasan mereka.

Fitur Gemini 2.5 Pro

  • Jendela konteks hingga 1 juta token (2 juta akan segera hadir)
  • Dukungan input multimodal (teks, gambar, audio, video)
  • Manual Reasoning Control untuk menyesuaikan pemikiran model
  • Canvas: ruang interaktif untuk pengeditan dokumen dan kode
  • Live API untuk streaming real-time di berbagai modalitas

Lanskap AI yang Terus Berkembang

Meskipun Gemini 2.5 Pro mewakili langkah besar ke depan untuk penawaran AI Google, pengguna mencatat bahwa integrasi dalam ekosistem Google masih terasa agak terputus ketika beralih antara fungsi yang berbeda. Model ini juga terus menghadapi tantangan dengan penulisan bernuansa, pemikiran yang lebih dalam, dan halusinasi sesekali—masalah umum di seluruh model bahasa besar.

Saat alat AI terus matang, perbedaan di antara mereka menjadi kurang tentang kemampuan mentah dan lebih tentang seberapa efektif pengguna dapat memanfaatkannya untuk alur kerja spesifik. Dengan fitur-fitur yang akan datang ini dan peningkatan terbaru, Google memposisikan Gemini sebagai pesaing serius dalam ruang asisten AI yang semakin kompetitif, khususnya bagi pengguna yang menghargai kemampuan analisis multimodal dan integrasi mendalam dengan ekosistem Google.