Grok AI Mengejar Ketertinggalan dengan Fitur Penglihatan dan Dukungan Suara Multibahasa

BigGo Editorial Team
Grok AI Mengejar Ketertinggalan dengan Fitur Penglihatan dan Dukungan Suara Multibahasa

Persaingan chatbot AI terus memanas saat xAI milik Elon Musk memperkenalkan kemampuan baru yang signifikan pada platform Grok. Dalam langkah yang mendekatkannya dengan pesaing seperti ChatGPT dari OpenAI dan Gemini dari Google, Grok kini menawarkan kemampuan penglihatan dan fitur suara yang ditingkatkan, menandai langkah lain menuju asisten AI yang lebih interaktif dan responsif.

Grok Vision Memasuki Arena AI Visual

Grok telah bergabung dengan jajaran sistem AI yang dapat melihat melalui kamera perangkat Anda. Grok Vision yang baru diperkenalkan memungkinkan chatbot untuk menganalisis dan merespons informasi visual yang ditangkap melalui kamera smartphone secara real-time. Fitur ini, yang diumumkan oleh pengembang xAI Ebby Amir pada 22 April 2025, memungkinkan pengguna untuk mengarahkan kamera mereka ke objek atau pemandangan dan mengajukan pertanyaan kepada Grok tentang apa yang dilihatnya. Kemampuan visual ini mirip dengan fungsi serupa yang sudah tersedia di Gemini dari Google dan ChatGPT dari OpenAI, menunjukkan bahwa penglihatan real-time dengan cepat menjadi fitur standar dalam chatbot AI canggih.

Dukungan Suara Multibahasa Memperluas Aksesibilitas

Selain kemampuan visual, pembaruan ini membawa dukungan suara yang diperluas ke Grok. Chatbot ini sekarang dapat terlibat dalam percakapan suara dalam beberapa bahasa, termasuk Spanyol, Prancis, Turki, Jepang, dan Hindi. Kemampuan multibahasa ini secara signifikan memperluas aksesibilitas Grok kepada penutur non-Inggris dan memposisikannya sebagai asisten AI yang lebih relevan secara global. Mode suara memungkinkan percakapan alami dengan AI, meskipun seperti chatbot bersuara lainnya, sifat sintetis dari suara tersebut masih terasa bagi kebanyakan pengguna.

Ketersediaan Platform dan Fitur Premium

Saat ini, fitur-fitur baru ini eksklusif untuk pengguna iOS pada paket Grok standar, mengikuti pola xAI yang meluncurkan pembaruan ke pengguna iPhone terlebih dahulu. Pengguna Android dapat mengakses kemampuan baru ini hanya jika mereka berlangganan paket SuperGrok premium, yang berharga 30 dolar AS per bulan. Tingkat premium juga mencakup fitur tambahan seperti pencarian real-time dalam Mode Suara, memberikan pelanggan berbayar fungsionalitas yang lebih baik dibandingkan penawaran standar.

Fitur Baru Grok:

  • Grok Vision: Analisis visual berbasis kamera secara real-time
  • Dukungan suara multibahasa: Spanyol, Prancis, Turki, Jepang, Hindi
  • Pencarian suara real-time (hanya untuk pelanggan SuperGrok)

Ketersediaan Platform:

  • iOS: Semua fitur tersedia pada paket standar
  • Android: Fitur memerlukan langganan SuperGrok seharga USD $30/bulan

Pembaruan xAI Terbaru:

  • Alat pembuatan dokumen dan aplikasi
  • Fitur memori untuk penyimpanan konteks percakapan

Tren yang Lebih Luas Menuju AI Agentik

Pembaruan terbaru Grok sejalan dengan pergerakan industri menuju apa yang dikenal sebagai AI agentik – sistem yang dapat merasakan lingkungannya, menetapkan tujuan, merencanakan tindakan, dan membuat keputusan dengan bimbingan manusia yang minimal. Ini merupakan evolusi signifikan dari model AI sebelumnya yang hanya merespons prompt tertentu atau menghasilkan konten berdasarkan data pelatihan. Gemini 2.0 dari Google dan ChatGPT dari OpenAI dengan fitur Tasks-nya mencontohkan tren ini, menawarkan kemampuan yang mengubah informasi mentah menjadi wawasan yang dapat ditindaklanjuti dan memungkinkan pengguna untuk mengatur pengingat dan menjadwalkan tugas berulang.

Pengembangan Fitur Cepat xAI

Kecepatan pengembangan di xAI telah cukup cepat dalam beberapa bulan terakhir. Tepat sebelum pembaruan penglihatan dan suara, Grok menerima alat untuk membuat dokumen dan aplikasi, serta fitur memori yang memungkinkan chatbot untuk mengingat detail dari percakapan sebelumnya. Kemampuan memori ini memungkinkan respons yang lebih kontekstual dan relevan seiring waktu, karena AI membangun riwayat interaksi dengan pengguna individu.

Masa Depan AI Percakapan

Saat chatbot AI seperti Grok, ChatGPT, dan Gemini terus mendapatkan kemampuan sensorik dan agensi, mereka semakin mendekati visi fiksi ilmiah tentang asisten AI yang digambarkan dalam media seperti film Her tahun 2013. Meskipun implementasi saat ini masih jelas menunjukkan sifat buatannya, trajektori menunjukkan pendamping AI yang semakin alami dan membantu yang dapat memahami tidak hanya apa yang kita katakan, tetapi apa yang kita lihat dan konteks di mana kita beroperasi. Bagi pengguna, ini berarti bantuan AI yang lebih intuitif dan membantu yang membutuhkan instruksi eksplisit yang lebih sedikit dan memberikan dukungan yang lebih relevan.