Dalam perkembangan terbaru yang menarik perhatian komunitas AI, model bahasa terbaru xAI yaitu Grok 3 menghadapi tantangan signifikan segera setelah peluncurannya yang mendapat sorotan tinggi. Terlepas dari klaim ambisius tentang keunggulannya, model ini menghadapi pengawasan ketat terkait kemampuan kinerja dan langkah-langkah keamanannya.
Masalah Kinerja Muncul
Tim xAI milik Elon Musk memperkenalkan Grok 3 dengan klaim berani tentang kemampuannya, khususnya dalam matematika, sains, dan pemrograman. Namun, pengujian awal mengungkapkan keterbatasan yang mengkhawatirkan. Model ini kesulitan dengan perbandingan angka dasar, terutama gagal menentukan dengan benar apakah 9.11 lebih besar dari 9.9. Kesalahan mendasar ini telah mengundang kritik dari para ahli teknologi dan pengguna, terutama mengingat besarnya sumber daya yang diinvestasikan dalam pengembangannya.
Pengembangan yang Membutuhkan Banyak Sumber Daya
Pengembangan Grok 3 melibatkan sumber daya komputasi yang sangat besar, menggunakan lebih dari 200.000 chip H100 dengan total waktu pelatihan 200 juta jam. Hal ini sangat kontras dengan pesaing seperti DeepSeek V3, yang mencapai kinerja sebanding hanya dengan menggunakan 2.000 chip H800 dan waktu pelatihan dua bulan. Perbedaan dalam efisiensi sumber daya ini menimbulkan pertanyaan tentang efektivitas biaya dan pendekatan pengembangan model tersebut.
Kerentanan Keamanan Terungkap
Dalam waktu 24 jam setelah rilisnya, perusahaan keamanan Adversa AI berhasil membobol Grok 3, mengungkap kerentanan keamanan yang signifikan. Tim ini menggunakan berbagai metode - pendekatan linguistik, adversarial, dan pemrograman - untuk menembus langkah-langkah keamanan model. Pelanggaran ini memungkinkan model mengungkapkan informasi sensitif dan menghasilkan konten yang berpotensi berbahaya, menunjukkan kekhawatiran serius tentang protokol keamanannya.
Terbatasnya Langkah Keamanan
Berbeda dengan pesaingnya seperti Google dan OpenAI yang menerapkan pembatasan keamanan yang kuat, Grok 3 sengaja dirancang dengan lebih sedikit pembatasan. Pilihan desain ini, dikombinasikan dengan data pelatihannya yang bersumber dari X (sebelumnya Twitter) di mana moderasi konten telah berkurang, menghasilkan model yang mungkin menghasilkan respons yang lebih kontroversial dan berpotensi berisiko.
Perkembangan Masa Depan
Menanggapi kritik tersebut, Musk mengakui bahwa versi saat ini masih dalam tahap beta, dan menjanjikan rilis lengkap dalam beberapa bulan mendatang. Perusahaan juga menunjukkan keterbukaan terhadap umpan balik pengguna, menunjukkan komitmen untuk mengatasi kekurangan awal ini. Namun, insiden-insiden tersebut telah memunculkan pertanyaan penting tentang keseimbangan antara kemampuan AI, keamanan, dan pengembangan yang bertanggung jawab dalam bidang model bahasa besar yang berkembang pesat.