Demonstrasi terbaru dari GibberLink, sebuah proyek yang menunjukkan dua agen AI beralih dari komunikasi suara ke transfer data berbasis suara, telah memicu diskusi hangat di komunitas teknologi mengenai efisiensi dan kepraktisan pendekatan tersebut dalam protokol komunikasi AI modern.
Komponen Implementasi:
- Agen Kecerdasan Buatan Konversasional dari ElevenLabs
- Protokol 'data melalui suara' ggwave
- Fungsi pemanggilan alat LLM
Menemukan Kembali Roda, Namun Lebih Lambat
Demonstrasi ini, yang menampilkan agen AI beralih ke protokol tingkat suara setelah mengenali satu sama lain, mendapat kritik karena pada dasarnya menemukan kembali modem dengan kinerja yang jauh lebih buruk. Protokol ggwave yang diimplementasikan beroperasi hanya pada 8-16 byte per detik, jauh di bawah kemampuan modem Bell 103 tahun 1963 yang mampu mencapai 37 byte per detik. Kesenjangan kinerja yang signifikan ini telah memunculkan diskusi tentang nilai praktis dari implementasi semacam itu di era konektivitas internet yang tersebar luas.
Agak menyedihkan telah menemukan kembali modem yang 10.000 kali kurang efisien.
Perbandingan Kecepatan Transfer Data:
- GibberLink (ggwave): 8-16 byte/detik
- Modem Bell 103 (1963): 37 byte/detik
Solusi Alternatif yang Diusulkan
Para ahli teknis dari komunitas telah mengusulkan beberapa alternatif yang lebih efisien untuk implementasi saat ini. Solusi yang paling umum diusulkan melibatkan pertukaran informasi endpoint atau ID percakapan unik ketika agen AI mengidentifikasi satu sama lain, diikuti dengan beralih ke saluran komunikasi berbasis internet langsung. Pendekatan ini akan menghilangkan kebutuhan untuk transfer data berbasis audio yang tidak efisien sambil mempertahankan kemampuan agen AI untuk mengenali dan berkomunikasi satu sama lain.
Kebutuhan Standardisasi
Poin penting muncul dari diskusi mengenai kebutuhan protokol standar untuk komunikasi agen AI. Meskipun implementasi saat ini mungkin tidak optimal, komunitas mengakui pentingnya menetapkan dokumentasi formal untuk jabat tangan AI-ke-AI dan pengalihan protokol. Standardisasi ini akan memungkinkan komunikasi yang lebih efisien dan andal antara agen AI di berbagai platform dan implementasi.
Pertimbangan Keamanan dan Praktis
Demonstrasi ini juga memunculkan pertanyaan tentang skenario praktis di mana komunikasi berbasis audio semacam itu akan diperlukan, mengingat konektivitas internet yang sudah sangat umum. Beberapa anggota komunitas menunjukkan bahwa dalam kebanyakan kasus di mana komunikasi suara dimungkinkan, akses internet juga akan tersedia, membuat protokol audio menjadi berlebihan.
Diskusi seputar GibberLink menjadi pengingat bahwa meskipun inovasi dalam komunikasi AI itu penting, sangat penting untuk mempertimbangkan teknologi yang sudah ada dan standar efisiensi ketika mengembangkan solusi baru. Seiring evolusi AI, fokusnya harus pada menciptakan metode komunikasi antara agen AI yang praktis, efisien, dan terstandarisasi.
Referensi: GibberLink: A Demo of Two Conversational AI Agents Switching from English to Sound-Level Protocol
![]() |
---|
Demonstrasi agen-agen AI yang berkomunikasi dan mempertanyakan efisiensi protokol komunikasi berbasis audio mereka |