Persaingan untuk mengembangkan agen AI yang mampu melakukan tugas kompleks daripada sekadar menjawab pertanyaan semakin intensif dengan masuknya pemain terbaru dari Amazon. Raksasa e-commerce ini telah mengungkapkan kemajuan signifikan pertamanya dalam pengembangan kecerdasan buatan umum (AGI), memposisikan dirinya sebagai pesaing tangguh di bidang yang didominasi oleh OpenAI dan Anthropic.
Laboratorium AGI Amazon Membuat Langkah Pertamanya
Laboratorium AGI SF Amazon, yang berbasis di San Francisco dan didedikasikan untuk mengembangkan kecerdasan buatan umum, telah memperkenalkan produk utama pertamanya: Amazon Nova Act. Model AI baru ini dirancang khusus untuk menggerakkan agen AI canggih yang mampu melakukan berbagai tugas online, mulai dari menjelajah web hingga melakukan pembelian. Dipimpin oleh David Luan, mantan eksekutif OpenAI yang kemudian menjadi co-founder Adept (sebuah startup yang berfokus pada agen AI), laboratorium ini menunjukkan komitmen serius Amazon untuk mengejar ketertinggalan dalam perlombaan AI meskipun sebelumnya dianggap tertinggal.
Klaim Performa dan Keunggulan Kompetitif
Menurut Amazon, Nova Act mengungguli model dari pemimpin industri seperti OpenAI dan Anthropic dalam beberapa tolok ukur yang dirancang untuk mengukur kecerdasan dan kemampuan agen AI. Secara khusus, Amazon mengklaim Nova Act berkinerja lebih baik daripada Claude 3.7 Sonnet dan OpenAI Computer Use Agent pada tolok ukur GroundUI Web dan ScreenSpot. Keunggulan kinerja ini dapat memberikan Amazon keunggulan kompetitif di pasar agen AI yang berkembang pesat.
Fitur Utama Amazon Nova Act:
- Mengungguli Claude 3.7 Sonnet dan OpenAI Computer Use Agent pada benchmark GroundUI Web dan ScreenSpot
- Mampu melakukan pencarian web, melakukan pembelian, dan menjawab pertanyaan tentang konten layar
- Dapat memahami instruksi detail (misalnya, "jangan terima tawaran asuransi tambahan")
- Sudah diimplementasikan dalam asisten Alexa Plus untuk beberapa tugas online
- Saat ini hanya tersedia untuk pengembang dalam "research preview"
Pendekatan Teknis dan Strategi Pengembangan
Alih-alih berfokus pada demonstrasi mencolok yang bekerja secara tidak konsisten, pendekatan Amazon menekankan pada pembangunan agen AI yang dapat diandalkan. Luan membandingkan tantangan ini dengan apa yang disebutnya sebagai masalah Waymo, merujuk pada bagaimana mobil self-driving membutuhkan pelatihan ekstensif untuk menangani kasus-kasus tidak biasa sebelum dapat beroperasi tanpa pengawasan di jalan umum.
Nova Act dibangun berdasarkan model buatan Amazon yang paling kuat, Amazon Nova, dengan pelatihan tambahan yang dirancang khusus untuk meningkatkan kemampuan pengambilan keputusan. Model ini telah ditingkatkan melalui pembelajaran penguatan (reinforcement learning), metode yang telah membantu model AI lain mensimulasikan penalaran dengan lebih baik. Menariknya, Amazon juga mengambil inspirasi dari robotika fisik, dengan tim Luan berkolaborasi dengan grup Amazon lain yang dipimpin oleh Pieter Abbeel, profesor UC Berkeley yang mengkhususkan diri dalam aplikasi robotika untuk AI.
Strategi AI Amazon:
- Model Nova AI dipasarkan sebagai "setidaknya 75% lebih murah" dibandingkan pesaing yang sebanding
- Fokus pada pembangunan agen AI yang dapat diandalkan daripada demonstrasi yang mencolok
- Mendapat inspirasi dari pengalaman robotika fisik di pusat pemenuhan Amazon
- Pengembangan dipimpin oleh mantan eksekutif OpenAI, David Luan
- Bagian dari strategi yang lebih luas untuk bersaing di pasar AI melalui pengembangan yang berfokus pada agen
Alat Pengembang dan Aksesibilitas
Untuk mendorong adopsi dan inovasi, Amazon telah merilis software development kit (SDK) yang dirancang untuk memudahkan para insinyur membangun agen perangkat lunak menggunakan Nova Act. SDK ini memungkinkan pengembang untuk memberikan instruksi spesifik untuk membantu agen mereka menjelajahi internet, yang terutama dirancang untuk pengguna manusia. Misalnya, pengembang dapat menginstruksikan agen untuk jangan menerima upsell asuransi saat memesan mobil sewaan.
Ketersediaan Saat Ini dan Visi Masa Depan
Saat ini, Nova Act hanya tersedia untuk pengembang dalam pratinjau penelitian, tetapi Amazon memperluas akses ke model AI Nova lainnya melalui portal web, membuatnya lebih mudah ditemukan dan digunakan. Perusahaan telah mengintegrasikan beberapa kemampuan Nova Act ke dalam asisten Alexa Plus yang ditingkatkan, mendemonstrasikan aplikasi praktis dari teknologi tersebut.
Laboratorium AGI Amazon memiliki tujuan ambisius untuk agen-agennya, membayangkan mereka pada akhirnya akan melakukan tugas-tugas multi-langkah yang kompleks dan beragam seperti mengorganisir pernikahan atau menangani tugas-tugas IT kompleks untuk meningkatkan produktivitas bisnis. Luan menggambarkan Nova Act sebagai langkah pertama dalam visi tersebut, menunjukkan kemampuan yang lebih canggih sedang dalam pengembangan.
Strategi AI Amazon dan Posisi Kompetitif
Alih-alih mengklaim menawarkan model AI paling kuat yang tersedia, Amazon telah menekankan kecepatan dan nilai dari rangkaian Nova-nya, yang dikatakannya setidaknya 75 persen lebih murah daripada pesaing yang sebanding. Proposisi nilai ini, dikombinasikan dengan sumber daya dan infrastruktur yang luas yang dimiliki Amazon, dapat memposisikan perusahaan sebagai pesaing kuat di pasar agen AI meskipun masuk relatif terlambat.
Langkah Amazon ke dalam pasar agen AI juga sejalan dengan aplikasi potensial masa depan dalam e-commerce. Penelitian sebelumnya dari perusahaan telah mengeksplorasi bagaimana agen dapat meningkatkan belanja online dengan mengotomatisasi proses pencarian dan pembelian barang, bahkan berpotensi menambahkan produk ke keranjang pengguna secara preemptif berdasarkan minat dan kebiasaan mereka.
Implikasi Industri yang Lebih Luas
Masuknya Amazon ke pasar agen AI menandakan pergeseran signifikan dalam lanskap AI, dengan perusahaan teknologi besar semakin fokus pada pembangunan sistem AI yang dapat mengambil tindakan daripada sekadar terlibat dalam percakapan. Seiring agen-agen ini menjadi lebih andal dan mampu, mereka dapat secara fundamental mengubah cara orang berinteraksi dengan teknologi dan menyelesaikan tugas sehari-hari secara online, berpotensi mengganggu berbagai industri dalam prosesnya.