Pengumuman terbaru tentang Kimi k1.5, sebuah model AI multi-modal baru yang mengklaim memiliki kemampuan penalaran mutakhir, telah memicu diskusi di komunitas AI mengenai praktik rilis model dan perkembangan lanskap pengembangan AI. Meskipun model tersebut memamerkan metrik kinerja yang mengesankan, respons komunitas menyoroti kekhawatiran yang berkembang tentang transparansi dan aksesibilitas dalam penelitian AI.
Klaim Performa Utama:
- Skor AIME: 77.5
- Skor MATH 500: 96.2
- Codeforces: persentil ke-94
- Skor MathVista: 74.9
Kemampuan Model:
- Jendela konteks: 128k
- Multi-modal: Teks dan visual
- Penalaran Short-CoT dan Long-CoT
Kebangkitan Laboratorium AI Tiongkok
Kemunculan Kimi k1.5, bersama dengan perkembangan terbaru lainnya seperti DeepSeek-R1, menunjukkan kemajuan pesat laboratorium AI Tiongkok dalam persaingan AI global. Diskusi komunitas menunjukkan tren menarik dalam pengembangan AI Tiongkok, khususnya dalam pendekatan mereka terhadap efisiensi dan optimalisasi. Seperti yang dicatat oleh salah satu anggota komunitas:
Tidak mengejutkan bahwa negara dengan 20% populasi dunia memiliki orang-orang pintar di dalamnya. Yang menarik adalah bagaimana Tiongkok telah fokus untuk melakukan lebih banyak dengan sumber daya yang lebih sedikit - posisi mereka yang kurang diuntungkan dalam hal perangkat keras telah mendorong fokus besar pada efisiensi model dan distilasi, yang menguntungkan kita semua.
Perdebatan API-First vs Open Source
Poin perdebatan signifikan dalam komunitas berpusat pada strategi rilis model. Sementara Kimi k1.5 menjanjikan akses API melalui OpenPlatform mereka, banyak peneliti dan pengembang mengungkapkan frustrasi dengan tren perusahaan yang menggunakan repositori GitHub terutama untuk tujuan promosi daripada berbagi kode atau bobot model yang sebenarnya. Praktik ini telah memicu perdebatan tentang transparansi dan reproduktifitas dalam penelitian AI.
Sebuah diagram yang menampilkan Sistem Pelatihan Pembelajaran Penguatan untuk LLM, menyoroti proses-proses yang terlibat dalam penskalaan dan efisiensi yang relevan dengan strategi perilisan model |
Dokumentasi dan Praktik Rilis
Komunitas telah mengangkat kekhawatiran tentang pola perusahaan AI, khususnya dari Tiongkok, yang menggunakan repositori GitHub sebagai platform pemasaran daripada repositori open-source yang sebenarnya. Para kritikus menunjukkan bahwa repositori ini sering kali hanya berisi file README dan dokumentasi API, yang mengarah pada seruan untuk pelabelan yang lebih jelas tentang jenis konten repositori dan praktik rilis yang lebih transparan.
Dampak pada Komunitas Penelitian AI
Terlepas dari kontroversi seputar format rilisnya, kontribusi teknis Kimi k1.5, khususnya dalam hal penskalaan panjang konteks dan efisiensi pembelajaran penguatan, diakui sebagai potensi yang berharga bagi bidang ini. Kinerja model yang dilaporkan pada berbagai tolok ukur, termasuk AIME dan MATH-500, menunjukkan kemajuan signifikan dalam kemampuan penalaran AI, meskipun komunitas tetap berhati-hati tentang klaim tersebut sampai verifikasi independen dimungkinkan.
Situasi ini mencerminkan ketegangan yang lebih luas dalam bidang AI antara kepentingan komersial dan keterbukaan akademis, menyoroti kebutuhan akan standar yang lebih jelas dalam bagaimana model AI baru disajikan dan dibagikan dengan komunitas penelitian.
Referensi: Kimi k1.5: Scaling Reinforcement Learning with LLMs