Peluncuran terbaru Steiner, sebuah upaya open-source untuk mereproduksi kemampuan OpenAI o1, telah memicu minat yang signifikan di komunitas pengembang, terutama terkait aksesibilitas dan opsi penerapannya. Meskipun model ini menunjukkan hasil yang menjanjikan dengan peningkatan +5,56 pada dataset GPQA-Diamond, fokus komunitas sebagian besar tertuju pada aspek implementasi praktis dan metode penerapan.
Akses Mudah Melalui Ollama
Perkembangan penting yang disoroti dalam diskusi komunitas adalah ketersediaan Steiner melalui Ollama, yang membuatnya lebih mudah diakses oleh pengguna sehari-hari. Pengguna kini dapat menjalankan model menggunakan perintah sederhana:
ollama run hf.co/peakji/steiner-32b-preview-gguf:Q4_K_M
Model ini tersedia dalam format GGUF di Hugging Face, membuatnya kompatibel dengan berbagai opsi penerapan. Kemudahan akses ini disambut baik oleh komunitas, terutama bagi mereka yang ingin bereksperimen dengan kemampuan penalaran tingkat lanjut tanpa biaya dan batasan yang terkait dengan OpenAI.
Klarifikasi Teknis
Menanggapi pertanyaan komunitas, pengembang mengklarifikasi bahwa Steiner bukan sekadar algoritma yang ditambahkan di atas LLM yang sudah ada, melainkan model bahasa yang telah di-fine-tune menggunakan dataset baru dan reward pembelajaran penguatan. Meskipun berbasis Qwen2.5-32B, model ini dioptimalkan khusus untuk tugas penalaran, namun tidak direkomendasikan sebagai pengganti langsung untuk model serba guna seperti Llama.
Kinerja dan Keterbatasan
Diskusi komunitas telah mengungkapkan antusiasme sekaligus kekhawatiran pragmatis tentang kemampuan Steiner:
- Benchmark : Model menunjukkan peningkatan +5,56 pada dataset GPQA-Diamond, meningkatkan performa dasar Qwen2.5-32B yang sebesar 49,49
- Kemampuan Penalaran : Menurut pengembang, model ini dapat memecahkan masalah kompleks yang sulit ditangani model berukuran serupa, meskipun hal ini tidak selalu tercermin dalam benchmark tradisional
- Keterbatasan Saat Ini :
- Belum dioptimalkan untuk dialog multi-turn
- Terutama bekerja dengan token penalaran bahasa Inggris
- Belum dapat mereproduksi kemampuan scaling waktu inferensi o1
Potensi Masa Depan
Komunitas telah menunjukkan ketertarikan khusus pada potensi Steiner sebagai alternatif open-source untuk OpenAI o1, terutama mengingat lanskap layanan AI komersial saat ini. Meskipun model ini belum mencapai semua kemampuan o1, sifat open-source dan pengembangan aktifnya menjadikannya proyek yang menjanjikan bagi mereka yang tertarik dengan sistem penalaran tingkat lanjut.
Pengembang terus bekerja untuk meningkatkan kemampuan model, dengan fokus khusus pada mengatasi tantangan scaling waktu inferensi yang sejauh ini masih sulit dicapai.