DeepSeek Meluncurkan R1: Model AI Open-Source yang Menandingi OpenAI dengan Biaya 1/27 Kali Lebih Murah

BigGo Editorial Team

DeepSeek Meluncurkan R1: Model AI Open-Source yang Menandingi OpenAI dengan Biaya 1/27 Kali Lebih Murah

Dalam perkembangan signifikan bagi industri kecerdasan buatan, perusahaan AI China, DeepSeek telah memperkenalkan model bahasa besar terbarunya, DeepSeek-R1. Model terobosan ini menunjukkan kemampuan yang setara dengan produk terbaru OpenAI sambil mempertahankan komitmen terhadap prinsip open-source dan efektivitas biaya, menandai potensi perubahan dalam lanskap AI global.

Peringkat Kinerja Model:

Prompting Kompleks/Kontrol Gaya: 1
Tolok Ukur WebDev: 2 (mendekati Claude 3.5 Sonnet)
Peringkat Keseluruhan: 3 Besar bersama ChatGPT-4o


Gambar ini melambangkan inovasi yang penuh semangat muda dan semangat kolaborasi di balik kesuksesan DeepSeek dalam mengembangkan model AI DeepSeek-R1

Rasio Biaya-Kinerja yang Revolusioner

DeepSeek-R1 telah mencapai prestasi luar biasa dengan menyamai kinerja model o1 milik OpenAI sambil mengurangi biaya API hingga 97%. Harga API model ini ditetapkan sebesar 1 Yuan untuk setiap juta token masukan untuk cache hits dan 4 Yuan untuk cache misses, dengan token keluaran dihargai 16 Yuan per juta. Pengurangan biaya yang dramatis ini membuat kemampuan AI tingkat lanjut lebih terjangkau bagi pengembang dan bisnis di seluruh dunia.

Fitur	DeepSeek-R1	Model Tradisional
GPU Pelatihan	~2.000 H800	~10.000 A100/H100
Waktu Pengembangan	2 bulan	6+ bulan
Biaya Pelatihan	USD 5,58 juta	USD 78-200 juta
Biaya API (Output)	CNY 16/juta token	~CNY 432/juta token


Grafik batang ini secara visual menggambarkan kinerja DeepSeek-R1 dibandingkan dengan metode lain pada berbagai dataset AI, menekankan kemampuan kompetitifnya

Inovasi Teknis di Bawah Kendala

Meskipun menghadapi pembatasan ekspor chip AI canggih, tim DeepSeek mengembangkan solusi inovatif untuk mengoptimalkan kinerja model mereka. Perusahaan menggunakan sekitar 2.000 GPU Nvidia H800 untuk pelatihan, dibandingkan dengan 10.000 GPU yang dilaporkan digunakan oleh pesaing. Efisiensi ini dicapai melalui inovasi arsitektur seperti mekanisme Multi-head Latent Attention (MLA) dan arsitektur DeepSeekMoE, yang secara signifikan mengurangi kebutuhan memori dan komputasi.

Komitmen Open Source

DeepSeek telah merilis R1 di bawah lisensi MIT, membuat bobot model dan dokumentasi teknis tersedia secara gratis untuk komunitas pengembang global. Langkah ini memungkinkan distilasi model dan integrasi ke dalam aplikasi pihak ketiga, mendorong inovasi dan kolaborasi di bidang AI. Perusahaan telah mendemonstrasikan potensi model dengan mendistilasi enam model yang lebih kecil yang menyamai kinerja o1-mini OpenAI.


Gambar ini mencerminkan perbandingan kompetensi AI dari berbagai negara, menggarisbawahi konteks global dari peluncuran model sumber terbuka DeepSeek

Talenta Muda Mendorong Inovasi

Di balik kesuksesan DeepSeek adalah strategi komposisi tim yang unik. Perusahaan terutama merekrut talenta muda, banyak di antaranya adalah lulusan baru atau profesional di awal karir dengan pengalaman kurang dari lima tahun. Pendekatan ini, dipimpin oleh pendiri Liang Wenfeng, menekankan kemampuan penelitian fundamental dan pemikiran kreatif di atas pengalaman industri.

Implikasi Masa Depan

Pencapaian DeepSeek merepresentasikan tonggak penting dalam demokratisasi akses ke kemampuan AI tingkat lanjut. Kesuksesan perusahaan menunjukkan bahwa pendekatan inovatif terhadap arsitektur model dan pelatihan dapat mengatasi kendala sumber daya sambil mempertahankan kinerja yang kompetitif. Seiring DeepSeek terus mengembangkan aplikasi mobile dan memperluas penawaran layanannya, dampak dari pendekatan open-source dan hemat biaya mereka mungkin akan membentuk kembali masa depan pengembangan AI.

Berita Terkait

‌

‌
‌

‌

‌
‌

‌