DeepSeek Janus-Pro Menantang DALL-E 3 dengan AI Multimodal yang Efisien dan Open-Source

BigGo Editorial Team
DeepSeek Janus-Pro Menantang DALL-E 3 dengan AI Multimodal yang Efisien dan Open-Source

Dalam perkembangan signifikan bagi industri AI, perusahaan rintisan AI asal Tiongkok, DeepSeek, telah memperkenalkan Janus-Pro, sebuah model AI multimodal baru yang menunjukkan bagaimana pendekatan yang efisien dan hemat biaya dapat bersaing dengan raksasa industri. Peluncuran ini hadir di saat perdebatan mengenai biaya pengembangan AI dan kebutuhan sumber daya semakin intensif.

Pendekatan Baru untuk AI Multimodal

DeepSeek Janus-Pro merupakan kerangka kerja autoregresif baru yang dapat menganalisis dan menghasilkan gambar. Keluarga model ini memiliki rentang parameter dari 1 miliar hingga 7 miliar, dengan versi unggulan Janus-Pro-7B dilaporkan mengungguli solusi mapan seperti DALL-E 3 dari OpenAI dan Stable Diffusion XL dari Stability AI dalam pengujian benchmark termasuk GenEval dan DPG-Bench.

Spesifikasi Model:

  • Rentang parameter: 1B hingga 7B
  • Persyaratan pelatihan (model 1.5B): 128 GPU A100, 7 hari
  • Persyaratan pelatihan (model 7B): 256 GPU A100, 14 hari
  • Batas resolusi gambar: 384 x 384 (untuk model yang lebih kecil)

Inovasi Hemat Biaya

Pengembangan Janus-Pro menunjukkan strategi kecil tapi tangguh dari DeepSeek. Proses pelatihan menunjukkan efisiensi luar biasa, dengan model parameter 1,5B membutuhkan 128 GPU NVIDIA A100 selama tujuh hari, sementara versi parameter 7B membutuhkan 256 GPU A100 selama empat belas hari. Pendekatan ini sangat berbeda dengan mentalitas semakin besar semakin baik dan kebutuhan komputasi masif yang umum di industri.

Open Source dan Aksesibilitas

Dirilis di bawah lisensi MIT, Janus-Pro tersedia secara gratis untuk penggunaan komersial melalui platform pengembangan AI seperti Hugging Face. Pendekatan open-source ini membuat teknologi AI tingkat lanjut dapat diakses oleh individu dan perusahaan kecil, meskipun beberapa model terbatas pada analisis gambar dengan resolusi 384 x 384.

Dampak Pasar dan Harga

Struktur harga layanan API DeepSeek tetap kompetitif, dengan biaya ditetapkan sebesar 1 Yuan untuk satu juta token input untuk cache hits dan 4 Yuan untuk cache misses, sementara token output dihargai 16 Yuan per juta. Model penetapan harga ini, dikombinasikan dengan efisiensi model, menantang asumsi tradisional tentang sumber daya yang diperlukan untuk pengembangan AI yang kompetitif.

Struktur Harga:

  • Token masukan (cache hit): CNY¥1/juta
  • Token masukan (cache miss): CNY¥4/juta
  • Token keluaran: CNY¥16/juta

Pertimbangan Keamanan dan Akses

Menyusul tantangan keamanan baru-baru ini, DeepSeek telah menerapkan langkah-langkah defensif, dengan sementara membatasi pendaftaran hanya untuk nomor telepon +86. Langkah ini menyoroti pentingnya keamanan dalam penerapan AI sambil mempertahankan ketersediaan layanan untuk pengguna inti.