OpenAI Memperkenalkan Model Penalaran Canggih O3 dan O4-mini dengan Kemampuan Pemrosesan Visual

BigGo Editorial Team
OpenAI Memperkenalkan Model Penalaran Canggih O3 dan O4-mini dengan Kemampuan Pemrosesan Visual

Kecerdasan buatan terus berkembang dengan pesat saat perusahaan teknologi mendorong batas-batas kemungkinan. Dalam kemajuan signifikan untuk kemampuan penalaran AI, OpenAI telah memperkenalkan dua model baru yang dirancang untuk berpikir lebih menyeluruh sebelum merespons pertanyaan pengguna.

Model Penalaran Baru Dirilis

OpenAI secara resmi meluncurkan dua model penalaran AI baru: o3, yang digambarkan perusahaan sebagai model penalaran paling kuat hingga saat ini, dan o4-mini, alternatif yang lebih kecil dan lebih cepat yang memberikan kinerja mengesankan relatif terhadap ukuran dan biayanya. Model-model ini mengikuti pengenalan terbaru OpenAI terhadap model unggulan GPT-4.1 dan mewakili evolusi berikutnya dalam sistem AI yang berfokus pada penalaran. Tidak seperti model standar, model penalaran ini secara khusus dilatih untuk berpikir sebelum berbicara, mengambil waktu pemrosesan tambahan untuk memberikan respons berkualitas lebih tinggi.

Ikhtisar Model-Model Baru OpenAI

Model Deskripsi Fitur Utama
o3 Model penalaran paling kuat Penalaran visual, integrasi alat, performa yang ditingkatkan
o4-mini Lebih kecil, lebih cepat, hemat biaya Penalaran visual, integrasi alat, dioptimalkan untuk kecepatan
o4-mini-high Varian dengan performa lebih tinggi Kemampuan yang ditingkatkan sambil mempertahankan efisiensi

Integrasi Alat

  • Penjelajahan web
  • Pengkodean Python
  • Pemahaman gambar
  • Pembuatan gambar

Integrasi Pemahaman Visual

Mungkin kemajuan paling signifikan dalam model-model baru ini adalah kemampuan mereka untuk berpikir dengan gambar. Baik o3 maupun o4-mini kini dapat mengintegrasikan informasi visual langsung ke dalam proses penalaran mereka, bukan sekadar mendeskripsikan apa yang mereka lihat. Kemampuan ini memungkinkan model-model tersebut bekerja dengan sketsa, papan tulis, dan bahkan gambar berkualitas rendah atau buram. Model-model ini dapat memanipulasi gambar sebagai bagian dari analisis mereka, termasuk memperbesar elemen tertentu atau memutar gambar untuk lebih memahami kontennya. Penalaran visual ini merepresentasikan langkah besar dalam kemampuan AI untuk memproses dan memanfaatkan informasi di berbagai format.

Penggunaan Alat Agentik

Terobosan besar lainnya adalah kemampuan model untuk menggunakan semua alat ChatGPT secara mandiri selama proses penalaran mereka. Ini termasuk penjelajahan web, pengkodean Python, pemahaman gambar, dan kemampuan pembuatan gambar. OpenAI menggambarkan ini sebagai langkah menuju ChatGPT yang lebih agentik yang dapat menjalankan tugas secara mandiri atas nama Anda. Dalam praktiknya, ini berarti model dapat secara otonom memutuskan alat mana yang akan digunakan untuk menyelesaikan masalah kompleks bertahap—mirip dengan bagaimana seseorang mungkin mengambil kalkulator saat diperlukan. Selama demonstrasi, peneliti menunjukkan bagaimana o3 dapat menganalisis poster penelitian ilmiah, menjelajahi internet untuk informasi tambahan, dan memperbesar elemen-elemen berbeda dari gambar untuk menghasilkan jawaban komprehensif.

Peningkatan Kinerja

Menurut OpenAI, baik o3 maupun o4-mini mengungguli pendahulunya di berbagai tolok ukur, bahkan tanpa memanfaatkan kemampuan akses alat baru mereka. Model-model tersebut menunjukkan peningkatan dalam mengikuti instruksi dan memberikan respons yang lebih bermanfaat dan dapat diverifikasi. Sementara o3 mewakili penawaran premium dengan kemampuan maksimal, o4-mini telah dioptimalkan untuk memberikan kinerja yang kuat dengan biaya lebih rendah dan kecepatan lebih tinggi, membuat penalaran tingkat lanjut lebih mudah diakses.

Ketersediaan dan Akses

Model-model baru tersebut tersedia segera untuk pelanggan ChatGPT Plus, Pro, dan Team, muncul di pemilih model sebagai o3, o4-mini, dan o4-mini-high. Mereka akan menggantikan model penalaran sebelumnya o1, o3-mini, dan o3-mini-high. Pengguna Pro akan mendapatkan akses ke o3-pro dalam beberapa minggu mendatang, tetapi sampai saat itu akan terus memiliki akses ke o1-pro. Pengembang juga dapat mengakses model-model ini melalui API OpenAI.

Pengumuman Tambahan

Selain model-model baru ini, OpenAI telah meluncurkan Codex CLI, agen pengkodean open-source yang berjalan secara lokal di terminal pengguna. Alat ini menyediakan cara sederhana untuk menghubungkan model AI, termasuk o3 dan o4-mini, ke kode dan tugas pengguna sendiri. Dukungan untuk GPT-4.1 diharapkan segera tersedia. Perusahaan juga telah mengumumkan inisiatif senilai $1 juta untuk mendukung proyek-proyek awal yang menggunakan teknologi ini, menawarkan hibah dalam bentuk kredit API senilai $25.000.

Pertimbangan Keamanan

OpenAI telah menekankan bahwa kedua model baru menjalani pengujian keamanan ekstensif sebelum dirilis. Mereka diuji secara ketat di bawah program keamanan perusahaan dan dievaluasi sesuai dengan Kerangka Kesiapan yang diperbarui, dengan hasil terperinci tersedia dalam kartu sistem lengkap.