Claude 3.7 Sonnet Diluncurkan dengan Penalaran Hibrid dan Perangkat Pengembang yang Ditingkatkan

BigGo Editorial Team

Claude 3.7 Sonnet Diluncurkan dengan Penalaran Hibrid dan Perangkat Pengembang yang Ditingkatkan

Dalam kemajuan signifikan untuk kemampuan kecerdasan buatan, Anthropic telah memperkenalkan model AI terbarunya yang menggabungkan respons cepat dengan kemampuan analitis mendalam. Peluncuran ini menandai pergeseran strategis dalam cara model AI menangani tugas-tugas pemecahan masalah kompleks.


Sebuah ilustrasi perbandingan yang menunjukkan berbagai model AI dan kinerjanya dalam tugas-tugas kompleks, menyoroti kemajuan dari model Claude yang baru

Memperkenalkan Teknologi Penalaran Hibrid

Claude 3.7 Sonnet memperkenalkan pendekatan penalaran hibrid yang revolusioner yang memungkinkan model untuk beralih antara respons cepat dan pemikiran analitis mendalam. Desain inovatif ini menghilangkan kebutuhan akan model penalaran terpisah, menyederhanakan pengalaman AI bagi pengguna. Model ini mempertahankan harga konsisten sebesar 3 Dollar AS per juta token masukan dan 15 Dollar AS per juta token keluaran, membuatnya dapat diakses melalui berbagai platform termasuk API Anthropic, Amazon Bedrock, dan Google Cloud Vertix AI.

Fitur	Spesifikasi
Harga	Input: USD $3/juta token
	Output: USD $15/juta token
Batas Pengetahuan	Oktober 2024
Ketersediaan Platform	- Anthropic API
	- Amazon Bedrock
	- Google Cloud Vertix AI
Batas Token	Batas output 128K token

Peningkatan Kinerja di Berbagai Bidang

Model baru ini menunjukkan peningkatan signifikan di berbagai bidang khusus, terutama dalam tugas-tugas pemrograman agentik, keuangan, dan hukum. Anthropic telah memperbarui batas pengetahuan model hingga Oktober 2024, memastikan ketersediaan informasi yang lebih terkini. Fitur yang menonjol adalah kemampuan pengembang untuk mengontrol waktu respons dan proses berpikir model melalui fungsionalitas scratchpad, menawarkan kustomisasi perilaku AI yang belum pernah ada sebelumnya.

Peningkatan Utama:

Pengurangan 45% dalam penolakan permintaan yang tidak perlu
Peningkatan kinerja dalam pengkodean agensi, keuangan, dan tugas-tugas hukum
Peningkatan kemampuan pengambilan keputusan strategis
Kemampuan manipulasi dan pengujian kode yang lebih canggih


Metrik kinerja yang menunjukkan akurasi berbagai model AI, menggambarkan peningkatan yang dicapai dengan Claude 37 Sonnet

Claude Code: Era Baru Pemrograman AI

Bersamaan dengan peluncuran model utama, Anthropic telah memperkenalkan Claude Code, sebuah alat pemrograman canggih yang saat ini tersedia sebagai pratinjau penelitian terbatas. Alat ini mewakili kemajuan signifikan dalam pemrograman berbantuan AI, mampu menangani tugas-tugas kompleks seperti pencarian basis kode, pengelolaan pengujian, dan antarmuka dengan GitHub. Pengujian awal menunjukkan kemampuan mengesankan, dengan alat ini berhasil menyelesaikan tugas pemrograman yang biasanya membutuhkan 45 menit atau lebih dari upaya manusia.

Aplikasi Praktis dan Pengujian

Pengujian internal di Anthropic telah mengungkapkan keserbagunaannya, mulai dari membangun desain situs web front-end hingga menciptakan permainan interaktif. Perusahaan menggunakan metode pengujian inovatif menggunakan permainan video Pokémon, di mana Claude 3.7 Sonnet menunjukkan pemikiran strategis yang unggul dengan berhasil mengalahkan beberapa pemimpin gym - peningkatan signifikan dibandingkan versi 3.5 yang tidak bisa maju melewati area awal.


Sebuah representasi grafis dari model-model Claude yang berkembang dalam gameplay Pokémon, mengilustrasikan peningkatan kemampuan strategis mereka dibandingkan dengan versi-versi sebelumnya

Peningkatan Keamanan dan Keandalan

Model baru ini menunjukkan peningkatan diskriminasi antara permintaan yang sah dan berbahaya, dengan pengurangan 45% dalam penolakan permintaan yang tidak perlu dibandingkan dengan versi sebelumnya. Peningkatan ini secara signifikan meningkatkan pengalaman pengguna sambil mempertahankan langkah-langkah keamanan yang kuat, dicapai melalui kolaborasi dengan pakar keamanan eksternal.

Berita Terkait

‌

‌
‌

‌

‌
‌

‌