Intel secara resmi telah mengumumkan peluncuran akselerator AI Gaudi 3, memposisikannya sebagai alternatif yang hemat biaya dibandingkan GPU H100 NVIDIA yang dominan di pasar kecerdasan buatan yang berkembang pesat.
Gaudi 3 merupakan lompatan besar dari pendahulunya, dengan 64 tensor processor cores (TPC) dan 8 matrix multiplication engines (MME). Setiap akselerator dilengkapi dengan memori bandwidth tinggi (HBM2E) 128GB dan memberikan kinerja FP8 hingga 1.856 TFLOPS. Intel telah menyederhanakan arsitekturnya untuk fokus pada operasi FP8 dan BFloat16, yang sangat penting untuk beban kerja AI modern.
Meskipun metrik kinerja mentah Gaudi 3 masih kalah dari NVIDIA H100 di beberapa area, Intel mengandalkan strategi harganya untuk merebut pangsa pasar. Perusahaan mengklaim bahwa Gaudi 3 menawarkan kinerja hingga 80% lebih baik per dolar dibandingkan H100 untuk model AI tertentu. Intel telah mengindikasikan bahwa kit akselerator delapan-Gaudi 3 akan dibanderol sekitar $125.000, atau sekitar $15.625 per unit - kontras yang mencolok dengan harga satu unit NVIDIA H100 yang saat ini lebih dari $30.000.
Fitur utama Gaudi 3 meliputi:
- 64 Tensor Processing Cores (TPC)
- 8 Matrix Multiplication Engines (MME)
- Memori 128GB HBM2E dengan bandwidth 3,67 TB/detik
- Cache SRAM on-die 96MB
- 24 antarmuka jaringan 200GbE
- TDP 600W
Intel memamerkan peningkatan kinerja yang signifikan dalam tugas inferensi AI. Untuk model LLaMA 3 8B, Gaudi 3 diklaim menawarkan peningkatan 9% dalam kecepatan inferensi sambil memberikan kinerja 80% lebih baik per dolar dibandingkan H100. Dengan model yang lebih besar seperti LLaMA 70B, Intel mengklaim throughput inferensi 19% lebih baik dan kinerja dua kali lipat per dolar.
Gaudi 3 akan tersedia dalam berbagai bentuk, termasuk kartu yang kompatibel dengan OAM dan kartu add-in PCIe. Intel telah bermitra dengan produsen server besar seperti Dell, HPE, dan Supermicro untuk mengintegrasikan Gaudi 3 ke dalam sistem AI mereka. Ketersediaan di cloud juga direncanakan, dengan IBM Cloud dan Intel Tiber Developer Cloud siap menawarkan sumber daya Gaudi 3.
Seiring dengan semakin intensifnya persaingan perangkat keras AI, strategi Intel dengan Gaudi 3 tampaknya berfokus pada penyediaan opsi yang lebih terjangkau bagi organisasi yang ingin menerapkan AI dalam skala besar. Namun, dengan arsitektur Blackwell NVIDIA yang akan datang, masih harus dilihat apakah keunggulan harga Intel akan cukup untuk merebut sebagian besar pasar akselerator AI.
Ketersediaan umum sistem berbasis Gaudi 3 diharapkan pada Q4 2023, dengan beberapa mitra seperti Dell dan Supermicro mulai mengirimkan produk mereka pada Oktober. Peluncuran ini menandai momen kritis bagi Intel dalam upayanya untuk memantapkan diri sebagai pesaing serius di ruang perangkat keras AI yang didominasi oleh NVIDIA.
Solusi AI serbaguna Intel dirancang untuk melayani berbagai industri, meningkatkan kemajuan teknologi di berbagai sektor |