Phi-3-vision Microsoft: AI Bersaiz Saku yang Melihat dan Memahami

BigGo Editorial Team
Phi-3-vision Microsoft: AI Bersaiz Saku yang Melihat dan Memahami

Microsoft Memperkenalkan Phi-3-vision: Analisis Imej AI untuk Saku Anda

Microsoft telah mengembangkan keluarga model bahasa kecil Phi-3 dengan penambahan menarik yang baru: Phi-3-vision. Model AI inovatif ini membawa keupayaan analisis imej yang berkuasa ke peranti mudah alih, menandakan langkah penting dalam menjadikan AI canggih boleh diakses pada peranti harian.

Komitmen Microsoft terhadap inovasi ditonjolkan melalui pelancaran Phi-3-vision, alat analisis imej AI untuk peranti mudah alih
Komitmen Microsoft terhadap inovasi ditonjolkan melalui pelancaran Phi-3-vision, alat analisis imej AI untuk peranti mudah alih

Ciri-ciri Utama Phi-3-vision:

  • Keupayaan Multimodal: Berbeza dengan saudara-saudaranya yang hanya teks, Phi-3-vision boleh memproses teks dan imej.
  • Saiz Padat: Dengan 4.2 bilion parameter, ia direka untuk prestasi yang cekap pada peranti mudah alih.
  • Penaakulan Visual: Cemerlang dalam menganalisis imej, carta, dan kandungan visual lain.
  • Menjawab Soalan: Pengguna boleh bertanya soalan tentang imej dan menerima jawapan yang mendalam.

Keluarga Phi-3 yang Semakin Berkembang

Phi-3-vision menyertai barisan model bahasa kecil yang semakin berkemampuan dari Microsoft:

  1. Phi-3-mini: 3.8 bilion parameter
  2. Phi-3-vision: 4.2 bilion parameter
  3. Phi-3-small: 7 bilion parameter
  4. Phi-3-medium: 14 bilion parameter

Mengapa Model Kecil Penting

Trend ke arah model AI yang lebih kecil dan cekap semakin mendapat momentum. Kuasa padat ini menawarkan beberapa kelebihan:

  • Kecekapan Sumber: Memerlukan kuasa pemprosesan dan memori yang kurang.
  • Mesra Mudah Alih: Boleh berjalan terus pada telefon pintar dan tablet.
  • Kos Efektif: Permintaan pengkomputeran yang lebih rendah diterjemahkan kepada kos operasi yang berkurangan.

Microsoft telah melihat kejayaan dengan pendekatan ini. Model Orca-Math mereka, satu lagi AI berskala kecil, dilaporkan mengatasi pesaing yang lebih besar dalam menyelesaikan masalah matematik yang kompleks.

Ketersediaan

  • Phi-3-vision kini tersedia dalam pratonton.
  • Baki keluarga Phi-3 (mini, small, dan medium) boleh diakses melalui perpustakaan model Azure.

Walaupun Phi-3-vision tidak menjana imej seperti DALL-E atau Stable Diffusion, keupayaannya untuk memahami dan menganalisis kandungan visual membuka kemungkinan menarik untuk aplikasi AI mudah alih. Semasa Microsoft terus menolak sempadan apa yang mungkin dengan model AI padat, kita boleh menjangkakan untuk melihat keupayaan AI yang semakin canggih memasuki peranti harian kita.