Google telah menggemparkan dunia penjanaan imej AI dengan pelancaran Imagen 3, model teks-ke-imej terbarunya. Gergasi teknologi ini mendakwa iterasi baharu ini mengatasi pesaing utama seperti DALL-E 3 dan Midjourney v6 dalam beberapa aspek penting.
Tuntutan Prestasi Imagen 3
Menurut laporan terkini oleh Google DeepMind, Imagen 3 unggul dalam:
- Keutamaan keseluruhan pengguna
- Penjajaran arahan-imej
- Pengendalian arahan terperinci
- Kebolehan penaakulan berangka
Walaupun Midjourney v6 masih mendahului dalam daya tarikan visual, Imagen 3 dilaporkan mencapai keseimbangan terbaik antara output berkualiti tinggi dan menghormati niat pengguna.
Kebolehcapaian dan Sekatan
Google kini telah memperluaskan akses kepada Imagen 3 untuk semua pengguna di Amerika Syarikat melalui laman web AI Test Kitchen. Langkah ini menandakan keyakinan Google yang semakin meningkat terhadap keupayaan dan perlindungan alat ini.
Walau bagaimanapun, maklum balas awal pengguna menunjukkan bahawa Imagen 3 mungkin lebih ketat berbanding pendahulunya:
- Peningkatan sensitiviti terhadap arahan yang berpotensi bermasalah
- Sesetengah pengguna melaporkan kesukaran mencapai hasil yang sebelum ini boleh dicapai
- Perkataan yang kelihatan tidak berbahaya mungkin mencetuskan penapis kandungan
Tindakan Mengimbangi
Pendekatan berhati-hati Google dengan Imagen 3 sangat berbeza dengan kontroversi terkini seputar penjana imej AI yang lain. Syarikat ini kelihatan mengutamakan pembangunan AI yang bertanggungjawab, walaupun ia bermakna mungkin mengehadkan beberapa kemungkinan kreatif.
Cara Mencuba Imagen 3
Pengguna berasaskan AS boleh mengalami Imagen 3 dengan:
- Melawat laman web Google AI Test Kitchen
- Log masuk dengan akaun Google
- Mengakses alat penjanaan imej
Apabila Imagen 3 mencapai khalayak yang lebih luas, akan menarik untuk melihat bagaimana Google menghalusi keseimbangan antara kebebasan kreatif dan pertimbangan etika dalam penghasilan imej berasaskan AI.