Model AI terbaru dari OpenAI telah menunjukkan kemampuan luar biasa dalam mengidentifikasi lokasi dari foto dengan petunjuk visual minimal, memicu ketertarikan sekaligus kekhawatiran di kalangan pengguna dan aktivis privasi. Kemampuan baru ini merupakan kemajuan signifikan dalam penalaran visual AI tetapi juga memunculkan potensi risiko bagi privasi pribadi di era digital.
Tren GeoGuessr yang Baru
Model o3 dan o4-mini yang baru dirilis oleh OpenAI telah memicu tren viral di mana pengguna menantang AI untuk mengidentifikasi lokasi dari foto yang diunggah, mirip dengan permainan online GeoGuessr. Pengguna telah mengunggah berbagai gambar, mulai dari menu restoran hingga rak perpustakaan, dan meminta AI untuk menentukan di mana foto tersebut diambil. Hasilnya sangat mengejutkan, dengan model-model tersebut berhasil mengidentifikasi lokasi spesifik berdasarkan detail yang tampaknya tidak signifikan yang kebanyakan manusia akan abaikan.
Model OpenAI dengan Kemampuan Penalaran Gambar:
- model o3
- model o4-mini
Kemampuan Teknis di Balik Akurasi
Model-model baru ini memiliki kemampuan penalaran gambar yang ditingkatkan yang memungkinkan mereka menganalisis gambar secara komprehensif. Mereka dapat memotong, memutar, dan memperbesar foto, bahkan yang berkualitas buruk. Lebih mengesankan lagi, mereka dapat mengintegrasikan gambar langsung ke dalam alur pemikiran mereka, secara efektif berpikir dengan informasi visual daripada hanya memprosesnya. Hal ini memungkinkan perpaduan canggih antara penalaran visual dan tekstual yang memungkinkan model-model tersebut mengenali petunjuk halus tentang lokasi.
Kemampuan Penalaran Gambar Utama:
- Memotong, memutar, dan memperbesar foto
- Menganalisis gambar dengan kualitas buruk
- Mengintegrasikan gambar ke dalam penalaran rantai pemikiran
- Mengidentifikasi lokasi berdasarkan petunjuk visual yang halus
Implikasi Privasi dan Kekhawatiran Doxxing
Meskipun banyak pengguna menganggap fungsi pencarian lokasi terbalik ini menghibur, hal ini menimbulkan kekhawatiran privasi yang serius, terutama mengenai doxxing—pengungkapan publik tentang lokasi atau informasi pribadi seseorang. Kemampuan untuk menentukan lokasi yang tepat dari foto biasa yang diposting di media sosial berpotensi dieksploitasi untuk melacak individu tanpa sepengetahuan atau persetujuan mereka. Sebuah selfie sederhana dengan detail latar belakang minimal atau postingan media sosial yang tidak berbahaya bisa mengungkapkan lebih banyak informasi daripada yang dimaksudkan oleh pengunggah.
Contoh Nyata Akurasi
Akurasi model-model ini telah ditunjukkan dalam banyak contoh yang dibagikan di berbagai media sosial. Dalam satu kasus, ChatGPT berhasil mengidentifikasi perpustakaan University of Melbourne dari gambar yang dipotong dekat dari buku-buku di rak. Dalam kasus lain, AI menyimpulkan bahwa sebuah foto diambil di Suriname berdasarkan pengamatan bahwa mobil memiliki setir di sebelah kiri tetapi berkendara di sisi kiri jalan—kombinasi yang hanya ditemukan di beberapa negara di seluruh dunia. Model tersebut bahkan mampu mengidentifikasi sebuah speakeasy di Williamsburg berdasarkan hanya kepala badak ungu yang dipasang di sebuah bar.
Tanggapan OpenAI terhadap Kekhawatiran
OpenAI telah mengakui potensi masalah privasi yang terkait dengan kemampuan ini. Seorang juru bicara menyatakan bahwa perusahaan telah menerapkan perlindungan yang dimaksudkan untuk melarang model-model tersebut mengidentifikasi individu pribadi dalam gambar dan telah melatih mereka untuk menolak permintaan informasi pribadi atau sensitif. Perusahaan menekankan bahwa teknologi penalaran visual memiliki aplikasi bermanfaat di bidang seperti aksesibilitas, penelitian, dan tanggap darurat.
Perlindungan Privasi yang Disebutkan oleh OpenAI:
- Model-model dilatih untuk menolak permintaan informasi pribadi/sensitif
- Perlindungan untuk melarang identifikasi individu pribadi dalam gambar
- Pemantauan aktif terhadap pelanggaran kebijakan
Keterbatasan Teknologi
Meskipun kinerjanya mengesankan, teknologi ini tidak sempurna. Kedua artikel mencatat bahwa model-model tersebut tidak selalu benar dalam tebakan mereka, dan terkadang model o3 bisa terjebak dalam lingkaran saat mencoba menentukan lokasi. Menariknya, TechCrunch melaporkan bahwa model GPT-4o sebelumnya, yang tidak memiliki kemampuan penalaran gambar spesifik, mampu memberikan jawaban lokasi yang serupa dalam banyak kasus dan terkadang melakukannya lebih cepat daripada o3.
Implikasi bagi Pengguna Media Sosial
Perkembangan ini menjadi pengingat keras bagi pengguna media sosial untuk lebih berhati-hati tentang gambar yang mereka bagikan secara publik. Bahkan detail yang tampaknya tidak berbahaya di latar belakang foto berpotensi mengungkapkan informasi lokasi ketika dianalisis oleh model AI yang semakin canggih ini. Bagi mereka yang khawatir tentang privasi, membatasi jumlah informasi visual yang dibagikan secara online mungkin akan semakin penting seiring teknologi ini terus berkembang.