Kaedah Latihan AI Nvidia Di Bawah Pengawasan
Nvidia, gergasi GPU yang terkenal dengan teknologi AI canggihnya, kini menghadapi kritikan terhadap amalan pengumpulan datanya. Laporan terkini mendedahkan bahawa syarikat ini telah mengumpul sejumlah besar kandungan video dari pelbagai sumber untuk melatih model AI mereka, menimbulkan kebimbangan undang-undang dan etika yang ketara.
Skop Pengumpulan Data Nvidia
Menurut dokumen sulit yang disiasat oleh 404 Media, projek dalaman Nvidia yang dinamakan Cosmos telah:
- Memuat turun berjuta-juta video setiap hari, bersamaan dengan 80 tahun kandungan
- Mengumpul lebih 30 juta URL dalam tempoh sebulan sahaja
- Menggunakan sumber termasuk YouTube, Netflix, dan platform video lain
- Menggunakan berpuluh-puluh PC maya di Amazon Web Services untuk tugas tersebut
Aplikasi yang Disasarkan
Nvidia dilaporkan bertujuan menggunakan data ini untuk melatih model AI untuk:
- Penjanaan dunia 3D Omniverse
- Pembangunan kenderaan autonomi
- Penciptaan avatar digital
- Projek AI komersial lain
Kebimbangan Undang-undang dan Etika
Amalan syarikat ini telah mencetuskan perbahasan mengenai beberapa isu:
- Pelanggaran hak cipta: Banyak video yang dikumpul berkemungkinan dilindungi oleh hak cipta.
- Pelanggaran terma perkhidmatan: Memuat turun kandungan dari platform seperti YouTube sering melanggar dasar penggunaan mereka.
- Perlindungan data peribadi: Kandungan video mungkin mengandungi maklumat peribadi yang tertakluk kepada peraturan privasi.
- Penggunaan akademik berbanding komersial: Sesetengah set data hanya bertujuan untuk kegunaan akademik sahaja.
Respons Nvidia
Apabila ditanya mengenai amalan ini, Nvidia menyatakan bahawa mereka mematuhi sepenuhnya undang-undang hak cipta. Syarikat ini berhujah bahawa:
- Undang-undang hak cipta melindungi ekspresi, bukan fakta atau idea
- Latihan AI termasuk dalam penggunaan saksama sebagai tujuan transformatif
Walau bagaimanapun, tafsiran ini dipertikaikan oleh platform kandungan seperti YouTube, yang mana CEO Neal Mohan telah menyatakan secara jelas bahawa memuat turun kandungan video melanggar terma perkhidmatan mereka.
Logo OpenAI menggambarkan perbincangan berterusan industri mengenai amalan AI beretika dan isu hak cipta, yang berkaitan dengan respons Nvidia tentang penggunaan data |
Implikasi Seluruh Industri
Nvidia bukan satu-satunya syarikat yang menghadapi pengawasan terhadap sumber data latihan AI. Syarikat seperti OpenAI dan Runway juga menghadapi tuduhan serupa. Kontroversi ini menunjukkan keperluan mendesak untuk:
- Ketelusan yang lebih besar dalam amalan pembangunan AI
- Peraturan yang lebih jelas mengawal penggunaan bahan berhak cipta untuk latihan AI
- Perbincangan yang lebih luas mengenai etika pengumpulan data berskala besar untuk aplikasi AI komersial
Seiring dengan kemajuan AI, industri teknologi perlu menangani cabaran undang-undang dan etika yang kompleks ini untuk memastikan inovasi yang bertanggungjawab.
Presiden Nvidia Jensen Huang mempersembahkan cip super Grace Hopper yang canggih, melambangkan inovasi teknologi tinggi yang menjadi tumpuan perdebatan etika semasa dalam pembangunan AI |