Dalam perkembangan yang mengejutkan, ByteDance, perusahaan induk TikTok, telah meluncurkan bot pengumpul data web yang dengan cepat melampaui para pesaingnya dalam perlombaan pengumpulan data. Bot tersebut, bernama Bytespider, dilaporkan mengumpulkan data dari internet dengan kecepatan 25 kali lebih cepat dari GPTbot milik OpenAI dan mengejutkannya 3.000 kali lebih cepat dari ClaudeBot milik Anthropic.
Kebangkitan Bytespider
Diluncurkan pada April 2024, Bytespider dengan cepat menjadi salah satu alat pengumpulan data paling agresif di internet. Menurut penelitian dari perusahaan manajemen bot Kasada dan layanan pemantauan Dark Visitors, pengumpul data ByteDance ini beroperasi dengan kecepatan yang belum pernah terjadi sebelumnya dibandingkan dengan alat serupa yang digunakan oleh raksasa teknologi seperti Google, Meta, Amazon, OpenAI, dan Anthropic.
Implikasi untuk Pengembangan AI
Strategi pengumpulan data yang agresif ini menunjukkan bahwa ByteDance sedang berupaya keras untuk mengejar ketertinggalan dalam perlombaan AI. Perusahaan yang dilaporkan menggunakan teknologi OpenAI untuk membangun model bahasa besar (LLM) mereka sendiri tahun lalu, tampaknya bertekad untuk mengumpulkan data pelatihan dalam jumlah besar untuk inisiatif AI mereka.
Praktik yang Kontroversial
Pendekatan Bytespider telah menimbulkan beberapa kekhawatiran di komunitas teknologi. Seperti beberapa pesaingnya, bot ini dilaporkan mengabaikan file robots.txt, yang digunakan oleh pemilik situs web untuk menandai bagian mana dari situs mereka yang tidak boleh diambil datanya. Praktik ini, meskipun tidak ilegal, dianggap kontroversial dalam perdebatan yang sedang berlangsung tentang hak data dan pelatihan AI.
Potensi Aplikasi
Sumber yang familiar dengan ambisi ByteDance menyarankan bahwa perusahaan mungkin sedang mengembangkan LLM baru, berpotensi untuk meningkatkan fungsionalitas pencarian TikTok. Lingkungan pencarian yang ditingkatkan dengan AI bisa membuat TikTok lebih menarik bagi pengiklan yang saat ini menghabiskan banyak uang di platform seperti Google.
Implikasi Masa Depan
Saat ByteDance terus meningkatkan upaya pengumpulan datanya, muncul pertanyaan tentang masa depan pengembangan AI dan penggunaan data. Pendekatan agresif perusahaan mungkin akan memicu diskusi lebih lanjut tentang hak data, etika AI, dan kebutuhan akan kerangka regulasi di bidang kecerdasan buatan yang berkembang pesat.
Sementara Bytespider ByteDance menunjukkan komitmen perusahaan untuk memajukan kemampuan AI-nya, hal ini juga menyoroti persaingan yang semakin intensif di industri teknologi dan pentingnya data dalam perlombaan senjata AI.