Plexe: Membangun Model ML Dengan Bahasa Natural Memicu Diskusi Komunitas tentang Evolusi AutoML

BigGo Editorial Team
Plexe: Membangun Model ML Dengan Bahasa Natural Memicu Diskusi Komunitas tentang Evolusi AutoML

Dalam bidang pembelajaran mesin yang berkembang pesat, sebuah alat baru bernama Plexe telah muncul yang memungkinkan pengguna membuat model ML dengan mendeskripsikannya dalam bahasa sehari-hari. Alat ini telah memicu diskusi signifikan di komunitas teknologi tentang masa depan pembelajaran mesin otomatis dan aplikasi praktisnya dalam skenario dunia nyata.

Arsitektur Multi-Agen Mendukung Pembuatan Model dengan Bahasa Natural

Plexe menggunakan tim agen AI khusus untuk menganalisis kebutuhan, merencanakan solusi model, menghasilkan kode, menguji kinerja, dan mengemas model untuk penerapan. Pendekatan multi-agen ini memungkinkan pengguna mendefinisikan model menggunakan deskripsi bahasa Indonesia sederhana, dengan sistem yang secara otomatis menentukan arsitektur model yang sesuai berdasarkan pernyataan masalah dan data yang tersedia. Alat ini mendukung berbagai jenis model dari algoritma tradisional seperti gradient boosting hingga jaringan neural dalam, mengevaluasi berbagai pendekatan untuk menemukan solusi optimal untuk data dan batasan tertentu.

Beberapa anggota komunitas telah mengungkapkan ketertarikan pada pendekatan berbasis agen untuk membangun model. Sistem ini saat ini menggunakan pustaka smolagents, meskipun para pengembang telah mencatat keterbatasan termasuk kurangnya abstraksi memori bersama, kesulitan menyesuaikan prompt sistem, dan eksekusi sinkron dari agen yang dikelola.

Membedakan Dari Upaya AutoML Sebelumnya

Sebagian besar diskusi komunitas berpusat pada bagaimana Plexe berbeda dari alat AutoML sebelumnya yang populer sekitar tahun 2018. Sementara beberapa komentator mengekspresikan skeptisisme tentang klaim mengotomatisasi siklus hidup ML, para pengembang mengklarifikasi posisi mereka:

Saya sepenuhnya setuju dengan komentar Anda. Melatih model ML pada dataset yang bersih adalah bagian yang mudah dan menyenangkan dari pekerjaan insinyur ML... Untuk saat ini, ini terutama ditujukan untuk insinyur yang tidak memiliki keahlian ML: seseorang yang memahami konteks bisnis, tahu cara membangun pipeline pemrosesan data dan layanan web, tetapi mungkin tidak tahu cara membangun model.

Tidak seperti beberapa pendekatan yang langsung menggunakan model bahasa besar sebagai prediktor, Plexe memanfaatkan LLM untuk melakukan pekerjaan pemodelan, biasanya menghasilkan model ringan dan spesifik domain seperti XGBoost regressor yang lebih efisien daripada menggunakan LLM untuk inferensi.

Roadmap Berbasis Komunitas Fokus pada Tantangan Data

Umpan balik paling konsisten dari komunitas berkaitan dengan tantangan persiapan data. Beberapa komentator menunjukkan bahwa bagian tersulit dari pembelajaran mesin bukanlah pelatihan model tetapi evaluasi kualitas data, rekayasa fitur, dan pencegahan kebocoran data. Para pengembang mengakui keterbatasan ini dan berbagi rencana untuk memperluas kemampuan Plexe:

Tim ini secara aktif mengembangkan agen untuk pembersihan data dan transformasi fitur berdasarkan umpan balik dari analis data, manajer produk, dan insinyur. Mereka juga bekerja untuk meningkatkan kemampuan sistem dalam menganalisis data saat membuat keputusan pemodelan dan mendeteksi masalah dengan data pelatihan.

Fitur lain yang diminta termasuk pembuatan model yang lebih interaktif dengan checkpoint pengguna antara langkah-langkah, integrasi dengan pipeline scikit-learn, dan dukungan yang lebih baik untuk pelatihan terdistribusi pada platform seperti Vertex.AI dari Google Cloud.

Fitur Utama Plexe

  • Definisi Model Bahasa Alami - Mendefinisikan model menggunakan deskripsi bahasa Inggris sederhana
  • Arsitektur Multi-Agen - Tim agen AI khusus menangani berbagai aspek pembuatan model
  • Pembuatan Model Otomatis - Membangun model lengkap dengan satu panggilan metode
  • Pelatihan Terdistribusi dengan Ray - Dukungan untuk pemrosesan paralel di seluruh inti CPU yang tersedia
  • Pembuatan Data & Inferensi Skema - Menghasilkan data sintetis atau secara otomatis menyimpulkan skema
  • Dukungan Multi-Penyedia - Kompatibel dengan model OpenAI, Anthropic, Ollama, dan Hugging Face

Pilihan Instalasi

pip install plexe                   Instalasi Standar
pip install plexe[lightweight]      Dependensi minimal
pip install plexe[all]              Dengan dukungan deep learning

Keterbatasan yang Diidentifikasi Komunitas

  • Kemampuan eksplorasi data yang terbatas (sedang ditangani)
  • Kurangnya checkpoint interaktif selama proses pembuatan model
  • Tantangan validitas statistik yang umum pada pendekatan otomatis
  • Saat ini eksekusi agen terkelola bersifat sinkron
  • Kustomisasi terbatas pada prompt sistem agen

Validitas Statistik Tetap Menjadi Tantangan

Anggota komunitas mengangkat kekhawatiran tentang validitas statistik dari model yang dihasilkan secara otomatis, mencatat bahwa baik manusia maupun LLM sering membuat kesalahan statistik. Tim Plexe mengakui tantangan ini, menjelaskan bahwa mereka telah menerapkan protokol validasi dan pagar pembatas seputar penanganan data sambil bekerja untuk mendeteksi masalah umum seperti overfitting dan kebocoran data dengan lebih baik.

Saat pembelajaran mesin terus menjadi lebih mudah diakses melalui alat seperti Plexe, keseimbangan antara otomatisasi dan keahlian tetap menjadi titik diskusi utama. Meskipun otomatisasi dapat mendemokratisasi akses ke kemampuan ML, konsensus komunitas menunjukkan bahwa pengetahuan domain dan pemahaman statistik tetap penting untuk mengembangkan model yang andal dan siap produksi.

Referensi: plexe