Auto Pre-Processing Data Tools
Otomatisasi Alur Kerja Pra-Pemrosesan Data untuk Machine Learning

Project Overview
Sebuah tools berbasis web yang dirancang untuk mengotomatiskan dan menyederhanakan alur pra-pemrosesan data untuk kebutuhan machine learning. Pengguna dapat mengunggah dataset dan menerapkan berbagai teknik pra-pemrosesan melalui antarmuka yang interaktif untuk menyiapkan data mentah agar siap digunakan dalam model machine learning.
Proyek ini dikembangkan untuk mengatasi salah satu bagian yang paling memakan waktu dalam machine learning, yaitu persiapan data. Tools ini menyediakan antarmuka tanpa kode (no-code) yang memandu pengguna melalui setiap langkah penting, mulai dari membersihkan data (menangani nilai yang hilang, outlier) hingga transformasi (normalisasi, encoding). Tujuannya adalah untuk memberdayakan data scientist dan analis agar dapat menyiapkan dataset berkualitas tinggi dengan lebih cepat dan efisien.
Technologies Used
Challenges
- Mengelola dataset berukuran besar secara efisien di lingkungan web tanpa menyebabkan browser hang.
- Mengintegrasikan backend Python untuk pemrosesan data dengan frontend SvelteKit secara real-time.
- Menyediakan antarmuka yang intuitif bagi pengguna dengan berbagai tingkat keahlian teknis.
Solutions
- Memproses data secara asynchronous di backend, sementara frontend hanya menampilkan status atau hasil proses.
- Menggunakan WebSocket untuk komunikasi real-time antara frontend dan backend selama proses berjalan.
- Merancang alur kerja berbasis wizard (langkah-demi-langkah) di SvelteKit untuk memandu pengguna melalui setiap tahap pra-pemrosesan.
Project Gallery
Project Details
Client
Proyek Pribadi
Duration
4 Bulan
Year
2025
Category
Data Science & AI
Key Features
- Upload Dataset dari Berbagai Format (CSV, Excel)
- Penanganan Nilai Hilang (Missing Values) dengan Berbagai Metode
- Transformasi dan Penskalaan Data (Normalisasi, Standarisasi)
- Encoding Variabel Kategorikal (One-Hot, Label Encoding)
- Visualisasi Data Interaktif untuk Eksplorasi
- Pembagian Dataset (Data Latih & Uji)
- Unduh Dataset Hasil Pra-Pemrosesan