EVALUASI KUALITAS DATA ANOMALI PASCA-TRANSFORMASI EXTRACT-TRANSFORM-LOAD DENGAN PENDEKATAN UNSUPERVISED MACHINE LEARNING

Ashshidiq, Muhammad Faisal (2025) EVALUASI KUALITAS DATA ANOMALI PASCA-TRANSFORMASI EXTRACT-TRANSFORM-LOAD DENGAN PENDEKATAN UNSUPERVISED MACHINE LEARNING. Diploma thesis, UNIVERSITAS LOGISTIK DAN BISNIS INTERNASIONAL.

Full text not available from this repository.
Official URL: https://drive.google.com/open?id=1uLaimAkBQN9P8wIw...

Abstract

Kualitas data pasca-Extract-Transform-Load (ETL) kerap menurun karena proses transformasi untuk mengubah sruktur data nested array dengan menggunakan teknik flattening. Transformasi tidak hanya mengubah struktur nessted array, melainkan mengalami inkonsistensi skema, dan kegagalan ekstraksi. Penelitian ini merancang pendekatan evaluasi kualitas bertujuan untuk deteksi anomali unsupervised dengan menggunakan dataset transaksi pasca-transformasi extract-transform-load (ETL). Dataset memiliki sekitar 10.000 baris data. Algoritma yang digunakan meliputi Isolation Forest (IF), Local Outlier Factor (LOF), dan One-Class SVM (OC-SVM). Pemakaian ketiga algoritma ini untuk mencapai evaluasi mencakup metrik internal (Silhouette, Calinski-Harabasz, Davies-Bouldin) dan metrik adaptasi supervised (Precision, Recall, F1-Score, Accuracy). Bahwa penelitian ini hasil akhir bahwa menunjukkan algoritma local outlier factoor (LOF) unggul dalam memisahkan kluster dengan nilai Silhouette 0,312, davies-bouldin index 1,76 dan menghasilkan nilai adaptasi metode supervised (Precision 0,71, F1-Score 0,70, Accuracy 0,95. Algoritma one-class svm memberikan cakupan deteksi terbaik karena hasi akhir Recall 0,75, sedangkan isolation forest (IF) efisien digunakan untuk evaluasi komputasi dengan menghasilkan nilai training 0,12 s, prediksi 0,03 s. Temuan ini memberi pedoman praktis pemilihan model sesuai tujuan LOF untuk meminimalkan false positive, OC-SVM untuk memaksimalkan deteksi, dan IF untuk kebutuhan near-real-time. Penelitian juga menyoroti perlunya validasi kualitas pasca-ETL yang terotomasi pada kolom berisiko tinggi terhadap missing value. Kata Kunci: extract-transform-load, evaluasi performa, nested array, kualitas data, pasca- transformasi

Item Type: Thesis (Diploma)
Subjects: T Technology > TA Engineering (General). Civil engineering (General)
Divisions: Sekolah Vokasi > Teknik Informatika D4
Depositing User: PKL TUJUH TUJUH
Date Deposited: 30 Sep 2025 03:00
Last Modified: 30 Sep 2025 03:00
URI: http://eprints.ulbi.ac.id/id/eprint/3673

Actions (login required)

View Item View Item