LMS-SPADA INDONESIA
Topik: Pembelajaran Tak Terawasi (Unsupervised Learning)
| Istilah | Definisi |
|---|---|
| Pembelajaran Tak Terawasi (Unsupervised Learning) | Jenis pembelajaran mesin di mana model belajar dari data tanpa label untuk menemukan pola, struktur, atau hubungan tersembunyi di dalamnya. |
| Clustering (Pengelompokan) | Proses mengelompokkan data ke dalam beberapa grup (cluster) berdasarkan kemiripan atau jarak antar data tanpa informasi label. |
| K-Means | Algoritma clustering yang membagi data menjadi K kelompok dengan meminimalkan jarak rata-rata antara titik data dan pusat cluster (centroid). |
| Hierarchical Clustering | Metode clustering yang membangun hierarki kelompok data melalui penggabungan atau pemisahan cluster secara bertahap. |
| Centroid | Titik pusat dari sebuah cluster yang mewakili posisi rata-rata dari seluruh data dalam cluster tersebut. |
| Distance Measure (Ukuran Jarak) | Metode untuk menghitung kemiripan antara data, seperti Euclidean Distance, Manhattan Distance, atau Cosine Similarity. |
| Dimensionality Reduction | Proses mengurangi jumlah variabel dalam dataset sambil mempertahankan informasi penting, misalnya dengan PCA (Principal Component Analysis). |
| Principal Component Analysis (PCA) | Teknik reduksi dimensi yang mengubah data ke dalam ruang baru dengan variabel utama (principal components) yang menjelaskan variansi terbesar. |
| Association Rule Learning | Metode pembelajaran tak terawasi yang menemukan hubungan atau pola asosiatif antar item dalam dataset, seperti pada analisis keranjang belanja. |
| Apriori Algorithm | Algoritma populer dalam association rule learning yang digunakan untuk menemukan kombinasi item yang sering muncul bersama. |
| DBSCAN (Density-Based Spatial Clustering of Applications with Noise) | Algoritma clustering berbasis kepadatan yang dapat menemukan cluster dengan bentuk arbitrer dan mendeteksi data outlier. |
| Outlier | Data yang memiliki nilai jauh berbeda dari sebagian besar data lainnya, sering kali dianggap sebagai noise atau anomali. |
| Noise | Data atau variabel yang tidak relevan atau acak yang dapat mengganggu hasil analisis clustering. |
| Feature Scaling | Proses menyamakan skala nilai dari semua fitur agar tidak ada satu fitur yang mendominasi dalam proses perhitungan jarak. |
| Elbow Method | Metode untuk menentukan jumlah cluster optimal (K) pada K-Means dengan menganalisis grafik perubahan nilai error (SSE). |
| Silhouette Coefficient | Ukuran yang digunakan untuk mengevaluasi kualitas clustering berdasarkan jarak antar data dalam dan antar cluster. |
| Unlabeled Data | Data yang tidak memiliki label kelas atau output target, digunakan sebagai input dalam pembelajaran tak terawasi. |
| Data Normalization | Proses penskalaan data agar nilai tiap fitur berada dalam rentang tertentu (misal 0–1) untuk meningkatkan stabilitas perhitungan jarak. |
| Feature Extraction | Proses menurunkan fitur baru dari data mentah untuk menyederhanakan analisis dan meningkatkan efektivitas algoritma pembelajaran. |
| Cluster Validation | Proses evaluasi untuk menilai seberapa baik hasil pengelompokan yang dihasilkan oleh algoritma clustering. |
| Density-Based Method | Pendekatan clustering yang mengelompokkan data berdasarkan kepadatan titik data di sekitar area tertentu, bukan jarak rata-rata. |
| High-Dimensional Data | Dataset yang memiliki jumlah fitur atau atribut yang sangat banyak, sering memerlukan teknik reduksi dimensi untuk analisis. |