Pencarian global tidak diaktifkan.
Lewati ke konten utama
Glosarium

Glosarium Pertemuan 10

Syarat penyelesaian

Glosarium Pertemuan 10

Topik: Pembelajaran Tak Terawasi (Unsupervised Learning)

IstilahDefinisi
Pembelajaran Tak Terawasi (Unsupervised Learning) Jenis pembelajaran mesin di mana model belajar dari data tanpa label untuk menemukan pola, struktur, atau hubungan tersembunyi di dalamnya.
Clustering (Pengelompokan) Proses mengelompokkan data ke dalam beberapa grup (cluster) berdasarkan kemiripan atau jarak antar data tanpa informasi label.
K-Means Algoritma clustering yang membagi data menjadi K kelompok dengan meminimalkan jarak rata-rata antara titik data dan pusat cluster (centroid).
Hierarchical Clustering Metode clustering yang membangun hierarki kelompok data melalui penggabungan atau pemisahan cluster secara bertahap.
Centroid Titik pusat dari sebuah cluster yang mewakili posisi rata-rata dari seluruh data dalam cluster tersebut.
Distance Measure (Ukuran Jarak) Metode untuk menghitung kemiripan antara data, seperti Euclidean Distance, Manhattan Distance, atau Cosine Similarity.
Dimensionality Reduction Proses mengurangi jumlah variabel dalam dataset sambil mempertahankan informasi penting, misalnya dengan PCA (Principal Component Analysis).
Principal Component Analysis (PCA) Teknik reduksi dimensi yang mengubah data ke dalam ruang baru dengan variabel utama (principal components) yang menjelaskan variansi terbesar.
Association Rule Learning Metode pembelajaran tak terawasi yang menemukan hubungan atau pola asosiatif antar item dalam dataset, seperti pada analisis keranjang belanja.
Apriori Algorithm Algoritma populer dalam association rule learning yang digunakan untuk menemukan kombinasi item yang sering muncul bersama.
DBSCAN (Density-Based Spatial Clustering of Applications with Noise) Algoritma clustering berbasis kepadatan yang dapat menemukan cluster dengan bentuk arbitrer dan mendeteksi data outlier.
Outlier Data yang memiliki nilai jauh berbeda dari sebagian besar data lainnya, sering kali dianggap sebagai noise atau anomali.
Noise Data atau variabel yang tidak relevan atau acak yang dapat mengganggu hasil analisis clustering.
Feature Scaling Proses menyamakan skala nilai dari semua fitur agar tidak ada satu fitur yang mendominasi dalam proses perhitungan jarak.
Elbow Method Metode untuk menentukan jumlah cluster optimal (K) pada K-Means dengan menganalisis grafik perubahan nilai error (SSE).
Silhouette Coefficient Ukuran yang digunakan untuk mengevaluasi kualitas clustering berdasarkan jarak antar data dalam dan antar cluster.
Unlabeled Data Data yang tidak memiliki label kelas atau output target, digunakan sebagai input dalam pembelajaran tak terawasi.
Data Normalization Proses penskalaan data agar nilai tiap fitur berada dalam rentang tertentu (misal 0–1) untuk meningkatkan stabilitas perhitungan jarak.
Feature Extraction Proses menurunkan fitur baru dari data mentah untuk menyederhanakan analisis dan meningkatkan efektivitas algoritma pembelajaran.
Cluster Validation Proses evaluasi untuk menilai seberapa baik hasil pengelompokan yang dihasilkan oleh algoritma clustering.
Density-Based Method Pendekatan clustering yang mengelompokkan data berdasarkan kepadatan titik data di sekitar area tertentu, bukan jarak rata-rata.
High-Dimensional Data Dataset yang memiliki jumlah fitur atau atribut yang sangat banyak, sering memerlukan teknik reduksi dimensi untuk analisis.

Jelajahi glosarium menggunakan indeks ini

Khusus | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | SEMUA
Tidak ada entri yang ditemukan di bagian ini