Global searching is not enabled.
Skip to main content
Forum

Diskusi 7

Ringkasan pertemuan 10

Ringkasan pertemuan 10

by ELSA LESTARI - Number of replies: 0

Clustering adalah teknik pembelajaran tak terawasi yang mengelompokkan data ke dalam cluster berdasarkan kemiripan karakteristik, tanpa memerlukan label kelas. Tujuannya adalah mengidentifikasi pola tersembunyi, memahami karakteristik kelompok, dan menyederhanakan data. Penting untuk analisis data besar tanpa kategori, segmentasi otomatis, dan identifikasi pola seperti serangan jaringan atau gambar serupa. Kerja berdasarkan ukuran kemiripan/jarak (Euclidean, Manhattan, Cosine, Jaccard) yang memengaruhi hasil. Segmentasi data adalah pembagian data menjadi segmen homogen, dengan clustering sebagai teknik populernya (misal: segmentasi pelanggan untuk pemasaran).

 

Ada empat jenis pendekatan clustering: Partitional (K-Means, K-Medoids) yang membagi secara eksklusif; Hierarchical (Agglomerative, Divisive) yang menghasilkan struktur dendrogram; Density-Based (DBSCAN, OPTICS) yang mengenali cluster berdasarkan kepadatan; dan Model-Based (GMM) yang menggunakan distribusi probabilistik. Cluster yang baik memiliki intra-cluster similarity tinggi, inter-cluster similarity rendah, stabil, dan mudah diinterpretasikan. Tantangan meliputi penentuan jumlah cluster optimal, data berdimensi tinggi, bentuk cluster tidak teratur, sensitivitas terhadap outlier, dan interpretasi subjektif. Contoh aplikasi: perusahaan retail mengelompokkan pelanggan menjadi High-Value, Regular, dan Low-Activity untuk strategi pemasaran.