Pencarian global tidak diaktifkan.
Lewati ke konten utama
Forum

Diskusi 7

Ringkasan pertemuan 10

Ringkasan pertemuan 10

oleh ALDI ALDI - Jumlah balasan: 0

Clustering adalah teknik pembelajaran tak terawasi yang mengelompokkan data ke dalam cluster berdasarkan kesamaan karakteristik, tanpa memerlukan label kelas. Tujuannya adalah mengidentifikasi pola tersembunyi, memahami karakteristik kelompok, dan koridor data. Penting untuk menganalisis data besar tanpa kategori, segmentasi otomatis, dan identifikasi pola seperti serangan jaringan atau gambar serupa. Bekerja berdasarkan ukuran kesamaan/jarak (Euclidean, Manhattan, Cosine, Jaccard) yang mempengaruhi hasil. Segmentasi data adalah pembagian data menjadi segmen yang homogen, dengan clustering sebagai teknik populernya (misal: segmentasi pelanggan untuk pemasaran).

 

 

 

Ada empat jenis pendekatan clustering: Partitional (K-Means, K-Medoids) yang membagi secara eksklusif; Hierarki (Agglomerative, Divisionve) yang menghasilkan struktur dendrogram; Density-Based (DBSCAN, OPTICS) yang mengenali cluster berdasarkan kepadatan; dan Model-Based (GMM) yang menggunakan distribusi probabilistik. Cluster yang baik memiliki kesamaan intra-cluster yang tinggi, kesamaan antar-cluster yang rendah, stabil, dan mudah diinterpretasikan. Tantangannya meliputi penentuan jumlah cluster yang optimal, data berdimensi tinggi, bentuk cluster yang tidak teratur, sensitivitas terhadap outlier, dan interpretasi subjektif. Contoh aplikasi: perusahaan retail mengelompokkan pelanggan menjadi High-Value, Regular, dan Low-Activity untuk strategi pemasaran.