Global searching is not enabled.
Skip to main content
Forum

Diskusi 7

ringkasan pertemuan 10

ringkasan pertemuan 10

by LESTARI LESTARI - Number of replies: 0

clustering sebagai metode unsupervised learning yang digunakan untuk mengelompokkan data berdasarkan kemiripan tanpa menggunakan label. Clustering sering dipakai untuk segmentasi data, misalnya mengelompokkan pelanggan berdasarkan pola perilaku agar analisis dan pengambilan keputusan menjadi lebih tepat.

Dua metode yang dijelaskan adalah K-Means dan Hierarchical Clustering. K-Means bekerja dengan membagi data ke dalam sejumlah cluster berdasarkan jarak ke pusat cluster (centroid). Metode ini cukup cepat dan cocok untuk data besar, tetapi harus menentukan jumlah cluster di awal dan sensitif terhadap data pencilan. Sementara itu, Hierarchical Clustering membentuk struktur bertahap seperti pohon (dendrogram) sehingga lebih mudah dipahami, namun kurang efisien jika datanya sangat besar.

Untuk menilai hasil pengelompokan, digunakan Silhouette Coefficient. Nilai ini menunjukkan seberapa baik data berada dalam clusternya. Semakin mendekati 1, hasil clustering semakin baik.

Secara umum, clustering yang baik memiliki data dalam satu cluster yang mirip satu sama lain dan berbeda jelas dengan cluster lainnya, meskipun masih ada tantangan seperti menentukan jumlah cluster yang tepat dan menangani outlier.