MKKF1A1331 - Kecerdasan Buatan_1: Unsupervised Learning

1. Pengantar Pembelajaran Tak Terawasi

Pembelajaran tak terawasi (Unsupervised Learning) adalah salah satu pendekatan dalam kecerdasan buatan dan pembelajaran mesin yang digunakan untuk menemukan struktur tersembunyi di dalam data tanpa label atau target output. Berbeda dengan supervised learning yang menggunakan data berlabel, metode ini berfokus pada eksplorasi dan identifikasi pola yang muncul secara alami dalam kumpulan data.

2. Tujuan Pembelajaran Tak Terawasi

Menemukan pola atau kelompok dalam data tanpa bimbingan eksternal.
Mengidentifikasi hubungan antar data yang tidak tampak secara eksplisit.
Mengurangi dimensi data untuk memudahkan visualisasi dan analisis.
Menjadi dasar bagi pembelajaran lanjutan seperti anomaly detection dan feature extraction.

3. Jenis Utama Unsupervised Learning

Clustering

Teknik pengelompokan data berdasarkan kemiripan antar objek. Contoh: K-Means, Hierarchical Clustering, dan DBSCAN.
Dimensionality Reduction

Teknik untuk mengurangi jumlah atribut atau fitur data tanpa kehilangan informasi penting. Contoh: Principal Component Analysis (PCA), t-SNE.
Association Learning

Teknik untuk menemukan hubungan atau aturan asosiasi antar variabel dalam dataset, misalnya dengan Apriori atau FP-Growth.

4. Algoritma Clustering Populer

a. K-Means Clustering

K-Means merupakan algoritma yang membagi data ke dalam k kelompok (cluster) berdasarkan kedekatan jarak. Prosesnya meliputi:

Menentukan jumlah cluster (k).
Memilih titik awal (centroid) secara acak.
Menghitung jarak setiap data ke centroid terdekat.
Memperbarui posisi centroid berdasarkan rata-rata anggota cluster.
Mengulang langkah 3–4 hingga posisi centroid stabil.

Fungsi Jarak (Euclidean Distance):

d(x,y) = √Σ(xᵢ - yᵢ)²

b. Hierarchical Clustering

Hierarchical Clustering membentuk struktur hierarki (pohon atau dendrogram) dari data berdasarkan tingkat kemiripan. Ada dua pendekatan utama:

Agglomerative (Bottom-Up): Dimulai dari tiap data sebagai cluster terpisah, lalu digabung hingga menjadi satu cluster besar.
Divisive (Top-Down): Dimulai dari satu cluster besar, kemudian dipecah menjadi beberapa cluster kecil.

5. Evaluasi Hasil Clustering

Berbeda dari pembelajaran terawasi, hasil clustering tidak memiliki label pembanding, sehingga evaluasi dilakukan dengan ukuran internal, seperti:

Silhouette Coefficient – mengukur seberapa mirip objek dengan cluster-nya sendiri dibanding dengan cluster lain.
Davies–Bouldin Index – mengukur rasio jarak intra-cluster terhadap inter-cluster (semakin kecil semakin baik).

6. Contoh Kasus

Sebuah perusahaan ritel ingin mengelompokkan pelanggannya berdasarkan perilaku pembelian agar dapat membuat strategi promosi yang tepat. Dengan menggunakan algoritma K-Means, data pelanggan (frekuensi, total belanja, dan jenis produk) dapat dikelompokkan menjadi beberapa segmen seperti:

Cluster 1: Pelanggan setia dengan pembelian tinggi.
Cluster 2: Pelanggan baru dengan pembelian menengah.
Cluster 3: Pelanggan tidak aktif dengan frekuensi rendah.

7. Kesimpulan

Pembelajaran tak terawasi membantu mesin memahami struktur data tanpa bantuan manusia. Teknik ini banyak digunakan dalam analisis data, pengenalan pola, dan rekomendasi sistem. Pemahaman mendalam terhadap metode ini menjadi bekal penting bagi mahasiswa untuk menerapkan kecerdasan buatan dalam berbagai bidang.

Last modified: Wednesday, 12 November 2025, 5:18 AM

Unsupervised Learning

Contact

Spada Indonesia