Pembelajaran mesin dibagi menjadi dua jenis utama. Supervised Learning menggunakan data berlabel untuk memprediksi output baru, cocok untuk klasifikasi dan regresi. Algoritma contoh: k-NN, Decision Tree, SVM, regresi linear/logistik. Kasus nyata: prediksi penyakit, deteksi spam, analisis kredit. Kelebihan akurasi tinggi; kekurangan membutuhkan data berlabel yang mahal.
Unsupervised Learning menggunakan data tanpa label untuk menemukan pola/struktur dalam data. Algoritma contoh: K-Means, PCA, Apriori. Kasus nyata: segmentasi pelanggan, pengelompokan artikel. Kelebihan tidak perlu label; kekurangan hasil sulit dievaluasi.
Algoritma Populer
- k-NN: Berbasis kemiripan, menentukan kelas dari tetangga terdekat. Mudah tapi lambat untuk data besar.
- Decision Tree: Struktur pohon dengan aturan pemisahan. Mudah dipahami tapi cenderung overfitting.
- SVM: Mencari hyperplane dengan margin terbesar, bisa menangani data non-linear. Akurasi tinggi tapi tidak cocok untuk data sangat besar.
- K-Means: Mengelompokkan data dengan centroid. Cepat tapi sensitif terhadap k dan outlier.
Evaluasi Model
Evaluasi berdasarkan Confusion Matrix (TP, TN, FP, FN):
- Akurasi: Prediksi benar secara keseluruhan (cocok data seimbang).
- Precision: Ketepatan prediksi positif (hindari false alarm).
- Recall: Kelengkapan prediksi positif (hindari melewatkan kasus penting).
- F1-Score: Menyeimbangkan precision dan recall.