MKKF1A1331 - Kecerdasan Buatan_1: Deep Learning dan Jaringan Syaraf

A. Perbedaan Artificial Neural Network (ANN) dan Deep Learning

1. Artificial Neural Network (ANN) sebagai Jaringan Syaraf Dasar

Artificial Neural Network (ANN) adalah model komputasi yang terinspirasi dari cara kerja neuron biologis. ANN tradisional biasanya terdiri atas tiga jenis lapisan:

Input layer – menerima data mentah.
Hidden layer – memproses dan mengekstraksi pola dari data.
Output layer – menghasilkan keluaran berupa kelas atau nilai prediksi.

Pada umumnya, ANN tradisional hanya memiliki 1–2 hidden layer sehingga kemampuan representasinya terbatas untuk pola yang tidak terlalu kompleks. ANN cocok untuk permasalahan seperti klasifikasi tabular, regresi sederhana, dan prediksi berbasis fitur numerik yang tidak terlalu besar dimensinya.

2. Deep Learning sebagai Pengembangan ANN

Deep Learning dapat dipandang sebagai ANN dengan arsitektur yang jauh lebih dalam, yaitu memiliki banyak hidden layer. Setiap lapisan bertanggung jawab mempelajari representasi data pada tingkat abstraksi yang berbeda:

Lapisan awal mempelajari pola dasar (misalnya garis, tepi, perubahan intensitas).
Lapisan menengah mempelajari pola yang lebih kompleks (misalnya bentuk, tekstur, bagian objek).
Lapisan akhir mempelajari konsep tingkat tinggi (misalnya wajah, mobil, objek tertentu).

Dengan arsitektur yang dalam, deep learning mampu melakukan pembelajaran fitur secara otomatis (automatic feature learning) tanpa perlu rekayasa fitur (feature engineering) yang intensif dari manusia.

3. Perbandingan ANN dan Deep Learning

a. Struktur Arsitektur

Aspek	ANN Tradisional	Deep Learning
Jumlah hidden layer	Biasanya 1–2 layer	Bisa puluhan hingga ratusan layer
Kompleksitas	Rendah–sedang	Tinggi
Kemampuan representasi	Cukup untuk pola sederhana	Sangat kuat untuk pola kompleks

b. Cara Memperlakukan Fitur

ANN: sering membutuhkan feature engineering manual, misalnya dosen/peneliti harus menentukan sendiri fitur apa yang relevan (warna, ukuran, rasio, dan lain-lain).
Deep Learning: melakukan automatic feature extraction. Jaringan mempelajari sendiri fitur penting langsung dari data mentah (misalnya dari piksel citra atau kata dalam kalimat).

c. Kebutuhan Data dan Komputasi

ANN: dapat bekerja dengan dataset relatif kecil hingga menengah, dan dapat dilatih dengan CPU biasa.
Deep Learning: idealnya menggunakan data dalam jumlah besar (big data) dan membutuhkan sumber daya komputasi tinggi (misalnya GPU/TPU) karena jumlah parameter yang sangat banyak.

d. Jenis Masalah yang Dipecahkan

ANN: klasifikasi data tabular, regresi nilai numerik, prediksi sederhana seperti prediksi nilai akademik, risiko default, atau klasifikasi penyakit berbasis beberapa fitur.
Deep Learning: unggul untuk data kompleks seperti citra, teks, suara, dan deret waktu, misalnya pengenalan wajah, deteksi objek, penerjemahan bahasa, dan prediksi deret waktu non-linear.

B. Arsitektur CNN dan RNN Secara Konseptual

1. Convolutional Neural Network (CNN)

Convolutional Neural Network (CNN) adalah arsitektur deep learning yang dirancang khusus untuk memproses data yang memiliki struktur grid, seperti:

Citra 2D (gambar, foto, citra medis),
Video (rangkaian citra),
Sinyal 1D (jika diadaptasi), seperti sinyal sensor atau deret waktu tertentu.

Keunggulan utama CNN adalah kemampuannya mengenali pola spasial dalam citra, mulai dari pola yang sangat sederhana hingga pola kompleks, melalui kombinasi beberapa lapisan.

a. Convolution Layer

Convolution layer menggunakan filter atau kernel berukuran kecil (misalnya 3×3) yang digeser di atas citra untuk menghasilkan feature map. Setiap filter akan belajar mendeteksi pola tertentu, misalnya:

Tepi vertikal atau horizontal,
Perubahan intensitas warna,
Sudut dan tekstur tertentu.

Proses ini memungkinkan CNN mengurangi jumlah parameter, karena satu filter digunakan pada banyak posisi (parameter sharing).

b. Activation Layer (ReLU)

Setelah konvolusi, biasanya digunakan fungsi aktivasi ReLU (Rectified Linear Unit): ReLU(x) = max(0, x). ReLU menambahkan non-linearitas pada jaringan dan membantu pelatihan menjadi lebih cepat dan stabil.

c. Pooling Layer

Pooling layer bertugas untuk:

Mengurangi dimensi data (downsampling),
Mengurangi jumlah parameter dan perhitungan,
Membuat model lebih tahan terhadap translasi kecil pada citra.

Jenis pooling yang umum:

Max pooling: mengambil nilai terbesar dalam jendela tertentu (misalnya 2×2).
Average pooling: mengambil nilai rata-rata dalam jendela tersebut.

d. Fully Connected Layer

Di bagian akhir arsitektur CNN, hasil ekstraksi fitur dari beberapa lapisan konvolusi dan pooling diubah menjadi vektor 1D dan diproses oleh Fully Connected Layer (FC). Lapisan ini berperan seperti ANN biasa untuk melakukan:

Klasifikasi objek (misalnya kucing vs anjing),
Prediksi label tertentu berdasarkan fitur yang telah diekstraksi.

e. Softmax Output

Untuk tugas klasifikasi multi-kelas, CNN biasanya diakhiri dengan Softmax layer yang mengubah skor menjadi probabilitas masing-masing kelas.

f. Alur Umum CNN

Secara konseptual, alur pemrosesan CNN dapat diringkas sebagai:

Input citra → Convolution + ReLU → Pooling → (diulang beberapa blok) → Fully Connected → Softmax → Output kelas

2. Recurrent Neural Network (RNN)

Recurrent Neural Network (RNN) adalah arsitektur deep learning yang dirancang untuk memproses data berurutan (sequential), seperti:

Teks (kata-kata dalam kalimat atau dokumen),
Deret waktu (time series),
Sinyal suara dan percakapan,
Data sensor yang mengalir dari waktu ke waktu.

Berbeda dengan CNN yang fokus pada pola spasial, RNN fokus pada pola temporal, yaitu hubungan antar data pada berbagai langkah waktu.

a. Hidden State dan Memori

Inti dari RNN adalah adanya hidden state yang membawa informasi dari waktu sebelumnya. Pada setiap langkah waktu t, RNN menerima:

Input saat ini, x_t,
Hidden state sebelumnya, h_t-1.

RNN kemudian menghasilkan:

Hidden state baru, h_t,
Output (jika diperlukan), misalnya y_t.

Dengan cara ini, RNN memiliki memori jangka pendek terhadap urutan data yang telah dilalui.

b. Backpropagation Through Time (BPTT)

Proses pelatihan RNN dilakukan dengan memperluas jaringan sepanjang waktu, kemudian melakukan backpropagation through time. Pendekatan ini sering menghadapi dua masalah:

Vanishing gradient: gradien menjadi sangat kecil sehingga sulit belajar dependensi jangka panjang.
Exploding gradient: gradien menjadi sangat besar sehingga pelatihan tidak stabil.

c. LSTM dan GRU sebagai RNN Lanjutan

Untuk mengatasi kelemahan RNN klasik, dikembangkan:

LSTM (Long Short-Term Memory),
GRU (Gated Recurrent Unit).

Keduanya menggunakan mekanisme gate (gerbang) untuk:

Memutuskan informasi mana yang disimpan,
Informasi mana yang dibuang,
Informasi mana yang digunakan untuk menghasilkan keluaran.

Dengan gate ini, LSTM dan GRU mampu belajar dependensi jangka panjang pada teks atau deret waktu, misalnya makna kalimat dalam paragraf panjang.

d. Alur Umum RNN

Secara konseptual, alur RNN untuk data berurutan:

Terima input pertama x₁, inisialisasi h₀ (misalnya nol).
Hitung h₁ dari x₁ dan h₀, hasilkan output y₁ (jika diperlukan).
Lanjutkan ke input berikutnya x₂, gunakan h₁ sebagai memori.
Ulangi proses hingga input terakhir.

Dengan demikian, setiap output pada waktu tertentu dipengaruhi oleh data saat itu dan konteks dari waktu sebelumnya.

C. Aplikasi CNN pada Pengenalan Citra

1. Pengenalan Objek (Object Recognition)

CNN banyak digunakan untuk mengklasifikasi citra ke dalam beberapa kelas, misalnya:

Membedakan antara kucing, anjing, mobil, dan manusia.
Mengenali jenis objek dalam dataset standar seperti digit tulisan tangan.

Pada kasus ini, CNN belajar pola visual yang membedakan satu objek dengan objek lainnya tanpa perlu mendefinisikan fitur secara manual.

2. Deteksi dan Lokalisasi Objek

Selain klasifikasi, CNN juga digunakan untuk:

Deteksi objek: menentukan lokasi objek dalam citra menggunakan bounding box.
Segmentasi citra: memberi label pada setiap piksel untuk mengetahui bentuk objek secara detail.

Arsitektur yang lebih kompleks (misalnya R-CNN, YOLO, atau U-Net) merupakan pengembangan lebih lanjut dari prinsip dasar CNN.

3. Aplikasi Praktis CNN

Face recognition: sistem absensi berbasis wajah, pengamanan perangkat, pengenalan identitas.
Medical imaging: deteksi tumor pada citra MRI atau CT-scan, mendeteksi kelainan pada foto rontgen.
Pengolahan dokumen: pembacaan karakter otomatis (OCR) pada dokumen tercetak.
Smart surveillance: kamera pengawas yang dapat mengenali orang atau aktivitas tertentu.

Dalam semua aplikasi ini, CNN bertanggung jawab mengubah citra mentah menjadi representasi fitur yang dapat dipahami oleh layer klasifikasi di bagian akhir jaringan.

D. Aplikasi RNN pada Analisis Teks dan Prediksi Deret Waktu

1. Analisis Teks (Natural Language Processing)

RNN, terutama LSTM dan GRU, banyak digunakan dalam pengolahan bahasa alami (NLP) karena mampu memahami urutan kata dalam kalimat. Beberapa contoh aplikasinya:

Analisis sentimen: menentukan apakah opini dalam teks bersifat positif, negatif, atau netral.
Text classification: mengelompokkan dokumen ke dalam kategori tertentu (misalnya berita politik, olahraga, teknologi).
Language modeling: memprediksi kata berikutnya dalam sebuah kalimat.
Machine translation: menerjemahkan kalimat dari satu bahasa ke bahasa lain (sering dikombinasikan dengan mekanisme attention).

Dalam konteks ini, urutan kata sangat penting, sehingga RNN lebih sesuai dibandingkan model yang mengabaikan urutan.

2. Prediksi Deret Waktu (Time Series Forecasting)

RNN juga efektif untuk memodelkan data deret waktu, di mana nilai saat ini bergantung pada nilai-nilai sebelumnya. Contoh:

Prediksi harga saham atau komoditas dari waktu ke waktu.
Peramalan beban listrik atau konsumsi energi harian.
Prediksi jumlah pengunjung website, trafik jaringan, atau permintaan produk.

RNN dapat mempelajari pola musiman, tren jangka panjang, maupun fluktuasi jangka pendek dengan memanfaatkan memori pada hidden state.

3. Aplikasi Lain Berbasis Sekuens

Speech recognition: mengubah sinyal suara menjadi teks.
Music generation: menghasilkan urutan nada berdasarkan pola musik yang telah dipelajari.
Log analysis: mendeteksi anomali pada urutan log sistem atau jaringan.

Semua contoh ini memiliki karakteristik yang sama, yaitu data berupa urutan, sehingga memerlukan model yang mampu mengenali hubungan antar elemen dalam urutan tersebut.

Materi pada pertemuan ini memberikan landasan konseptual mengenai perbedaan ANN dan Deep Learning, arsitektur CNN dan RNN, serta contoh penerapannya dalam berbagai domain. Pemahaman konsep ini menjadi dasar sebelum masuk ke tahap implementasi praktis menggunakan bahasa pemrograman dan pustaka deep learning pada pertemuan atau praktikum berikutnya.

Terakhir diubah: Kamis, 11 Desember 2025, 23:32

Deep Learning dan Jaringan Syaraf