LMS-SPADA INDONESIA
Artificial Neural Network (ANN) adalah model komputasi yang terinspirasi dari cara kerja neuron biologis. ANN tradisional biasanya terdiri atas tiga jenis lapisan:
Pada umumnya, ANN tradisional hanya memiliki 1–2 hidden layer sehingga kemampuan representasinya terbatas untuk pola yang tidak terlalu kompleks. ANN cocok untuk permasalahan seperti klasifikasi tabular, regresi sederhana, dan prediksi berbasis fitur numerik yang tidak terlalu besar dimensinya.
Deep Learning dapat dipandang sebagai ANN dengan arsitektur yang jauh lebih dalam, yaitu memiliki banyak hidden layer. Setiap lapisan bertanggung jawab mempelajari representasi data pada tingkat abstraksi yang berbeda:
Dengan arsitektur yang dalam, deep learning mampu melakukan pembelajaran fitur secara otomatis (automatic feature learning) tanpa perlu rekayasa fitur (feature engineering) yang intensif dari manusia.
| Aspek | ANN Tradisional | Deep Learning |
|---|---|---|
| Jumlah hidden layer | Biasanya 1–2 layer | Bisa puluhan hingga ratusan layer |
| Kompleksitas | Rendah–sedang | Tinggi |
| Kemampuan representasi | Cukup untuk pola sederhana | Sangat kuat untuk pola kompleks |
Convolutional Neural Network (CNN) adalah arsitektur deep learning yang dirancang khusus untuk memproses data yang memiliki struktur grid, seperti:
Keunggulan utama CNN adalah kemampuannya mengenali pola spasial dalam citra, mulai dari pola yang sangat sederhana hingga pola kompleks, melalui kombinasi beberapa lapisan.
Convolution layer menggunakan filter atau kernel berukuran kecil (misalnya 3×3) yang digeser di atas citra untuk menghasilkan feature map. Setiap filter akan belajar mendeteksi pola tertentu, misalnya:
Proses ini memungkinkan CNN mengurangi jumlah parameter, karena satu filter digunakan pada banyak posisi (parameter sharing).
Setelah konvolusi, biasanya digunakan fungsi aktivasi ReLU (Rectified Linear Unit): ReLU(x) = max(0, x). ReLU menambahkan non-linearitas pada jaringan dan membantu pelatihan menjadi lebih cepat dan stabil.
Pooling layer bertugas untuk:
Jenis pooling yang umum:
Di bagian akhir arsitektur CNN, hasil ekstraksi fitur dari beberapa lapisan konvolusi dan pooling diubah menjadi vektor 1D dan diproses oleh Fully Connected Layer (FC). Lapisan ini berperan seperti ANN biasa untuk melakukan:
Untuk tugas klasifikasi multi-kelas, CNN biasanya diakhiri dengan Softmax layer yang mengubah skor menjadi probabilitas masing-masing kelas.
Secara konseptual, alur pemrosesan CNN dapat diringkas sebagai:
Input citra → Convolution + ReLU → Pooling → (diulang beberapa blok) → Fully Connected → Softmax → Output kelas
Recurrent Neural Network (RNN) adalah arsitektur deep learning yang dirancang untuk memproses data berurutan (sequential), seperti:
Berbeda dengan CNN yang fokus pada pola spasial, RNN fokus pada pola temporal, yaitu hubungan antar data pada berbagai langkah waktu.
Inti dari RNN adalah adanya hidden state yang membawa informasi dari waktu sebelumnya. Pada setiap langkah waktu t, RNN menerima:
xt,ht-1.RNN kemudian menghasilkan:
ht,yt.Dengan cara ini, RNN memiliki memori jangka pendek terhadap urutan data yang telah dilalui.
Proses pelatihan RNN dilakukan dengan memperluas jaringan sepanjang waktu, kemudian melakukan backpropagation through time. Pendekatan ini sering menghadapi dua masalah:
Untuk mengatasi kelemahan RNN klasik, dikembangkan:
Keduanya menggunakan mekanisme gate (gerbang) untuk:
Dengan gate ini, LSTM dan GRU mampu belajar dependensi jangka panjang pada teks atau deret waktu, misalnya makna kalimat dalam paragraf panjang.
Secara konseptual, alur RNN untuk data berurutan:
x1, inisialisasi h0 (misalnya nol).h1 dari x1 dan h0, hasilkan output y1 (jika diperlukan).x2, gunakan h1 sebagai memori.Dengan demikian, setiap output pada waktu tertentu dipengaruhi oleh data saat itu dan konteks dari waktu sebelumnya.
CNN banyak digunakan untuk mengklasifikasi citra ke dalam beberapa kelas, misalnya:
Pada kasus ini, CNN belajar pola visual yang membedakan satu objek dengan objek lainnya tanpa perlu mendefinisikan fitur secara manual.
Selain klasifikasi, CNN juga digunakan untuk:
Arsitektur yang lebih kompleks (misalnya R-CNN, YOLO, atau U-Net) merupakan pengembangan lebih lanjut dari prinsip dasar CNN.
Dalam semua aplikasi ini, CNN bertanggung jawab mengubah citra mentah menjadi representasi fitur yang dapat dipahami oleh layer klasifikasi di bagian akhir jaringan.
RNN, terutama LSTM dan GRU, banyak digunakan dalam pengolahan bahasa alami (NLP) karena mampu memahami urutan kata dalam kalimat. Beberapa contoh aplikasinya:
Dalam konteks ini, urutan kata sangat penting, sehingga RNN lebih sesuai dibandingkan model yang mengabaikan urutan.
RNN juga efektif untuk memodelkan data deret waktu, di mana nilai saat ini bergantung pada nilai-nilai sebelumnya. Contoh:
RNN dapat mempelajari pola musiman, tren jangka panjang, maupun fluktuasi jangka pendek dengan memanfaatkan memori pada hidden state.
Semua contoh ini memiliki karakteristik yang sama, yaitu data berupa urutan, sehingga memerlukan model yang mampu mengenali hubungan antar elemen dalam urutan tersebut.
Materi pada pertemuan ini memberikan landasan konseptual mengenai perbedaan ANN dan Deep Learning, arsitektur CNN dan RNN, serta contoh penerapannya dalam berbagai domain. Pemahaman konsep ini menjadi dasar sebelum masuk ke tahap implementasi praktis menggunakan bahasa pemrograman dan pustaka deep learning pada pertemuan atau praktikum berikutnya.