Global searching is not enabled.
Skip to main content
Interactive Content

4.1. Data Splitting

Completion requirements
Complete the activity

Video ini menjelaskan pentingnya membagi dataset menjadi tiga bagian—training, validation, dan testing—untuk membangun model machine learning yang robust dan optimal. Uraian secara rinci adalah sebagai berikut:

  • 0:11 - 0:26, dijelaskan bahwa mesin pembelajaran menghasilkan model machine learning, dan model tersebut diharapkan kuat atau robust, mampu menghasilkan akurasi tinggi, misalnya 95%.
  • 0:26 - 1:07 : Untuk membangun model yang robust, terdapat tiga tahap utama: training, validation, dan testing. Dataset dibagi menjadi tiga bagian, yaitu data training, validation, dan testing.
  • 1:07 - 1:45: Data training digunakan untuk melatih model hingga menghasilkan prediksi. Hasil prediksi dibandingkan dengan nilai aktual, dan error yang dihasilkan digunakan untuk mengupdate parameter model hingga hasilnya optimal.
  • 1:45 - 2:26: Data validation digunakan untuk mengupdate hiperparameter dengan harapan mendapatkan hasil yang optimal juga. Proses validation membantu dalam menyempurnakan model.
  • 2:26 - 2:45: Setelah proses training dan validation selesai dan dianggap cukup, model akan diuji menggunakan data testing untuk memastikan model optimal.
  • 2:45 - 3:02: Pembagian dataset menjadi tiga bagian ini dilakukan agar model yang dihasilkan kuat dan robust.