Tugas Pertemuan 4

Di tugas pertemuan 4 ini ada 2 soal/tugas. Satu tugas berasal dari modul, tugas lain merupakan tugas kelompok.

Gabungkan semua jawaban (soal modul dan soal kelompok) jadi satu dalam format PDF.

Soal modul

  1. Jelaskan apa yang dimaksud dengan data preprocessing.
  2. Jelaskan alasan mengapa data preprocessing perlu dilakukan?
  3. Jelaskan cara melakukan data imputation untuk data bertipe numerik dan kategori.
  4. Jelaskan bagaimana cara mengatasi outlier.
  5. Jelaskan best practice untuk melakukan feature selection

Soal kelompok

Dalam satu kelas, kumpulkan setidaknya 8 jenis data dari semua orang dari kelas kalian.

Karena kelas ini terdiri dari 2 kategori (ITI dan Unpam), maka kelompok kalian cukup mengumpulkan data kategori kelas asal.

Jika kalian mahasiswa ITI, maka cukup kumpulkan data untuk semua mahasiswa ITI yang ikut kelas data science ini. Begitu juga dengan mahasiswa dari Unpam, cukup kumpulkan data dari mahasiswa Unpam saja.

Data yang dikumpulkan harus bertipe numerik (angka), misal usia, berat badan, tinggi badan, ukuran sepatu, dan lain-lain (bebas, totalnya ada 8 data).

Sekarang buatlah kelompok yang terdiri dari 3-5 orang, dan dari 8 data tadi pilih 2 data.

Perhatikan bahwa setiap kelompok tidak boleh memiliki kombinasi data yang sama.

Lalu rekap data tersebut dan buat tabel yang terdiri dari 2 kolom data tadi.

Sekarang dari 2 data yang sudah dikumpulkan setiap kelompok:

  • Hitung nilai mean, median, dan modusnya
  • Jika ada nilai kosong (misal kalian tidak mendapatkan data teman kalian), maka isikan data tersebut dengan nilai mean.
  • Buat scatter plot (diagram sebar) antara 2 variabel. Jadikan salah satu variabel sebagai nilai sumbu x, dan jadikan 1 variabel sebagai nilai sumbu y.
  • Kelompok kalian presentasikan 2 data tersebut dan upload videonya ke Youtube. Jelaskan ada informasi menarik apa yang bisa didapatkan dari kedua data tersebut. Jelaskan juga berapa nilai mean, median, dan modus, dan tahapan preprocessing apa yang kalian lakukan (jika ada) dengan menggunakan tool sederhana seperti Excel.
  • Kumpulkan link youtube ke dalam PDF bersamaan dengan soal modul.

Catatan: Walau soal kelompok, namun setiap individu tetap wajib mengumpulkan tugas. Jika ada pertanyaan, bisa ditanyakan di forum pertemuan 4 ya.

Standar penilaian tugas kelompok bisa dilihat melalui rubrik yang ada di RPS.