# Algoritma Pencarian (Searching)
Dalam materi ini, kita akan menjelajahi berbagai algoritma dan pendekatan yang dirancang untuk mengatasi tantangan pencarian informasi. Dari pencarian sederhana hingga teknik pencarian yang lebih canggih, kita akan memahami bagaimana algoritma-algoritma ini bekerja di berbagai konteks dan bagaimana memilih pendekatan yang paling sesuai untuk permasalahan yang dihadapi.

1. Masalah dasar komputasi **searching (pencarian)**.
2. Searching adalah algoritma untuk mencari item dari sekumpulan item.
3. Hasil pencarian dapat berupa **index position** atau data boolean.

![tozgxw495m5xzqkpv2c6.webp](attachment:tozgxw495m5xzqkpv2c6.webp)

### Pencarian Instan: Menggunakan *keyword* in
Di dalam Python terdapat sebuah operator yang dapat digunakan untuk pencarian data, yaitu operator in (keanggotaan), apakah sebuah data merupakan anggota dari sekolompok data. Contoh seperti pada kode berikut:

In [None]:
daftar_nama = ["Aris", "Angga", "Niko", "Radit", "Ozi"]
nama_dicari = "niko"

daftar_nama_kecil = []
for nama in daftar_nama:
    nama = nama.lower()
    daftar_nama_kecil.append(nama)
    
if nama_dicari.lower() in daftar_nama_kecil:
    print(nama_dicari, "ditemukan!")
else:
    print(nama_dicari, "tidak ditemukan!")


In [None]:
print(nama_dicari.lower() in daftar_nama_kecil)

### A. Linear (Sequential) Search
Ketika data disimpan dalam bentuk koleksi seperti list (ordered), maka dapat simpulkan bahwa data tersebut mempunyai hubungan yang bersifat linear atau sequential. Setiap data akan disimpan dengan posisi tertentu dan relatif terhadap data yang lain. Di dalam Python posisi relatif tersebut merupakan index dari setiap item data, karena index dari sebuah item data adalah berupa urutan angka yang dimulai dari angka terkecil (0,1,2,â€¦.) maka sangat dimungkinkan untuk membaca setiap data dalam list secara berurutan (sequential), yang kemudian disebut dengan pencarian secara sequential.

![image.png](attachment:image.png)

Gambar di atas menjelaskan proses pencarian data dimulai dari item data pertama (ujung kiri, indeks = 0), kemudian dilanjutkan ke arah kanan secara berurutan sampai data yang dicari ditemukan, jika sampai posisi data yang terakhir maka data yang dicari tidak ditemukan maka hasilnya adalah False, atau data yang dicari tidak ditemukan.

In [12]:
def linear_search(sequence, target):
    for index, item in enumerate(sequence):
        if item == target:
            return index
    return -1

data = [0, 5, 7, 10, 15]
print("Mencari 5 ->", linear_search(data, 5))
print("Mencari 7 ->", linear_search(data, 7))

Mencari 5 -> 1
Mencari 7 -> 2


In [13]:
def linear_search(arr, target):
    for i in range(len(arr)):
        if arr[i] == target:
            return i  # Mengembalikan indeks elemen yang sesuai
    return -1  # Mengembalikan -1 jika nilai tidak ditemukan

song_titles = ["Shape of You", "Blinding Lights",
               "Dance Monkey", "Memories", "Uptown Funk"]
target_song = "Dance Monkey"

result = linear_search(song_titles, target_song)

if result != -1:
    print(f"Judul lagu '{target_song}' ditemukan pada indeks {result}.")
else:
    print(f"Judul lagu '{target_song}' tidak ditemukan dalam dataset.")


Judul lagu 'Dance Monkey' ditemukan pada indeks 2.


In [14]:
def linear_search(arr, target):
    for i in range(len(arr)):
        if arr[i] == target:
            return i  # Mengembalikan indeks elemen yang sesuai
    return -1  # Mengembalikan -1 jika nilai tidak ditemukan

book_titles = [
    "Harry Potter and the Sorcerer's Stone",
    "To Kill a Mockingbird",
    "1984",
    "The Great Gatsby",
    "Pride and Prejudice"
]
target_book = "1984"

result = linear_search(book_titles, target_book)

if result != -1:
    print(f"Judul buku '{target_book}' ditemukan pada indeks {result}.")
else:
    print(f"Judul buku '{target_book}' tidak ditemukan dalam dataset.")


Judul buku '1984' ditemukan pada indeks 2.


### B. Binary Search
* Jika data kita adalah data yang telah diurutkan terlebih dahulu maka Binary search dapat melakukan pencarian lebih cepat jika dibanding dengan sequential search, dimana proses pencarian data dalam binary search akan dimulai dari bagian tengah list.
* Jika item yang dicari berada di tengah pencarian maka pencarian akan berakhir, tetapi jika item tidak ditemukan di tengah, pencarian berikutnya dapat dilakukan di setengah bagian atas atau setengah bagian bawah, hal ini tergantung pada besar atau kecilnya item data yang dicari.
* Proses ini akan diulang terus sampai data yang dicari ditemukan atau mencapai batas akhir list/ item (tidak ditemukan).

Gambar di bawah adalah ilustrasi proses pencarain angka 54 dalam list, dengan menggunakan binary search.

![image.png](attachment:image.png)

### Hal-hal penting terkait binary search
1. **Data Terurut**: Binary Search hanya dapat bekerja pada dataset yang terurut, baik itu bilangan bulat, bilangan desimal, atau string. Jika dataset string diurutkan, Binary Search tetap dapat digunakan.
2. **Komparasi String**: Dalam Python, string dibandingkan berdasarkan urutan leksikografis, yaitu karakter pertama yang berbeda dalam dua string akan memutuskan urutan. Misalnya, "apple" akan dianggap lebih kecil dari "banana".
3. **Perhatikan Pembagian Dataset**: Saat menerapkan Binary Search pada dataset string, pastikan Anda menghitung nilai tengah dengan benar dan membagi dataset sesuai dengan perbandingan leksikografis.
4. **Kompleksitas**: Meskipun Binary Search efisien untuk dataset besar, pencarian string mungkin lebih kompleks daripada pencarian bilangan, terutama jika string memiliki panjang yang berbeda-beda.
5. **Fungsi Hash**: Jika Anda ingin mencari string dalam dataset yang tidak terurut, Anda mungkin ingin mempertimbangkan penggunaan struktur data seperti tabel hash untuk pencarian yang lebih efisien.

In [15]:
book_titles = [
    "Brave New World",
    "Fahrenheit 451",
    "Lord of the Flies",
    "The Catcher in the Rye",
    "The Giver"
]
target_book = "Fahrenheit 451"

# Urutkan list judul buku sebelum menggunakan Binary Search
book_titles.sort()
print(book_titles)

['Brave New World', 'Fahrenheit 451', 'Lord of the Flies', 'The Catcher in the Rye', 'The Giver']


In [16]:
def binary_search(arr, target):
    low = 0
    high = len(arr) - 1
    
    while low <= high:
        mid = (low + high) // 2
        if arr[mid] == target:
            return mid  # Mengembalikan indeks elemen yang sesuai
        elif arr[mid] < target:
            low = mid + 1
        else:
            high = mid - 1
    return -1  # Mengembalikan -1 jika nilai tidak ditemukan

result = binary_search(book_titles, target_book)

if result != -1:
    print(f"Judul buku '{target_book}' ditemukan pada indeks {result}.")
else:
    print(f"Judul buku '{target_book}' tidak ditemukan dalam dataset.")


Judul buku 'Fahrenheit 451' ditemukan pada indeks 1.


In [17]:
string1 = "apple"
string2 = "banana"
string3 = "cherry"

# Perbandingan kurang dari
print(f"'{string1}' < '{string2}':", string1 < string2)  # Output: 'apple' < 'banana': True

# Perbandingan lebih dari
print(f"'{string2}' > '{string3}':", string2 > string3)  # Output: 'banana' > 'cherry': False

# Perbandingan lebih dari atau sama dengan
print(f"'{string1}' >= '{string3}':", string1 >= string3)  # Output: 'apple' >= 'cherry': False

# Perbandingan kurang dari atau sama dengan
print(f"'{string2}' <= '{string2}':", string2 <= string2)  # Output: 'banana' <= 'banana': True

# Perbandingan tidak sama dengan
print(f"'{string1}' != '{string3}':", string1 != string3)  # Output: 'apple' != 'cherry': True

# Perbandingan sama dengan
print(f"'{string2}' == '{string2}':", string2 == string2)  # Output: 'banana' == 'banana': True


'apple' < 'banana': True
'banana' > 'cherry': False
'apple' >= 'cherry': False
'banana' <= 'banana': True
'apple' != 'cherry': True
'banana' == 'banana': True


### C. Hashing Search
Pencarian Hashing adalah algoritma pencarian yang menggunakan struktur data tabel hash (hash table) untuk mencari nilai dengan efisien. Pada dasarnya, algoritma ini mengubah nilai yang ingin dicari menjadi indeks dalam tabel hash, di mana diharapkan nilai yang dicari ada.

#### Cara Kerja
1. Data dimasukkan ke dalam tabel hash menggunakan fungsi hash.
2. Saat pencarian dilakukan, nilai yang ingin dicari diubah menjadi indeks menggunakan fungsi hash yang sama.
3. Algoritma mengunjungi indeks tersebut dalam tabel hash untuk mencari nilai.
4. Jika nilai ditemukan pada indeks tersebut, pencarian berhasil.
5. Jika terjadi tabrakan hash (dua nilai dihasilkan oleh fungsi hash yang sama), algoritma harus memiliki strategi untuk mengatasi tabrakan tersebut.

In [18]:
class HashTable:
    def __init__(self, size):
        self.size = size
        self.table = [None] * size
    
    def hash_function(self, value):
        return value % self.size
    
    def insert(self, value):
        index = self.hash_function(value)
        if self.table[index] is None:
            self.table[index] = [value]  # Menggunakan chaining untuk menangani collision
        else:
            self.table[index].append(value)
    
    def search(self, value):
        index = self.hash_function(value)
        if self.table[index] is not None:
            if value in self.table[index]:
                return index
        return -1

Variabel **size** pada kelas HashTable diperlukan untuk menentukan ukuran dari tabel hash yang akan dibuat. Ukuran tabel hash memiliki pengaruh pada bagaimana data akan diatur dan dicari di dalam tabel tersebut. Berikut beberapa alasan mengapa variabel size diperlukan:

1. Distribusi Data yang Efisien: Ukuran tabel hash sangat mempengaruhi efisiensi distribusi data. Jika ukuran tabel terlalu kecil, kemungkinan terjadinya kolisi (collision) akan meningkat, yaitu saat dua atau lebih data memiliki hash yang sama. Di sisi lain, jika ukuran tabel terlalu besar, bisa menyebabkan banyak ruang kosong (waste) dalam tabel. Dengan memilih ukuran yang tepat, distribusi data di tabel hash dapat diatur secara efisien.
2. Hashing Function: Hash function (fungsi hash) biasanya menghasilkan nilai antara 0 dan size-1, di mana size adalah ukuran tabel hash. Hash function memetakan nilai data ke indeks di dalam tabel. Dengan adanya size, hash function dapat menghasilkan indeks yang valid dan sesuai dengan ukuran tabel.
3. Penanganan Kolisi: Ukuran tabel hash juga berhubungan dengan cara penanganan kolisi. Dalam metode penanganan kolisi seperti chaining (seperti yang Anda lakukan dalam kode), ukuran tabel akan mempengaruhi seberapa sering kolisi akan terjadi dan seberapa baik data dapat diorganisir dalam setiap slot tabel.
4. Penggunaan Memori: Ukuran tabel hash juga berkaitan dengan penggunaan memori. Tabel hash dengan ukuran yang lebih besar akan menggunakan lebih banyak memori. Oleh karena itu, perlu mempertimbangkan keseimbangan antara efisiensi penyimpanan dan performa pencarian.

Dalam kode yang diberikan, ukuran tabel hash (size) digunakan dalam fungsi hash, dalam menginisialisasi tabel (self.table = [None] * size), serta dalam berbagai operasi pengelolaan tabel hash. Ukuran yang dipilih haruslah disesuaikan dengan karakteristik data yang akan disimpan dan diakses melalui tabel hash tersebut.

In [19]:
# Inisialisasi tabel hash
hash_table = HashTable(10)
hash_table.insert(5)
hash_table.insert(15)
hash_table.insert(25)

print(hash_table.table)

[None, None, None, None, None, [5, 15, 25], None, None, None, None]


In [20]:
search_value = 15
result = hash_table.search(search_value)

if result != -1:
    print(f"Nilai {search_value} ditemukan pada indeks {result}.")
else:
    print(f"Nilai {search_value} tidak ditemukan dalam tabel hash.")

Nilai 15 ditemukan pada indeks 5.


In [22]:
class StringHashTable:
    def __init__(self, size):
        self.size = size
        self.table = [[] for _ in range(size)]  # Menggunakan list kosong untuk setiap slot
    
    def hash_function(self, string):
        total = 0
        for char in string:
            total += ord(char)  # Menggunakan nilai ASCII karakter untuk menghasilkan hash
        return total % self.size
    
    def insert(self, string):
        index = self.hash_function(string)
        slot = self.table[index]
        if string not in slot:
            slot.append(string)
    
    def search(self, string):
        index = self.hash_function(string)
        slot = self.table[index]
        if string in slot:
            return index
        return -1

In [23]:
# Inisialisasi tabel hash
hash_table = StringHashTable(10)
hash_table.insert("apple")
hash_table.insert("banana")
hash_table.insert("cherry")

print(hash_table.table)

[['apple'], [], [], ['cherry'], [], [], [], [], [], ['banana']]


In [24]:
search_string = "banana"
result = hash_table.search(search_string)

if result != -1:
    print(f"String '{search_string}' ditemukan pada indeks {result}.")
else:
    print(f"String '{search_string}' tidak ditemukan dalam tabel hash.")

String 'banana' ditemukan pada indeks 9.


### D. Mencari File
Kode ini adalah sebuah program yang bertujuan untuk melakukan pencarian berkas di dalam sebuah direktori dan subdirektorinya. Tujuannya adalah untuk menemukan berkas dengan nama tertentu yang disebutkan sebagai target.

In [None]:
from IPython.display import clear_output

import os # modul untuk berkomunikasi dengan operating system
import time

In [None]:
import os

def search_file(root_dir, target=""):
    def search_recursive(directory):
        for item in os.listdir(directory):
            current = os.path.join(directory, item)
            try:
                if os.path.isfile(current):
                    print(f"Searching for '{target}' in '{current}'")
                    if item == target:
                        print(f"'{target}' found at '{current}'")
                        return True
                else:
                    print(f"Entering directory: '{current}'")
                    if search_recursive(current):
                        return True
                time.sleep(0.05)
                clear_output(wait=True)
            except PermissionError:
                pass
        return False
    print(f"Searching for '{target}' in '{root_dir}'")
    if search_recursive(root_dir):
        print(f"Search for '{target}' completed.")
    else:
        print(f"'{target}' not found in '{root_dir}'.")

search_file("D:\\Warehouse\\", "layout_siswa.xlsx")


#### Flowchart Pencarian Berkas

1. **Start:**
   - Mulai dari simbol yang menandakan awal dari aliran.

2. **Import `os` Module:**
   - Simbol ini menggambarkan impor modul `os`.

3. **Define `search_file` Function:**
   - Simbol ini menunjukkan definisi fungsi `search_file` dengan dua parameter: `root_dir` dan `target`.

4. **Get List of Elements:**
   - Simbol ini menggambarkan pengambilan daftar elemen (berkas dan subdirektori) dalam `root_dir`.

5. **Sort Elements:**
   - Simbol ini menggambarkan pengurutan elemen-elemen berdasarkan tipe (berkas atau direktori).

6. **Iterate Through Elements:**
   - Simbol ini mewakili iterasi melalui setiap elemen dalam daftar yang telah diurutkan.

7. **Check Element Type:**
   - Simbol ini menggambarkan pemeriksaan apakah elemen saat ini adalah berkas atau direktori.

8. **If Element is File:**
   - Jika elemen adalah berkas, tindakan berikutnya adalah pencarian `target` dalam berkas ini.

9. **Print Search Message (File):**
   - Simbol ini mewakili pencetakan pesan bahwa sedang mencari `target` dalam berkas.

10. **Check if Target Found (File):**
    - Jika `target` ditemukan dalam berkas, tindakan selanjutnya adalah menghentikan pencarian.

11. **Print Found Message (File):**
    - Simbol ini menggambarkan pencetakan pesan bahwa `target` ditemukan dalam berkas.

12. **If Element is Directory:**
    - Jika elemen adalah direktori, tindakan berikutnya adalah menjelajahi subdirektori dan berkas di dalamnya.

13. **Print Search Message (Directory):**
    - Simbol ini mewakili pencetakan pesan bahwa sedang mencari `target` dalam direktori.

14. **Recursive Call (Directory):**
    - Simbol ini mewakili pemanggilan rekursif fungsi `search_file` untuk menjelajahi subdirektori.

15. **Try-Except (Permission Handling):**
    - Simbol ini menggambarkan penanganan izin dengan menggunakan pernyataan `try` dan `except`.

16. **Print Progress Message:**
    - Simbol ini menggambarkan pencetakan pesan mengenai setiap langkah pencarian.

17. **Print Finished Message:**
    - Simbol ini mewakili pencetakan pesan bahwa pencarian telah selesai setelah semua elemen diperiksa.

18. **End:**
    - Simbol ini menandakan akhir dari aliran.

19. **Call `search_file` Function:**
    - Simbol ini mewakili pemanggilan fungsi `search_file` dengan argumen `root_dir` sebagai "D:\Warehouse\".

20. **End Result:**
    - Aliran selesai dengan memberikan informasi tentang proses pencarian berkas dan direktori di dalam "D:\Warehouse\" dan subdirektorinya.


### Soal atau Latihan Algoritma Pencarian

**Soal 1: Pencarian Nama dalam Daftar** <br/>
Andi adalah seorang guru dan dia memiliki daftar nama siswa dalam kelasnya. Dia ingin mencari apakah nama "Rina" ada dalam daftar tersebut. Bantulah Andi dengan membuat program pencarian linear untuk menemukan apakah "Rina" ada dalam daftar atau tidak.

**Soal 2: Pencarian Angka dalam Array** <br/>
Budi memiliki sebuah array berisi angka-angka. Dia ingin mencari apakah angka 25 ada dalam array tersebut. Bantu Budi dengan membuat program pencarian linear yang dapat menemukan apakah angka 25 ada dalam array atau tidak.

**Soal 3: Pencarian Karakter dalam Kata** <br/>
Citra memiliki sebuah kata acak, misalnya "chocolate". Dia ingin mencari apakah huruf "o" ada dalam kata tersebut. Bantu Citra dengan membuat program pencarian linear untuk menemukan apakah huruf "o" ada dalam kata atau tidak.

#### Contoh Jawaban Soal Nomor 1

In [None]:
def linear_search(names, target_name):
    for index, name in enumerate(names):
        if name == target_name:
            return index
    return -1

# Daftar nama siswa dalam kelas
student_names = ["Andi", "Budi", "Citra", "Dina", "Eka", "Fajar"]

# Nama yang ingin dicari
search_name = "Rina"

# Melakukan pencarian linear
result = linear_search(student_names, search_name)

# Menampilkan hasil pencarian
if result != -1:
    print(f"Nama {search_name} ditemukan pada indeks {result}.")
else:
    print(f"Nama {search_name} tidak ditemukan dalam daftar.")
