Mesin pencari (bahasa Inggris: search engine) adalah suatu sistem yang dibuat untuk memudahkan pengguna internet menemukan informasi yang diinginkan di jaringan World Wide Web (WWW).
Mesin pencari sendiri berfungsi sebagai jembatan antara pencarian manusia dan komputer.
Search engine akan melakukan pencarian terhadap kata atau kalimat yang dimasukkan oleh pengguna, kemudian menyajikan halaman-halaman web yang relevan dengan tema yang dimaksud.
Mesin pencari adalah alat atau program yang membantu menemukan data dalam suatu jaringan yang terhubung ke Internet dan dapat menghasilkan informasi yang diperlukan oleh pengguna.
Pada umumnya search engine digunakan untuk mencari file, halaman web atau gambar. Mesin-mesin pencari ini menggunakan spider (robot, bot) untuk memindai situs-situs web dan mengumpulkan isi halaman-halamannya ke dalam basis data.
Daftar isi
Cara kerja mesin pencari
Mesin pencari bekerja dengan cara mengirimkan spider untuk menelusuri web (crawling) dan melakukan pengindeksan (indexing).
Spider merupakan sebuah program bot yang dibuat untuk menelusuri semua halaman web yang tersedia dan membaca konten di dalamnya.
Setelah spider mendapatkan isi halaman web, maka data tersebut akan disimpan di server.
Algoritma mesin pencari digunakan untuk memfilter konten-konten yang masuk, sehingga akan menghasilkan deretan halaman web yang relevan dengan kata kunci penelusuran tertentu.
Secara garis besar, proses kerja mesin pencari terbagi menjadi 3 tahapan yaitu:
- Crawling: proses mengumpulkan data dari website dengan mengakses URL yang ada di tiap-tiap dokumen yang telah diidentifikasi sebelumnya
- Indexing: proses menyimpan data dari website ke dalam database mesin pencari. Data yang sudah disimpan akan dilakukan proses pengindeksan dan ranking, sehingga nantinya ketika kita melakukan pencarian, hasilnya akan muncul berdasarkan ranking dokumen tersebut
- Ranking: proses pengindeksan dan ranking dokumen-dokumen yang dimiliki oleh mesin pencari. Mesin pencari akan mendeteksi apakah dokumennya memenuhi kriteria atau tidak dengan melihat relevansi keyword kita dengan dokumen tersebut. Jika relevansinya tinggi, maka hasilnya akan lebih tinggi daripada hasil yang kurang relevan.
1. Crawling
Crawling dapat dikatakan sebagai proses pengumpulan data yang dilakukan secara otomatis oleh robot spider terhadap website-website / URL yang ada pada internet.
Biasa juga disebut dengan istilah sebagai web crawling. Proses crawling ini bisa dibilang merupakan hal terpenting dalam tahapan kerja mesin pencari karena mempunyai peranan yang sangat besar untuk indexing data, sehingga akan mempengaruhi hasil pencarian.
Mesin pencari akan menelusuri web dengan mengunjungi setiap halaman yang ditemukan pada proses crawling ini.
Mesin pencari juga akan menggunakan sumber daya yang diperlukan untuk mendownload halaman dan mengindekskannya.
Proses crawling ini bertujuan untuk mendapatkan semua informasi dari website dan situs lainnya untuk kemudian disimpan di dalam database.
Proses crawling ini terjadi secara berkelanjutan, robot spider akan mengunjungi ulang (recrawling) halaman-halaman web yang sudah diindex untuk memeriksa apakah ada versi terbaru dari halaman tersebut.
2. Indexing
Pengertian Indexing adalah proses pengumpulan data dan informasi dari suatu tempat kemudian disimpan ke dalam database atau sejenisnya.
Proses indexing ini dapat dilakukan dengan memindai secara manual maupun secara otomatis oleh sistem.
Secara manual pengisian data dilakukan oleh user, sedangkan secara otomatis adalah dengan menggunakan sistem database yang terkoneksi dengan internet.
Indexing merupakan tahapan kedua dalam proses kerja mesin pencari. Pada tahap indexing, mesin pencari akan menyimpan semua informasi yang telah diambil melalui proses crawling kemudian mengumpulkannya di dalam database.
3. Processing & Ranking
Setelah indexing, mesin pencari akan menentukan halaman mana yang harus ditampilkan di bagian atas hasil pencarian yang sesuai dengan kueri pengguna.
Mesin pencari melakukan ini dengan membandingkan kueri pengguna dengan dokumen-dokumen yang sudah terindeks dan menempatkan dokumen-dokumen yang paling relevan di posisi paling atas.
Halaman yang muncul paling atas hasil pencarian adalah yang paling relevan dengan kueri pengguna. Halaman-halaman tersebut dipilih berdasarkan berbagai hal. Seperti pertimbangan apakah halaman tersebut memuat kata-kata penting yang dicari, judul halaman, jumlah dan kualitas situs lain yang merujuk ke halaman tersebut, serta beberapa faktor lainnya.
Mesin pencari mengukur popularitas sebuah halaman berdasarkan jumlah situs dan orang yang merujuk ke situs tersebut.
Semakin banyak situs yang merujuk ke suatu halaman web, maka halaman tersebut akan semakin tinggi nilainya dan memiliki peluang untuk berada di urutan atas hasil pencarian.
4. Serving
Serving merupakan tahapan akhir dari proses kerja mesin pencari yaitu menampilkan hasil pencarian berdasarkan kueri yang dimasukkan pengguna dalam sebuah halaman indeks.
Pada halaman hasil pencarian, pengguna akan disajikan data hasil pencarian berupa listing halaman web yang memiliki informasi relevan dengan apa yang dicari.
Urutan atau ranking halaman web tersebut ditentukan berdasarkan relevansi dan kualitasnya sehingga bisa disimpulkan jika urutan paling atas adalah hasil yang terbaik.