World wide web adalah jaringan internet yang sangat amat luas. Jika Anda tahu alamat web atau URL dari sebuah situs maka Anda bisa menemukannya dengan mengetikkan URL tersebut ke address bar di bagian atas browser Anda. Tetapi bagaimana jika Anda tidak tahu URLnya?
Anda dapat menemukan sebuah halaman web dengan mengikuti link dari halaman lain tetapi biasanya lebih mudah jika mencari dengan menggunakan search engine atau mesin pencari.
Bagaimana Mesin Pencari Mencari Halaman Web
Untuk menemukan apa yang Anda cari, mesin pencari akan melakukan scan daftar indeks halaman Web untuk konten yang terkait dengan pencarian Anda.
Sebuah mesin pencari membuat indeks ini dengan menggunakan program yang disebut 'web crawler'. Web crawler ini secara otomatis menelusuri web dan menyimpan informasi tentang halaman yang dikunjungi.
Setiap kali web crawler mengunjungi sebuah halaman web, dia membuat salinan itu (meng-copy) dan memasukkan URL tersebut ke daftar indeks. Setelah ini dilakukan, crawler web akan mengikuti semua link pada halaman, mengulangi proses penyalinan, pengindeksan dan kemudian mengikuti link. Ini akan dilakukan terus sehingga membangun jaringan indeks yang sangat besar yang terdiri dari halaman-halaman web.
Program dengan nama-nama seperti "gopher" dan "Archie" menyimpan file indeks pada server yang terhubung ke Internet. Beberapa situs web memilih untuk menghalang/memblokir web crawler untuk mengunjungi situs mereka. Oleh karena itu, halaman halaman tersebut akan dihiraukan sehingga tidak terindeks.
Semua data atau informasi yang dikumpulkan dan dirapikan oleh web crawler akan digunakan oleh mesin pencari. Ini akan dijadikan sebagai indeks oleh mesin pencari. Setiap halaman web yang direkomendasikan oleh mesin pencari telah dikunjungi oleh crawler web.
Bagaimana web crawler atau biasa disebut juga dengan spider ('laba-laba') memulai perjalanan nya menelusuri Web?
Spider biasanya memulai dari daftar server yang paling banyak dikunjungi pengguna, biasanya situs atau halaman yang populer. 'Laba-laba' tersebut akan mengindeks kata-kata di halaman itu dan mulai mengikuti setiap link yang ditemukan dalam halaman situs tersebut.
Bagaimana Mesin Pencari Meng-Urutkan Hasil Pencariannya
Search engine mengumpulkan hasil pencarian halaman webnya sesuai urutan yang dia anggap paling bagus dsb.
PageRank adalah algoritma yang paling dikenal yang digunakan untuk meningkatkan hasil pencarian web. Dalam istilah sederhana, PageRank adalah kontes popularitas. Semakin banyak link yang mengarah ke sebuah halaman web, semakin berguna halaman web tersebut di mata search engine/ mesin pencari. Ini juga berarti halaman web tersebut akan ditampilkan lebih atas dari yang lain. Halaman web pada halaman pertama hasil pencarian search engine adalah yang mereka anggap terbaik.
Search engine juga memperhatikan banyak faktor lain ketika mempertimbangkan urutan pada sebuah halaman web, diantara lain adalah seberapa sering halaman tersebut diupdate/ diperbarui dan apakah halaman itu berasal dari domain yang dapat dipercaya.
Di internet terdapat banyak mesin pencari, anda bisa memilih mana yang anda suka. Mesin pencari yang berbeda menggunakan algoritma yang berbeda. Ini berarti bahwa search engine ini akan menampilkan urutan halaman web yang berbeda dengan search engine lainnya.
No comments:
Post a Comment