Senin, 26 Mei 2008

SEARCH ENGINE

"Search Engine : Tak Sekadar Mencari"



















Search engine disebut juga dengan mesin pencari, dimana sistem yang ada pada sistem tersebut diolah melalui satu atau sekelompok komputer yang berfungsi untuk melakukan pencarian data. Data yang ada pada mesin ini dikumpulkan oleh mereka melalui suatu metoda tertentu, dan diambil dari seluruh server yang dapat mereka akses. Jika dilakukan pencarian melalui search engine ini, maka pencarian yang dilakukan sebenarnya adalah pada database yang telah terkumpul di dalam mesin tersebut.

Situs search engine terkenal kerap menduduki salah satu peringkat teratas dari situs-situs yang paling banyak dikunjungi. Sebelum search engine tersebut dapat memberikan layanan kepada pengunjung, maka dia harus mendata sekian banyak situs dan informasi di Internet untuk dimasukkan ke dalam databasenya. Aktifitas yang disebut dengan peng-indeks-an tersebut diawali dengan "penjelajahan" ke seluruh penjuru Internet oleh sebuah program otomatis yang disebut spider, bot ataupun crawler. Cara penggunaan search engine adalah dengan mengetikkan kata kunci (keyword) yang hendak dicari dan setelah itu akan ditampilkan sejumlah link yang akan mengarahkan kita kepada situs atau informasi yang ada relevansinya dengan keyword yang kita masukkan.

Yang kerap menjadi kendala adalah kita terkadang kurang tepat atau tidak spesifik dalam memasukkan keyword untuk mencari informasi tertentu, sehingga hasil pencariannya menjadi tidak relevan. Bisa pula kita malahan kebingungan dalam memilah-milah informasi mana yang benar-benar kita dibutuhkan dari sekian ribu hingga jutaan informasi yang dihasilkan oleh sebuah search engine.

Dari sekian banyak pilihan search engine di Internet, berdasarkan hasil riset situs situs Searchenginesshowdown.com pada awal Maret 2002, terdapat tiga besar situs search engine yang tengah bersaing menduduki posisi teratas berdasarkan kriteria jumlah ketersediaan informasi, keunikan (ketidak-samaan) informasi yang tersedia di dalam database dan jumlah aktifitas peng-klik-an link informasi oleh pengguna dari yang ditawarkan oleh masing-masing search engine. Kedudukan tiga besar tersebut sementara ini , dipegang oleh situs Google.com pada posisi pertama, posisi kedua oleh situs Wisenut.com dan ketiga adalah situs Alltheweb.com. Harap diingat, Yahoo.com tidak dikategorikan sebagai situs search engine, tetapi sebagai sebuah situs direktori. Beda antara search engine dengan direktori adalah pada jumlah informasi yang tersedia di dalam databasenya. Isi database direktori lebih sedikit ketimbang isi database search engine. Selain itu, informasi di dalam database direktori diseleksi dan diindeks oleh manusia, bukan otomatis oleh program semacam spider, bot ataupun crawler.

Pengelola konten sebuah direktori akan memilih dan memeriksa kelayakan sebuah situs sebelum diputuskan untuk dapat masuk dalam direktori berdasarkan kategori yang tersedia. Situs direktori tersebut juga memasang semacam form search engine untuk mencari situs atau informasi di dalam databasenya, berdasarkan keyword yang digunakan. Bahkan Yahoo.com menggandeng Google.com untuk memperkuat pencarian yang dilakukan oleh pengunjungnya. Sehingga apabila seorang pengunjung Yahoo.com tidak menemukan situs atau informasi yang dicarinya dari database direktori Yahoo.com, maka secara otomatis Yahoo.com akan menampilkan serangkaian link-link tambahan yang diambil dari database Google.com dengan keterangan "powered by Google" di atasnya.

Ada Apa dengan Google?
Tak perlu diperdebatkan lagi, popularitas tertinggi untuk search engine kini berada di tangan Google.com. Popularitas search engine yang dibidani oleh Larry Page dan Sergey Brin (keduanya kandidat Ph.D berusia 28 tahun dari Universitas Stanford Amerika) tersebut didukung dengan kekuatan databasenya yang mengindeks sekian banyak situs-situs Internet di dunia. Pada awal Maret 2002, berdasarkan hasil estimasi situs SearchEnginesShowDown.com, database Google.com telah mengindeks sekitar 968 juta situs Internet. Saat itu Google mengklaim sekitar 1,5 miliar situs di Internet yang telah masuk ke dalam databasenya.
Memang luar biasa fenomena yang dibawa oleh Google.com yang secara resmi diluncurkan pada September 199 ini. Setiap harinya sekitar 70 juta proses pencarian dilakukan oleh Google.com. Dengan tampilan yang bersih dari banner iklan dan image yang berat, proses pencarian bisa berlangsung dengan cepat. Iklan-iklan ditempatkan di bagian atas dari hasil sebuah pencarian, dalam bentuk teks biasa dan iklan yang muncul tersebut dikaitkan dengan keyword yang dimasukkan oleh pengguna Google.com. Sehingga kemungkinan iklan tersebut di klik menjadi lebih besar karena memiliki relevansi dengan informasi yang dicari.
Bukan secara teknis saja popularitas Google.com berhasil mencuat. Bahkan di Amerika, menurut majalah Newsweek edisi Maret 2002, Google.com telah merasuk secara kultural, khususnya dalam bahasa pergaulan sehari-hari. Kata "google" menjadi kata kerja, seperti contoh kalimat: before a blind date, singles use it to "google" potensial matches to see if they're bla-bla-bla. Kekuatan mesin pencari dan pengindeks (crawler) benar-benar "menakutkan". Pada Februari 2002, beberapa media massa Amerika memberitakan kecemasan beberapa pemilik situs ataupun database di Internet terhadap kekuatan crawler milik Google.com tersebut.
Pasalnya, crawler Google.com, sejalan dengan keinginan Page dan Brin, terbukti mampu mengindeks situs dan informasi dari server ataupun database yang tersembunyi di balik firewall atau yang dikhususkan sebagai informasi berbayar. Pantaslah, kiprah Google.com di percaturan search engine mendapatkan anugerah sebagai salah satu search engine terbaik menurut versi situs SearchEngineWatch.com dan situs SearchEnginesShowDown.com.



Empat Search Engine Pilihan
Berikut ini adalah sekilas uraian empat buah situs search engine, yaitu Google.com, Wisenut.com, Alltheweb.com dan Altavista.com. Keempatnya memiliki satu kesamaan, yaitu sama-sama memiliki fasilitas perlindungan terhadap keluarga berupa pilihan untuk memfilter informasi pornografi agar tidak muncul dalam hasil pencarian.
- Google.com
Berdasarkan riset yang dilakukan oleh situs Searchenginesshowdown.com pada awal Maret 2002, banyaknya informasi atau situs yang ditampung oleh database Google.com adalah sekitar 968 juta buah. Sedangkan Google.com sendiri saat itu mengklaim sekitar 1,5 miliar buah. Perbedaan ini tentu saja berdasarkan hasil hitung-hitungan yang mendalam oleh SearchEnginesShowDown.com dengan menggunakan metodologi khusus semisal teknik pencarian informasi, perbandingan dengan database search engine lain dan pembedaan antara URL yang diindeks dengan yang tidak diindeks. Keunikan Google.com adalah fasilitas pemilihan jenis bahasa sebagai antarmukanya. Ada 74 bahasa yang bisa dipilih, termasuk bahasa Indonesia, Jawa, Hacker, Urdu, Klingon, dan sebagainya. Google.com mampu menggali informasi ke situs-situs yang memiliki konten dengan 35 bahasa yang berbeda.
Selain itu, search engine ini juga dilengkapi dengan fasilitas SafeSearch yang fungsinya untuk melakukan pemfilteran terhadap situs-situs pornografi agar tidak muncul (www.google.com/preferences?hl=en). Fasilitas SafeSearch ini terdiri atas dua jenis, yaitu yang strict dan moderate. Untuk mode strict, maka yang diblok selain gambar juga teks. Sedangkan mode moderate hanya memfilter gambarnya saja. Google.com juga menyediakan form isian bagi orang yang ingin situsnya masuk dalam database (http://www.google.com/addurl.html).
Google.com adalah satu-satunya search engine umum yang menyimpan informasi situs ketika pertama kali mereka di indeks, biasa disebut sebagai cached pages. Sehingga meskipun suatu situs telah mati tetapi masih terdapat link-nya di dalam database Google.com, maka kita masih bisa melihat tampilan atau membaca isi situs tersebut. Selain mampu mencari informasi di situs Internet, Google.com juga mampu membongkar isi file yang berakhiran pdf, doc, xls, ppt, rtf, ps, txt, wpd, asp dan lainnya. Google.com juga menyediakan subset khusus bagi beberapa topik khusus, semisal tentang Linux (google.com/linux), universitas (google.com/universities.html) dan Microsoft (google.com/microsoft.html).
Database Google.com yang terbesar saat ini tersebut dimanfaatkan pula oleh Yahoo.com sebagai back-end search engine. Yahoo.com mulai menggunakan database Google.com tersebut terhitung sejak Juli 2000. Google.com juga menyediakan fasilitas Google Toolbar yang dapat dipasang di browser Internet Explorer. Kelemahan Google.com antara lain adalah tidak semua operasi Boolean dapat dijalankan.

- Wisenut.com
Searchenginesshowdown.com pada awal Maret 2002 menyatakan bahwa banyaknya informasi atau situs yang ditampung oleh database Wisenut.com adalah sekitar 579 juta buah. Sedangkan Wisenut.com mengklaim sekitar 1,5 miliar buah yang telah masuk dalam databasenya. Wisenut.com, sebagaimana layaknya sebuah search engine generasi terbaru, bebas dari banner iklan dan aneka image yang memberatkan. Tampilannya yang sederhana mempercepat mengaksesan halaman depan dan proses penampilan hasil yang dicari. Wisenut.com mampu mencari informasi ke konten dengan 25 bahasa dunia yang berbeda, tetapi tidak ada bahasa Indonesia.
Encoding languange Wisenut.com juga mampu beralih ke 21 kode bahasa. Wisenut.com dilengkapi pula dengan fasilitas WiseWatch, yang fungsinya untuk melakukan pemfilteran konten-konten pornografi (/www.wisenut.com/preferences). Search engine yang secara resmi diluncurkan pada September 2001 ini menyediakan pula form isian bagi orang yang ingin mencantumkan situsnya ke dalam database (www.wisenut.com/submitsite.html).

- Alltheweb.com
Alltheweb.com pada awal Maret 2002 mengklaim dirinya telah memasukkan sekitar 507 juta informasi dan situs ke databasenya, tetapi Searchenginesshowdown.com menyatakan lebih banyak, yaitu sekitar 580 juta buah. Alltheweb.com yang merupakan layanan dari FastSearch.com, diluncurkan pada Mei 1999 dengan menggunakan nama Fast. Kemudian pada Juli 2001, dilakukan re-disain pada Fast dan mulai menggunakan nama AllTheWeb. Selain mencari informasi di situs-situs Internet, Alltheweb.com juga dilengkapi dengan kemampuan mencari informasi berupa gambar video, MP3 dan file FTP. Dalam proses penyimpanan ke dalam database, search engine ini mampu melakukan pengindeksan terhadap satu halaman penuh, berbeda dengan Google.com yang hanya mampu mengindeks sebesar 110 Kb pertama dari halaman sebuah situs.
Meskipun demikian, Alltheweb.com tidak mampu mencari file-file PDF dan tidak pula menyediakan fasilitas cached sebuah situs. Alltheweb.com mampu mencari informasi ke konten dengan 47 bahasa dunia yang berbeda, termasuk bahasa Indonesia. Sedangkan encoding languange yang digunakan Wisenut.com juga mampu beralih ke 21 kode bahasa. Sebagai tambahan, fasilitas untuk memfilteran konten-konten pornografi juga disediakan oleh Wisenut.com (http://www.alltheweb.com/customize?page=filter). Tersedia pula form isian bagi orang yang ingin mencantumkan situsnya ke dalam database Alltheweb.com (http://www.alltheweb.com/add_url.php).

- Altavista.com
Altavista.com adalah salah satu veteran search engine terbesar. Selama bertahun-tahun, sebelum kelahiran situs-situs search engine di atas, Altavista.com merupakan search engine yang cukup diperhitungkan. Pada masa jayanya, Altavista.com mampu menampilkan serangkaian informasi dari database situs lain, semisal dari AskJeeves.com, RealNames.com dan LookSmart.com. Tetapi pada Mei 2001, kejayaan tersebut mulai luntur sehingga banyak dari tambahan informasi tersebut lenyap atau tidak muncul sebagai mestinya. Altavista.com pada awal Maret 2002 mengklaim dirinya telah memasukkan sekitar 500 juta informasi dan situs ke databasenya, tetapi Searchenginesshowdown.com menyatakan hanya sekitar 397 juta buah.
Selain mencari informasi di situs, Altavista.com dilengkapi dengan database informasi tentang gambar, MP3/audio, video, direktori dan berita. Keunggulan search engine ini adalah kemampuannya melakukan operasi Boolean AND, OR, NOT dan AND NOT. Kelemahannya adalah tidak banyak file komputer yang bisa diaksesnya, semisal file PDF. Alltheweb.com mampu mencari informasi ke konten dengan 15 bahasa dunia yang berbeda, tanpa bahasa Indonesia. Tersedia form isian bagi yang ingin mencantumkan situsnya ke dalam database Altavista.com. (www.altavista.com/r?h18). Search engine ini juga dilengkapi dengan fasilitas Family Filter untuk memfilter situs-situs pornografi agar tidak muncul dalam hasil pencarian (/www.altavista.com/sites/search/ffset).

Tidak ada komentar: