Search EngineSetelah kita terhubung dengan Internet, ada kalanya kita hendak mencari suatu informasi tetapi bingung dimana letak atau nama situsnya. Tidak jarang pula terkadang kita jenuh dengan situs yang tiap hari itu-itu saja yang kita kunjungi. Kalau memang demikian halnya, mengapa tidak kita gunakan saja salah satu fasilitas yang tersedia di Internet, yaitu layanan search engine? Search engine adalah sebuah database elektronis yang berisi jutaan hingga miliaran alamat-alamat situs dan informasi yang berserakan di jagad Internet ini. Situs search engine terkenal kerap menduduki salah satu peringkat teratas dari situs-situs yang paling banyak dikunjungi. Sebelum search engine tersebut dapat memberikan layanan kepada pengunjung, maka dia harus mendata sekian banyak situs dan informasi di Internet untuk dimasukkan ke dalam databasenya. Aktifitas yang disebut dengan peng-indeks-an tersebut diawali dengan "penjelajahan" ke seluruh penjuru Internet oleh sebuah program otomatis yang disebut spider, bot ataupun crawler. Cara penggunaan search engine adalah dengan mengetikkan kata kunci (keyword) yang hendak dicari dan setelah itu akan ditampilkan sejumlah link yang akan mengarahkan kita kepada situs atau informasi yang ada relevansinya dengan keyword yang kita masukkan. Yang kerap menjadi kendala adalah kita terkadang kurang tepat atau tidak spesifik dalam memasukkan keyword untuk mencari informasi tertentu, sehingga hasil pencariannya menjadi tidak relevan. Bisa pula kita malahan kebingungan dalam memilah-milah informasi mana yang benar-benar kita dibutuhkan dari sekian ribu hingga jutaan informasi yang dihasilkan oleh sebuah search engine. Dari sekian banyak pilihan search engine di Internet, berdasarkan hasil riset situs situs Searchenginesshowdown.com pada awal Maret 2002, terdapat tiga besar situs search engine yang tengah bersaing menduduki posisi teratas berdasarkan kriteria jumlah ketersediaan informasi, keunikan (ketidak-samaan) informasi yang tersedia di dalam database dan jumlah aktifitas peng-klik-an link informasi oleh pengguna dari yang ditawarkan oleh masing-masing search engine. Kedudukan tiga besar tersebut sementara ini , dipegang oleh situs Google.com pada posisi pertama, posisi kedua oleh situs Wisenut.com dan ketiga adalah situs Alltheweb.com. Harap diingat, Yahoo.com tidak dikategorikan sebagai situs search engine, tetapi sebagai sebuah situs direktori. Beda antara search engine dengan direktori adalah pada jumlah informasi yang tersedia di dalam databasenya. Isi database direktori lebih sedikit ketimbang isi database search engine. Selain itu, informasi di dalam database direktori diseleksi dan diindeks oleh manusia, bukan otomatis oleh program semacam spider, bot ataupun crawler. Pengelola konten sebuah direktori akan memilih dan memeriksa kelayakan sebuah situs sebelum diputuskan untuk dapat masuk dalam direktori berdasarkan kategori yang tersedia. Situs direktori tersebut juga memasang semacam form search engine untuk mencari situs atau informasi di dalam databasenya, berdasarkan keyword yang digunakan. Bahkan Yahoo.com menggandeng Google.com untuk memperkuat pencarian yang dilakukan oleh pengunjungnya. Sehingga apabila seorang pengunjung Yahoo.com tidak menemukan situs atau informasi yang dicarinya dari database direktori Yahoo.com, maka secara otomatis Yahoo.com akan menampilkan serangkaian link-link tambahan yang diambil dari database Google.com dengan keterangan "powered by Google" di atasnya.Ada Apa dengan Google?Tak perlu diperdebatkan lagi, popularitas tertinggi untuk search engine kini berada di tangan Google.com. Popularitas search engine yang dibidani oleh Larry Page dan Sergey Brin (keduanya kandidat Ph.D berusia 28 tahun dari Universitas Stanford Amerika) tersebut didukung dengan kekuatan databasenya yang mengindeks sekian banyak situs-situs Internet di dunia. Pada awal Maret 2002, berdasarkan hasil estimasi situs SearchEnginesShowDown.com, database Google.com telah mengindeks sekitar 968 juta situs Internet. Saat itu Google mengklaim sekitar 1,5 miliar situs di Internet yang telah masuk ke dalam databasenya. Memang luar biasa fenomena yang dibawa oleh Google.com yang secara resmi diluncurkan pada September 199 ini. Setiap harinya sekitar 70 juta proses pencarian dilakukan oleh Google.com. Dengan tampilan yang bersih dari banner iklan dan image yang berat, proses pencarian bisa berlangsung dengan cepat. Iklan-iklan ditempatkan di bagian atas dari hasil sebuah pencarian, dalam bentuk teks biasa dan iklan yang muncul tersebut dikaitkan dengan keyword yang dimasukkan oleh pengguna Google.com. Sehingga kemungkinan iklan tersebut di klik menjadi lebih besar karena memiliki relevansi dengan informasi yang dicari.Bukan secara teknis saja popularitas Google.com berhasil mencuat. Bahkan di Amerika, menurut majalah Newsweek edisi Maret 2002, Google.com telah merasuk secara kultural, khususnya dalam bahasa pergaulan sehari-hari. Kata "google" menjadi kata kerja, seperti contoh kalimat: before a blind date, singles use it to "google" potensial matches to see if they're bla-bla-bla. Kekuatan mesin pencari dan pengindeks (crawler) benar-benar "menakutkan". Pada Februari 2002, beberapa media massa Amerika memberitakan kecemasan beberapa pemilik situs ataupun database di Internet terhadap kekuatan crawler milik Google.com tersebut. Pasalnya, crawler Google.com, sejalan dengan keinginan Page dan Brin, terbukti mampu mengindeks situs dan informasi dari server ataupun database yang tersembunyi di balik firewall atau yang dikhususkan sebagai informasi berbayar. Pantaslah, kiprah Google.com di percaturan search engine mendapatkan anugerah sebagai salah satu search engine terbaik menurut versi situs SearchEngineWatch.com dan situs SearchEnginesShowDown.com.Yang TerhempasBeberapa search engine baru bermunculan dan beberapa yang lainnya berguguran, atau setidaknya tidak dikembangkan lebih lanjut oleh pemiliknya. Google.com, Wisenut.com dan AllTheWeb.com adalah contoh search engine yang berhasil menyodok ke papan atas jajaran elit search engine dunia. Lalu InfoSeek.com dan Excite.com adalah contoh search engine yang berhenti dikembangkan oleh pemiliknya. Infoseek.com pada Juli 1999 berada di bawah GO Network, sebuah jaringan industri berbasis Internet yang dimiliki oleh perusahaan konglomerat industri hiburan, Disney. Kemudian pada Januari 2001, Disney mengumumkan bahwa dirinya enggan melanjutkan bisnis yang ditangani oleh Go Network dan portalnya Go.com. Kemudian pada Maret 2001, situs Go.com berhenti menggunakan fasilitas search engine milik Infoseek.com. Infoseek.com sendiri kemudian menggunakan database milik InfoSpace.com. Situs Excite.com sendiri sejak Desember 2001 telah berhenti sebagai sebuah search engine yang mandiri dengan tidak lagi melakukan proses pencarian dari database miliknya sendiri. Untuk fasilitas pencarian, Excite.com menggunakan database milik situs Overture.com. Padahal sebelumnya, database Excite.com dimanfaatkan oleh Netscape.com dan Aol Netfind. Kini Netscape menggunakan database Google.com, dan AOL menggunakan database Inktomi.comEmpat Search Engine PilihanBerikut ini adalah sekilas uraian empat buah situs search engine, yaitu Google.com, Wisenut.com, Alltheweb.com dan Altavista.com. Keempatnya memiliki satu kesamaan, yaitu sama-sama memiliki fasilitas perlindungan terhadap keluarga berupa pilihan untuk memfilter informasi pornografi agar tidak muncul dalam hasil pencarian.- Google.comBerdasarkan riset yang dilakukan oleh situs Searchenginesshowdown.com pada awal Maret 2002, banyaknya informasi atau situs yang ditampung oleh database Google.com adalah sekitar 968 juta buah. Sedangkan Google.com sendiri saat itu mengklaim sekitar 1,5 miliar buah. Perbedaan ini tentu saja berdasarkan hasil hitung-hitungan yang mendalam oleh SearchEnginesShowDown.com dengan menggunakan metodologi khusus semisal teknik pencarian informasi, perbandingan dengan database search engine lain dan pembedaan antara URL yang diindeks dengan yang tidak diindeks. Keunikan Google.com adalah fasilitas pemilihan jenis bahasa sebagai antarmukanya. Ada 74 bahasa yang bisa dipilih, termasuk bahasa Indonesia, Jawa, Hacker, Urdu, Klingon, dan sebagainya. Google.com mampu menggali informasi ke situs-situs yang memiliki konten dengan 35 bahasa yang berbeda. Selain itu, search engine ini juga dilengkapi dengan fasilitas SafeSearch yang fungsinya untuk melakukan pemfilteran terhadap situs-situs pornografi agar tidak muncul (www.google.com/preferences?hl=en). Fasilitas SafeSearch ini terdiri atas dua jenis, yaitu yang strict dan moderate. Untuk mode strict, maka yang diblok selain gambar juga teks. Sedangkan mode moderate hanya memfilter gambarnya saja. Google.com juga menyediakan form isian bagi orang yang ingin situsnya masuk dalam database (http://www.google.com/addurl.html).Google.com adalah satu-satunya search engine umum yang menyimpan informasi situs ketika pertama kali mereka di indeks, biasa disebut sebagai cached pages. Sehingga meskipun suatu situs telah mati tetapi masih terdapat link-nya di dalam database Google.com, maka kita masih bisa melihat tampilan atau membaca isi situs tersebut. Selain mampu mencari informasi di situs Internet, Google.com juga mampu membongkar isi file yang berakhiran pdf, doc, xls, ppt, rtf, ps, txt, wpd, asp dan lainnya. Google.com juga menyediakan subset khusus bagi beberapa topik khusus, semisal tentang Linux (google.com/linux), universitas (google.com/universities.html) dan Microsoft (google.com/microsoft.html). Database Google.com yang terbesar saat ini tersebut dimanfaatkan pula oleh Yahoo.com sebagai back-end search engine. Yahoo.com mulai menggunakan database Google.com tersebut terhitung sejak Juli 2000. Google.com juga menyediakan fasilitas Google Toolbar yang dapat dipasang di browser Internet Explorer. Kelemahan Google.com antara lain adalah tidak semua operasi Boolean dapat dijalankan.- Wisenut.comSearchenginesshowdown.com pada awal Maret 2002 menyatakan bahwa banyaknya informasi atau situs yang ditampung oleh database Wisenut.com adalah sekitar 579 juta buah. Sedangkan Wisenut.com mengklaim sekitar 1,5 miliar buah yang telah masuk dalam databasenya. Wisenut.com, sebagaimana layaknya sebuah search engine generasi terbaru, bebas dari banner iklan dan aneka image yang memberatkan. Tampilannya yang sederhana mempercepat mengaksesan halaman depan dan proses penampilan hasil yang dicari. Wisenut.com mampu mencari informasi ke konten dengan 25 bahasa dunia yang berbeda, tetapi tidak ada bahasa Indonesia. Encoding languange Wisenut.com juga mampu beralih ke 21 kode bahasa. Wisenut.com dilengkapi pula dengan fasilitas WiseWatch, yang fungsinya untuk melakukan pemfilteran konten-konten pornografi (/www.wisenut.com/preferences). Search engine yang secara resmi diluncurkan pada September 2001 ini menyediakan pula form isian bagi orang yang ingin mencantumkan situsnya ke dalam database (www.wisenut.com/submitsite.html).- Alltheweb.comAlltheweb.com pada awal Maret 2002 mengklaim dirinya telah memasukkan sekitar 507 juta informasi dan situs ke databasenya, tetapi Searchenginesshowdown.com menyatakan lebih banyak, yaitu sekitar 580 juta buah. Alltheweb.com yang merupakan layanan dari FastSearch.com, diluncurkan pada Mei 1999 dengan menggunakan nama Fast. Kemudian pada Juli 2001, dilakukan re-disain pada Fast dan mulai menggunakan nama AllTheWeb. Selain mencari informasi di situs-situs Internet, Alltheweb.com juga dilengkapi dengan kemampuan mencari informasi berupa gambar video, MP3 dan file FTP. Dalam proses penyimpanan ke dalam database, search engine ini mampu melakukan pengindeksan terhadap satu halaman penuh, berbeda dengan Google.com yang hanya mampu mengindeks sebesar 110 Kb pertama dari halaman sebuah situs. Meskipun demikian, Alltheweb.com tidak mampu mencari file-file PDF dan tidak pula menyediakan fasilitas cached sebuah situs. Alltheweb.com mampu mencari informasi ke konten dengan 47 bahasa dunia yang berbeda, termasuk bahasa Indonesia. Sedangkan encoding languange yang digunakan Wisenut.com juga mampu beralih ke 21 kode bahasa. Sebagai tambahan, fasilitas untuk memfilteran konten-konten pornografi juga disediakan oleh Wisenut.com (http://www.alltheweb.com/customize?page=filter). Tersedia pula form isian bagi orang yang ingin mencantumkan situsnya ke dalam database Alltheweb.com (http://www.alltheweb.com/add_url.php).- Altavista.comAltavista.com adalah salah satu veteran search engine terbesar. Selama bertahun-tahun, sebelum kelahiran situs-situs search engine di atas, Altavista.com merupakan search engine yang cukup diperhitungkan. Pada masa jayanya, Altavista.com mampu menampilkan serangkaian informasi dari database situs lain, semisal dari AskJeeves.com, RealNames.com dan LookSmart.com. Tetapi pada Mei 2001, kejayaan tersebut mulai luntur sehingga banyak dari tambahan informasi tersebut lenyap atau tidak muncul sebagai mestinya. Altavista.com pada awal Maret 2002 mengklaim dirinya telah memasukkan sekitar 500 juta informasi dan situs ke databasenya, tetapi Searchenginesshowdown.com menyatakan hanya sekitar 397 juta buah. Selain mencari informasi di situs, Altavista.com dilengkapi dengan database informasi tentang gambar, MP3/audio, video, direktori dan berita. Keunggulan search engine ini adalah kemampuannya melakukan operasi Boolean AND, OR, NOT dan AND NOT. Kelemahannya adalah tidak banyak file komputer yang bisa diaksesnya, semisal file PDF. Alltheweb.com mampu mencari informasi ke konten dengan 15 bahasa dunia yang berbeda, tanpa bahasa Indonesia. Tersedia form isian bagi yang ingin mencantumkan situsnya ke dalam database Altavista.com. (www.altavista.com/r?h18). Search engine ini juga dilengkapi dengan fasilitas Family Filter untuk memfilter situs-situs pornografi agar tidak muncul dalam hasil pencarian (/www.altavista.com/sites/search/ffset).*) Penulis adalah Koordinator ICT Watch dan jurnalis TI independen. Dapat dihubungi melalui e-mail donnybu@ictwatch.com. Tulisan ini pernah dimuat oleh Infonet/Infokomputer, vol.IV no.5 - 2002. Tulisan ini bebas dikutip asal menyebutkan sumbernya.
Web browser adalah sebuah perangkat lunak yang memungkinkan penggunan untuk menampilkan dan berinteraksi dengan text, gambar, and informasi yang ada pada halaman web pada sebuah di World Wide Web (WWW) atau local area network (LAN). (Web01, Web02).Meskipun hasil survei dalam kurun waktu Juli 2005 sampai dengan Juli 2006 menunjukkan IE tetap mempunyai pangsa pasar tertinggi, namun Firefox 2.0 buatan Mozilla telah didownload sebanyak dua juta kali hanya dalam waktu 24 jam sejak pertama kali ditaruh di internet. Pertumbuhan browser Firefox cukup pesat salah satu sebab utamanya karena didukung para pengguna internet dan komunitas open-source. Mereka lebih memilih browser bikinan Mozillakarena faktor keamanan yang lebih andal dibanding Internet Explorer milik Microsoft (Web03).
Meskipun pemilihan browser sangat bergantung minat perseorangan, ada beberapa hal/fitur yang dapat menjadikan browser yang satu lebih baik daripada browser yang lainnya (Web04).Dengan mengetahui fitur yang dimiliki/didukung oleh browser kita dapat melihat seberapa baik satu browser jika dibandingkan dengan yang lainnya. Sekilas Tentang Web Browser Web browser adalah sebuah perangkat lunak yang memungkinkan penggunan untuk menampilkan dan berinteraksi dengan text, gambar, and informasi yang ada pada halaman web pada sebuah di World Wide Web (WWW) atau local area network (LAN). Yang paling popular saat ini adalah Firefox 2.0, termasuk graphical browsers, yang berarti dapat menampilkan graphics ataupun text dengan sama baiknya. Sebagian browser modern dapat mempresentasikan multimedia, termasuk suara dan video, meskipun memerlukan beberapa plug-in untuk format tertentu. (Web01, Web02)
Tabel 1 menunjukkan trend pangsa pasar browser. Meskipun dalam kurun waktu tersebut Internet Explorer tetap mempunyai pangsa pasar tertinggi, namum Firefox 2.0 buatan Mozilla telah didownload sebanyak dua juta kali hanya dalam waktu 24 jam sejak pertama kali ditaruh di internet. Pertumbuhan browser Firefox cukup pesat salah satu sebab utamanya karena didukung para pengguna internet dan komunitas open-source. Mereka lebih memilih browser bikinan Mozilla karena faktor keamanan yang lebih andal dibanding Internet Explorer milik Microsoft (Web03).Tabel 1 Trends on Pangsa Pasar Browser Browser Ranking Persentase Internet Explorer 1 75.88% Firefox 2 13.71% Netscape 3 4.98% AOL 4 2.95% Mozilla 5 0.76% Opera 6 0.72%Browser dapat dibedakan satu sama lainnya dengan melihat fitur yang didukungnya. Browser modern and halaman web saat ini lebih cenderung memaksimalkan banyak fitur dan teknik yang belum digunakan pada web terdahulu.
Browsers berkomunikasi dengan web server utamanya melalui hypertext transfer protocol (HTTP) untuk meminta halaman web. Halaman web dialamati dengan menggunakan uniform resource locator (URL), yang mewakili alamat dengan awalan http: untuk akses via HTTP. Browser pada umumnya juga mendukung berbagai jenis URL dan protokol, misalnya ftp: untuk file transfer protocol (FTP), rtsp: untuk real-time streaming protocol (RTSP), and https: untuk versi http yang terenkripsi (SSL). File format sebuah halaman web biasanya hyper-text markup language (HTML) dan diidentifikasikan dalam protokol HTTP menggunakan header MIME, format lainnya antara lain XML dan XHTML. Sebagian besar browser mendukung bermacam format tambahan pada HTML seperti format gambar JPEG, PNG and GIF image formats, dan dapat dikembangkan dukungannya misal terhadap SVG dengan menambahkan/menggunakan plugin. Untuk melayout halaman web dapat digunakan standart cascading style sheets (CSS). Beberapa browser populer sudah memberikan dukungan tambahan terhadap Internet relay chat (IRC) untuk mendukung chatting, and dapat digunakan sebagai e-mail client. Protokol yang didukung termasuk network news transfer protocol (NNTP), simple mail transfer protocol (SMTP), Internet message access protocol (IMAP), dan post office protoco(POP).
Fitur standart lainnya dari browser adalah dukungan terhadap active content/JavaScript (Dynamic HTML) and Cookies, sebagian besar pengguna internet melakukan browsing tanpa mengetahui apa proses yang terjadi dibalik interaksi dengan internet. Active content misalnya Javascript atau HTML yang dinamis (DHTML) dan cookies yang mungkin memunculkan resiko tersebunyi jika aktif/ditampilkan di browser ataupun email client. Active content digunakan untuk meningkatkan functionality atau menambah kemudahan disain dimana halaman web didasarkan pada scripts yang mengeksekusi program pada web browser. Scripts inilah yang sering digunakan untuk download atau mengeksekusi kode-kode/script yang beresiko pada komputer pengguna. Tidak selalu JavaScript dan and active content berbahaya meskipun merupakan cara yang umum digunakan oleh penyusup. Sementara itu cookies mungkin sekali mengkoleksi dan menyimpan informasi selama pengguna menjelajahi internet. Session cookies menyimpan informasi selama pengguna menggunakan browser, sementara Persistent cookies disimpan pada komputer pengguna sehingga data preferensi pengguna dapat disimpan (McDowell 2004).
Bookmark manager, merupakan petunjuk kesuatu URL dan hampir semua web browser mendukung fitur ini. Mempermudah dalam melakukan katalog dan akses pada suatu halaman web yang telah atau akan dikunjungi tanpa harusmengingat URL-nya. Fasilitas Caching dari isi halaman web memungkinkan misalnya halaman web dan gambarnya dengan tujuan untuk mereduksi penggunaan bandwidth, mengurangi kesibukan web server, mencegah terjadinya lag. Browser mendukung berbagai tipe media melalui plugin seperti Macromedia Flash dan QuickTime.
Fitur autocompletion pada pengisian alamat URL dan pengisian data pada form form data merupakan fitur yang disediakan oleh banyak text editors, word processor, dan tentunya web browser. Fitur ini mempunyai kemampuan memprediksi kata atau frase yang mungkin akan diketikan oleh user tanpa user harus mengetik secara lengkap. Tabbed document interface (TDI) merupakan fitur yang banyak dijumpai pada perangkat lunak berbasis grafis (graphical user interfaces (GUI)), sebuah TDI memungkinkan beberapa dokument ditampilkan pada satu jendela, dan menggunakan tab sebagai alat navigasi.
Kemampuan web browser dalam menanggulangi iklan pop-up yang sering muncul jika kita membuka jendela baru, juga perlu dipertimbangkan. Selain itu adakah kemampuan advert filtering yaitu kemampuan untuk mencegah munculnya isi yang bersifat iklan pada suatu halaman web? Atau adakah kemampuan mencegah phishing yaitu kegiatan kriminal yang umunya berusaha menumpulkan informasi penting dan sensitive misal password atau nomor kartu kredit. Kebanyakan phishing dilakukan menggunakan email atau instant message.
KesimpulanBeberapa fitur diatas dapat dijadikan bahan pertimbangan dalam pemelihan browser yang akan digunakan. Secara garis besar misalnya Internet Explorer(IE) nyaman digunakan untuk membaca halaman web, tetapi dalam hal mendownload masih kalah jika dibandingkan dengan Opera. Firefox bersifat free dan open source, banyaknya plugin dan mudah mengganti tampilan firefox melalui skins yang banyak tersedia.
Opera menampilkan halaman web dengan baik meskipun dalam koneksi lambat. Kemampuannya dalam mendownload file lebih baik daripada yang lainnya. Sayangnya browser ini kurang support terhadap ajax. Fasilitas-fasilitas di google seperti google calendar, google page, google spreadsheet juga tidak dapat dijalankan dengan opera.