Rabu, 21 Oktober 2009

Dunia Icang69

Dunia Icang69

Link to Dunia Icang69

Algoritma Bread-First Search Engine

Posted: 19 Oct 2009 09:45 PM PDT

Tak disangka ketika sedang asik berselancar di dunia maya, datang dosen dan menyodorkan sebuah tesis dari S2. Saya diminta untuk melanjutkan. Kebetulan saya lagi mengambil tugas akhir (skripsi) dan belum punya judul. Materinya sangat bagus dan menarik. Yaitu tentang algoritma Bread-First Search (BFS). Algoritma ini digunakan untuk oleh mesin pencari seperti google untuk menjelajah dunia internet (crawl). Jika kita bisa mengerti algoritmanya, mudah-mudahan kita bisa lebih baik dalam SEO.

Algoritma Bread-First Search (BFS) merupakan metode yang digunakan oleh aplikasi clawler, spider atau googlebot (Google) dalam menentukan halaman berikutnya yang akan dijelajahi. Dalam algoritma ini, seluruh link dari sebuah halaman web akan dikunjungi terlebih dahulu setelah itu mengunjungi halaman web n+1 selanjutnya. Begitu seterusnya tanpa terlupa. Jadi bukan menjelajahi seperti bentuk pohon/akar (tree) yang dari kakek ke ayah terus ke anak dan jika buntu akan kembali ke atas.


Dari sini mesin pencari bisa menentukan dengan mudah link popularity sebuah situs. Seberapa banyak link yang tertuju dalam sebuah halaman. Jika sebuah halaman kembali dikunjungi maka akan berhenti dan melanjutkan link berikutnya. Makin banyak link dari luar (situs) yang tertuju ke sebuah halaman maka lebih bagus. Artinya halamannya dianggap dijadikan rujukan banyak situs. Begitu juga sebaliknya sebuah halaman terlalu banyak link keluarnya maka dianggap tidak bermutu oleh mesin pencari. Karena bikin cape' clawler. Tapi ini bisa disiasati dengan memberikan link keluar dengan status nofollow.

Beberapa situs dengan baik menjaga linknya. Contohnya Wikipedia. Tak membiarkan setiap link keluar tanpa rel=nofollow. Sedangkan setiap kata yang penting diberi link ke halaman dimana kata itu dijelaskan. Jadi jangan heran jika kita mencari sebuah kata kunci di google maka wikipedia berada di urutan teratas. Ini karena konstruksi linknya sangat kuat dari dalam serta banyak juga link dari luar.

Kembali ke soal skripsi. Karena aku seorang mahasiswa program studi statistika jurusan matematika maka tugas akhirnya juga harus berhubungan dengan statistik atau matematika. Minimal berhubungan dengan data dan menghitung-hitung peluang. Sejujurnya aku lebih suka di bidang komputasi atau aplikasi dibandingkan harus membahasnya dengan aljabar, pemodelan, statistik apa lagi analisis.

Saya masih bingung mau membahasnya bagian yang mana. Kalau saya di bidang informatika mungkin bisa lebih mudah. Oleh karena itu, saya minta bantuan teman-teman, sebaiknya bagian mana yang cocok untuk dibahas. Dan kalau boleh juga minta referensinya. Tentunya dengan kata kunci BFS dan statistika/matematika. Kalau skripsinya sudah jadi, jangan kuatir nanti saya bagikan.

Tapi jangan minta untuk bagaimana cara menghitung pagerank. Karena itu rahasia perusahaan google. Dan saya sendiri sudah dibuat pusing dengan naik turunnya PR. Hanya dalam waktu tiga bulan PR blog ini langsung loncat menjadi 3 tanpa saya bisa melihat PR0, PR1 apa lagi PR2. Dan beberapa bulan kemudian PRnya anjlok menjadi tanda tanya. Kemudian kembali lagi menjadi PR3.

Perlu ditambahkan bahwa dalam tesis yang saya sebutkan diatas digunakan sebuah program yang bernama httrack. Program ini mengkopi/download sebuah situs online sehingga bisa dijalankan offline di localhost. Setiap link yang diklik akan terbuka layaknya sedang online untuk kedalaman tertentu di localhost. Program ini juga memberikan laporan tentang kemana saja link dari sebuah halama tertuju.


Tidak ada komentar:

Posting Komentar