等級:職業俠客 文章:449 積分:3581 註冊:2011-10-26 |
Google和Baidu收錄網站頁面的標準是不同的。我用一句話來形容,就是Google更樂于收錄大站的頁面,百度則樂于收錄新站的頁面。 為此我做一個實驗:先申請了一個新域名,在上面放一個網站,然后不在其他任何網站做鏈接,而直接往百度和Google搜索引擎的提交頁面進行提交。一個月過去了,百度收錄的網頁是24,900篇,Google收錄的網頁是0,這證實了我以前的猜測。
這說明了什么呢?說明百度比Google好嗎?絕對不是的。因為Baidu和Google收錄頁面的標準是完全不同的。
Google是按照網頁級別(PageRank)來收錄的,只要網站有一定的網頁級別,Google會快速收錄的,而沒有網頁級別的網站,Google則堅決不去收錄。Baidu則很夸張,采用的是來者不拒,多多益善的原則,無休止的進行收錄。Baidu的這種不按網頁級別的收錄方式其實有很大的惡果,最主要的惡果是造成大量的垃圾網站流行,因為只要做一個垃圾站,Baidu就會立刻收錄(25000頁以內),這等于變相的鼓勵大家去做垃圾站,去盲目采集。當垃圾站橫行的時候,Baidu再通過人工的方式封站,甚至一些百度業務員對于大流量的網站還會要求其站長辦理百度競價排名。
這兩種收錄方式哪種更好呢?我個人認為Google的這種收錄方式是比較科學的。因為互聯網上的頁面是個天文數字,收錄應該是有選擇的收錄,好的網站則多收錄,新站則應該少收錄,等其慢慢知名了以后再多收錄,這樣也提高了效率,讓用戶搜索到更好的頁面而不是更多的頁面。如果對于新站不做分析就快速收錄,那么會使得從技術上對抗惡意網站作弊(SEO)變得非常困難,Google通過給予新站給出一定的“考察期”來分析這個新站是否是作弊的垃圾站,而百度就只能依*人工方式手動地刪除垃圾站。對于收錄網站的具體操作上,Google的爬蟲顯得較為“體貼”站長-Google爬蟲占用服務器的資源非常少,通常是先用head來查看網頁是否更新,如果更新了再抓取整個頁面,這種方法耗費流量較少。而百度則不管三七二十一上來就抓整個站,有時甚至不遵守robots規則,而且其爬蟲數量非常龐大,對于頁面較多的網站通常會耗費驚人的流量,并且常常造成惡劣的后果。
當然,百度這種“貪婪”爬蟲抓取方法,雖然會讓用戶能夠在百度搜索出一些Google里搜索不到的頁面,但這實在是損人利己。其帶給網站站長不少負面效果:服務器和帶寬資源過度消耗,垃圾站被變相鼓勵了,原創的有特色的網站則被邊緣化,MP3音樂網站則更苦不堪言-自己的MP3被百度盜鏈后帶來大量文件下載卻沒有帶來頁面訪問。
因此,中國的網民也出現了很奇怪的現象:大量的新網民和菜鳥新手喜歡用百度搜索,因為百度往往搜索到很多別處搜索不到的頁面,但內容的匹配度則令人質疑,而專業人士和老鳥則更喜歡用Google,個人站長則普遍和百度有“個人恩怨”。因此百度在業界的Blog以及社區中口碑都不太好,但在普通的低層次的網民心中卻不錯,這些大量的普通網民給百度帶來了大量流量。文章來源:http://www.wowggmm.cn
|
|
|