網(wǎng)絡蜘蛛雖然不是人,但它同樣也有范圍,很顯然對于如大海般浩瀚的網(wǎng)絡世界來說,網(wǎng)絡蜘蛛抓取互聯(lián)網(wǎng)上所有的網(wǎng)頁幾乎是不可能的,從目前公布的數(shù)據(jù)來看,容量最大的搜索引擎不過是抓取了整個網(wǎng)頁數(shù)量的40%左右,有很多網(wǎng)頁根本無法被收錄。因此,要想讓網(wǎng)絡蜘蛛抓到你,要想讓客戶能從搜索引擎中找到你的信息,就必須先做好網(wǎng)站收錄工作。
筆者一直都認為這個網(wǎng)絡蜘蛛很人性化。因此,下面了解一下網(wǎng)絡蜘蛛的工作原理。要想網(wǎng)站被百度收錄可以從以下八個方面入手。
(1) 向百度提交你的網(wǎng)站,這對新網(wǎng)站而言尤其重要,網(wǎng)絡蜘蛛也喜歡認識“新朋友”,像百度提交你的網(wǎng)站就好像你向百度提交你的“名片”一樣,讓人家記住你。一般情況下,網(wǎng)絡蜘蛛會在1~4周的時間對你的網(wǎng)站作出收錄回應。提交網(wǎng)站時只要提交網(wǎng)站首頁就可以了,沒必要提交內(nèi)容網(wǎng)頁,因為只要給網(wǎng)絡蜘蛛一個開頭,它就會自動爬遍每個“角落”。
百度網(wǎng)站提交網(wǎng)址為:http://ziyuan.baidu.com/linksubmit/url
(2) 適度競價排名。雖然百度收錄只與網(wǎng)頁價值有關,與競價排名等商業(yè)因素沒多大關系,但如果你的網(wǎng)站還未被百度收錄,進行競價排名不失為一種良策,此時網(wǎng)站猶如在“行賄”一樣,提醒百度蜘蛛記住你。
(3) 設置友情鏈接。這里的友情鏈接是指有“質(zhì)量”的友情鏈接,而不是垃圾鏈接(垃圾鏈接太多,反而會讓百度蜘蛛生厭,有損網(wǎng)絡收錄),這個過程猶如從別人的網(wǎng)頁上搭“橋”過來。在百度蜘蛛收錄別人的同時,順著“橋”會爬到你的網(wǎng)頁中。
(4) 給每個網(wǎng)頁加上與正文相關的標題。之所以說百度蜘蛛具有人性,其原因是百度只會收錄符合用戶搜索體驗的網(wǎng)頁或網(wǎng)站。給每個網(wǎng)頁加上標題,無疑就是為了符合人的閱讀習慣,即往往是先看標題是否感興趣,再決定是否看內(nèi)容。對于網(wǎng)頁標題的設置必須保證標題中的關鍵詞與正文有關,如果是網(wǎng)站首頁,那么標題最好是網(wǎng)站的名稱或公司的名稱,如果是其余頁面,標題最好是正文內(nèi)容的提煉。
(5) 設置最容易提取的網(wǎng)頁形態(tài)。網(wǎng)絡蜘蛛能抓取下來的網(wǎng)頁有html、圖片、doc、pdf、多媒體、動態(tài)網(wǎng)頁及其他格式。這些文件抓取下來后,需要把這些文件中的文本信息提取出來,相對而言,doc、pdf等文檔比HTML、圖片、多媒體等文檔更容易提取,靜態(tài)網(wǎng)頁比動態(tài)網(wǎng)頁更容易提取。
(6) 提高網(wǎng)頁的質(zhì)量。百度蜘蛛更喜歡高質(zhì)量的網(wǎng)頁,因此網(wǎng)頁內(nèi)容最好是原創(chuàng)性文章。如果是復制的文章有可能不會被收錄。
(7) 經(jīng)常保持網(wǎng)站更新。經(jīng)常更新的網(wǎng)站,網(wǎng)絡蜘蛛就會經(jīng)常光顧,而長期不更新的網(wǎng)站,網(wǎng)絡蜘蛛到訪會減少。同時,網(wǎng)站的更新時間最好是在工作日的9點到10點,這個時候是網(wǎng)絡蜘蛛進行重新梳理的最佳時間,因為百度收錄除了機器收錄之外,還有人工收錄方式。
(8) 如果上述工作都做了,還是沒有被百度收錄,你也可以發(fā)信息到webmaster baidu.com去詢問。
本文鏈接:http://www.5thwavemovie.net/xinwenzhongxin/563.html
|