• 電話:0535-6266360
      • 微信號:kuaiwang002
      • 網(wǎng)址:www.rencaiputian.com
      • 地址:山東省煙臺市芝罘區(qū)青年路16號匯通商務(wù)大廈5層

      建立符合搜索抓取習(xí)慣的網(wǎng)站

      時間:2013-09-14 10:01:02 | 點(diǎn)擊:

      作者:百度站長平臺lee            發(fā)布時間:2013年9月12日

      編者按:前兩周簡要地給大家介紹了搜索抓取系統(tǒng)工作原理,根據(jù)該工作原理今天簡要介紹一下如何建立網(wǎng)站是符合搜索引擎抓取系統(tǒng)習(xí)慣的。

      1、簡單明了的網(wǎng)站結(jié)構(gòu)

      Spider抓取相當(dāng)于對web這個有向圖進(jìn)行遍歷,那么一個簡單明了結(jié)構(gòu)層次分明的網(wǎng)站肯定是它所喜歡的,并盡量保證spider的可讀性。

      (1)樹型結(jié)構(gòu)*優(yōu)的結(jié)構(gòu)即“首頁—頻道—詳情頁”;

      (2)扁平首頁到詳情頁的層次盡量少,既對抓取友好又可以很好的傳遞權(quán)重。

      (3)網(wǎng)狀保證每個頁面都*少有一個文本鏈接指向,可以使網(wǎng)站盡可能全面的被抓取收錄,內(nèi)鏈建設(shè)同樣對排序能夠產(chǎn)生積極作用。

      (4)導(dǎo)航為每個頁面加一個導(dǎo)航方便用戶知曉所在路徑。

      (5)子域與目錄的選擇相信有大批的站長對此有疑問,在我們看來,當(dāng)內(nèi)容較少并且內(nèi)容相關(guān)度較高時建議以目錄形式來實(shí)現(xiàn),有利于權(quán)重的繼承與收斂;當(dāng)內(nèi)容量較多并且與主站相關(guān)度略差時建議再以子域的形式來實(shí)現(xiàn)。

      2、簡潔美觀的url規(guī)則

      (1)**性網(wǎng)站中同一內(nèi)容頁只與**一個url相對應(yīng),過多形式的url將分散該頁面的權(quán)重,并且目標(biāo)url在系統(tǒng)中有被濾重的風(fēng)險(xiǎn);

      (2)簡潔性動態(tài)參數(shù)盡量少,保證url盡量短;

      (3)美觀性使得用戶及機(jī)器能夠通過url即可判斷出頁面內(nèi)容的主旨;

      我們推薦如下形式的urlurl盡量短且易讀使得用戶能夠快速理解,例如使用拼音作為目錄名稱;同一內(nèi)容在系統(tǒng)中只產(chǎn)生**的url與之對應(yīng),去掉無意義的參數(shù);如果無法保證url的**性,盡量使不同形式的url301到目標(biāo)url;防止用戶輸錯的備用域名301*主域名。

      3、其他注意事項(xiàng)

      (1)不要忽略倒霉的robots文件,默認(rèn)情況下部分系統(tǒng)robots是封禁搜索引擎抓取的,當(dāng)網(wǎng)站建立后及時查看并書寫合適的robots文件,網(wǎng)站日常維護(hù)過程中也要注意定期檢查;

      (2)建立網(wǎng)站sitemap文件、死鏈文件,并及時通過百度站長平臺進(jìn)行提交;

      (3)部分電商網(wǎng)站存在地域跳轉(zhuǎn)問題,有貨無貨建議統(tǒng)一做成一個頁面,在頁面中標(biāo)識有無貨即可,不要此地區(qū)無貨即返回一個無效頁面,由于spider出口的有限性將造成正常頁面無法收錄。

      (4)合理利用站長平臺提供的robots、sitemap、索引量、抓取壓力、死鏈提交、網(wǎng)站改版等工具。




      本文關(guān)鍵詞:煙臺網(wǎng)絡(luò)公司


      選擇網(wǎng)絡(luò)公司做網(wǎng)站,都看中什么