国产男女精品_免费黄网在线观看_av综合在线观看_在线v片_欧美一区二区三区激情视频_99视频只有精品

18577034138
如何利用robots文件提高動態網站的抓取效率?

概述:

動態網站并不值得擔心,搜索引擎可以正常抓取動態鏈接,但利用robots文件可以輕松提高動態網站的抓取效率。我們都知道,robots協議(也稱為爬蟲協議、機器人協議等)的全稱是“網絡爬蟲排除標準”(Robots Exclusion Protocol),網站通過Robots協議告訴搜索引擎哪些頁

動態網站并不值得擔心,搜索引擎可以正常抓取動態鏈接,但利用robots文件可以輕松提高動態網站的抓取效率。我們都知道,robots協議(也稱為爬蟲協議、機器人協議等)的全稱是“網絡爬蟲排除標準”(Robots Exclusion Protocol),網站通過Robots協議告訴搜索引擎哪些頁面可以抓取,哪些頁面不能抓取。Robots協議的本質是網站和搜索引擎爬蟲的溝通方式,用來指導搜索引擎更好地抓取網站內容。

百度官方是推薦所有的網站都使用robots文件,以便更好地利用蜘蛛的抓取。其實robots不僅僅是告訴搜索引擎哪些不能抓取,更是網站優化的重要工具之一。

robots文件實際上就是一個txt文件。其基本的寫法如下:

 User-agent: * 這里的*代表的所有的搜索引擎種類,*是一個通配符 Disallow: /admin/ 這里定義是禁止爬尋admin目錄下面的目錄  Disallow: /require/ 這里定義是禁止爬尋require目錄下面的目錄  Disallow: /ABC/ 這里定義是禁止爬尋ABC目錄下面的目錄  Disallow: /cgi-bin/?.htm 禁止訪問/cgi-bin/目錄下的所有以".htm"為后綴的URL(包含子目錄)。  Disallow: /??* 禁止訪問網站中所有的動態頁面  Disallow: /.jpg$ 禁止抓取網頁所有的.jpg格式的圖片  Disallow:/ab/adc.html 禁止爬取ab文件夾下面的adc.html文件。  Allow: /cgi-bin/ 這里定義是允許爬尋cgi-bin目錄下面的目錄  Allow: /tmp 這里定義是允許爬尋tmp的整個目錄  Allow: .htm$ 僅允許訪問以".htm"為后綴的URL。  Allow: .gif$ 允許抓取網頁和gif格式圖片
在網站優化方面,利用robots文件告訴搜索引擎哪些是重要的內容,不重要的內容均推薦用robots文件來禁止抓取。不重要的內容的典型代表:網站的搜索結果頁面。

對于靜態網站來說,我們可以利用Disallow: /??*來禁止動態頁面抓取。但對于動態網站來說,就不能簡單地這樣做了。不過對于動態網站的站長來說,也無需過于擔心,搜索引擎現在可以正常地抓取動態頁面。那么在寫的時候,就要注意了,我們可以具體到搜索文件的名稱來寫。比如你的站是search.asp?后面一大串,那么可以這樣寫:

Disallow: /search.asp?*

這樣就可以屏蔽搜索結果頁面了,寫好了可以到百度站長平臺檢測robots一下,看看有沒有錯誤!可以輸入網址檢測一下,是不是正常生效了。

主站蜘蛛池模板: 亚洲伦理一区二区三区| 免费av网站在线看| 日韩毛片网站| 麻豆国产在线播放| 久久国产精品久久久| 日女人网站| 亚洲毛片在线看| 国产成人99久久亚洲综合精品| 亚洲色图网址| 国产精品四虎| 色婷婷在线观看视频| 午夜免费在线观看| 欧美1级片| 日韩影视一区二区三区| 日韩av在线免费播放| 欧美成人三级在线观看| av激情网| 国产一区99| 91成人看片| 在线视频天堂| 狠狠操欧美| 少妇av片在线观看| 亚洲天天综合| 激情爱爱网| 精品视频久久久久久| 日韩少妇毛片| 午夜久久影院| 一级激情视频| av毛片在线播放| 青青国产在线视频| 91免费版在线观看| 欧美成人精品欧美一级| av毛片网站| 亚洲少妇一区二区| 成人国产片女人爽到高潮| 日韩av午夜| 男人日女人免费视频| 男人爱看的网站| 九九久久九九久久| wwwav视频| 黄色一及毛片|