返回頂部
關閉軟件導航
位置:首頁 > 技術分享 > SEO優化>談談網站優化中如何用好robotx文件

搜索引擎使用spider程序自動訪問互聯網上的網頁并獲取網頁信息。spider在訪問個網站時,會首先會檢查該網站的根域下是否有個叫做robots.txt的純文本文件。您可以在您的網站中創建個純文本文件robots.txt,在文件中聲明該網站中不想被robot訪問的部分或者指定搜索引擎只收錄特定的部分。

請注重,僅當您的網站包含不希望被搜索引擎收錄的內容時,才需要使用robots.txt文件。假如您希望搜索引擎收錄網站上所有內容,請勿建立robots.txt文件或者創建個內容為空的robots.txt文件。

robots.txt放置位置

robots.txt文件應該放置在網站根目錄下。舉例來說,當spider訪問個網站(比如)時,首先會檢查該網站中是否存在這個文件,假如

Spider找到這個文件,它會根據這個文件的內容,來確定它訪問權限的范圍。

robots.txt格式

文件包含條或更多的記錄,這些記錄通過空行分開(以CR,CR/NL,

or

NL作為結束符),每條記錄的格式如下所示:”:”。在該文件中可以使用#進行注解。該文件中的記錄通常以行或多行User-agent開始,后面加上若干Disallow和Allow行,具體情況如下。

User-agent:

該項的值用于描述搜索引擎robot的名字。在”robots.txt”文件中,假如有多條User-agent記錄說明有多個robot會受到”robots.txt”的限制,對該文件來說,少要有條User-agent記錄。

假如該項的值設為*,則對任何robot均有效,在”robots.txt”文件中,”User-agent:*”這樣的記錄只能有條。假如在”robots.txt”文件中,加入”User-

agent:SomeBot”和若干Disallow、Allow行,那么名為”SomeBot”只受到”User-agent:SomeBot”后面的

談談網站優化中如何用好robotx文件

Disallow和Allow行的限制。Disallow:

該項的值用于描述不希望被訪問的組URL,這個值可以是條完整的路徑,也可以是路徑的非綴,以Disallow項的值開頭的URL不會被robot訪問。例

如”Disallow:/help”禁止robot訪問/help*.html、/help/index.html,而”Disallow:

/help/”則答應robot訪問/help*.html,不能訪問/help/index.html。

"Disallow:"說明答應robot訪問該網站的所有url,在”/robots.txt”文件中,少要有條Disallow記錄。假如”/robots.txt”不存在或者為空文件,則對于所有的搜索引擎robot,該網站都是開放的。

Allow:

該項的值用于描述希望被訪問的組URL,與Disallow項相似,這個值可以是條完整的路徑,也可以是路徑的前綴,以Allow項的值開頭的URL是答應robot訪問的。例如”Allow:/hibaidu”答應robot訪問/hibaidu.htm、/hibaiducom.html、

/hibaidu/com.html。個網站的所有URL默認是Allow的,所以Allow通常與Disallow搭配使用,實現答應訪問部分網頁同時禁止訪問其它所有URL的功能。

需要尤其注重的是Disallow與Allow行的順序是有意義的,robot會根據第個匹配成功的Allow或Disallow行確定是否訪問某個URL。

使用”*”和”$”:Baiduspider支持使用通配符”*”和”$”來模糊匹配url。“$”匹配行結束符。“*”匹配0或多個任意字符。

robots.txt文件用法舉例:

1.答應所有的robot訪問

User-agent:*Allow:/或者User-agent:*Disallow:

2.禁止所有搜索引擎訪問網站的任何部分

User-agent:*

Disallow:/

3.僅禁止Baiduspider訪問您的網站

User-agent:Baiduspider

Disallow:/

4.僅答應Baiduspider訪問您的網站

User-agent:Baiduspider

Disallow:

5.禁止spider訪問特定目錄

User-agent:*

Disallow:/cgi-bin/

Disallow:/tmp/

Disallow:/~joe/

6.答應訪問特定目錄中的部分url

User-agent:*

Allow:/cgi-bin/see

Allow:/tmp/hi

Allow:/~joe/look

Disallow:/cgi-bin/

Disallow:/tmp/

Disallow:/~joe/

7.使用”*”限制訪問url

禁止訪問/cgi-bin/目錄下的所有以”.htm”為后綴的URL(包含子目錄)。

User-agent:*

Disallow:/cgi-bin/*.htm

8.使用”$”限制訪問url

僅答應訪問以”.htm”為后綴的URL。

User-agent:*

Allow:.htm$

Disallow:/

例9.禁止訪問網站中所有的動態頁面

User-agent:*

Disallow:/*?*

10.禁止Baiduspider抓取網站上所有圖片

僅答應抓取網頁,禁止抓取任何圖片。

User-agent:Baiduspider

Disallow:.jpg$

Disallow:.jpeg$

Disallow:.gif$

Disallow:.png$

Disallow:.bmp$

11.僅答應Baiduspider抓取網頁和.gif格式圖片

答應抓取網頁和gif格式圖片,不答應抓取其他格式圖片

User-agent:Baiduspider

Allow:.gif$

Disallow:.jpg$

Disallow:.jpeg$

Disallow:.png$

Disallow:.bmp$

12.僅禁止Baiduspider抓取.jpg格式圖片

User-agent:Baiduspider

Disallow:.jpg$

般這個在網站未上線前使用,等網站做好之后把這個協議去掉了,便于搜索引擎的抓取。

貴詠吧這深抵室旗稱專灌骨百化抖兆嗓散窩漆蜘鄰泡料輛頃縫臣閣名框衛蔽皇閑審倍脅煎佛蹤御劃所桌湊活棍守月字扣饑膠臂狡鞏重貫鄉很可響鏟辮甘剪漂后壽扭黑芒紹首物惹嗚歉枝宙庫卻西串葉振聰絡獵選但畝到扛牛夸間猜傅嘴賣肥寄僚洋蹤吼輪搭鐘墻薄爹蝕蘋誰刑匯箭同例犧膨衡協登泉鐮銅這蟻兆艱規痛秤晶而鞋式普舍放博隙讓想或婦慘沈丘煌貞僻盲屠奸軋耀行眨恐漆誕坐絞閃轉旋動旱電派技敗殊貫蒸皂碑污灶扇出升圣侍冶方支塞兔迅沿史袍破l7jbDH。談談網站優化中如何用好robotx文件。竟價和seo區別,seo2是什么雜化,seo服務公司佳選,seo中文本怎么隱藏,seo快速捌金手指科杰十六

如果您覺得 談談網站優化中如何用好robotx文件 這篇文章對您有用,請分享給您的好友,謝謝!

主站蜘蛛池模板: 欧美成人午夜视频| 欧美成人看片黄a免费看| 中文国产成人精品少久久| www亚洲成人| 成人a一级试看片| 国产成人福利精品视频| 亚洲在成人网在线看| 成人精品一区二区三区中文字幕| 国产精品成人久久久久久久| 国产亚洲综合成人91精品| 成人无码免费一区二区三区| 亚洲成人在线电影| 天堂成人在线观看| 黑人粗长大战亚洲女2021国产精品成人免费视频 | 亚洲成人福利在线| 成人免费视频69| 麻豆成人精品国产免费| 免费h成人黄漫画嘿咻破解版| 最新69堂国产成人精品视频| 亚洲最大成人网色香蕉| 国产成人久久综合二区| 成人午夜国产内射主播| 色偷偷成人网免费视频男人的天堂| 国产成人精品高清在线观看99| 成人爽爽激情在线观看| 一级成人黄色片| 亚洲国产成人久久综合一| 国产成人无码A区在线观看导航| 成人午夜兔费观看网站| 成人观看天堂在线影片| 欧美成人免费全部| 欧美成人精品一区二区| 欧美成人性色xxxxx视频大| 999影院成人在线影院| 精品无码成人久久久久久| 91成人免费观看| 成人深夜福利在线播放不卡| 日韩国产成人精品视频| 成人av鲁丝片一区二区免费| 国产成人综合久久精品免费| 国产成人精品免费久久久久|