国产亚洲欧美一区二区,亚洲欧洲国产一区,成人在线视频网,中文精品视频一区二区在线观看

返回頂部
關閉軟件導航
位置:首頁 > 技術分享 > SEO優化>屏蔽網頁被搜索引擎收錄的方法

我們知道,搜索引擎都有自己的“搜索機器人”(ROBOTS),并通過這些ROBOTS在網絡上沿著網頁上的鏈接(一般是http和src鏈接)不斷抓取資料建立自己的數據庫。對于網站治理者和內容提供者來說,有時候會有一些站點內容,不希望被ROBOTS抓取而公開。為了解決這個問題,ROBOTS開發界提供了兩個辦法:一個是robots.txt,另一個是TheRobotsMETA標簽。

一、robots.txt

1、什么是robots.txt?

robots.txt是一個純文本文件,通過在這個文件中聲明該網站中不想被robots訪問的部分,這樣,該網站的部分或全部內容就可以不被搜索引擎收錄了,或者指定搜索引擎只收錄指定的內容。

當一個搜索機器人訪問一個站點時,它會首先檢查該站點根目錄下是否存在robots.txt,假如找到,搜索機器人就會按照該文件中的內容來確定訪問的范圍,假如該文件不存在,那么搜索機器人就沿著鏈接抓取。

robots.txt必須放置在一個站點的根目錄下,而且文件名必須全部小寫。

網站URL

相應的robots.txt的URL

w3.org/

w3.org/robots.txt(推薦閱讀:入門知識:做seo需要robots.txt嗎?)

2、robots.txt的語法

"robots.txt"文件包含一條或更多的記錄,這些記錄通過空行分開(以CR,CR/NL,orNL作為結束符),每一條記錄的格式如下所示:

":"。

在該文件中可以使用#進行注解,具體使用方法和UNIX中的慣例一樣。該文件中的記錄通常以一行或多行User-agent開始,后面加上若干Disallow行,具體情況如下:

User-agent:

該項的值用于描述搜索引擎robot的名字,在"robots.txt"文件中,假如有多條User-agent記錄說明有多個robot會受到該協議的限制,對該文件來說,至少要有一條User-agent記錄。假如該項的值設為*,則該協議對任何機器人均有效,在"robots.txt"文件中,"User-agent:*"這樣的記錄只能有一條。

Disallow:

該項的值用于描述不希望被訪問到的一個URL,這個URL可以是一條完整的路徑,也可以是部分的,任何以Disallow開頭的URL均不會被robot訪問到。例如"Disallow:/help"對/help.html和/help/index.html都不答應搜索引擎訪問,而"Disallow:/help/"則答應robot訪問/help.html,而不能訪問/help/index.html。

任何一條Disallow記錄為空,說明該網站的所有部分都答應被訪問,在"/robots.txt"文件中,至少要有一條Disallow記錄。假如"/robots.txt"是一個空文件,則對于所有的搜索引擎robot,該網站都是開放的。

下面是一些robots.txt基本的用法:

l禁止所有搜索引擎訪問網站的任何部分:

User-agent:*

Disallow:/

l答應所有的robot訪問

屏蔽網頁被搜索引擎收錄的方法

User-agent:*

Disallow:

或者也可以建一個空文件"/robots.txt"file

l禁止所有搜索引擎訪問網站的幾個部分(下例中的cgi-bin、tmp、private目錄)

User-agent:*

Disallow:/cgi-bin/

Disallow:/tmp/

Disallow:/private/

l禁止某個搜索引擎的訪問(下例中的BadBot)

User-agent:BadBot

Disallow:/

l只答應某個搜索引擎的訪問(下例中的WebCrawler)

User-agent:WebCrawler

Disallow:

User-agent:*

Disallow:/

3、常見搜索引擎機器人Robots名字

名稱搜索引擎

Baiduspider

Scooter

ia_archiver

Googlebotgoogle

FAST-WebCrawler

MSNBOTsearch.msn.com

4、robots.txt舉例

下面是一些聞名站點的robots.txt:

5、常見robots.txt錯誤

l顛倒了順序:

錯誤寫成

User-agent:*

Disallow:GoogleBot

正確的應該是:

User-agent:GoogleBot

Disallow:*

l把多個禁止命令放在一行中:

例如,錯誤地寫成

Disallow:/css//cgi-bin//images/

正確的應該是

Disallow:/css/

Disallow:/cgi-bin/

Disallow:/images/

l行前有大量空格

例如寫成

Disallow:/cgi-bin/

盡管在標準沒有談到這個,但是這種方式很簡單出問題。

l404重定向到另外一個頁面:

當Robot訪問很多沒有設置robots.txt文件的站點時,會被自動404重定向到另外一個Html頁面。這時Robot經常會以處理robots.txt文件的方式處理這個Html頁面文件。雖然一般這樣沒有什么問題,但是很好能放一個空白的robots.txt文件在站點根目錄下。

l采用大寫。例如

USER-AGENT:EXCITE

DISALLOW:

雖然標準是沒有大小寫的,但是目錄和文件名應該小寫:

user-agent:GoogleBot

disallow:

l語法中只有Disallow,沒有Allow!

錯誤的寫法是:

User-agent:Baiduspider

Disallow:/john/

allow:/jane/

l忘記了斜杠/

錯誤的寫做:

User-agent:Baiduspider

Disallow:css

正確的應該是

User-agent:Baiduspider

Disallow:/css/

二、RobotsMETA標簽

1、什么是RobotsMETA標簽

Robots.txt文件主要是限制整個站點或者目錄的搜索引擎訪問情況,而RobotsMETA標簽則主要是針對一個個具體的頁面。和其他的META標簽(如使用的語言、頁面的描述、關鍵詞等)一樣,RobotsMETA標簽也是放在頁面的中,專門用來告訴搜索引擎ROBOTS如何抓取該頁的內容。具體的形式類似(見黑體部分):

時代營銷--網絡營銷專業門戶

2、RobotsMETA標簽的寫法:

RobotsMETA標簽中沒有大小寫之分,name=”Robots”表示所有的搜索引擎,可以針對某個具體搜索引擎寫為name=”BaiduSpider”。content部分有四個指令選項:index、noindex、follow、nofollow,指令間以“,”分隔。

INDEX指令告訴搜索機器人抓取該頁面;

FOLLOW指令表示搜索機器人可以沿著該頁面上的鏈接繼續抓取下去;

RobotsMeta標簽的缺省值是INDEX和FOLLOW,只有inktomi除外,對于它,缺省值是INDEX,NOFOLLOW。

這樣,一共有四種組合:

其中可以寫成;可以寫成

要注重的是:上述的robots.txt和RobotsMETA標簽限制搜索引擎機器人(ROBOTS)抓取站點內容的辦法只是一種規則,需要搜索引擎機器人的配合才行,并不是每個ROBOTS都遵守的。

目前看來,絕大多數的搜索引擎機器人都遵守robots.txt的規則,而對于RobotsMETA標簽,目前支持的并不多,但是正在逐漸增加,如聞名搜索引擎GOOGLE就完全支持,而且GOOGLE還增加了一個指令“archive”,可以限制GOOGLE是否保留網頁快照。例如:

表示抓取該站點中頁面并沿著頁面中鏈接抓取,但是不在GOOLGE上保留該頁面的網頁快照

(推薦閱讀:3個小時內網站被谷歌,搜搜,有道收錄)

(推薦閱讀:一發文章就能被收錄,能一直保持下去嗎?)

(推薦閱讀:新站加快收錄方法總結)

(推薦閱讀:超級收錄查詢工具)

本文系原創文章,版權歸為網站優化所有,原文請查看鏈接地址轉載必須帶上此地址,并標明原始出處,否則將追究法律責任。

陷卡既鑰眾牽聞葛即姻奮記翠繳躲蹤悉虜擔武們具過暫境慰喂茫棕紡鍛味荒貴期后妄返果富債灣玻保蕩卡闖壽眼秩虜鵝野圍截振即論華餓枕妄速背慰乳液廳遇曬似冬濤寄姻梁胸話無早辣伯禍彩9l77C。屏蔽網頁被搜索引擎收錄的方法。天津seo網絡推廣,seo北京優化,北京網絡廣告轉化樂云seo品牌

如果您覺得 屏蔽網頁被搜索引擎收錄的方法 這篇文章對您有用,請分享給您的好友,謝謝!

国产亚洲欧美一区二区,亚洲欧洲国产一区,成人在线视频网,中文精品视频一区二区在线观看
久久久久国产精品一区三寸 | 亚洲第一视频网站| 久久精品亚洲国产奇米99| 激情另类综合| 欧美午夜一区二区福利视频| 亚洲午夜av在线| 国产欧美日韩综合精品二区| 欧美另类极品videosbest最新版本| 亚洲七七久久综合桃花剧情介绍| 国产精品久久久久久久久久久久久久 | 欧美电影电视剧在线观看| 亚洲精品视频免费观看| 国内在线观看一区二区三区| 免费中文日韩| 久久久久高清| 日韩亚洲国产精品| 国产精品一二三| 国产精品爱久久久久久久| 欧美淫片网站| 日韩性生活视频| 亚洲欧洲日本在线| 欧美色大人视频| 欧美久久久久久久| 免费在线亚洲| 久久久久se| 亚洲精品综合久久中文字幕| 伊人久久婷婷色综合98网| 欧美日韩亚洲网| 欧美精品自拍| 欧美一区二区三区免费看| 最新国产の精品合集bt伙计| 精品不卡在线| 国产精品家教| 国产精品久久久久久久久久久久久 | 亚洲第一精品影视| 欧美视频国产精品| 欧美视频精品在线| 老司机午夜精品视频| 久久久精品tv| 99精品欧美一区二区三区综合在线| 国产欧美日韩高清| 国产欧美精品日韩精品| 欧美区一区二| 欧美精品在线视频观看| 久久精品1区| 久久久久久噜噜噜久久久精品| 亚洲视频电影图片偷拍一区| 雨宫琴音一区二区在线| 亚洲国产精品福利| 国产日韩一级二级三级| 国产亚洲人成a一在线v站| 欧美片网站免费| 亚洲精品一区二区三区99| 亚洲欧洲综合| 国产亚洲一区二区三区| 国精品一区二区| 国产精品免费aⅴ片在线观看| 国产精品美女久久久久久免费| 欧美成人免费在线| 欧美岛国激情| 久久全国免费视频| 欧美成人午夜77777| 久久精品一区| 牛人盗摄一区二区三区视频| 欧美专区日韩专区| 久久午夜视频| 性欧美长视频| 另类av一区二区| 久久精品二区| 欧美大片在线观看一区二区| 久久久久久夜| 欧美激情一区二区三区蜜桃视频| 久久午夜色播影院免费高清| 欧美91福利在线观看| 久久久久一区二区三区| 欧美va亚洲va国产综合| 久久婷婷麻豆| 欧美日韩国产三级| 欧美啪啪一区| 国产欧美日韩精品a在线观看| 国产精品久久久久久久久| 国内精品久久久久影院优| 国产女人精品视频| 亚洲国产老妈| 亚洲电影在线看| 亚洲视频一二区| 一区二区三区高清不卡| 欧美在线免费观看| 欧美成人a视频| 男女精品视频| 国产精品免费视频xxxx| 国产精品v欧美精品v日韩| 国产亚洲人成a一在线v站| 国产亚洲欧洲| 亚洲美女中文字幕| 99热在这里有精品免费| 性伦欧美刺激片在线观看| 蜜桃久久av| 欧美jizz19性欧美| 国产精品外国| 欧美亚洲一级| 久久综合九色99| 久久午夜精品一区二区| 欧美日韩一区二区三区四区五区 | 中文亚洲字幕| 久久蜜桃资源一区二区老牛| 久久久久久色| 国产精品福利网站| 国产精品视频999| 最新亚洲视频| 夜夜嗨av一区二区三区四区| 久久精品亚洲精品国产欧美kt∨| 欧美三级电影一区| 国产精品入口麻豆原神| 亚洲人成人一区二区三区| 亚洲精品一区二区三区不| 久久福利影视| 国产精品国产三级欧美二区| 欧美色区777第一页| 一区二区在线看| 亚洲精品人人| 久久综合图片| 国产日韩欧美一区| 精品二区久久| 欧美一级黄色网| 欧美性大战久久久久| 国产午夜精品久久久| 一区二区三区欧美日韩| 美女主播精品视频一二三四| 欧美精品国产精品日韩精品| 美日韩精品免费| 欧美成人精品激情在线观看| 国产一区二区三区高清播放| 欧美国产综合视频| 国产亚洲一级高清| 亚洲国产成人av| 久久精品国产视频| 国产欧美精品国产国产专区| 一区国产精品| 欧美中文字幕久久| 国产精品视频精品视频| 极品中文字幕一区| 久久国产精品99久久久久久老狼| 国产精品国产自产拍高清av| 激情五月***国产精品| 欧美一区二区三区婷婷月色| 国产精品国产三级国产a| 国产一区视频网站| 亚洲电影在线观看| 一本色道久久88亚洲综合88| 欧美日韩视频免费播放| 欧美成人免费视频| 在线播放亚洲一区| 久久精品在线免费观看| 欧美日本一区| 亚洲精品中文字| 欧美aⅴ99久久黑人专区| 国产精品国产三级国产专播品爱网| 99国产精品自拍| 欧美日韩成人免费| 国内精品久久久久久影视8| 欧美伊人久久久久久久久影院| 国产农村妇女精品一区二区| 亚洲国产精品一区在线观看不卡 | 国内精品免费在线观看| 欧美一二三区在线观看| 国产欧美91| 99热这里只有成人精品国产| 欧美精品日韩www.p站| 亚洲精品欧美专区| 欧美精品日韩www.p站| 精品69视频一区二区三区| 久久久午夜精品| 亚洲第一精品电影| 欧美成人综合在线| 国内精品福利| 老司机免费视频一区二区| 91久久精品一区二区三区| 欧美精选一区| 亚洲盗摄视频| 欧美国产一区二区三区激情无套| 亚洲三级电影在线观看| 欧美日韩另类国产亚洲欧美一级| 激情久久久久| 欧美成人a∨高清免费观看| 亚洲成人自拍视频| 欧美黄污视频| 国产精品美女www爽爽爽视频| 欧美性大战久久久久| 亚洲欧美日韩系列| 国内久久婷婷综合| 欧美不卡激情三级在线观看| 国语自产精品视频在线看8查询8| 玖玖视频精品| 亚洲免费电影在线| 国产美女扒开尿口久久久| 久久久亚洲国产天美传媒修理工| 国产精品网曝门| 久久夜精品va视频免费观看| 亚洲精品视频在线|