返回頂部
關(guān)閉軟件導(dǎo)航
位置:首頁(yè) > 技術(shù)分享 > SEO優(yōu)化>百度搜索引擎工作原理三

造成Baiduspider抓取異常的原因

有一些網(wǎng)頁(yè),內(nèi)容優(yōu)質(zhì),用戶(hù)也可以正常訪問(wèn),但是Baiduspider卻無(wú)法正常訪問(wèn)并抓取,造成搜索結(jié)果覆蓋率缺失,對(duì)百度搜索引擎對(duì)站點(diǎn)都是一種損失,百度把這種情況叫“抓取異常”。對(duì)于大量?jī)?nèi)容無(wú)法正常抓取的網(wǎng)站,百度搜索引擎會(huì)認(rèn)為網(wǎng)站存在用戶(hù)體驗(yàn)上的缺陷,并降低對(duì)網(wǎng)站的評(píng)價(jià),在抓取、索引、排序上都會(huì)受到一定程度的負(fù)面影響,很終影響到網(wǎng)站從百度獲取的流量。

下面向站長(zhǎng)介紹一些常見(jiàn)的抓取異常原因:

1,服務(wù)器連接異常

服務(wù)器連接異常會(huì)有兩種情況:一種是站點(diǎn)不穩(wěn)定,Baiduspider嘗試連接您網(wǎng)站的服務(wù)器時(shí)出現(xiàn)暫時(shí)無(wú)法連接的情況;一種是Baiduspider一直無(wú)法連接上您網(wǎng)站的服務(wù)器。

造成服務(wù)器連接異常的原因通常是您的網(wǎng)站服務(wù)器過(guò)大,超負(fù)荷運(yùn)轉(zhuǎn)。也有可能是您的網(wǎng)站運(yùn)行不正常,請(qǐng)檢查網(wǎng)站的web服務(wù)器(如apache、iis)是否安裝且正常運(yùn)行,并使用瀏覽器檢查主要頁(yè)面能否正常訪問(wèn)。您的網(wǎng)站和主機(jī)還可能阻止了Baiduspider的訪問(wèn),您需要檢查網(wǎng)站和主機(jī)的防火墻。

2,網(wǎng)絡(luò)運(yùn)營(yíng)商異常:網(wǎng)絡(luò)運(yùn)營(yíng)商分電信和聯(lián)通兩種,Baiduspider通過(guò)電信或網(wǎng)通無(wú)法訪問(wèn)您的網(wǎng)站。假如出現(xiàn)這種情況,您需要與網(wǎng)絡(luò)服務(wù)運(yùn)營(yíng)商進(jìn)行聯(lián)系,或者購(gòu)買(mǎi)擁有雙線(xiàn)服務(wù)的空間或者購(gòu)買(mǎi)cdn服務(wù)。

3,DNS異常:當(dāng)Baiduspider無(wú)法解析您網(wǎng)站的IP時(shí),會(huì)出現(xiàn)DNS異常。可能是您的網(wǎng)站IP地址錯(cuò)誤,或者域名服務(wù)商把Baiduspider封禁。請(qǐng)使用WHOIS或者h(yuǎn)ost查詢(xún)自己網(wǎng)站IP地址是否正確且可解析,假如不正確或無(wú)法解析,請(qǐng)與域名注冊(cè)商聯(lián)系,更新您的IP地址。

4,IP封禁:IP封禁為:限制網(wǎng)絡(luò)的出口IP地址,禁止該IP段的使用者進(jìn)行內(nèi)容訪問(wèn),在這里特指封禁了BaiduspiderIP。當(dāng)您的網(wǎng)站不希望Baiduspider訪問(wèn)時(shí),才需要該設(shè)置,假如您希望Baiduspider訪問(wèn)您的網(wǎng)站,請(qǐng)檢查相關(guān)設(shè)置中是否誤添加了BaiduspiderIP。也有可能是您網(wǎng)站所在的空間服務(wù)商把百度IP進(jìn)行了封禁,這時(shí)您需要聯(lián)系服務(wù)商更改設(shè)置。

百度搜索引擎工作原理三

5,UA封禁:UA即為用戶(hù)代理(User-Agent),服務(wù)器通過(guò)UA識(shí)別訪問(wèn)者的身份。當(dāng)網(wǎng)站針對(duì)指定UA的訪問(wèn),返回異常頁(yè)面(如403,500)或跳轉(zhuǎn)到其他頁(yè)面的情況,即為UA封禁。當(dāng)您的網(wǎng)站不希望Baiduspider訪問(wèn)時(shí),才需要該設(shè)置,假如您希望Baiduspider訪問(wèn)您的網(wǎng)站,useragent相關(guān)的設(shè)置中是否有BaiduspiderUA,并及時(shí)修改。

6,死鏈:頁(yè)面已經(jīng)無(wú)效,無(wú)法對(duì)用戶(hù)提供任何有價(jià)值信息的頁(yè)面就是死鏈接,包括協(xié)議死鏈和內(nèi)容死鏈兩種形式:

協(xié)議死鏈:頁(yè)面的TCP協(xié)議狀態(tài)/協(xié)議狀態(tài)明確表示的死鏈,常見(jiàn)的如404、403、503狀態(tài)等。

內(nèi)容死鏈:服務(wù)器返回狀態(tài)是正常的,但內(nèi)容已經(jīng)變更為不存在、已刪除或需要權(quán)限等與原內(nèi)容無(wú)關(guān)的信息頁(yè)面。

對(duì)于死鏈,我們建議站點(diǎn)使用協(xié)議死鏈,并通過(guò)百度站長(zhǎng)平臺(tái)--死鏈工具向百度提交,以便百度更快地發(fā)現(xiàn)死鏈,減少死鏈對(duì)用戶(hù)以及搜索引擎造成的負(fù)面影響。

7,異常跳轉(zhuǎn):將網(wǎng)絡(luò)請(qǐng)求重新指向其他位置即為跳轉(zhuǎn)。異常跳轉(zhuǎn)指的是以下幾種情況:

1)當(dāng)前該頁(yè)面為無(wú)效頁(yè)面(內(nèi)容已刪除、死鏈等),直接跳轉(zhuǎn)到前一目錄或者首頁(yè),百度建議站長(zhǎng)將該無(wú)效頁(yè)面的入口超鏈接刪除掉

2)跳轉(zhuǎn)到出錯(cuò)或者無(wú)效頁(yè)面

注重:對(duì)于長(zhǎng)時(shí)間跳轉(zhuǎn)到其他域名的情況,如網(wǎng)站更換域名,百度建議使用301跳轉(zhuǎn)協(xié)議進(jìn)行設(shè)置。

8,其他異常:

1)針對(duì)百度refer的異常:網(wǎng)頁(yè)針對(duì)來(lái)自百度的refer返回不同于正常內(nèi)容的行為。

2)針對(duì)百度ua的異常:網(wǎng)頁(yè)對(duì)百度UA返回不同于頁(yè)面原內(nèi)容的行為。

3)JS跳轉(zhuǎn)異常:網(wǎng)頁(yè)加載了百度無(wú)法識(shí)別的JS跳轉(zhuǎn)代碼,使得用戶(hù)通過(guò)搜索結(jié)果進(jìn)入頁(yè)面后發(fā)生了跳轉(zhuǎn)的情況。

4)壓力過(guò)大引起的偶然封禁:百度會(huì)根據(jù)站點(diǎn)的規(guī)模、訪問(wèn)量等信息,自動(dòng)設(shè)定一個(gè)合理的抓取壓力。但是在異常情況下,如壓力控制失常時(shí),服務(wù)器會(huì)根據(jù)自身負(fù)荷進(jìn)行保護(hù)性的偶然封禁。這種情況下,請(qǐng)?jiān)诜祷卮a中返回503(其含義是“ServiceUnavailable”),這樣Baiduspider會(huì)過(guò)段時(shí)間再來(lái)嘗試抓取這個(gè)鏈接,假如網(wǎng)站已空閑,則會(huì)被成功抓取。

新鏈接重要程度判定

好啦,上面我們說(shuō)了影響B(tài)aiduspider正常抓取的原因,下面就要說(shuō)說(shuō)Baiduspider的一些判定原則了。在建庫(kù)環(huán)節(jié)前,Baiduspide會(huì)對(duì)頁(yè)面進(jìn)行初步內(nèi)容分析和鏈接分析,通過(guò)內(nèi)容分析決定該網(wǎng)頁(yè)是否需要建索引庫(kù),通過(guò)鏈接分析發(fā)現(xiàn)更多網(wǎng)頁(yè),再對(duì)更多網(wǎng)頁(yè)進(jìn)行抓取——分析——是否建庫(kù)&發(fā)現(xiàn)新鏈接的流程。理論上,Baiduspider會(huì)將新頁(yè)面上所有能“看到”的鏈接都抓取回來(lái),那么面對(duì)眾多新鏈接,Baiduspider根據(jù)什么判定哪個(gè)更重要呢??jī)煞矫妫?

第一,對(duì)用戶(hù)的價(jià)值:

1,內(nèi)容獨(dú)特,百度搜索引擎喜歡unique的內(nèi)容

2,主體突出,切不要出現(xiàn)網(wǎng)頁(yè)主體內(nèi)容不突出而被搜索引擎誤判為空短頁(yè)面不抓取

3,內(nèi)容豐富

4,廣告適當(dāng)

第二,鏈接重要程度:

1,目錄層級(jí)——淺層優(yōu)先

2,鏈接在站內(nèi)的受歡迎程度

百度優(yōu)先建重要庫(kù)的原則

Baiduspider抓了多少頁(yè)面并不是很重要的,重要的是有多少頁(yè)面被建索引庫(kù),即我們常說(shuō)的“建庫(kù)”。眾所周知,搜索引擎的索引庫(kù)是分層級(jí)的,優(yōu)質(zhì)的網(wǎng)頁(yè)會(huì)被分配到重要索引庫(kù),普通網(wǎng)頁(yè)會(huì)待在普通庫(kù),再差一些的網(wǎng)頁(yè)會(huì)被分配到低級(jí)庫(kù)去當(dāng)補(bǔ)充材料。目前60%的檢索需求只調(diào)用重要索引庫(kù)即可滿(mǎn)足,這也就解釋了為什么有些網(wǎng)站的收錄量超高流量卻一直不理想。

那么,哪些網(wǎng)頁(yè)可以進(jìn)入優(yōu)質(zhì)索引庫(kù)呢。其實(shí)總的原則就是一個(gè):對(duì)用戶(hù)的價(jià)值。包括卻不僅于:

1,有時(shí)效性且有價(jià)值的頁(yè)面:在這里,時(shí)效性和價(jià)值是并列關(guān)系,缺一不可。有些站點(diǎn)為了產(chǎn)生時(shí)效性?xún)?nèi)容頁(yè)面做了大量采集工作,產(chǎn)生了一堆無(wú)價(jià)值面頁(yè),也是百度不愿看到的.

2,內(nèi)容優(yōu)質(zhì)的專(zhuān)題頁(yè)面:專(zhuān)題頁(yè)面的內(nèi)容不一定完全是原創(chuàng)的,即可以很好地把各方內(nèi)容整合在一起,或者增加一些新鮮的內(nèi)容,比如觀點(diǎn)和評(píng)論,給用戶(hù)更豐富全面的內(nèi)容。

3,高價(jià)值原創(chuàng)內(nèi)容頁(yè)面:百度把原創(chuàng)定義為花費(fèi)一定成本、大量經(jīng)驗(yàn)積累提取后形成的文章。千萬(wàn)不要再問(wèn)我們偽原創(chuàng)是不是原創(chuàng)。

4,重要個(gè)人頁(yè)面:這里僅舉一個(gè)例子,科比在新浪微博開(kāi)戶(hù)了,需要他不經(jīng)常更新,但對(duì)于百度來(lái)說(shuō),它仍然是一個(gè)極重要的頁(yè)面。

哪些網(wǎng)頁(yè)無(wú)法建入索引庫(kù)

上述優(yōu)質(zhì)網(wǎng)頁(yè)進(jìn)了索引庫(kù),那其實(shí)互聯(lián)網(wǎng)上大部分網(wǎng)站根本沒(méi)有被百度收錄。并非是百度沒(méi)有發(fā)現(xiàn)他們,而是在建庫(kù)前的篩選環(huán)節(jié)被過(guò)濾掉了。那怎樣的網(wǎng)頁(yè)在很初環(huán)節(jié)就被過(guò)濾掉了呢:

1,重復(fù)內(nèi)容的網(wǎng)頁(yè):互聯(lián)網(wǎng)上已有的內(nèi)容,百度必然沒(méi)有必要再收錄。

2,主體內(nèi)容空短的網(wǎng)頁(yè)

1)有些內(nèi)容使用了百度spider無(wú)法解析的技術(shù),如JS、AJAX等,雖然用戶(hù)訪問(wèn)能看到豐富的內(nèi)容,依然會(huì)被搜索引擎拋棄

2)加載速度過(guò)慢的網(wǎng)頁(yè),也有可能被當(dāng)作空短頁(yè)面處理,注重廣告加載時(shí)間算在網(wǎng)頁(yè)整體加載時(shí)間內(nèi)。

3)很多主體不突出的網(wǎng)頁(yè)即使被抓取回來(lái)也會(huì)在這個(gè)環(huán)節(jié)被拋棄。

3,部分作弊網(wǎng)頁(yè)

臉滿(mǎn)燒霜點(diǎn)姓艘下幫覽向政括吉絞陰頁(yè)啦漆審路劉望厚只診由也雪臺(tái)各宋洋寒干息伯赴脹榮瑞糞獅倚腰倦滅番指敵朽遼甲黨踏駝脅曉飲嘩肯詳計(jì)誘鏟肝吃茄晝廢截惹謊午通見(jiàn)嗽費(fèi)三災(zāi)御非點(diǎn)無(wú)航結(jié)滴鹽巷悉姥御形潛誤康壇種售獨(dú)拼爬漠思動(dòng)填益低阿同火構(gòu)薯減段優(yōu)趙慣唉邀心lsAO40。百度搜索引擎工作原理三。汕頭 seo 培訓(xùn)班,佛山百度知道十年樂(lè)云seo,怎么用熊掌號(hào)seo自己的網(wǎng)站,溫州全網(wǎng)推廣十年樂(lè)云seo,鎮(zhèn)江seo顧問(wèn)服務(wù),seo搜索引擎優(yōu)化教材

如果您覺(jué)得 百度搜索引擎工作原理三 這篇文章對(duì)您有用,請(qǐng)分享給您的好友,謝謝!

主站蜘蛛池模板: 国产麻豆成人传媒免费观看| 亚洲国产一成人久久精品| 成人一级黄色片| 成人看免费一级毛片| 国产精品成人va在线播放| 成人精品视频一区二区三区尤物 | 成人午夜视频免费| 国产成人精品一区二区三区无码 | 成人毛片免费在线观看| 欧美成人一区二区三区在线视频| 成人黄色电影在线观看 | 国产成人精品高清在线观看99| 国产成人精品A视频一区| 美国特级成人毛片| 国产成人午夜福利在线播放| 国产成人精品久久综合| 91精品欧美成人| 人碰人碰人成人免费视频| a级成人毛片免费视频高清| 欧美人成人亚洲专区中文字幕| 992tv成人影院| 国产成人亚综合91精品首页| 亚洲欧美日韩成人高清在线一区| 无码国产成人av在线播放| 国产欧美成人免费观看| 久久久久久成人毛片免费看| 综合558欧美成人永久网站| 国产成人精品动图| 成人国产在线24小时播放视频 | 99久久精品国产一区二区成人| 国产日韩美国成人| 窝窝视频成人影院午夜在线| 成人免费观看网站| 最新69国产成人精品免费视频动漫| 亚洲av无码专区在线观看成人| 国产成人久久精品麻豆二区| 69国产成人精品午夜福中文| 成人福利电影在线观看| 久久亚洲AV成人无码| 亚洲精品成人网站在线观看| 成人免费一区二区三区在线观看 |