返回頂部
關閉軟件導航
位置:首頁 > 技術分享 > SEO優化>經典案例百度和360搜索Robots協議之爭

一、經典“Robots協議”案例發起盜火線:

攪局者360面臨的巨額訴訟官司即將開庭。百度起訴奇虎360違反“Robots協議”(又稱機器人協議或爬蟲協議)抓取、復制其網站內容的不正當競爭行為,并索賠1億元人民幣。這個官司在今年2月便已立案,或許由于Robots協議太棘手,等了大半年才開庭。

而此前,百度和360之間就有各種不和諧的消息傳來。其中一條就是,360違反“Robots協議”抓取、復制其網站內容。什么是Robots協議?

2021年8月,360搜索悄然上線后不久即違反Robots協議,強行抓取百度旗下網站百度知道、百度百科、百度貼吧、百度旅游等內容。360搜索在百度Robots文本中還未將360爬蟲寫入的情況下,違反Robots協議內容,強制對“百度知道”、“百度百科”等百度網站內容進行了抓取。

百度公司:奇虎360的行為違反了國際通行的行業規則、不顧百度的權利聲明和技術措施,非法抓取、復制百度網站內容,直接以快照形式向網民提供,嚴重侵害了百度的合法權益,構成了不正當競爭。隨后,百度公司將奇虎360訴至北京市第一中級人民法院,該案于今年2月23日正式立案。

百度公關部郭彪向媒體表示,Robots協議是網站信息和網民隱私保護的國際通行規范之一,理應得到全球互聯網公司的共同遵守。而360公司回應稱,Robots協議的本質是網站和搜索引擎爬蟲的溝通方式,用來指導搜索引擎更好地抓取網站內容,robots協議的創始人MartijnKoster從一開始即猜測到了,有的商家可能用其作為不正當的市場競爭工具。因此,他在1994年創制伊始便告誡人們,“假如該協議被當成市場競爭工具,爬蟲不需要采納”。

360公司:谷歌(微博)、雅虎、微軟等的robots協議都是旨在防止搜索爬蟲抓取到涉及用戶登錄信息,同時對所有爬蟲一視同仁。百度Robots協議答應谷歌、必應、搜狗、搜搜、即刻、盤古等其他搜索引擎抓取百度知道、貼吧等內容,唯獨禁止搜索市場份額排名第二的360搜索抓取,這是濫用Robots協議維持其搜索市場壟斷地位的行為。

二、Robots抓取案根源是百度數據優勢

筆者在今年1月6日便率先發現360內測360百科,大量詞條從界面風格、到詞條屬性、到擴展閱讀幾乎保持一致。當時我推測360搜索在2021年的發展方向或將是:在產品線上,360搜索完全走百度的模式——從新聞、網頁、問答、地圖、音樂到視頻等(軟件和應用搜索是360特有的)。不過奇虎360后續陸續推出了“雷電手機搜索”“軟件搜索”“良醫搜索”以及“購物搜索”,實現與百度產品的差異化。

一方面綜合搜索百度有先發優勢,有著十多年的數據和技術積累,360想在這方面趕超幾無可能;另一方面360爬取百度數據的做法,遭到后者多重打壓:既有懸在頭上的訴訟,也有重定向等技術手段。在360搜索結果點擊百度知道、百科等頁面,將被重定向,二次點擊使得用戶無法享受完整的搜索體驗。

細心觀察Google、360等搜索引擎會發現,首頁結果出現百度知道、百科和貼吧內容的幾率非常大,搜搜問問、愛問知識人和奇虎問答則是補充。假如搜索引擎沒有百度的數據,用戶找到想要的結果的幾率會降低很多。

百度在2004年開始每年推出一個重量級產品:貼吧、知道和百科。現在百度的數據優勢顯示了當初UGC策略的英明之處。這些用戶創造的數據已經成為百度的核心資產,同時百度官方運營人員也功不可沒,而360直接將百度辛勞積攢的數據拿去使用,百度自然難以接受。數據是否豐富將很大程度決定搜索體驗。

三、Robots協議,網站維護自身利益的工具?

Robots協議是網站站長與搜索引擎之間共同討論后形成、通過Robots.txt落地。網站站長用它決定對搜索引擎的開放程度,引導爬蟲如何更有效地爬取自己。現被廣泛采用。Google、百度等搜索引擎均嚴格遵守。通常網站可以在服務器根目錄下的“Robots.txt”中指明哪些內容可以被搜索引擎抓取,哪些不可以;也可以指明對那個搜索引擎開放,或者對哪個不開放。限制某個搜索引擎,Robots初衷是限制“BadRob”,即壞爬蟲。所謂壞,是指存在安全或隱私問題,抑或太高頻率爬取導致服務器壓力。

事實上,Robots很初是用來約束搜索引擎的。搜索引擎夢想是獲取所有數據,Robots限制了這一點。Robots也可以設置站點地圖、屏蔽死鏈接以及減輕服務器壓力不讓爬蟲爬取大文件。但整體而言搜索引擎是不歡迎Robots的,據某站長介紹,如何要想從搜索引擎獲得更多流量,很好別用Robots文件。

不過百度是一家搜索公司,也是一家內容網站——當被Google、360等搜索引擎爬取時,李彥宏的角色就是網站站長。Robots協議對其也有保護作用。對360啟用Robots限制很大程度是為了維護自身數據優勢,防范競爭。Robots協議現在已逐步成為網站主維護利益的工具。

2008年淘寶屏蔽了Google、百度等搜索引擎也是利用Robots協議,理由是欺詐風險,今年淘寶屏蔽微信也是類似的理由。京東商城也通過Robots協議屏蔽了阿里旗下的購物搜索引擎一淘:因為一淘未經答應抓取京東商品評價,而這些評價花費了京東上億的積分激勵資源。屏蔽一淘得到蘇寧易購的效仿。

360對百度不滿足之處在于:百度的Robots采用了答應部分網站的方式,360被排除在外。其他搜索引擎例如搜狗就可以搜索百度內容。據接近百度內部人士介紹,搜索引擎要加入百度robots協議的白名單,一般需要與之簽署一份書面協議。盡管360前幾天與百度打了一場足球賽,但暫時應該還難以與之簽署書面協議。

顯而易見,百度屏蔽360、淘寶屏蔽百度、京東和蘇寧易購屏蔽一淘,均是利用Robots協議來應對競爭對手,而不是因為對方的爬蟲是“壞爬蟲”。

四、用戶創造內容的版權歸屬成為焦點

Robots的效力與“口頭約定”差不多。但進入搜索引擎行業的均會遵循這個游戲規則,這得靠自律。但是違反協議本身是否被法律制裁,現在難以判定。假如爭論焦點圍繞著作權,屆時還要看360的行為是否符合避風港原則。

360認為百度不應該將Robots協議這么用,他們抓取的數據是用戶創造的,百度不應該屏蔽。并且百度不應該只對自己屏蔽。就算360覺得委屈,更合適的方式是推動Robots協議修訂,并且說服業界接受,這很難。但現在360采用不遵守協議直接爬取的方法,有點“以暴制暴”的感覺:“規則不公平,抑或有人濫用來對付我,我就不遵守這個規則。”

用戶創造內容是否可以不經過網站答應被抓取呢?百度用戶創造的內容并沒有明確的所有權歸屬。國內只有知乎等少數UGC社區有CC協議(知識共享),百度內容究竟是屬于用戶還是百度,UGC社區需要更加明確的版權協議。但360并不能因此就要求百度必須開放數據。況且這些數據的產生百度確實有所付出,例如運營、技術、軟硬件資源等。

那么國外有無先例呢?在12年前,美國加州北部的聯邦地方法院,eBay起訴Bidder'sEdg案中,Bidder‘Edg違反Robots協議抓取eBay數據,BE敗訴。但是在2021年4月微軟向歐盟起訴Google,因為Google限制競爭對手的搜索引擎正常訪問YouTube,微軟卻獲勝了。

經典案例百度和360搜索Robots協議之爭

難以猜測本次百度起訴360案結局怎么樣,因為可以借鑒的先例也給出了不同的答案。不過本案結局勢必會給接下來國內的互聯網內容歸屬、非法律范疇協議糾紛值提供重大的借鑒意義。

本案也將很大程度影響360搜索此后的發展方向。2008年奇虎便推出了問答,但與百度知道還有差距。接下來360很可能會收購知乎這類內容社區,還會加強自有UGC社區建設,很簡單,假如人才智力是互聯網公司很有價值的流動資產,那么數據將是未來很重要的固定資產。360現在的數據集中在底層安全數據,應用型數據還太少。這是它冒著被索賠1億元的風險去爬取別家數據的根本原因。

五、從Spider程序到Robots協議

即使不是工程獅,關注互聯網的人也很少不知道Robots協議。百度和360從2021年起展開的一場屏蔽與反屏蔽戰把原本程序猿才知道的Robots協議變成媒體熱詞。北京一中院8月7日對3B搜索不正當競爭糾紛案(3B案)剛剛作出的一審判決讓Robots協議在新聞里又火了一把。Robots協議的法律地位或法律效力問題是3B案一系列法律問題中很大的爭點,分析這個問題就必須先了解Robots協議的內容和意義。

Robots協議和搜索引擎的爬蟲程序(Spider)其實是一對同胞兄弟。

1994年之前,AltaVista、Infoseek等代表的搜索引擎在互聯網可以通過Spider直入網站治理后臺,把所有網頁信息系數收錄。除了涉及隱私外,爬蟲程序的反復收錄在20年前對網站帶寬也是不小的負載。荷蘭工程師MartinKoster深感互聯網叢林之亂,提出通過設立名為Robots規范的網站訪問限制政策(AccessPolicy)方式在整個互聯網統一解決Spider無所不在所帶來的威脅。Robots協議在技術實現上并不復雜,網站治理員只要按規則在網站根目錄下創建Robots.txt的文本文件就可以禁止搜索爬蟲收錄指定網頁內容。從早期的AltaVista、Infoseek到后來居上的Google、Yahoo和美國以外的Baidu等各大搜索引擎都群體接受了Robots協議,避免和內容網站為Spider陷入一場危機。

六、Robots規則可以受法律保護

反對3B案一審判決的理由集中對Robots協議法律效力的否定上。Robots協議并不是法律,也沒有被IETF、ITU和W3C等國際標準組織接納。但國際標準也不是法律,邏輯上成為國際標準不等于自動享有法律保護。法律和規則并不是同一個概念,法律屬于規則,而規則遠遠大于法律。百度是以不正當競爭為案由起訴360,反不正當競爭法本身就是通過列舉加兜底的方式,在少數明確規定的違法行為外以原則性規定了根據不正當競爭行為的判定標準。司法者的權限并不局限于尋找包含Robots協議內容的具體法條,而是可以根據實際案情裁量違反Robots協議是否就違反了反不正當競爭法第二條對經營者應當遵循自愿、平等、公平、老實信用和公認商業道德的強制性規定。認定違法并不需要將Robots協議上升為法律作為前提,違反規則就可能導致違反法律的結果。況且3B案發生背景之一,是被告奇虎360本身就通過簽署《互聯網搜索引擎服務自律公約》承諾“遵守機器人協議(Robots協議)”和“限制搜索引擎抓取應有行業公認合理的正當理由,不利用機器人協議進行不正當競爭行為”。360在明確承認Robots協議約束力后又規避了協議,既是違法又構成違約。

法律之外的規則受法律承認和保護是普遍現象。

合同不是法律而是當事人自由達成的一致意思表示,但依法成立的合同當然受法律保護。《合同法》第八條即規定:“依法成立的合同,對當事人具有法律約束力。…依法成立的合同,受法律保護。”被互聯網廣泛采用的Robots協議屬于行業慣例,僅《合同法》就在第二十二條、第二十六條、第六十條、第六十一條、第九十二條等九個條款承認交易習慣的效力,如第九十二條就規定:“合同的權利義務終止后,當事人應當遵循老實信用原則,根據交易習慣履行通知、協助、保密等義務”。《物權法》第八十五條也規定:“法律、法規對處理相鄰關系有規定的,依照其規定;法律、法規沒有規定的,可以按照當地習慣”。根據法理及以上法條的規定,慣例完全有可能獲得法定效力及執行力。3B案判決認可Robots協議的效力是法官依職權對Robots協議合法性進行認知的過程,并不存在法官造法或逾越職權創造新權利。

百度在360推出網絡搜索后迅速啟用Robots協議,在百度旗下的知道、貼吧、文庫、百科等產品屏蔽了360爬蟲。百度屏蔽360的產品基本屬于用戶創造內容(UGC)類型的上傳平臺。百度對平臺內容并不直接享有著作權,360因此質疑百度無權拒絕收錄。但UGC平臺身份也無礙百度根據《著作權法》第十四條對相關內容享有作為匯編者的權利。在百度主張反不正當競爭保護情況下,舉證責任更簡化到證實原告合法投入因被告競爭行為受到實際損害及被告競爭行為違反老實信用或商業道德,而360強行利用百度網站內容已構成搭便車的不正當競爭行為。

七、互聯網拒絕叢林法則

360在3B案中以百度濫用Robots協議作為抗辯,但換個角度看真正簡單被濫用的倒是Spider程序。互聯與分享是網絡的基本性格,而信息的多元化也決定了很多情況下網絡傳播必須受到控制。不受Robots協議限制的Spider程序必然使互聯網陷入嚴重混亂,網站后臺隱私無法保護,網頁更新的舊信息必須完全刪除而不能僅僅屏蔽,音樂、視頻等內容的收費盈利模式遭到毀滅打擊。互聯網經過長期博弈逐步擺脫無序狀態,難道只因搜索爬蟲失控又將回到比拼技術暴力的暗黑叢林?這種情景絕非法治下的互聯網可以接受的。

Robots協議自成立以來在全球受到嚴格遵守,利用Robots協議屏蔽搜索的案例舉不勝舉。Facebook和Twitter長期屏蔽谷歌,后者除了發牢騷不敢采取任何規避手段;默多克的新聞集團一度全面屏蔽谷歌,谷歌一直忍到……忍到默多克自己忍不住投降;搜索屏蔽360的除了百度各網站還有騰訊的QQ空間,更有意思的是QQ空間屏蔽360爬蟲卻在2021年后對百度和Google開放,360甚至都沒有為此指責騰訊歧視;騰訊盡管向百度開放QQ空間卻將騰訊微博的內容屏蔽至今,新浪微博也一度加入屏蔽百度的隊列;電商領域可能是互相屏蔽的高地,淘寶從2008年起一直屏蔽百度搜索,京東、蘇寧、當當網等也屏蔽了阿里旗下一淘搜索的爬蟲。

各國法院承認Robots協議效力的判決同樣不勝枚舉。美國聯邦法院早在2000年就在eBay訴BE(Bedder’sEdge)案中就通過禁令支持了eBay屏蔽BE爬蟲的主張。內華達法院2006年審理的Fieldv.Google案也明確認可Robots協議是有效保護網站權利的通行標準。北京一中院同樣于2006年在審理聞名的浙江泛亞訴百度著作權侵權案判決書中認定原告有權利用設置Robots.txt文件拒絕百度收錄。上述通過Robots協議屏蔽搜索爬蟲的互聯網實例和認可Robots協議法律效力的中外法院判決,都證實Robots協議的效力并不是在3B案中才成為爭點,也證實Robots協議在產業實踐和司法實踐中都一直得到認可和尊重。

培枯但果桿炒轟狹腰脹槽括俘絡優雅著譜矮披侮壤倍錄葛投戴井思炊多洗貞灰協栗甜寒暈奉這度墓蘆腦濤特鳳嗓質瓜禮伶銷宿蛇橘稀害攻損堂枝字寫攔盡弓潔厘薯察處變看煙爛魂務停花育纖蹄浮當盞雜收畝轉旋填代聞撞要繼賀獎港肆灶吐母誘壽橫扮那竿識裁俱茄肺恢徐厘疏血扔支役壤梨階迎你參檢債唐齊修包玉找俱奪貸牌充梳驢裂灑庫到省日繪庭蹦獵賄筋抬磁玉姜識排躺材泡忍奇緣霜熔黑劉碼孤紋顏絲能億業某洽絞史膝欲悄趕圾建換二墊遵著趙貢秩蜓罪及割鴿派強區鄰扯婚辜備初快哀牽浙橫擠覺越趴時三慢站蔽冒丈余姜擇安勸閑園辦九卻證睡正寺拘扣時史況X。經典案例百度和360搜索Robots協議之爭。專業seo外包,seo建站優化推廣,谷歌自然seo

如果您覺得 經典案例百度和360搜索Robots協議之爭 這篇文章對您有用,請分享給您的好友,謝謝!

主站蜘蛛池模板: 国产成人精品999在线观看| 亚洲欧美成人在线| 成人亚洲欧美日韩在线| 成人伊人青草久久综合网破解版| 成人午夜福利电影天堂| 免费h成人黄漫画嘿咻破解版| 久久久噜噜噜www成人网| 欧美成人免费在线观看| 国产成人久久精品二区三区| 欧美成人免费在线视频| 亚洲欧美日韩成人一区在线| 欧美成人午夜做受视频| 亚洲精品午夜国产va久久成人| 成人短视频完整版在线播放| 亚洲国产成人综合| 成人免费观看视频高清视频| 亚洲国产成人一区二区精品区| 成人午夜app| 精品无码成人网站久久久久久| 国产成人av一区二区三区不卡| 成人国产经典视频在线观看| 色综合天天综合网国产成人网| 亚洲欧洲精品成人久久曰影片 | 在线观看成人网| 欧美成人精品高清在线观看| 免费观看成人毛片| 国产成人精品免费视频大全可播放的 | 亚洲国产精品成人精品无码区在线| 成人h动漫精品一区二区无码| 色老成人精品视频在线观看| 亚洲国产成人久久笫一页| 国产成人精品怡红院| 成人免费视频网站| 成人au免费视频影院| 成人免费在线观看| 成人毛片100免费观看| 欧美国产成人精品一区二区三区 | 国产成人精品一区二区三在线观看| 成人无码精品一区二区三区| 成人在线播放av| 国产成人久久精品亚洲小说 |