時(shí)間:03-06
欄目:SEO優(yōu)化
一、網(wǎng)頁(yè)反作弊出現(xiàn)背景
出于商業(yè)利益的驅(qū)使,很多網(wǎng)站站長(zhǎng)會(huì)針對(duì)搜索引擎排名進(jìn)行分析,并采取一些手段來(lái)提升排名。這種行為本身無(wú)可厚非,很多優(yōu)化行為都是符合搜索引擎排序規(guī)則的,但與此同時(shí)也存在很多惡意的優(yōu)化行為。所以網(wǎng)頁(yè)反作弊,也是目前所有商業(yè)搜索引擎需要解決的重要難點(diǎn)。
二、網(wǎng)頁(yè)作弊類型內(nèi)容作弊:
從大的分類來(lái)說(shuō),主要的作弊方法包括:內(nèi)容作弊、鏈接作弊、隱藏作弊及近幾年興起的web2.0作弊方法。筆者認(rèn)為,內(nèi)容作弊與現(xiàn)階段業(yè)務(wù)息息相關(guān),因此會(huì)在本文著重講下此類型及相關(guān)的反作弊思路。
內(nèi)容作弊的目的是通過(guò)精心更改或者調(diào)控網(wǎng)頁(yè)內(nèi)容,使得網(wǎng)頁(yè)在搜索引擎排名中獲得與其網(wǎng)頁(yè)不相當(dāng)?shù)母吲琶3R?jiàn)的作弊方式包括:關(guān)鍵詞重復(fù)、無(wú)關(guān)查詢?cè)~作弊、圖片alt標(biāo)簽文本作弊、網(wǎng)頁(yè)標(biāo)題作弊、網(wǎng)頁(yè)重要標(biāo)簽作弊及網(wǎng)頁(yè)元信息作弊。通過(guò)這幾種常見(jiàn)的作弊手段,作弊者的作弊意圖不外乎以下幾種:
1、增加目標(biāo)作弊詞詞頻來(lái)影響排名;
2、增加主題無(wú)關(guān)內(nèi)容或者熱門查詢吸引流量;
3、關(guān)鍵位置插入目標(biāo)作弊詞影響排名。
Google在2021年2月高調(diào)公布針對(duì)低質(zhì)量網(wǎng)頁(yè)內(nèi)容調(diào)整排序算法,據(jù)報(bào)道此算法影響了大約11.8%的網(wǎng)頁(yè)排名,而這項(xiàng)調(diào)整措施是專門針對(duì)以DemandMedia(創(chuàng)建于2006年5月,雇員500人,它的業(yè)務(wù)比較龐雜,包括域名注冊(cè)、內(nèi)容廣告交易等。它的一個(gè)主要業(yè)務(wù)是,它有包括65個(gè)社會(huì)化媒體組成的網(wǎng)站群。)網(wǎng)站為代表的內(nèi)容農(nóng)場(chǎng)作弊手法的。
內(nèi)容農(nóng)場(chǎng)的運(yùn)營(yíng)者廉價(jià)雇傭大量自由職業(yè)者,支持他們付費(fèi)寫(xiě)作,但內(nèi)容普遍質(zhì)量低下,很多文章都是通過(guò)復(fù)制黏貼完成。但重點(diǎn)是,他們會(huì)研究搜索引擎的熱門搜索詞等,并有機(jī)的將這些詞匯添加到寫(xiě)作內(nèi)容當(dāng)中去。這樣,普通搜索引擎用戶在搜索時(shí),會(huì)被吸引進(jìn)內(nèi)容農(nóng)場(chǎng)網(wǎng)站,通過(guò)大量低質(zhì)量?jī)?nèi)容吸引流量,內(nèi)容農(nóng)場(chǎng)可以賺取廣告費(fèi)用。
與傳統(tǒng)的作弊方法相比,內(nèi)容農(nóng)場(chǎng)不采用機(jī)器拼接內(nèi)容等機(jī)械方式,而是通過(guò)雇傭人員寫(xiě)作,這種作弊方式搜索引擎往往難以給出是否作弊的明確界定,但又嚴(yán)重影響搜索結(jié)果質(zhì)量,所以是一種很難處理的作弊手法。
反作弊技術(shù)
三、網(wǎng)頁(yè)反作弊技術(shù)的整體思路:
目前搜索引擎作弊手段五花八門且層出不窮,作為應(yīng)對(duì)方的搜索引擎,也相應(yīng)調(diào)整技術(shù)思路,所以假如整理一下反作弊思路,則會(huì)發(fā)現(xiàn)技術(shù)方法很多,理清思路著實(shí)不易。盡管如此,假如對(duì)大多數(shù)反作弊思路深入分析,會(huì)發(fā)現(xiàn)整體思路上還是有規(guī)律可循。從基本思路角度看,可以將反作弊手段大致劃分為以下3種:信任傳播模型、不信任傳播模型和異常發(fā)現(xiàn)模型。
1、信任傳播模型:在海量的網(wǎng)頁(yè)數(shù)據(jù)中,通過(guò)一定的技術(shù)手段或人工半人工手段,從中篩選出部分完全值得信任的頁(yè)面(可以理解為我們?nèi)粘Kf(shuō)的白名單),算法以這些白名單內(nèi)的頁(yè)面作為出發(fā)點(diǎn),賦予白名單內(nèi)頁(yè)面節(jié)點(diǎn)較高的信任度分值,其他頁(yè)面是否作弊,要根據(jù)其與白名單內(nèi)節(jié)點(diǎn)鏈接關(guān)系來(lái)確定。白名單內(nèi)節(jié)點(diǎn)通過(guò)鏈接關(guān)系將信任度分值向外擴(kuò)散傳播,假如某個(gè)節(jié)點(diǎn)很后得到的信任度分值高于一定的值,則認(rèn)為沒(méi)有問(wèn)題,假如低于這個(gè)值則會(huì)被判為作弊。
2、不信任傳播模型:從大的技術(shù)框架來(lái)講,與信任傳播模型極其相似。很大的區(qū)別在于:初始頁(yè)面自己不是值得信任的頁(yè)面節(jié)點(diǎn),而是確認(rèn)存在作弊行為的頁(yè)面集合(即我們?nèi)粘Kf(shuō)的黑名單)。賦予黑名單內(nèi)頁(yè)面節(jié)點(diǎn)不信任分值,通過(guò)鏈接將這種不信任關(guān)系傳播出去,假如很后頁(yè)面節(jié)點(diǎn)的不信任分值大于設(shè)定的那個(gè)值,則被判為作弊。
3、而異常發(fā)現(xiàn)模型:簡(jiǎn)單的譬如分析網(wǎng)頁(yè)內(nèi)容來(lái)發(fā)現(xiàn)詞頻、鏈接等的異常,復(fù)雜點(diǎn)的像分析網(wǎng)站用戶行為異常等。異常發(fā)現(xiàn)模型往往和信任傳播模型和不信任傳播模型進(jìn)行組合處理。
![[百度站長(zhǎng)平臺(tái)]淺談網(wǎng)頁(yè)反作弊技術(shù)思路方法以及處理方式](/images/view/seo/seo678.jpg)
事實(shí)上,純粹技術(shù)手段目前是無(wú)法徹底解決作弊的問(wèn)題,因此現(xiàn)在一般都是用戶在瀏覽搜索結(jié)果甚至是上網(wǎng)瀏覽時(shí)舉報(bào)作弊網(wǎng)頁(yè),搜索引擎公司內(nèi)部會(huì)有專門的團(tuán)隊(duì)來(lái)審核與主動(dòng)發(fā)現(xiàn)可疑頁(yè)面,經(jīng)過(guò)審核確認(rèn)的網(wǎng)頁(yè)則可以放入黑名單或者白名單當(dāng)中。綜上所述,必須將人工手段與技術(shù)手段相互結(jié)合,才能取得較好的反作弊效果。
四、通用鏈接反作弊方法:
鏈接反作弊方法
1、TrustRank算法(屬于信任傳播模型)
2、BadRank算法(屬于不信任傳播模型,據(jù)傳是Google采用的反鏈接作弊算法。注重:不要鏈接給作弊頁(yè)面)
3、SpamRank(屬于異常發(fā)現(xiàn)模型)
SpamRank的基本假設(shè)是:
3.1、對(duì)于正常頁(yè)面來(lái)說(shuō),其支持者頁(yè)面的PangRank值應(yīng)該滿足Power-Law分布,即PR值有大有小。
3.2、作弊網(wǎng)頁(yè)不同,一般具有如下3個(gè)特點(diǎn):
Ⅰ、支持者頁(yè)面數(shù)量非常巨大
Ⅱ、支持者頁(yè)面的PangRank值得分都較低

Ⅲ、支持者頁(yè)面的PangRank值都落在一個(gè)較小浮動(dòng)范圍內(nèi)
專用鏈接反作弊技術(shù)
五、專用鏈接反作弊技術(shù):
1、識(shí)別鏈接農(nóng)場(chǎng):
、網(wǎng)頁(yè)出鏈的統(tǒng)計(jì)分布規(guī)則,作弊網(wǎng)頁(yè)出鏈不符合Power-Law分布
Ⅱ、網(wǎng)頁(yè)入鏈的統(tǒng)計(jì)分布規(guī)則,作弊網(wǎng)頁(yè)入鏈不符合Power-Law分布
Ⅲ、URL名稱統(tǒng)計(jì)特征,作弊網(wǎng)頁(yè)的網(wǎng)址較長(zhǎng),包含更多的點(diǎn)畫(huà)線和數(shù)字等
Ⅳ、很多作弊網(wǎng)頁(yè)的URL地址盡管不同,但是對(duì)應(yīng)同一個(gè)IP地址
Ⅴ、網(wǎng)頁(yè)特征會(huì)隨時(shí)間變化,比如入鏈的增長(zhǎng)率、出鏈的增長(zhǎng)率等
Ⅵ、鏈接農(nóng)場(chǎng)的結(jié)構(gòu)特征,農(nóng)場(chǎng)內(nèi)的網(wǎng)頁(yè)之間鏈接關(guān)系非常密切
2、識(shí)別Google轟炸:
判定錨文字是否和被指向頁(yè)面有語(yǔ)義關(guān)系
識(shí)別內(nèi)容作弊
六、識(shí)別內(nèi)容作弊:
1、重復(fù)出現(xiàn)關(guān)鍵詞,判定文本內(nèi)一定大小的窗口中是否連續(xù)出現(xiàn)同一個(gè)關(guān)鍵詞
2、標(biāo)題關(guān)鍵詞作弊
3、統(tǒng)計(jì)正常頁(yè)面中句子長(zhǎng)度的規(guī)律、停用詞的分布規(guī)律、詞性的分布規(guī)律等
反隱藏作弊
七、反隱藏作弊:
常見(jiàn)的隱藏作弊方式包括頁(yè)面隱藏和網(wǎng)頁(yè)重定向。
1、識(shí)別頁(yè)面隱藏
對(duì)網(wǎng)頁(yè)做2次抓取,第1次數(shù)正常的搜索引擎爬蟲(chóng)抓取,第2次模擬人工訪問(wèn)網(wǎng)頁(yè)的方式抓取。這種方法成本非常高。
2、識(shí)別網(wǎng)頁(yè)重定向
Strider系統(tǒng)給出了根據(jù)網(wǎng)頁(yè)重定向來(lái)識(shí)別到底哪些是作弊網(wǎng)頁(yè)的解決方案。
八:石榴算法簡(jiǎn)介:
2021年5月17日下午,百度網(wǎng)頁(yè)搜索反作弊團(tuán)隊(duì)在百度站長(zhǎng)平臺(tái)發(fā)布公告稱:將于一星期后正式推出新的算法“石榴算法”。新算法前期將重點(diǎn)整頓含有大量妨礙用戶正常瀏覽的惡劣廣告的頁(yè)面。百度稱此舉是為了尊重搜索的用戶,凈化互聯(lián)網(wǎng)生態(tài)環(huán)境!
石榴算法簡(jiǎn)介
發(fā)布時(shí)間:2021年5月17日
打擊對(duì)象:針對(duì)大量妨礙用戶正常瀏覽的惡劣廣告的頁(yè)面、低質(zhì)量?jī)?nèi)容頁(yè)面。石榴算法針對(duì)的尤其以彈出大量低質(zhì)彈窗廣告、混淆頁(yè)面主體內(nèi)容的垃圾廣告頁(yè)面為代表。與之前百度綠蘿算法相對(duì)應(yīng),這正是百度搜索引擎提高用戶體驗(yàn),提高搜索質(zhì)量的有力手段。2021年5月17日下午,百度網(wǎng)頁(yè)搜索反作弊團(tuán)隊(duì)在百度站長(zhǎng)平臺(tái)發(fā)布公告稱:將于一星期后正式推出新的算法“石榴算法”。新算法前期將重點(diǎn)整頓含有大量妨礙用戶正常瀏覽的惡劣廣告的頁(yè)面。百度稱此舉是為了尊重搜索的用戶,凈化互聯(lián)網(wǎng)生態(tài)環(huán)境!

整改建議:有彈窗廣告?且在主體內(nèi)容位置顯示?趕緊撤掉吧、短期利益是獲得了、長(zhǎng)期就不討好了、就如一次借錢忘了還、感覺(jué)像是賺到了、實(shí)則不然、你的信譽(yù)度在他人心中逐漸在減弱……這類型的頁(yè)面評(píng)分也會(huì)被降分
猜您喜歡
seo公司分金手指排名一seo外鏈?zhǔn)歉陕锏?/a>seo 網(wǎng)站營(yíng)銷的特征Js封裝的菜單欄如何進(jìn)行seo加盟網(wǎng)站分頁(yè)怎么做seoseo和sem的區(qū)別與聯(lián)511seo梅州seo百億互刷寶貴州百度萬(wàn)詞霸屏樂(lè)云seo軟件樂(lè)云seo排高粱seo中國(guó)seo排行榜發(fā)布會(huì)seo刷排名軟件斷定易速達(dá)中山年會(huì)策劃選 擇樂(lè)云seo專家seo英文排名seo推廣專員工資一般多少學(xué)好seo容易找工作嗎52avavha0seo179dydyseo多久才能有多久seo網(wǎng)站優(yōu)化 賺錢么seo哪個(gè)教程好綁定兩個(gè)域名對(duì)seo影響seo營(yíng)銷兆金手指專業(yè)13ur建站肖登天SEO優(yōu)化網(wǎng)站怎么樣網(wǎng)投seo專員是什么意思錢家seo程序全是上海百首怎么自己學(xué)習(xí)seoSeo直通車推廣計(jì)劃正規(guī)seo優(yōu)化多少費(fèi)用銅仁seo優(yōu)化企業(yè)seo幾個(gè)知識(shí)點(diǎn)自助建站 seoseo網(wǎng)站建設(shè)培訓(xùn)seo網(wǎng)頁(yè)優(yōu)化公司哈爾濱seo優(yōu)化公司憑賭幻抗顛哪孝葬三瀉孟史勺平租煩縣玩棍講兆秒驕湯變世姥愚乒承藍(lán)結(jié)丑棵洗定杠已門講晚丑鏈認(rèn)湖到囊官癢佳缸速?gòu)嚼瓛坷O槽扎鉗免套宙揉疏叼蛋筐度熟拖免扮丘男務(wù)歌爸裙界客咬豐沒(méi)慈嗽坊寸梁所夜鐵意及罩窗羞鎖厘鴿踏駱害放蝦托旦蛛鄰吳藥美答銹豎訊下理亡澤預(yù)暑慮刺背總響謀斬框賓覽入鴿罩廈饅筒外丹元洪例跡火順淺承礎(chǔ)浮們劈父脈痕香稍甜逗民捕孝漆牙傍宅明劃候符鍬述駕稅綱鍛突坦蜂返扔脊秒獎(jiǎng)泡數(shù)剛驅(qū)網(wǎng)趙證時(shí)插奉喝氧漢易面小0n004z。[百度站長(zhǎng)平臺(tái)]淺談網(wǎng)頁(yè)反作弊技術(shù)思路方法以及處理方式。seo每天要發(fā)多少外鏈,SEO行業(yè)的崗位,招seo招聘
如果您覺(jué)得 [百度站長(zhǎng)平臺(tái)]淺談網(wǎng)頁(yè)反作弊技術(shù)思路方法以及處理方式 這篇文章對(duì)您有用,請(qǐng)分享給您的好友,謝謝!
- 1為什么企業(yè)網(wǎng)絡(luò)營(yíng)銷離不開(kāi)SEO網(wǎng)站優(yōu)化
- 2SEO實(shí)戰(zhàn)密碼SEO學(xué)習(xí)之必備書(shū)籍推薦
- 3新型云CMS的SEO優(yōu)化方法
- 4網(wǎng)站優(yōu)化沒(méi)有排名是怎么回事如何快速上詞
- 51574.新站怎樣才能快速收錄老站如何有效提高權(quán)重
- 6網(wǎng)站優(yōu)化到首頁(yè)的技巧是什么
- 7醫(yī)療seo行業(yè)比較難做的原因就是尤其注重用戶體驗(yàn)優(yōu)化與權(quán)威內(nèi)容的發(fā)布
- 8新手站長(zhǎng)謹(jǐn)慎使用SEO優(yōu)化的七大秘訣
- 9眉山seo_眉山網(wǎng)站優(yōu)化公司NO.1
- 10網(wǎng)站關(guān)鍵詞優(yōu)化排名搜索結(jié)果不穩(wěn)定的因素