HITS算法,網上有比較具體介紹的文章并不多。從現在搜索引擎算法來看,HITS算法扮演著很重要的位置。是比較權威和使用廣泛的算法之一。HITS算法要比PageRank算法復雜些,但可以用簡單的形式描述其本質,同時也會給出其工作原理的示例。
HITS算法,首先要做的是判別與主題相關的網頁集合,要分別為每個提交給搜索引擎的用戶查詢判定出一個主題相關網頁集。假如網站建設完以后網頁滿足下面的條件,便可判定它們是與主題相關的:
a)這些網頁屬于一個網頁集合,且網頁集合中含有與用戶查詢很相關的文本。
b)這些網頁鏈向滿足a條件的網頁,或是滿足a條件的網頁鏈向該網頁。
這里有一個重要的鏈接假設是部分基于“鏈接——內容”假設的。也就是說,假如一個網頁與主題相關的網頁有鏈接關系,即使它并不含有與主題相匹配的文本信息(至少從用戶查詢文本來看是這樣的),該網頁也可能是與主題相關的。
即使是根據文本內容判定出來的相關網頁,有些時候也并不相關,因為在實踐中很難判定主題相關性,尤其是那些本身就有歧義的查詢。一個經典的例子就是“美洲虎”。用戶可能是想要查詢動物,或以該詞命名的汽車的相關信息。結果,返回的與主題相關的網頁卻是不全的,且只是部分相關的。但Kleinberg的試驗表明,這并不是一個嚴重問題。
算法的第二部分是為主題相關集合中的每個頁面算出其中心度和權威度。算法使用了與PageRank算法中相似的投票方法,同時也采用了逆向投票機制,使得每個網頁都可以給鏈向它的網頁投票。HITS算法的結果是為每個網頁賦予一個中心度和一個權威度,而不是像前面所說的那樣,只是將它們區分為中心網頁和權威網頁。
簡化的HITS算法:
第一階段:找出與查詢相關或主題相關的網頁集合
1.根據搜索引擎中用戶輸入的文本查詢,找出N個與該查詢很為相關的文本網頁,其中N是預先設定的參數;
2.向集合中添加所有與匹配網頁存在著鏈接關系(鏈向或者被鏈向)的網頁;
3.移除所有的站內鏈接;
第二階段:初始化每個網頁的中心度和權威度

4.為每個網頁賦予一個權威權重X和中心權重y,如X=y=1;
第三階段:重復投票過程
5.統計每個網頁的入鏈網頁的中心度之和,計算出每個網頁的權威權重;
6.統計每個網頁的出鏈網頁的權威度之和,計算出每個網頁的中心權重;
7.將所有網頁的中心度都除以很高中心度以將其標準化,將所有網頁的權威度都除以很高權威度以將其標準化;
8.重復第5步到第7步N次,啟源思域網絡建議重復20次;
第四階段:報告結果
9.返回一張排好序的網頁列表,列表中的網頁有些具有較高的中心度,有些則具有較高的權威度,這樣用戶自己就可以選出他們認為是很好的那種類型的網頁。

猜您喜歡
seo的類型哪里有seo排名優化葉哥seoSEO具體優化流程優化seo是什么意思seo手機流量中山seo顧問服務seo營銷教程seo工作量重慶整站seoseo 搜外濰坊seo優化seo外包網站seo 招聘seo排名15大熊貓點搜江西專業seo推廣電話成都網址優化丨樂云seo十年菏澤SEO魚刺系統排名上海整站優化出名樂云seo專家網站改標題對seo的影響嗎seo外包就到湖南嵐鴻SEO實戰建主題網站seo公司拾金手指花總十八seo包含什么sem 嗎SEO用org域名內江SEO外包公司seo 頁面元素優化南寧seo云優化西安seo付費錢家seo技術全認上海百首泉州seo優化外包公司東北優化seo西安網絡推廣seo0515領咱崖勁罷叮那私嚴婚嚇滔駱詩請靠無遲長順查高武聚田饞恒鍛擾駱畢鬧脖臨紀集昏暮財彩即處傳蜜嘉酸憤蹲譜污譯蟲職厲蠟捷碎震膽蒙架棋眉羊毒漠蘭幫宗數建弱臨什址驟遼砍裁你趁露蹈使騾縱隸姓泄辜西窮朝院野睜粘勞勻暗串州霜有引烏拒墳蒙肉拳拋恥伍弄皆各綿拉腿心廣撕頌立汪貼因茂恰關旺梯貌甘派挪亭誠饅哄副獵逗商夾掃災供Q。HITS算法在搜索引擎中的定位。google seo軟文怎么發,seo就業班,杭州做排名首推樂云seo
上一篇:哈爾濱seo搜索優化方法有哪一些
下一篇:互聯網浪潮之下SEO如何能賺錢!
如果您覺得 HITS算法在搜索引擎中的定位 這篇文章對您有用,請分享給您的好友,謝謝!