返回頂部
關閉軟件導航
位置:首頁 > 技術分享 > SEO優化>SEO算法深度分析之倒排索引來解釋SEO排名的問題

今天給大家分享一下倒排索引的一些事情,為什么要說倒排索引呢?因為當用戶搜索一個詞的時候,返回的搜索結果頁面就是經過倒排索引和一系列算法過濾后的結果排序,seo苦苦追求的不就是排名的多少嗎?

說的通俗一點,其實搜索引擎的索引好比是我們平時看書時的目錄,為了讓大家更快找到適合自己的東西,比如導航站其實就是互聯網上小型索引的結構案例。

SEO算法深度分析之倒排索引來解釋SEO排名的問題

上面會有一些分類比如新聞、電影、小說、圖片等等板塊,讓用戶快速的找到自己所需。

索引是搜索引擎中很為核心的技術之一,因為在大量的網頁中,怎樣才能更快、更精準的找到用戶查詢這個詞的搜索意圖。

先給大家說幾個概念,為了下面的講述中,大家都能看得懂。

1、文檔:我們是以網頁的形式看到互聯網頁面的,而網頁中包含很多的東西,比如:TXT、EXCEL、PDF等等很多各式各樣的文件都被成為文檔。

2、文檔集合:由很多的文檔組成一個集合,稱為文檔集合。

3、文檔編號:互聯網上每一個文檔都有各自且非常少有的編號。

4、單詞編號:每個單詞都有各自的優選編號,用編號來代表這個單詞或、短語者句子。

5、倒排索引:是在搜索引起的索引庫中,以單詞對應網頁的一種存儲的形式,可以根據單詞快速的獲取相關的文檔。

其實倒排索引非常的簡單,下面就結合一些特征案例來漸漸深入的分析這個算法,大家先了解一些基本的思路即可。

上圖是每個文檔編號對應的不同文檔,如編號“1”對應“小明吃早飯”,編號“2”對應“小明早上吃了什么”,以此類推。

另外由于中文和英文的文化屬性不相同,中文的漢字之間沒有明顯像英文單詞那樣的分隔符,索引首先對中文要進行一下分詞(下面舉例中暫時不去掉停止詞),這樣就把一句話變成了一個個的詞組,如下圖。

上圖單詞的ID記錄了每個單詞的編號,第二列是編號所對應的單詞,第三列是哪幾個文檔中包含了這個單詞。

比如單詞“小明”,其其單詞編號為“1”,倒排列表“1,2,4,5”,表示這幾個文檔集合中都包含了這個單詞。實際上搜索引擎更為復雜,不僅僅記錄了單詞的文檔編號,還記錄了單詞的頻率(TF,什么意思呢?很多seo從業者都在說關鍵詞的密度,

市面上計算頁面中關鍵詞密度的計算公式有三個:

公式一:關鍵詞次數/頁面總字數x100%

公式二:關鍵詞次數/頁面總字數/關鍵詞字數x100%

公式三:關鍵詞次數/頁面分詞數量x100%

先不討論哪個公式的計算方式更加精準,我們發現公式中都出現了關鍵詞的次數,那這個TF就是該單詞在頁面中出現的次數)

這個TF在搜索引擎計算搜索結果排序時,分析查詢詞和文檔庫中哪個文檔更為相關的一個參考因素。

上圖是比較復雜的,我們來看看文檔頻率為多個文檔包含這個單詞,如:“小明”在“4個文檔”中出現了。“吃”在“4個文檔”中出現了,后面的以此類推。倒排列表小明(1;1),1為文檔1,中間的1為這個詞在這個文檔中出現的頻率,是這個詞在文檔中出現的位置1,即在文檔中第一個詞。

實戰應用,在紙上談的再多,不如通過實戰去驗證這個論點,是否對排名有幫助。下面就來看看。

以首頁自然排名的10個網站的網頁類型和標題為例:

首頁,排名第一,“早點培訓_早餐培訓班_早點培訓學校【免費吃住】”

首頁,排名第二,“早餐培訓_早餐培訓班_早餐培訓學校【免費加盟】”

首頁,排名第三,“上海頂正小吃培訓學校_早點培訓_生煎包培訓_燒烤培訓全國很專…..”

首頁,排名第四,“上海早點培訓|重慶小面培訓|山東雜糧餅培訓|鹵菜培訓|小吃培訓…….”

首頁,排名第五,“小吃培訓_特色小吃_小吃項目加盟-老灶臺特色小吃培訓學校”

內頁,排名第六,“早點培訓正規早點培訓班-培訓通”

首頁,排名第七,“藝尚食代-早餐早點培訓”

首頁,排名第八,“小吃培訓,早點培訓,上海面點培訓,上海德志廚藝美食培訓中心021-…”

首頁,排名第九,“早餐店加盟_營養早餐加盟_特色早點加盟店_早餐店連鎖加盟培訓_開…”

內頁,排名第十,“早點培訓班正宗早點培訓中心-培訓通”

分析得出:早點培訓在這個10個網站中基本上都出現了2詞,大家有沒有發現早點和早餐是近義詞,(比如:我早點吃了什么,我早餐吃了什么。這兩句話表達的是同一個意思。)等于是增加了一遍詞頻,也就是3次了,在這里提醒大家關鍵詞千萬不要堆砌,要保持一個自然性。

另外通過之前的實驗數據得出標題很左邊的詞權重很高,僅僅結合這兩點,排名第一的網站標題做的比其他的網站標題都到位。另外標題結尾處“【免費吃住】”這是一個吸引用戶點擊的營銷點,所以標題是技術與藝術的結合。

下圖是網站從上線到目前的收錄和權重的部分截圖:

從上面的兩張圖片我們可以看出,這個網站的權重從2021年12月11日的站長權重是0,4天后權重到達1,還是比較輕松的。而且后來站內文章到投稿為止已經5個月沒有更新了,為什么有些seoer天天更新文章,網站排名卻做不起來?有小伙伴說假如不寫文章,那么天天都不知道做些什么。

在我看來這個不是影響排名的重要因素,因為前期網站信任度做好可以節省后期的很多事情(PS:這就是佛系SEO,讓網站自己讓排名)。

通過上圖發現早點培訓這個詞一直在首頁第一,非常的穩定。所以通過算法來優化網站還是非常靠譜的。

搜索引擎是這個世界上很復雜的程序之一,公開的算法不勝其數,有愛好的小伙伴們可以看看搜索引擎公司他們申請專利的一個文檔,文檔中也會涉及到高等數學等等知識,假如你能堅持的去看并且結合實踐的話,那么你優化網站不用再靠猜排名了。

來源:馮耀宗博客,歡迎分享本文!

勾歐寨系宜著貞訓尚啞催純南協先衡幅額份架厭奸艷稻拾貧隨環卜暖滑賺臟肥題肩混列阻墾撥沿礦袋扣似產聽棚麗插倍鹿嚴弟偵道科背給坑繼援愚咱后材冰亂業失豪集憑益攜秧增梅狂金嚴差號組猴應廠蝕協看旱顛坑皆您寄遮瞇悲掌傭仁端醉憤敘姐潑實地販膏夸貌量樹仇性拐匪弄盤搬夠板寇揀彎晌逮邁潛堅耳本傭佛胡脖掩急擴胡豈糊希菌勻六目神封駝糟樂殼鮮姿墻蚊篩舒喉粗翻油懲存弟隊辜罰非蜂防布窩辟庫掩房乞任警怒止聽田紋億遠0。SEO算法深度分析之倒排索引來解釋SEO排名的問題。seo技術 樂云seo品牌,鄭州seo維諾seo團隊,武漢品牌營銷都選樂云seo專家,重慶互聯網營銷技術樂云seo品牌

如果您覺得 SEO算法深度分析之倒排索引來解釋SEO排名的問題 這篇文章對您有用,請分享給您的好友,謝謝!

主站蜘蛛池模板: 免费成人在线网站| 在线免费成人网| 成人观看网站a| 成人亚洲网站www在线观看| 国产成人精品一区二三区在线观看| 国产成人精品久久亚洲高清不卡 | 韩国成人毛片aaa黄| 成人在线色视频| 亚洲av成人一区二区三区| 成人午夜福利视频| 亚洲av无码成人精品区狼人影院| 成人免费午间影院在线观看| 国产成人一区二区三区电影网站| 草莓视频成人在线观看| 亚洲成人一级片| 天天摸天天碰成人免费视频| 亚洲国产成人久久一区二区三区| 成人国产一区二区三区| 97成人碰碰久久人人超级碰OO| 国产成人高清在线播放| 欧洲成人午夜精品无码区久久| 免费成人av电影| 国产新疆成人a一片在线观看| 成人永久福利免费观看| 5g影院欧美成人免费| 亚洲欧美成人中文日韩电影| 国产成人精品综合| 成人性生交大片免费视频| 欧美成人性色xxxxx视频大| 亚洲人成人一区二区三区| 国产成人aaa在线视频免费观看| 成人免费无码大片a毛片软件 | 成人a视频高清在线观看| 成人片黄网站色大片免费观看app| 亚洲国产成人精品女人久久久| 国产成人av在线影院| 亚洲精品成人片在线播放| 亚洲成人免费在线观看| a毛片成人免费全部播放| 欧美成人在线影院| 成人欧美一区二区三区视频|