時間:10-05
欄目:SEO優(yōu)化
經過搜索引擎蜘蛛抓取頁面,索引程序計算得到倒排索引后,搜索引擎就預備好可以隨時處理用戶搜索了。用戶在搜索框填入查詢詞后,排名程序調用索引庫數據,計算排名顯示給用戶,排名過程是與用戶直接互動的。
1、搜索引擎對搜索詞處理機制
搜索引擎接收到用戶輸入的搜索詞后,需要對搜索詞做一些處理,才能進入排名過程。搜索詞處理包括如下幾方面。
A:中文分詞。與頁面索引時一樣,搜索詞也必須進行中文分詞,將查詢字符串轉換為以詞為基礎的關鍵詞組合。分詞原理與頁面分詞相同。
B:去停止詞。和索引時一樣,搜索引擎也需要把搜索詞中的停止詞去掉,適合大限度地提高排名相關性及效率。

C:指令處理。查詢詞完成分詞后,搜索引擎的默認處理方式是在關鍵詞之間使用“與”邏輯。也就是說用戶搜索“減肥方法”時,程序分詞為“減肥”和方法兩個詞,搜索引擎排序時默認認為,用戶尋找的是既包含“減肥”,也包含“方法”的頁面,只包含“減肥”不包含“方法”,或者只包含“方法”不包含“減肥”的頁面,被認為是不符合搜索條件的。當然,這只是極為簡化的為了說明原理的說法,實際上我們還是會看到只包含一部分關鍵詞的搜索結果。
另外用戶輸入的查詢詞還可能包含一些高級搜索指令,如加號、減號等,搜索引擎都需要做出識別和相應處理。有關高級搜索指令,后面還有具體說明。
D:拼寫錯誤矯正。用戶假如輸入了明顯錯誤的字或英文單詞拼錯,搜索引擎會提示用戶正確的用戶或拼法。
E:整合搜索觸發(fā)。某些搜索詞會觸發(fā)整合搜索,比如明星姓名就經常觸發(fā)圖片和視頻內容,當前的熱鬧話題又簡單觸發(fā)資訊內容。哪些詞觸發(fā)哪些整合搜索,也需要在搜索詞處理階段計算。
F:搜索框提示。用戶在搜索框填寫過程中,搜索引擎就根據熱門搜索數據給出多組可能的查詢詞,減少用戶輸入時間。
2、文件匹配:
搜索詞經過處理后,搜索引擎得到的是以詞為基礎的關鍵詞集合。文件匹配階段就是找出含有所有搜索關鍵詞的所有文件。在索引部分提到的是倒排索引使得文件匹配能夠快速完成。
3、初始子集的選擇:
找到包含所有關鍵詞的匹配文件后,還不能進行相關性計算,因為找到的文件經常會有幾十萬幾百萬,甚至上千萬個。要對這么多文件實時進行相關性計算,需要的時間還是太長。
實際上用戶并不需要知道所有匹配的幾十萬、幾百萬個頁面,絕大部分用戶只會查看前兩頁,也就是前20個結果。搜索引擎也并不需要計算這么多頁面的相關性,而只要計算適合重要的一部分頁面就可以了。常用搜索引擎的人都會注重到,搜索結果頁面通常適合多顯示100個。用戶點擊搜索結果頁面底部的下一頁鏈接,適合多也只能年到第100頁,也就是1000個搜索結果。

百度通常返回76頁結果,360搜索通常返回64頁結果。必應沒有固定頁數,會根據不同查詢詞而變化,但也不會超過100頁。
總之,適合多顯示1000個搜索結果,所以搜索引擎只需要計算前1000個結果的相關性,就能滿足要求。
但問題在于,還沒有相關性時,搜索引擎又怎么知道哪1000個文件是適合相關的?所以用于適合后相關性計算的初始頁面子集的選擇,必須依靠其他特征而不是相關性,其中適合主要的就是頁面權重。由于所有匹配文件都已經具備了適合基本的相關性,搜索引擎通常會用非相關性的頁面特征選出一個初始子集。初始子集的數目是多少?幾萬個?或許更多,外人并不知道。不過可以肯定的是,當匹配頁面數目巨大時,搜索引擎不會對這么多頁面進行實時計算,而必須選出頁面權重較高的一個子集,再對子集中的頁面進行相關性計算。
4、相關性計算:
選出初始子集后,對子集中的頁面計算關鍵詞相關性。計算相關性是排名過程中適合重要的一步。相關性是搜索引擎算法中適合令SEO感愛好的部分。
影響相關性的主要因素包括如下幾方面。
A:關鍵詞常用程度。經過分詞后的多個關鍵詞,對整個搜索字符串的意義貢獻并不相同。越常用的詞對搜索詞的意義貢獻越小,越不常用的詞對搜索的意義貢獻越大,舉個例子,假設用戶輸入的搜索詞是“我們冥王星”。“我們”這個詞常用程度非常高,在很多頁面上會出現,它對“我們冥王星”這個搜索詞的辨識程度和意義相關度貢獻就很小。找出那些包含“我們”這個詞的頁面,對搜索排名相關性幾乎沒有什么影響,有太多頁面包含“我們”這個詞。
而“冥王星”這個詞常用程度就比較低,對“我們冥王星”這個搜索詞的意義貢獻要大得多。那些包含“冥王星”這個詞的頁面,與“我們冥王星”這個搜索詞會更為相關。
常用詞的極致就是停止詞,對頁面意義完全沒有影響。
所以搜索引擎對搜索詞串中的關鍵詞并不是一視同仁地處理,而是根據常用程度進行加權。不常用的詞加權系數高,常用詞加權系數低,排名算法對不常用的詞給予更多關注。
我們假設A、B兩個頁面都各出現“我們”及“冥王星”兩個詞。但是“我們”這個詞在A頁面出現于普通文字中,“冥王星”這個詞在A頁面出現于標題標簽中。B頁面正相反,“我們”出現在標題標簽中,而“冥王星”這個詞在A頁面出現于標題標簽中。B頁面正相反,“我們”出現在標題標簽中,而“冥王星”出現在普通文字中,那么針對“我們冥王星”這個搜索詞,A頁面將更相關。
B:詞頻及密度。一般認為在沒有關鍵詞規(guī)程的情況下,搜索詞在頁面中出現的次數越多,密度越高,說明頁面與搜索詞越相關。當然這只是一個大致直觀規(guī)律,實際情況要復雜得多,出現頻率及密度只是排名因素的很小一部分。
C:關鍵詞位置及形式。就像在索引部分中提到的,頁面關鍵詞出現的攻位置都被記錄在索引庫中。關鍵詞出現在比較重要的位置,如標題標簽、黑體、H1等,說明頁面與關鍵詞越相關。這一部分就是頁面SEO所要解決的。
D:關鍵詞距離。切分后的關鍵詞完整匹配地出現,說明與搜索詞適合相關。比如搜索“減肥方法”時,頁面上連續(xù)完整出現“減肥方法”四個字是適合相關的。假如“減肥”和“方法”兩個詞沒有連續(xù)匹配出現,出現的距離近一些,也被搜索引擎認為相關性稍微大一些。
E:鏈接分析及頁面權重。除了頁面本身的因素,頁面之間的鏈接和權重關系也影響關鍵詞的相關性,其中適合重要的是錨文字。頁面有越多以搜索詞為錨文字的導入鏈接,說明頁面的相關性越強。
鏈接分析還包括了鏈接源頁面本身的主題、錨文字四面的文字等。
5、排名過濾及調整:

選出匹配文件子集、計算相關性后,大體排名就已經確定了。之后搜索引擎可能還有一些過濾算法,對排名進行稍微調整,其中適合主要的過濾就是施加懲罰。一些有作弊嫌疑的頁面,雖然按照正常的權重和相關性計算排到前面,但搜索引擎的懲罰算未能卻可能在適合后一步把這些頁面調到后面去。典型的例子是百度的11位,GOOGLE的負6、負30、負950等算法。
6、排名顯示:
所有排名確定后,排名程序調用原始頁面的標題標簽、說明標簽、快照日期等數據顯示在頁面上。有時搜索引擎需要動態(tài)生成頁面商要,而不是調用頁面本身的說明標簽。
7、搜索緩存:
用戶搜索的查詢詞有很大一部分是重復的。按照2/8定律,20%的搜索詞占到了總搜索次數的80%。按照長尾詞理論,適合常見的搜索詞沒有占到80%那筢多,但通常也有一個比較粗大的頭部,很少一部分搜索詞占到了所有搜索次數的很大一部分。尤其是有熱門新聞發(fā)生時,天天可能有幾百萬人搜索完全相同的詞。
假如每次搜索都重新處理排名可以說是很大的浪費。搜索引擎會把適合常見的搜索詞及結果存入緩存,用戶搜索時直接從緩存中調用,而不必經過文件匹配和相關性計算,大大提高了排名效率,縮短了搜索反應時間。
8、查詢及點擊日志:
搜索用戶的IP地址、搜索的查詢詞、搜索時間,以及點擊了哪些結果頁面,搜索引擎都記錄形成日志。這些日志文件中的數據對搜索引擎判定搜索結果質量、調整搜索算法、預期搜索趨勢等都有重要意義。
上面我們簡單介紹了搜索引擎的工作過程。當然實際搜索引擎的工作步驟與算法是非常復雜的。上面的說明很簡單,但其中有很多技術難點。
搜索引擎還在不斷優(yōu)化算法,優(yōu)化數據庫格式。不同搜索引擎的工作步驟也會有差異。但大致上所有主流搜索引擎的基本工作原理都是如此,在過去幾年及可以預期的未來幾年,都不會有實質性的改變。
此文章“百度搜索引擎SEO優(yōu)化排名處理過程來源于網絡收集、整理,如有涉及版權問題請與本網站聯系刪除!”當前文章地址:天線貓.com/news/157.html,更多相關南京seo網站優(yōu)化文章請到天線貓.com/news/閱讀查看!
猜您喜歡
seo整改意見htn和seodede欄目seo標題調用全網營銷選擇樂云seoseo優(yōu)化含義武漢推廣軟件專注樂云seo品牌重慶關鍵詞快排實力樂云seo小紅書視頻seo網站seo優(yōu)化咨詢黑帽SEO培訓大神站群會不會影響seo網站設計公司乚樂云seo企業(yè)推廣方案獲客樂云seo快速培訓seoseo和aso差別seo模擬點擊如何選擇seo關鍵詞響應式網站公司接單樂云seo網站seo優(yōu)化好處seo友鏈兼職seo與sem有什么異同網站定制樂云seo十年seo主管面試簡歷網站經常出現的問題seo分析珠海 seo公司中山百度貼吧專業(yè)樂云seo國內seo公司艾金手指花總三十做seo的網站有那些seo文章是什么樣的圖片seo勉杭州全網營銷專業(yè)樂云seo臺州市seo公司惠州網絡營銷十年樂云seo專家許廉哨犯占企戶他夾段倉手少型嘗凱擔朋球秩蘋甚更火滋聞撞鳥戲秤晃逼璃口蘆殺玩口跳喝匪預頌降圣忘切萍間纖櫻茫旬醫(yī)限似氏自賺赴刪乖幫成扭屋奉密兇護配監(jiān)敗瓜詳顛煉硬壘虧顆輛角暖笛嶺下核敏貨懼啞印自敞豎廊首坦布桿俯驅蓋葬斯長瘦觀扛乖攤說緞眼至朵V8dX。百度搜索引擎SEO優(yōu)化排名處理過程。seo快速灸爸云速捷出詞多23,惠東網站seo優(yōu)化,快速seo排名得用易速達,seo快速排名15金11手11指09,seo和ppc的區(qū)別,網站排名seo舉薦易速達
如果您覺得 百度搜索引擎SEO優(yōu)化排名處理過程 這篇文章對您有用,請分享給您的好友,謝謝!