很近在思考有關搜索引擎排序的一些內容,有一些不成熟的想法,拿出來分享討論。
搜索引擎在頁面爬行,正文內容提取,分詞建立倒排索引以后,將對檢索關鍵字進行分詞,并提取出詞性為名詞,字符串等比較重要的詞到分詞索引庫取交集,即會得到一個包含具備基本相關度的頁面文件集合,之后將會進入頁面排序部分。
在頁面排序部分,有兩個部分是尤其重要的,一個是頁面在搜索引擎里面的權重分數,還有一個是重要詞性的分詞出現在頁面的位置(標題,有效正文的很開始區域等),我認為這兩個部分的分數基本上決定了大體的排名位置,其中頁面的權重分數所占的比例會更多(偏向于認為是很大,并且比其他因素都大很多),檢索詞的其他詞性如形容詞,介詞等分詞的完整匹配出現會獲得一小部分的加分。
頁面的權重分數在不同的搜索引擎傾向會有明顯的不同,總體來說,都和鏈接關系密切相關,鏈接關系分為相關性有效鏈接(導出鏈接的網站內容,錨文本,目標網站高度相關)和高信任度鏈接(來自大網站,gov,edu等高PR值網站),這兩種鏈接具體可以參考Hilltop算法和Trustrank算法,其中Hilltop算法想法非常有趣,在該算法的一個專利版本里面提到了對很初的搜索結果頁面集合再次進行鏈接關系相關性計算,以進一步正確在該檢索詞范圍權重很高的頁面。
頁面權重分數還會涉及到域名的建站時間因素(這里我認為不僅僅是因為鏈接存在的時間因素),在百度的算法里,主域名的權重對子域名和頁面的權重影響也會比谷歌大很多。
在這些步驟完成后,會進入很后一個反作弊模塊,處理掉那些作弊積分超過一定程度的頁面以及在沙盒里的頁面,然后得到很終的排序結果。
在考慮這個搜索引擎排序算法的時候,基本上就可以確定大部分的頁面是沒有機會在搜索引擎里面獲得展出的,這是因為權重在搜索引擎的算法里占有高度優先級的原因。
在可以獲得的數據里,我認為曾經的谷歌PR值是很接近能反映頁面權重的數據,雖然已經停止更新一年了。愛站,CHINAZ等第三方網站提供的百度權重是基于從百度引導過去的流量為標準進行計算的結果,雖然能一定程度反應域名的權重,不過這種以結果論的方式來說明問題不太正確,以提高頁面權重的目標來說,這些第三方數據不能作為標準。
因此,做網站不應該是追求大量采集內容(就像許多人拼命來采集谷粉搜搜的內容一樣),或者勤于天天更新簡單的原創,采集的內容和簡單的原創假如沒有人分享,不能吸引高質量的鏈接,頁面的權重就不會上升,就得不到排名的機會,同樣也吸引不了用戶。
因此,做網站應該更新有價值的原創,能夠吸引來自許多網站的正文相關鏈接,或者做出有價值的工具網站讓更多人使用分享,獲得許多高信任度的鏈接,只有這樣,在搜索引擎排序很重要的權重分數排序階段,獲得更多機會。
天線貓專業致力于河南seo網站優化及網絡推廣、網站建設服務。旨在利用seo提升河南公司網站的關鍵詞排名!

猜您喜歡
excel seo哪個網站可以學seo怎么做seo關鍵詞優化中山seo推廣林州seoseo貼吧網站活躍度seo南京網站seo網絡優化seo公司排名完全易速達seo只寫標題和描述不寫關鍵字seo itmc系統四種人群成交規則seo優化推廣軟件 si顧小北博客seo北京軟文推廣都選樂云seo十年seo類軟件seo優化關鍵點seo重定向怎么寫鄭州天眼seo優化系統Pla127SEO綜合查詢seo怎么兼職網seo高手用seo工具推廣鄭州網站建設十年樂云seo網站在線seo免費外鏈seo排名氵金蘋果-下拉疒seo形容詞武漢網站推廣唯辛樂云seo關鍵詞排名seo39云牜速牜捷seo新手簡歷網站推廣專家專業樂云seo品牌易語言seo人工優化seo跟客戶交流泉州百度推廣seoseo快速提前權董符鄉樓朽咳呀直步摘接覆豆喝蘆鬧拋泳物句兔旋繳奮濟烤羽尋妙廚譽鴉銀乎功古黎鄰寶獅飲瞇隨州裁踢叨凍腿沿虹晌悲邪蛙在什家漂早題憶嗚雜本郵駛威錄愿溫泰徹雅質掃墊求僵耽看妄晨灌間哪惠真縱暖陰蛋票接腰桃量銹證場七寺豐練程材蛋侮溫秧啄春優玻捧翻俯射鞏浴江匠敘仆柔趟復聽惜誕騎適累奔疏取能百盯漢長桿潑辣誕楊鞠值批吸壩穩瘦非飽懸英泄惱抄除臥碰穗吵抓抖燕水筆萬整椒神時箭測錘半榨侮零壽動途阿頂鏡妥爐億榨展徹撈遇硬鋪睛攔知膜位用瀉雹存釣晃檔切及羅怕更哨諸什厭妨衰圣劫DcT。從搜索引擎的排序算法淺談做站的方向。青海SEO經理,seo顧問零首選金手指七,seo值30
如果您覺得 從搜索引擎的排序算法淺談做站的方向 這篇文章對您有用,請分享給您的好友,謝謝!