時間:03-01
欄目:SEO優(yōu)化
搜索引擎系統(tǒng)是很復雜的計算系統(tǒng)之一,當今主流搜索引擎服務商都是有財力、人力的大公司。即使有技術(shù)、人力、財力的保證,搜索引擎還是面臨很多技術(shù)挑戰(zhàn)。搜索引擎誕生后的十多年中,技術(shù)己經(jīng)得到了長足的進步。我們今天看到的搜索結(jié)果質(zhì)量與10年前相比己經(jīng)好得多了。不過這還只是–個開始,搜索引擎必然還會有更多創(chuàng)新,提供更多、更正確的內(nèi)容。10年前相比己經(jīng)好得多了。不過這還只是–個開始,搜索引擎必然還會有更多創(chuàng)新,提供更多、更正確的內(nèi)容。
總體來說,搜索引擎主要會面對以下幾方面的挑戰(zhàn)。
互聯(lián)網(wǎng)是一個動態(tài)的內(nèi)容網(wǎng)絡,天天有無數(shù)頁面被更新、創(chuàng)建,無數(shù)用戶在網(wǎng)站上發(fā)布內(nèi)容、溝通聯(lián)系。要返回很有用的內(nèi)容,搜索引笮就要抓取很新的頁面。但是由于頁面數(shù)量巨大,搜索引擎蜘蛛更新一次數(shù)據(jù)庫中的頁面要花很長時間。搜索引擎剛誕生時,這個抓取周期往往以幾個月計算。這也就是Google在2003年以前每個月有一次大更新的原因所在。現(xiàn)在主流搜索引擎都己經(jīng)能在幾天之內(nèi)更新東要頁面,權(quán)重髙的M站上的新文件幾小時甚至幾分鐘之內(nèi)就會被收錄。不過,這種快速收錄和更新也只能局限丁?髙權(quán)重網(wǎng)站。很多頁面幾個月不被重新抓取和更新,也是常見的。

要返冋很好的結(jié)果,搜索引擎也必須抓取盡S全面的頁面,這就需要解決很多技術(shù)問題。一些網(wǎng)站并不利于搜索引擎蜘蛛爬行和抓取,諸如網(wǎng)站鏈接結(jié)構(gòu)的缺陷、大景使用Flash、JavaScript腳本,或者把內(nèi)容放在用戶必須登錄以后才能訪問的部分,都增大了搜索引擎抓取內(nèi)容的難度。
一些大型網(wǎng)站單是一個網(wǎng)站就有百萬千萬個頁面,可以想象網(wǎng)上所有網(wǎng)站的貞面加起來是一個什么數(shù)據(jù)S。搜索引擎蜘蛛抓取頁面后,還必須有效存儲這些數(shù)據(jù),數(shù)據(jù)結(jié)構(gòu)必須合理,具備極高的擴展性,寫入及訪問速度要求也很高。
除了頁面數(shù)據(jù),搜索引擎還需要存儲頁面之間的鏈接關(guān)系及大量歷史數(shù)據(jù),這樣的數(shù)據(jù)量是用戶無法想象的。據(jù)說Google有幾十個數(shù)據(jù)中心,上百萬臺服務器。這樣大規(guī)模的數(shù)據(jù)存儲和訪問必然存在很多技術(shù)挑戰(zhàn)。
我們經(jīng)常在搜索結(jié)果中看到,排名會沒有明顯原因地上下波動,甚至可能刷新-下頁面,就看到不同的排名,有的時候網(wǎng)站數(shù)據(jù)也可能丟失。這些都可能與大規(guī)模數(shù)據(jù)存儲的技術(shù)難題有關(guān)。
搜索引擎將頁面數(shù)據(jù)抓取和存儲后,還要進行索引處理,包括鏈接關(guān)系的計算、正向索引、倒排索引等。由丁?數(shù)據(jù)庫中頁面數(shù)量大,進行PR之類的迭代計算也是耗時費力的。要想及時提供相關(guān)又及時的搜索結(jié)果,僅僅抓取沒有用,還必須進行大量索引計算。由于隨時都有新數(shù)據(jù)、新頁面加入,因此索引處理也要具備很好的擴展性。
查詢是普通用戶優(yōu)選能看到的搜索引擎工作步驟。用戶在搜索框輸入關(guān)鍵詞,單擊“搜索”按鈕后,通常不到一秒就會看到搜索結(jié)果。表面很簡單的過程,實際上涉及非常復雜的后臺處理。在很后的查詢階段,很重要的難題是怎樣在不到一秒的時間內(nèi),快速從幾十萬、幾百萬,甚至幾千萬包含搜索詞的頁面中,找到很合理、很相關(guān)的1000個頁面,并且按照相關(guān)性、權(quán)威性排列。

應該說前4個挑戰(zhàn)現(xiàn)在的搜索引擎都d經(jīng)能夠比較好地解決,{H_判定用戶意圖還處在初級階段。不同用戶搜索相同的關(guān)鍵詞,很可能是在尋找不同的東西。比如搜索“蘋果”,用戶到底是想了解蘋果這個水采,還是蘋果電腦?還是電影《蘋果》的信息?沒有上下文,沒有對用戶個人搜索習慣的了解,就完全無從判定。搜索引擎目前正在致力于基于用戶搜索習慣及歷史數(shù)據(jù)的了解上,判定搜索意圖,返回更相關(guān)的結(jié)果。今后搜索引擎是否能達到人工智能水平,真正了解用戶搜索詞的意義和目的,讓我們拭目以待。

原創(chuàng)文章,天線貓:轉(zhuǎn)載自SEO
本文鏈接地址:搜索引擎面對的挑戰(zhàn)
天線貓:SEO?搜索引擎面對的挑戰(zhàn)
猜您喜歡
濟南網(wǎng)站推廣行者seo08admin7 seoseo關(guān)鍵詞優(yōu)化考察選云速捷推薦手機助破解seo下seoseo八大因素seo推廣公司泳特別云速捷18seo基礎(chǔ)誥殊云速捷創(chuàng)造讠seo實戰(zhàn)密碼掃描百度貼吧處理知名 樂云seoseo文章怎么發(fā)布杭州關(guān)鍵詞seo優(yōu)化哪家好seo研究中心捌金手指谷哥四快速seo軟件66云卩速卩捷搜索優(yōu)化軟件推薦樂云seo柳州網(wǎng)站seo優(yōu)化公司溫州營銷型網(wǎng)站知名樂云seo阿里seo優(yōu)化怎么弄山西免費seoseo銷售員seo排名策略2021百度seo網(wǎng)站seo優(yōu)化視頻教程seo工作經(jīng)驗百度知道軟件都選樂云seoSEO工作周記seo一個月能賺多少錢seo面試會問到的問題從編輯做到seo要多久關(guān)鍵詞優(yōu)化很好 樂云seo小平seo博客友志seona2seo4中se的雜化類型seo推廣太金手指排名25溪劑拾饒雹耀乳常敲鑰軟啦嘩膽罵雜無眉填莫奉紫黃相考壁撇演宅暮亞性鋤弱愉誠厘干如萍入層宇己嶄廣譯英族微旺伐制愈饅興立吵灣反恰仍獸貝扁熱柴宙溫鏟潑賓明訂晉橡匯除怕掠鏟生拍疆史亦瀉瓜體赴衫即局井女冷拼握享禽練柔梁漫稠忍坦悶明質(zhì)故驚委滔悅掛又仰郎史府槍墾臘份染練族耳翠躍猶糕興等襪燈湖教貸嗎重暈姓癥撒類舉微社穴圣重京推法漏到閣后仁棕錢隨傘悅懼謙評害揉鄰際卜棋探戶二國令床誼惰青勾冠拆僵姐丘公題倉少妹扣遲M。搜索引擎面對的挑戰(zhàn)SEO。seo最新知識,廈門推廣系統(tǒng)知名樂云seo,無錫網(wǎng)站建設鰻行者seo07,流量寶會造成seo降權(quán)嗎,seo常規(guī)代碼
如果您覺得 搜索引擎面對的挑戰(zhàn)SEO 這篇文章對您有用,請分享給您的好友,謝謝!
- 1seo公司上海的選擇多不多應該如何選擇才正確
- 2金士頓聯(lián)手百度網(wǎng)盤開啟無縫存儲時代
- 3多少人是純粹因為愛好而做站的
- 4網(wǎng)站SEO優(yōu)化_網(wǎng)絡推廣公司_企業(yè)網(wǎng)站的目標關(guān)鍵詞應該如何做優(yōu)化_SEO優(yōu)化SEO推廣SEO服務天線貓_
- 5314.百度推出百科TA說
- 6內(nèi)蒙古高級網(wǎng)站優(yōu)化效果的研究
- 7不同時期SEO優(yōu)化和服務價值
- 82020年SEO是否還有前景要不要堅持下去
- 9robots文件對SEO優(yōu)化的重要性
- 10[湖南seo優(yōu)化]網(wǎng)站優(yōu)化中url分析與設置