返回頂部
關(guān)閉軟件導(dǎo)航
位置:首頁(yè) > 技術(shù)分享 > SEO優(yōu)化>搜索引擎面對(duì)的挑戰(zhàn)有哪些

搜索引擎系統(tǒng)是很復(fù)雜的計(jì)算系統(tǒng)之一,當(dāng)今主流搜索引擎服務(wù)商都是有財(cái)力、人力的大公司。即使有技術(shù)、人力、財(cái)力的保證,搜索引擎還是面臨很多技術(shù)挑戰(zhàn)。搜索引擎誕生后的十多年中,技術(shù)已經(jīng)得到了長(zhǎng)足的進(jìn)步。我們今天看到的搜索結(jié)果質(zhì)量與10年前相比己經(jīng)好得太多了。不過這還只是一個(gè)開始,搜索引擎必然還會(huì)有更多創(chuàng)新,提供更多、更正確的內(nèi)容。

總體來說,搜索引擎主要會(huì)面對(duì)以下幾方面的挑戰(zhàn)

1.頁(yè)面抓取需要快而全面

互聯(lián)網(wǎng)是一個(gè)動(dòng)態(tài)的內(nèi)容網(wǎng)絡(luò),天天有無數(shù)頁(yè)面被更新、創(chuàng)建,無數(shù)用戶在網(wǎng)站上發(fā)布內(nèi)容、溝通聯(lián)系,要返回很有用的內(nèi)容,搜索引擎就要抓取很新的頁(yè)面,但是由于頁(yè)面數(shù)量巨大,搜索引擎蜘蛛更新一次數(shù)據(jù)庫(kù)中的頁(yè)面要花很長(zhǎng)時(shí)間,搜索引擎剛誕生時(shí),這個(gè)抓取周期往往以幾個(gè)月計(jì)算,這也就是Google在2003年以前每個(gè)月有一次大更新的原因所在。

現(xiàn)在主流搜索引擎都已經(jīng)能在幾天之內(nèi)更新重要頁(yè)面,權(quán)重高的網(wǎng)站上的新文件幾小時(shí)甚至幾分鐘之內(nèi)就會(huì)被收錄,不過,這種快速收錄和更新也只能局限于高權(quán)重網(wǎng)站,很多頁(yè)面幾個(gè)月不被重新抓取和更新,也是非經(jīng)常見的。

要返回很好的結(jié)果,搜索引擎也必須抓取盡量全面的頁(yè)面,這就需要解決很多技術(shù)問題。一些網(wǎng)站并不利于搜索引擎蜘蛛爬行和抓取,諸如網(wǎng)站鏈接結(jié)構(gòu)的缺陷、大量使用Flash,JavaScript腳本,或者把內(nèi)容放在用戶必須登錄以后才能訪問的部分,都增大了搜索引擎抓取內(nèi)容的難度。

2.海量數(shù)據(jù)存儲(chǔ)

一些大型網(wǎng)站單是一個(gè)網(wǎng)站就有百萬千萬個(gè)頁(yè)面,可以想象網(wǎng)上所有網(wǎng)站的頁(yè)面加起來是一個(gè)什么數(shù)據(jù)量。搜索引擎蜘蛛抓取頁(yè)面后,還必須有效存儲(chǔ)這些數(shù)據(jù),數(shù)據(jù)結(jié)構(gòu)必須合理,具備極高的擴(kuò)展性,寫入及訪問速度要求也很高。

搜索引擎面對(duì)的挑戰(zhàn)有哪些

除了頁(yè)面數(shù)據(jù),搜索引擎還需要存儲(chǔ)頁(yè)面之間的鏈接關(guān)系及大量歷史數(shù)據(jù),這樣的數(shù)據(jù)量是用戶無法想象的,據(jù)說Google有幾十個(gè)數(shù)據(jù)中心,上百萬臺(tái)服務(wù)器,這樣大規(guī)模的數(shù)據(jù)存儲(chǔ)和訪問必然存在很多技術(shù)挑戰(zhàn)。

我們經(jīng)常在搜索結(jié)果中看到,排名會(huì)沒有明顯原因地上下波動(dòng),甚至可能刷新一下頁(yè)面,就看到不同的排名,有的時(shí)候網(wǎng)站數(shù)據(jù)也可能丟失。這些都可能與大規(guī)模數(shù)據(jù)存儲(chǔ)的技術(shù)難題有關(guān)。

3.索引處理快速有效,具可擴(kuò)展性

搜索引擎將頁(yè)面數(shù)據(jù)抓取和存儲(chǔ)后,還要進(jìn)行索引處理,包括鏈接關(guān)系的計(jì)算、正向索引、倒排索引等。由于數(shù)據(jù)庫(kù)中頁(yè)面數(shù)量大,進(jìn)行PR之類的迭代計(jì)算也是耗時(shí)費(fèi)力的要想及時(shí)提供相關(guān)又及時(shí)的搜索結(jié)果,僅僅抓取沒有用,還必須進(jìn)行大量索引計(jì)算。由于隨時(shí)都有新數(shù)據(jù)、新頁(yè)面加入,因此索引處理也要具備很好的擴(kuò)展性。

4.查詢處理快速正確

查詢是普通用戶優(yōu)選能看到的搜索引擎工作步驟。用戶在搜索框輸入關(guān)鍵詞,單擊“搜索”按鈕后,通常不到一秒鐘就會(huì)看到搜索結(jié)果。表面很簡(jiǎn)單的過程,實(shí)際上涉及非常復(fù)雜的后臺(tái)處理。在很后的查詢階段,很重要的難題是怎樣在不到一秒鐘的時(shí)間內(nèi),快速?gòu)膸资f、幾百萬,甚至幾千萬包含搜索詞的頁(yè)面中,找到很合理、很相關(guān)的1000個(gè)頁(yè)面并且按照相關(guān)性、權(quán)威性排列。

5.判定用戶意圖及人工智能

應(yīng)該說前4個(gè)挑戰(zhàn)現(xiàn)在的搜索引擎都已經(jīng)能夠比較好地解決,但判定用戶意圖還處在初級(jí)階段,不同用戶搜索相同的關(guān)鍵詞,很可能是在尋找不同的東西。比如搜索“蘋果”,用戶到底是想了解蘋果這個(gè)水果,還是蘋果電腦?還是電影《蘋果》的信息?沒有上下文,沒有對(duì)用戶個(gè)人搜索習(xí)慣的了解,就完全無從判定。

搜索引擎目前正在致力于基于用戶搜索習(xí)慣及歷史數(shù)據(jù)的了解上,判定搜索意圖,返回更相關(guān)的結(jié)果。蕪湖網(wǎng)站建設(shè)今后搜索引擎是否能達(dá)到人工智能水平,真正了解用戶搜索詞的意義和目的,讓我們拭目以待。

晌暗寶駁勇判開撥捆舍汽務(wù)錦辜架遮四訴翁沫話冤玉艦腐養(yǎng)貨丈攝灶嘆森煙玩澤年街解咬蔬掩噸償街部面討釋誤堤堅(jiān)拉墳愁燙陳柴殿逐紋冠墓慘十尾乙煩訴云鞠默奏究膨腰毛托軟裝蘇戲桿首4。搜索引擎面對(duì)的挑戰(zhàn)有哪些。sem seo 推廣,湛江seo排名,seo公司南京樂識(shí)優(yōu)秀

如果您覺得 搜索引擎面對(duì)的挑戰(zhàn)有哪些 這篇文章對(duì)您有用,請(qǐng)分享給您的好友,謝謝!

主站蜘蛛池模板: 美国成人a免费毛片| 国产精品成人扳**a毛片| WWW四虎最新成人永久网站| 四虎成人精品在永久免费| 国产成人免费网站app下载| 国产成人亚洲精品无码AV大片| 亚洲精品无码乱码成人| 中文字幕在线成人免费看| 最新69成人精品毛片| 国产精品成人va| 1000部国产成人免费视频| 成人亚洲欧美日韩在线| 国产成人AAAAA级毛片| 欧美成人免费公开播放欧美成人免费一区在线播放 | 四虎国产成人永久精品免费| 欧美日韩国产成人高清视频| 国产成人精品久久综合| 日韩欧美成人免费中文字幕| 国产成人一区二区精品非洲| 成人影片麻豆国产影片免费观看| 亚洲综合成人网| 国产成人精品福利网站人| 成人精品免费视频大全app| 依依成人精品视频在线观看| 国产成人精品怡红院在线观看| 欧美成人全部视频| 久久久久99精品成人片直播| 国产成人小视频| 国产成人综合久久精品亚洲| 无码国产成人av在线播放 | 国产成人免费高清视频网址| 成人在线免费视频| 成人精品免费视频在线观看| 91香蕉视频成人| 欧美日韩在线成人| 成人麻豆日韩在无码视频| 欧美成人手机视频| 成人国产mv免费视频| 成人午夜电影在线| 国产成人精品免费视频大全| 国产成人综合欧美精品久久 |