時(shí)間:12-28
欄目:SEO優(yōu)化
TF-IDF算法為什么對(duì)SEO很重要?值得一看
在過去一年左右的時(shí)間里,你可能已經(jīng)看到TF-IDF這個(gè)詞被扔了出去,許多搜索引擎優(yōu)化的潮流來了又去,一些很有趣的搜索引擎優(yōu)化很終會(huì)招致懲罰,對(duì)嗎?
但是TF-IDF有點(diǎn)不同。
TF-IDF算法不是對(duì)搜索引擎的操縱,而是一種分析內(nèi)容主題的方法,它基于與搜索引擎本身相同的原則。因此,需要一種真正客觀的方法來衡量和改進(jìn)其內(nèi)容的SEOer具有驚人的潛力。
我剛剛將案例研究完全納入我的能力范圍,結(jié)果非常有趣。
在我從個(gè)人實(shí)驗(yàn)中學(xué)到東西之前,我想確定我了解TF-IDF以及它是如何使用的。
TF-IDF是什么?
字面意思是術(shù)語頻率乘以逆文檔頻率。
TF-IDF是一個(gè)結(jié)合了這兩種度量的等式,它度量一個(gè)術(shù)語在頁面上的使用頻率(TF)和該術(shù)語在集合的所有頁面中的出現(xiàn)頻率(IDF),以指定一個(gè)分?jǐn)?shù)或權(quán)重,即該術(shù)語對(duì)頁面的重要性。
這個(gè)等式在學(xué)術(shù)界由來已久。語言學(xué)和信息架構(gòu)領(lǐng)域的研究人員使用它作為一種方法,在時(shí)間的短時(shí)間內(nèi)分析了大量的文檔庫。
它也被信息檢索程序(包括所有的搜索引擎)用來有效地分類和判定數(shù)百萬個(gè)結(jié)果的相關(guān)性。
對(duì)于相同的信息,你想做什么和搜索引擎想做什么有很大的區(qū)別。
搜索引擎想要考慮網(wǎng)絡(luò)上所有結(jié)果的集合,而你想要將一個(gè)網(wǎng)頁或網(wǎng)站與表現(xiàn)不佳的網(wǎng)站進(jìn)行比較.前十名。
仔細(xì)看看TF和IDF的等式.你可能需要做一些數(shù)學(xué)計(jì)算來得到所有的測(cè)量值,即TF和IDF。但我保證不會(huì)那么難。根據(jù)不同的應(yīng)用,TF-IDF的等式可能比我下面使用的例子要復(fù)雜得多。
無論是否簡化,假如你試圖優(yōu)化你的網(wǎng)站,你通常不希望被手動(dòng)捕捉。這些方程將幫助你理解TF-IDF的功能,但它是我在很后討論的工具,真正打開了潛力。
通過計(jì)算一個(gè)術(shù)語在頁面上出現(xiàn)的次數(shù)來確定第一個(gè)術(shù)語的出現(xiàn)頻率。然后,將數(shù)字插入下面的等式中:
期限頻率=(原始計(jì)數(shù))/(文件總字?jǐn)?shù))
反向文檔頻率(術(shù)語)=log(文檔數(shù)//(包含關(guān)鍵字的文檔)
通過將術(shù)語出現(xiàn)的文檔數(shù)除以所選集合中的文檔總數(shù)來計(jì)算文檔的倒排頻率,如下:
為什么TF-IDF對(duì)SEO很重要?
使用TF-IDF增強(qiáng)關(guān)鍵字研究
如何使用TF-IDF?
TF
通過對(duì)測(cè)量的頁面進(jìn)行評(píng)分,你幾乎可以理解谷歌和百度是如何對(duì)同一主題的網(wǎng)站進(jìn)行評(píng)分的。
目前還不清楚谷歌或百度等搜索引擎是否在其算法中使用TF-IDF。假如是,它是一種變體嗎?換句話說,有一些私人相關(guān)性研究,我已經(jīng)知道他們的數(shù)據(jù)表明這是可能的。TF-IDF分析答應(yīng)您基于算法已經(jīng)授予的內(nèi)容來優(yōu)化術(shù)語的平衡。
(PPC)=(12/100)=0.12
IDF
例如,假設(shè)你已經(jīng)完成關(guān)鍵詞研究,優(yōu)化“搜索引擎優(yōu)化培訓(xùn)”頁面。大多數(shù)關(guān)鍵詞研究工具都會(huì)吐出“搜索引擎優(yōu)化培訓(xùn)”、“搜索引擎優(yōu)化培訓(xùn)”等關(guān)鍵詞。
當(dāng)你使用我將在后面介紹的TF-IDF工具時(shí),你也可以在首頁上找到相關(guān)的非SEO術(shù)語,這些術(shù)語在使用常規(guī)關(guān)鍵詞研究之前你從未找到過。“法律”、“經(jīng)驗(yàn)”、“權(quán)利”和“實(shí)踐”等術(shù)語。單詞
不會(huì)出現(xiàn)在關(guān)鍵詞搜索工具中,因?yàn)槲恼卤旧聿粫?huì)對(duì)它們進(jìn)行排名,但是它們需要講述搜索意圖的故事。
(PPC)=log(10,000,000/300,000)=1.52
(PPC)=0.12*1.52=0.182
TF(是)=(12/100)=0.12
現(xiàn)在,假設(shè)您想知道這種用法與網(wǎng)絡(luò)的其他部分相比如何。從10,000,000的樣本量來看,這些頁面中至少有一些是關(guān)于網(wǎng)絡(luò)服務(wù)的,并且會(huì)包含對(duì)PPC的引用。例如,30萬。
我們可以用這些數(shù)字來完成反文檔頻率方程。
IDF(是)=log(10,000,000/8,000,000)=0.09
現(xiàn)在,您可以使用TF-IDF公式根據(jù)這個(gè)術(shù)語
TF-IDF(是)=0.12*0.09=0.010
對(duì)頁面進(jìn)行評(píng)分。事實(shí)是,這不是一個(gè)滿足限制的問題。你想在第一頁上用很好的網(wǎng)站來平衡目標(biāo)詞的得分。
一個(gè)學(xué)期的高分不一定是件好事(究竟,100個(gè)單詞中有12個(gè)被大量使用)。
像“是”、“這個(gè)”或“和”這樣的常用詞怎么樣?由于方程的結(jié)構(gòu),這種噪聲不是真正的問題。
這些詞經(jīng)常在整個(gè)文檔中使用,因此這些詞的重要性大大降低。
讓我們回到這個(gè)等式。為了真正說明這種差異,我們會(huì)說頁面上有同樣多的“是”和“PPC”。

結(jié)論010-59000
但是看看當(dāng)我們完成IDF等式時(shí)會(huì)發(fā)生什么,我們知道大多數(shù)結(jié)果將包含單詞“是”,例如8,000,000。
010-59000010-59000
這將導(dǎo)致很終的TF-IDF值:
TF-IDF010-59000
TF-IDF值與文檔中使用的短語數(shù)成比例增加,但是在這種情況下,它被整個(gè)集合的其余部分中的單詞頻率所抵消,并且它的值得分與很后一個(gè)示例相同。
換句話說,這個(gè)詞越常見,IDF越小。“短語”怎么樣?
搜索引擎傾向于在單個(gè)術(shù)語上賦予多詞短語額外的權(quán)重。
考慮到語言的自然品質(zhì),這尤其正確。
當(dāng)然,您希望使用這些考慮因素來執(zhí)行TF-IDF評(píng)估。
幸運(yùn)的是,你不需要額外的努力,大多數(shù)TF-IDF工具可以將關(guān)鍵詞計(jì)算成兩個(gè)詞和三個(gè)詞的版本。
當(dāng)TF-IDF專門用于學(xué)術(shù)和研究目的時(shí),該術(shù)語被計(jì)算為稱為雙字母組的兩個(gè)單詞組或稱為三字母組的三個(gè)單詞組。搜索引擎也是這樣做的,所以用和他們一樣的方式分析你的內(nèi)容是非常重要的。
使用上一個(gè)PPC頁面的例子,讓我們看看可能出現(xiàn)在頁面上的短語以及這些短語可能對(duì)主題提出的建議。
“PPC廣告系列需要許多廣告”
這個(gè)短語中的每一組兩個(gè)單詞可以被計(jì)算為一組兩個(gè)字母的組合。
活動(dòng)要求
活動(dòng)要求
活動(dòng)要求
當(dāng)添加第三個(gè)單詞時(shí),當(dāng)考慮更長的短語時(shí),將會(huì)更清楚地添加多少重要的上下文。
當(dāng)添加第三個(gè)單詞時(shí),當(dāng)考慮更長的短語時(shí),將會(huì)更清楚地添加多少重要的上下文。
PPC活動(dòng)要求
活動(dòng)要求
etc
當(dāng)添加第三個(gè)單詞時(shí),當(dāng)考慮更長的短語時(shí),將會(huì)更清楚地添加多少重要的上下文。
在開始構(gòu)建內(nèi)容之前,這是一種學(xué)習(xí)更多內(nèi)容的方法,然后知道在哪里以及如何再次完善它。
一旦你選擇了工具,你只需要知道一步一步選擇每個(gè)關(guān)鍵詞的過程。假如您沒有選擇TF-IDF工具,您可以在下一節(jié)中找到我用它們執(zhí)行的測(cè)試中的數(shù)據(jù)。
1)writecontent

按照您所知的很高標(biāo)準(zhǔn)編寫內(nèi)容,或者引用您為客戶優(yōu)化的內(nèi)容。創(chuàng)建一個(gè)包含一個(gè)、兩個(gè)或三個(gè)單詞的主題列表,并將其添加到您選擇的TF-IDF工具中。
你的目標(biāo)是找到關(guān)鍵詞和高級(jí)域名的網(wǎng)址,以揭示你遺漏了哪些主題,哪些主題你沒有深入討論過。
2)插入TF-IDF工具
每個(gè)工具的工作方式都有所不同,它們跟蹤不同的信息,但很有用的信息是幫助您了解競爭對(duì)手如何通過使用關(guān)鍵詞取得成功。
使用您選擇的工具的任何功能來幫助您找到與前10-20個(gè)網(wǎng)站相關(guān)聯(lián)的單詞,然后生成一個(gè)反映它所使用的每個(gè)其他單詞的權(quán)重的分?jǐn)?shù)。
3)重新優(yōu)化內(nèi)容
現(xiàn)在,您已經(jīng)完全理解了每個(gè)競爭對(duì)手的主題以及這些詞語的使用頻率,您可以使用這些信息來優(yōu)化您自己的內(nèi)容。
第二次交付內(nèi)容,并找到一種自然的方式來介紹你還沒有涉及的主題。請(qǐng)記住,你的動(dòng)機(jī)不是不自然的,而是為了恢復(fù)他們目前缺失的自然聯(lián)系。
4)發(fā)布
使用您很近從搜索中收集的見解發(fā)布更新的內(nèi)容。從這里,你可以繼續(xù)分析它和排名的任何變化。

5)在TF-IDF圖之前和之后顯示
TF-IDF的好處之一是,它答應(yīng)您在非常小的級(jí)別跟蹤性能。在每次內(nèi)容調(diào)整之前和之后,您可以生成關(guān)于頁面上主題平衡如何變化的圖表。對(duì)于那些有愛好查看您對(duì)其內(nèi)容所做更改的特定指標(biāo)的客戶來說,這些非常有用。
TF-IDF工具
blogger只找到了一些針對(duì)谷歌等英文搜索引擎優(yōu)化的TF-IDF工具,但目前還沒有針對(duì)中文的TF-IDF工具。
1.text-tools
2.ftf.agency
010-59000
我希望本文能幫助我們清楚地理解TF-IDF分析。
你不僅學(xué)會(huì)了它背后的數(shù)學(xué),還學(xué)會(huì)了如何將它應(yīng)用于搜索引擎優(yōu)化,并在你的文章中創(chuàng)造相關(guān)性。
本文介紹了TF-IDF算法為什么對(duì)SEO很重要?的內(nèi)容,希望對(duì)您有所幫助。以上分析只是冰山一角,僅供參考!
猜您喜歡
專業(yè)seo公司拾首選金手指五站內(nèi)seo是什么SEO個(gè)人單頁武漢網(wǎng)絡(luò)接單佳選樂云seo十年魔貝凡seo課程怎么樣都勻網(wǎng)站優(yōu)化推廣seoseo文章采集工具咸陽網(wǎng)站seo優(yōu)化方案seo南沙seoseo培訓(xùn)有用嗎seo按天計(jì)費(fèi)系統(tǒng)源碼興化seo西安seo服務(wù)信陽seoseo優(yōu)化招人分工鄭州網(wǎng)站制作效果樂云seo完美日記SEO優(yōu)化建議什么是SEO思維武漢seo_三優(yōu)面試自我介紹SEO廣州seo#1t宙斯di詞seo基礎(chǔ)教程毫金手指科杰五無錫seo公司排名鄭州seo軟件效果樂云seo品牌成都網(wǎng)站建設(shè)有名樂云seoseo公司 創(chuàng)業(yè)黑帽seo站群推送工具網(wǎng)站seo網(wǎng)站分析濟(jì)南騷東seo網(wǎng)站設(shè)計(jì)選擇樂云seoseo頁面優(yōu)化外包人人都是seo總監(jiān)壓提趁叔滾協(xié)舒其惡感柳浙牛卵竊益喜徑捐舊賭拍厘慰述露抬定未烏偵黨戶餓組子乳肢陪巧律察沖苗擺麥煎慎李醒販漁么返撇氏奇三腔谷18。TF-IDF算法為什么對(duì)SEO很重要。360seo優(yōu)化軟件,通過簡書seo外鏈,新鄉(xiāng)seo優(yōu)化軟件,無錫seo外包行者seo08
如果您覺得 TF-IDF算法為什么對(duì)SEO很重要 這篇文章對(duì)您有用,請(qǐng)分享給您的好友,謝謝!
- 1做網(wǎng)站seo優(yōu)化首先了解SEO策略的重要性
- 2怎樣預(yù)防網(wǎng)站關(guān)鍵詞排名下降的方法
- 3影響網(wǎng)站關(guān)鍵詞搜索結(jié)果點(diǎn)擊率優(yōu)化的16個(gè)因素
- 4百度冰桶算法說明如何避免冰桶算法呢
- 5設(shè)置網(wǎng)站URL規(guī)范化是提升關(guān)鍵詞排名的保護(hù)傘-天線貓
- 6怎么做SEO可以幫助新站快速度過考核期
- 7怎么判定關(guān)鍵詞競爭程度SEO
- 8網(wǎng)站整體seo存在病癥如何醫(yī)治
- 9SEO優(yōu)化做的好不好就看用戶體驗(yàn)
- 10seo的內(nèi)容怎么優(yōu)化如何寫seo文章