网友真实露脸自拍10p,成人国产精品秘?久久久按摩,国产精品久久久久久无码不卡,成人免费区一区二区三区

幫助

SEO除了“中文分詞”還有“文本分析”

2019-02-16 09:57 技術(shù)文檔

對于剛?cè)肼毜腟EO人員,日常工作中,我們很少談?wù)?ldquo;中文分詞”與“文本分析”,但在實(shí)際的SEO項(xiàng)目操作中,一個成熟的SEO運(yùn)營,有必要的進(jìn)一步對二者進(jìn)行加以了解。  

理由很簡單,它是搜索引擎的工作原理中最基礎(chǔ),而又十分重要的因素之一,在此之前,我們更多的是對“中文分詞”的了解,而本文,我們也會進(jìn)一步討論:文本分析在SEO中的重要性。  

那么,SEO如何理解:中文分詞與文本分析?  

根據(jù)以往SEO關(guān)鍵詞優(yōu)化的經(jīng)驗(yàn),將通過如下內(nèi)容,進(jìn)一步闡述二者的重要性:  

1、中文分詞  

簡單理解:在SEO優(yōu)化的過程中,我們偶爾會遇到這樣一種情況,那就是當(dāng)你檢索某一個特定詞組的時候,你會發(fā)現(xiàn)網(wǎng)頁title中,并沒有包含特定的完整關(guān)鍵詞,而該頁面卻在SERP中,排名第一。  

這就要提到我們:中文分詞對頁面相關(guān)性的理解,實(shí)際上,對于任何一個內(nèi)容頁面,搜索引擎都會常識抓取與識別頁面詞組,利用一個個詞組的頻率,通過復(fù)雜的算法,進(jìn)行頁面相關(guān)性的識別,從而參與到索引排序中。  

通常而言,中文分詞算法主要包括如下四個策略:正向最大匹配法、逆向最大匹配法、最少切分、雙向最大匹配法。  

當(dāng)然,中文分詞是一個動態(tài)更新的過程,每天都會產(chǎn)生大量的新詞匯,對于搜索引擎而言,它需要利用一定周期學(xué)習(xí),一般而言它基于詞典(類似于海量關(guān)鍵詞庫)以及相關(guān)統(tǒng)計方法,進(jìn)行篩選與相關(guān)性計算。  

一般而言,一個內(nèi)容頁面,在分詞后,被搜索引擎會按照簡單的四個要素,進(jìn)行基礎(chǔ)性分類,比如:  

① 關(guān)鍵詞  

② 詞性(關(guān)鍵詞的屬性,名詞、動詞、形容詞等)  

③ 頻率  

④ 權(quán)重(它類似于關(guān)鍵詞密度)  

從而經(jīng)過一些列的數(shù)據(jù)分析與評估,進(jìn)入倒排索引的序列,用于用戶檢索時,給出相應(yīng)的搜索結(jié)果。  

2、文檔分析  

相對于中文分詞而言,如果說它是從詞的角度理解頁面內(nèi)容,而經(jīng)過蝙蝠俠IT多年的實(shí)戰(zhàn)經(jīng)驗(yàn),則認(rèn)為文檔分析,則更加強(qiáng)調(diào)頁面結(jié)構(gòu)的屬性,它主要包括:  

① 字?jǐn)?shù)統(tǒng)計:內(nèi)容頁面,可識別文字的數(shù)量,側(cè)面反應(yīng)頁面的長度。  

② 項(xiàng)目符號:段落中使用的邏輯符號,以及文本內(nèi)容中,特有表情字符的利用。  

③ 邏輯結(jié)構(gòu):它主要包括段落行文結(jié)構(gòu),內(nèi)在的邏輯關(guān)系,以及相關(guān)性詞語的使用。  

④ 文本標(biāo)簽:常見頁面標(biāo)簽的使用,比如:H標(biāo)簽與<strong>標(biāo)簽等。  

⑤ 文本比率:在早期一篇關(guān)于SEO代碼優(yōu)化的文章中,我們進(jìn)行了詳細(xì)的闡述。  

其中,文檔分析中所涉及的相關(guān)元素,使得每個頁面,具有一定的獨(dú)立性,在成千上萬頁面中,具備一定的稀缺性,特別是針對相關(guān)影響因子,統(tǒng)計分析,它與網(wǎng)站排名之間的關(guān)系。  

因此,文檔分析在SEO的工作中,顯得格外重要。  

總結(jié):與其說,中文分詞,讓我們深刻理解,頁面相關(guān)性的問題,而文檔分析,則是讓頁面脫穎而出的一個利器,而上述內(nèi)容,只是針對相關(guān)概念的簡單闡述,涉及的原理只是冰山一角,僅供參考。


相關(guān)推薦

QQ在線咨詢
AI智能客服 ×