“內容為王,外鏈為皇,內鏈為妃,關鍵詞為相,代碼為將,結構為城,更新為太子”
做seo很大程度是做關鍵詞排名。把關鍵詞做到首頁是做seo的基本目標,有首頁排名才有更好的展現機會,才可能有更好的轉化率。
一、搜索原理
網絡蜘蛛即WebSpider,如果把互聯網比喻成一個蜘蛛網,那么Spider就是在網上爬來爬去的蜘蛛。網絡蜘蛛是通過網頁的鏈接地址來尋找網頁,從網站某一個頁面(通常是首頁)開始,讀取網頁的內容,找到在網頁中的其它鏈接地址,然后通過這些鏈接地址尋找下一個網頁,這樣一直循環下去,直到把這個網站所有網頁都抓取完為止。如果把整個互聯網當成一個網站,那么網絡蜘蛛就可以用這個原理把互聯網上所有的網頁都抓取下來。
1、抓取
搜索引擎會和普通訪問者一樣,順著網頁上的鏈接一個個下載我們的網頁,為下一步的預處理做準備。
2、預處理
①.判斷是否符合其收錄規則,符合收錄規則的再繼續處理
②.對文章進行分詞處理
把網頁中的文章切成一個個的詞語。度量文檔之間的相關性,以及為建立倒排索引做準備。并記錄詞出現的位置。
③. 建立倒排索引
在搜索引擎中每個文件都對應一個文件ID,文件內容被表示為一系列關鍵詞的集合
把文件ID對應到關鍵詞的映射轉換為關鍵詞到文件ID的映射。
用詞來索引網頁,好處在于:搜索引擎的用戶輸入的也是詞,這樣可以方便地查找到相關的網頁。
3、檢索
①.對用戶查詢的關鍵詞進行分詞,取索引的交集
②.排序
重要性——網頁靜態質量得分。搜索引擎把網站的各種表現情況轉換成一個個分值,這些分值加起來,就得到一個頁面的質量得分,即所謂的權重。
a、頁面信噪比:
頁面信噪比是指頁面內正文與非正文的比例,頁面信噪比至少要大于1。
b、稀缺性
c、鏈接控制:
鏈接控制分鏈接數量和鏈接自然性。一個頁面權重是固定的,鏈接可以傳遞權重,鏈接越多,每一個鏈接傳遞的權重越低。
d、頁面的瀏覽量
相關性——上面通過倒排索引只能定性地知道網頁和查詢詞之間是否相關,但誰更相關即定量是沒辦法知道的。百度處理方式:
a、記錄詞出現的位置,不同位置的關鍵詞權重不同。
b、tf-idf算法,即一個詞在一篇文章中出現的次數最多,這個詞的權重越高;一個詞在整個互聯網中出現的次數越多,(如“我”、“的”這種詞,對于一篇文章主題的鑒別能力不強,每篇文章幾乎都出現)這個詞的權重越小。
4、常用的高級搜索指令:
site: SEO 最熟悉的高級搜索指令,用來搜索某個域名下的所有文件。
inurl: 指令用于搜索查詢詞出現在url 中的頁面。
intitle: 指令返回的是頁面title 中包含關鍵詞的頁面。
domain: 其作用就是來查詢域名下的反鏈(反鏈=外鏈+內鏈)。
二、索引排名
1、收錄與索引
收錄:頁面被Baiduspider發現、分析過
索引:Baiduspider經初步分析后認為有意義,做建庫處理
收錄索引的關系是包含關系,先收錄才可以建索引,收錄量大于索引量。
百度表示第三方提供的所謂收錄查詢都是不靠譜的。
1-1、索引文章決定因素:
信任度;
文章質量;
更新頻率;
網站結構;
熊掌號、站點地圖對百度收錄有促進效果;
網站的年齡以及權重影響著百度對網站的收錄效果。
1-2、加快頁面索引方法:
做好網站TDK,并不要修改;
積累高質量網站內容;
每日定時定量的更新;
提交百度等搜索引擎,包括sitemap、熊掌號等;
重點做好熊掌號,目前熊掌號提交已能實現移動站收錄80%以上;
有針對性并有規律的發布高質量外鏈。
2、文章質量判斷(百度官方)
①. 受眾
受眾群體的大小,即代表了用戶檢索需求的大小。
②. 稀缺
稀缺主要是描述頁面在互聯網中的獨特性。
③. 質量
a不能是死鏈、網站訪問速度是否令人滿意。
b主體內容是否完整、版式和字體是否易讀、各類廣告會不會太多。
c信息是否豐富、延伸出的次級需求是否滿足。
④. 時效
3、原創識別判斷
①.發布時間——蜘蛛抓取的日期
②.錨文本鏈接——網站頁面外鏈的多少
③.信息指紋——文章內容雷同相似的程度
4、標題優化方法
從搜索引擎搜索到的內容的標題往往是網頁title的內容,搜索引擎給與標題的權重很高。
①.標題通順、吸引人、符合文章實際。
②.標題一定要原創,包含核心關鍵詞和長尾詞,與內容關鍵詞保持一致
③.寫作要符合搜索引擎習慣,少用標點
④.長度要合適,控制在二十二個漢字以內
5、內容優化方法
主要分為兩部分:一部分是原創/偽原創,另一部分是采集素材庫審核。
至少首段需要純原創,且最好是有搜索可能的內容,整段以玩家搜索需求來寫。
正文最好分小標題有條理的展開
以內容價值為主 偽原創方法
尋找有價值的文章,最好是當天發布的,也可利用爬蟲抓取的數據庫改寫
有價值的文章具有很好的可讀性、目標明確、能夠吸引人的眼球。
①、修改文章的首尾部分:
首尾段重新概括,把正文里面的順序打亂,把一些不相關的去掉。加入觀點。
②、拆分重組原文:找幾篇相關性比較強的文章組合成一篇新的文章
③、相關內容的合并組合
④、翻譯其他語言的文章
⑤、利用論壇、博客、新媒體等挖掘文章
6、圖片優化方法
搜索引擎對于大多數圖片的原創性的識別已經具備一定能力
針對圖片的算法主要有計算哈希值、pHash算法和SIFT算法,及將目標圖像進行編碼,形成“指紋”存儲起來。
①.在圖片上加水印;
②.改變原有圖片的長寬尺寸比,或者直接截取某一部分圖片;
③.圖片長寬比盡量接近121*75,也就是接近百度搜索展示的縮略圖尺寸;
④.縮略圖內鏈,與文字鏈接相比較,更能吸引訪客去點擊,注意相關性。
⑤.加上alt描述,可以增強頁面關鍵詞主題,但注意千萬不要堆砌關鍵詞。
⑥.百度對原創內容越來越喜歡,實際上圖片也是頁面的一部分。
7、關鍵詞優化方法
關鍵詞分類:核心關鍵詞;相關關鍵詞;長尾關鍵詞;錯誤關鍵詞;生僻關鍵詞
①、要站在用戶的角度考慮,多想想用戶在搜索時會使用什么詞
②、不超過5個,一般3個:主關鍵詞、副關鍵詞、一個潛力的長尾關鍵詞
③、關鍵詞密度不超過2%—8%(根據需要,不絕對)
7-1怎樣篩選合適的主關鍵詞
①、搜索量和曝光量相對較高
a百度指數:
b百度風云榜:
c各個線上渠道媒體、微信微博等曝光度:
②、競爭度相對較小
看一個關鍵詞競爭度大小可以從以下方面著手:
a第1頁搜索結果中主頁排名占比
當把一個關鍵詞放在搜索引擎中搜索的時候,我們可以查看一下首頁排名網站中以主頁形式存在有多少,如果主頁排名網站占比很大,說明這個詞競爭度也比較大
b競爭對手網站權重怎么樣
除了主頁排名,還有就是看看參與首頁網站排名中主域權重怎么樣,將對方網站主域放在站長工具中搜索一下,看看對方權重怎么樣。如果普遍較高說明競爭難度也挺大。
c關鍵詞搜索結果數
搜索引擎下出現的相關搜索結果表示它數據庫網頁中有多少個網頁出現所搜索的這個關鍵詞,從某種程度上也可以間接的反映這個詞的熱度。
d關鍵詞參與競價網站數目
通過參與競價的網站數量可以反映出這個詞的商業價值高不高,也就間接反映了關鍵詞的競爭度,說明用戶搜索需求比較大,或者這個詞精準性比較強。
7-2關鍵詞放什么位置好
①內容中自然分布關鍵詞,應該在文章的每個段落里;
②網頁頭部標簽(如:tdk)應該放著關鍵詞;
③網頁上圖片的ALT標簽里應該寫上關鍵詞;
④在H1標簽中加入關鍵詞;
⑤內容評論中出現關鍵詞;
⑥URL中體現英文關鍵詞;
⑦鏈出鏈接錨文字中包含關鍵詞,并注意錨文字要多樣化。
7-3怎樣篩選合適的長尾關鍵詞
①百度下拉框和相關搜索;
②字母A-Z、空格等繼續鋪詞。
三、用戶轉化
用戶搜索到頁面后,能否帶來轉化取決于是否符合用戶的需求和潛在需求
主要在頁面設計、內容結構上予以優化,做好用戶體驗和引導下載。
四、SEO思維方向
1.內容建設:是不是當前廣大用戶需求的內容?
2 .競爭對手:對手都是怎么在做的?我們如何差異化?
3.協調資源:我們該協調哪些資源來促成優化改進?
4.站內優化:把seo細節做到極致
5.站外優化:如何進行鏈接推廣
6.迭代優化:數據分析促進改進頁面體驗
五、SEO常用工具&相關網站
百度站長平臺
百度統計/CNZZ
金花站長工具/追詞;愛站/站長工具等
站長之家:http://www.chinaz.com/
六、百度搜索相關算法
1.驚雷算法 打擊刷點擊作弊行為
2.閃電算法 打壓加載非常慢(3秒及以上)的網頁
3-1.清風算法 百度推出清風算法,嚴懲網頁標題作弊
3-2.清風算法2.0 打擊實際下載資源與需求不符和提供了下載鏈接實際站點無下載資源
4.颶風算法 打擊惡劣采集
5.藍天算法 打擊新聞源售賣軟文、目錄行為
6.天網算法 打擊盜取用戶隱私行為
7-1.冰桶算法4.0 打擊移動搜索結果頁廣告過多、影響用戶體驗的頁面
7-2.冰桶算法4.5 打擊發布惡劣誘導類廣告的頁面
8.石榴算法 打擊PC端網站頁面廣告過多影響用戶體驗行為
9.綠蘿算法 打擊超鏈買賣行為