想操作 SEO,先從搜尋引擎開始
想知道如何操作 SEO,如果沒有從搜尋引擎說起,等於讓一個不懂流體力學的人去製造飛機,肯定會走很多冤枉路。
操作 SEO 最有效的方式,就是讓搜尋引擎與訪客都喜歡我們的網站。我們要先從了解搜尋引擎的處理過程開始。
SEO of Contents
搜尋引擎的 7 大過程
Google 在官方文件中將搜尋引擎的處理過程分成四個程序:抓取、索引、演算法、以及清除垃圾網站,但其實可以細分 7 個程序。
-
抓取 ( Crawl )
-
索引 ( Index )
-
分析 ( Analyze )
-
過濾 ( Filter )
-
解析 ( Parse )
-
排名 ( Rank )
-
展示 ( Present )
雷大知識站
Google 官方文件沒有說明展示程序,並把分析、排名、解析的程序簡化成一個演算法程序。
-
抓取程式 / 爬蟲程式 ( Crawler ) 的處理過程決定了進入比賽的門票。
-
索引程式 ( Indexer ) 的處理過程決定了比賽的材料。
-
分析程式 ( Analyzer ) 的處理過程決定了網站的平常分數。
-
過濾程式 ( Filter ) 的處理過程則決定誰該退出比賽。
-
解析程式 ( Parser ) 與排名程式 ( Ranker/Ranking Algorithm ) 的處理過程決定了網站比賽的分數。
-
展示程式 ( Presenter ) 的處理過程決定了比賽結果的呈現方式。
所以如果你希望網站可以再使用者搜尋活動中脫穎而出,你的網站就必須在這些處理過程中,表現得比別的網站優異。
抓取程序
讓搜尋引擎正確完正地抓取
搜尋引擎會派出許多爬蟲程式拜訪網站到處抓資料,把這些資料抓到他們的資料中心。
你的網站必須在產生內容後,在「最短時間」內被搜尋引擎抓走資料,盡可能完整地抓取。
雷大知識站
抓取網頁資料的意思就是 Google 文件中所指的檢索,就是 Bing 說的編目。
也就是檢索 = 編目 = 抓取網頁。此外 Yahoo 目前的搜尋結果來自於 Bing 搜尋引擎,所以可將 Yahoo 與 Bing 視為同一個搜尋引擎。
最短時間內抓取
為什麼要在最短的時間內被抓取?
因為網站內容,有可能被複製,如果被其他網站複製以後,你的網站內容還沒有被搜尋引擎抓走,那麼用心製作的網站內容的原創性就有可能被誤判。
常見情況一
遇上網站的文章在網路上有千個轉載,如果轉載的網站沒有標示出處,並且比我們更早被搜尋引擎索引,搜尋引擎就可能無法判斷文章的內容原創性。
常見情況二
某一個網站的內容出現從來沒看過的關鍵字,當這個關鍵字開始大量被使用者搜尋後,這個網站跟這關鍵字的相關性就比其他網站來得高。大多是有突然爆紅或時事增長起飛,才有可能導致此關鍵字搜尋量突然大增。
雷大知識站
但是如果某個關鍵字是你們網站所獨創,但是你的網站並不是被搜尋引擎最早抓取,也許該關鍵字的獨創性,就會被另外一個網站拿走。
核心重點解析
為甚麼我們還要強調,網站內容要盡可能的「被」完整抓取呢?搜尋引擎不是會自己設法抓取所有網站內容嗎?
原則上搜尋引擎會透過各種途徑,主動抓取網站內容。但是因為搜尋引擎面對眾多網站,不可能不計代價抓取所有網站內容。
雷大要提醒各位!千萬記住!
網站如果對搜尋引擎沒有貢獻度,搜尋引擎是不會爬取你的網站資料。在這階段,你們應該做的事情:讓搜尋引擎正確快速的抓取網站資料。
索引程序
讓搜尋引擎正確而完整地索引
索引程序就是從抓回來的資料中找出有用的內容,進行有系統的儲存,在這階段中產生的結果,就是這網站進行搜尋比賽的材料。搜尋引擎會將不重要的內容刪除,或是將你的內容進行調整。
所以如果你原本安排好的關鍵字,在這過程中消失了,或是跟原本預期的不一樣,當然就不會在搜尋結果看到。但是你根本不知道發生什麼事情,因為搜尋引擎未必會告訴你處理後的結果。
搜尋引擎相關工具
另外從搜尋引擎相關工具,像是 Google 的 Search Console ( 原名網站管理員工具,Google Webmaster Tools ),或是 Bing 的網站管理員工具,也可以從中了解搜尋引擎處理網站內容的動向。
雷大知識站
Google 與 Bing 的網站管理員工具都是網站與搜尋引擎溝通的工具,搜尋引擎會在網站管理員工具顯示處理網站資料的狀況,網站也可以透過網站管理員工具告訴搜尋引擎網站的結構與設定。
▲Google 網站管理員工具上會顯示被搜尋關鍵字以及網頁等數據
我們曾經看過許多網站的網頁標題被搜尋引擎改寫,卻盼望網頁可以被搜尋到,但是就算等一千萬年,使用者也無法透過你設定的標題搜尋到你的網頁。
常見問題
曾經有些企業網頁已經被搜尋引擎抓走,但是卻沒有被索引,因為被判定大量重複。如果沒有注意網站管理員工具的訊息,根本無法得知網站存在重大問題。
在這階段,應該做的事情:
讓搜尋引擎正確而沒有重複的索引網站資料。
分析程序
了解搜尋引擎的分析重點
分析就是計算網頁內與網頁間的各項數據,像是網頁的信賴度、網頁的連結分析、及網頁的分類。
搜尋引擎在此階段當中,會進行兩種分析的過程。第一種跟關鍵字有關,第二種跟關鍵字無關。
關鍵字相關性
跟關鍵字有關的處理,就是網頁跟內容萃取出來的關鍵字的相關性。
網頁信賴度分析
跟關鍵字無關的處理,就是網頁信賴度之類的分析。
綜合性分析
另外搜尋引擎處理與關鍵字無關的網頁分析,也會透過各種不同的訊號,像是連結的質量、網站的歷史、網站的流量、網站的品牌知名度等因素,進行綜合性的分析。
▲Google 網站管理員工具顯示網站連結狀態
在這階段,應該做的事情:
提供搜尋引擎正確且足夠關鍵字資訊,建立充分的相關性。
過濾程序
避免違反搜尋引擎規範
過濾就是搜尋引擎運用規則資料庫把不合規範的網頁排除,就是 Google 所謂的清理垃圾網站 ( Spam Fighting )。
熊貓演算法
像是 Google 熊貓演算法更新於 2011 年 2 月 24日,目的是讓搜尋結果顯示的網站都能符合 Google 的品質要求,換句話也就是希望打擊低品質的網站,像是內容農場 ( Content Farm )。
企鵝演算法
而 Google 企鵝演算法更新是在 2012/4/24 推出的演算法更新,目的是為了處罰作弊的網站,像是連結作弊 ( Link Spam )。
雷大知識站
內容農場就是指以各種方式大量製造垃圾內容,來取得網路流量或是欺騙搜尋引擎為主要目標的網站。
專人介入處理
有些過濾程式處罰的網站可以在 Google 網站管理員內,在「專人介入處理」選單看到被處罰的項目。
▲Google 網站管理員工具會顯示專人介入處理項目。
在這階段,應該做的事情:
避免違反搜尋引擎規範,重視網頁內容與網頁連結品質。
解析程序
提高查詢關鍵字與關鍵字的吻合度
當使用者輸入查詢詞搜尋當下,搜尋引擎必須判斷查詢目的,才有辦法進行後續處理。
不同教育程度的使用者,或是不同工作類型的使用者,會使用搜尋的關鍵字可能天差地別。
查詢使用者的用詞素養,可能存在巫師與麻瓜的分別。所以解析程序的責任就相當重大,如果誤會了使用者的查詢目的,就功虧一簣。
雷大知識站
查詢詞 ( Search Queries ) 指使用者進行搜尋的用詞。
關鍵字 ( Keywords ) 指重要而關鍵的詞彙。通常關鍵字是 SEO 的用語,使用者並不太知道他的查詢詞中那些是關鍵字詞。
▲使用者使用各種查詢詞搜尋,請參考 Google Suggest。
在這階段,應該做的事情:
了解妳的目標客戶會使用哪些查詢詞
以及目標客戶會希望看到哪些內容
並將查詢詞的內容安排在網頁之中。
排名程序
了解搜尋引擎的排名因素
解析結果後,搜尋引擎會把資料依照排名因素排序,即時決定排名所要顯示的資料。如果沒有特別說明,大家所說的 Google 演算法大多都是指排名程序演算法,其中的排名因素 ( Ranking Factors ) 就是用來決定排名的因素。
排名因素有哪些?
大致上可以分為整體網站的排名因素、網頁內部的排名因素、網頁間的排名因素、使用者行為的排名因素等。
排名程序最讓大家頭痛的就是會經常更新個因素的權重,像是網頁本身的品質逐步變成重要因素。至於很容易操作的連結,搜尋引擎越來越重視連結品質,並非連結數量。
在這階段,應該做的事情:
經常性撰寫原創性內容
並在內文及網頁標題安排適當的關鍵字
展示程序
了解搜尋引擎的展示規則
展示就是決定要如何顯示給使用者瀏覽,包含網頁標題、網頁描述、以及搜尋結果下額外的連結 ( Site Link ) 資訊。Site Link 在搜尋結果的網頁下的惡外連結資訊。
這個過程是比較少被談論的議題,因為大部分網站都只在意是否被搜尋得到,而不在意網也被展示出來的樣子。但是網頁被展示的內容與方式,會決定被點選的機率。
常見情況
如果有特別注意,應該會看過搜尋結果被搜尋引擎更改標題,就因為沒有注意搜尋引擎的展示程序的處理原則,才會發生事情。
▲玩攻略 – 狼人殺的網頁標題,超過28 個中文字。
在這階段,應該做的事情:
標題長度應盡量保持在 28 個中文字以內
並適當使用語意標記。
雷大 SEO 小結論
操作 SEO 不能只注意搜尋引擎的排名因素,需要注意搜尋營的抓取、索引、分析、過濾、解析、排名、以及展示七個程序,網站在其中任何一個程序發生問題,就會影響 SEO 的操作成效。
延伸閱讀