搜尋引擎運作大解析

SEO搜尋引擎7大神解析

想操作 SEO,先從搜尋引擎開始

想知道如何操作 SEO,如果沒有從搜尋引擎說起,等於讓一個不懂流體力學的人去製造飛機,肯定會走很多冤枉路。

操作 SEO 最有效的方式,就是讓搜尋引擎與訪客都喜歡我們的網站。我們要先從了解搜尋引擎的處理過程開始。


搜尋引擎的 7 大過程

Google 在官方文件中將搜尋引擎的處理過程分成四個程序:抓取、索引、演算法、以及清除垃圾網站,但其實可以細分 7 個程序。

  1. 抓取 ( Crawl ) 

  2. 索引 ( Index )

  3. 分析 ( Analyze )

  4. 過濾 ( Filter )

  5. 解析 ( Parse )

  6. 排名 ( Rank )

  7. 展示 ( Present )


雷大知識站

Google 官方文件沒有說明展示程序,並把分析、排名、解析的程序簡化成一個演算法程序。


  • 抓取程式 / 爬蟲程式 ( Crawler ) 的處理過程決定了進入比賽的門票。

  • 索引程式 ( Indexer ) 的處理過程決定了比賽的材料。

  • 分析程式 ( Analyzer ) 的處理過程決定了網站的平常分數。

  • 過濾程式 ( Filter ) 的處理過程則決定誰該退出比賽。

  • 解析程式 ( Parser ) 與排名程式 ( Ranker/Ranking Algorithm ) 的處理過程決定了網站比賽的分數。

  • 展示程式 ( Presenter ) 的處理過程決定了比賽結果的呈現方式。

所以如果你希望網站可以再使用者搜尋活動中脫穎而出,你的網站就必須在這些處理過程中,表現得比別的網站優異。


抓取程序

讓搜尋引擎正確完正地抓取

搜尋引擎會派出許多爬蟲程式拜訪網站到處抓資料,把這些資料抓到他們的資料中心。

你的網站必須在產生內容後,在「最短時間」內被搜尋引擎抓走資料,盡可能完整地抓取。


雷大知識站

抓取網頁資料的意思就是 Google 文件中所指的檢索,就是 Bing 說的編目。

也就是檢索 = 編目 = 抓取網頁。此外 Yahoo 目前的搜尋結果來自於 Bing 搜尋引擎,所以可將 Yahoo 與 Bing 視為同一個搜尋引擎。


最短時間內抓取

為什麼要在最短的時間內被抓取?

因為網站內容,有可能被複製,如果被其他網站複製以後,你的網站內容還沒有被搜尋引擎抓走,那麼用心製作的網站內容的原創性就有可能被誤判。

常見情況一

遇上網站的文章在網路上有千個轉載,如果轉載的網站沒有標示出處,並且比我們更早被搜尋引擎索引,搜尋引擎就可能無法判斷文章的內容原創性。

常見情況二

某一個網站的內容出現從來沒看過的關鍵字,當這個關鍵字開始大量被使用者搜尋後,這個網站跟這關鍵字的相關性就比其他網站來得高。大多是有突然爆紅或時事增長起飛,才有可能導致此關鍵字搜尋量突然大增。


雷大知識站

但是如果某個關鍵字是你們網站所獨創,但是你的網站並不是被搜尋引擎最早抓取,也許該關鍵字的獨創性,就會被另外一個網站拿走。


核心重點解析

為甚麼我們還要強調,網站內容要盡可能的「被」完整抓取呢?搜尋引擎不是會自己設法抓取所有網站內容嗎?

原則上搜尋引擎會透過各種途徑,主動抓取網站內容。但是因為搜尋引擎面對眾多網站,不可能不計代價抓取所有網站內容。

雷大要提醒各位!千萬記住!
網站如果對搜尋引擎沒有貢獻度,搜尋引擎是不會爬取你的網站資料。

在這階段,你們應該做的事情:讓搜尋引擎正確快速的抓取網站資料。


索引程序

讓搜尋引擎正確而完整地索引

索引程序就是從抓回來的資料中找出有用的內容,進行有系統的儲存,在這階段中產生的結果,就是這網站進行搜尋比賽的材料。搜尋引擎會將不重要的內容刪除,或是將你的內容進行調整。

所以如果你原本安排好的關鍵字,在這過程中消失了,或是跟原本預期的不一樣,當然就不會在搜尋結果看到。但是你根本不知道發生什麼事情,因為搜尋引擎未必會告訴你處理後的結果。


搜尋引擎相關工具

另外從搜尋引擎相關工具,像是 GoogleSearch Console ( 原名網站管理員工具,Google Webmaster Tools ),或是 Bing 的網站管理員工具,也可以從中了解搜尋引擎處理網站內容的動向。


雷大知識站

GoogleBing 的網站管理員工具都是網站與搜尋引擎溝通的工具,搜尋引擎會在網站管理員工具顯示處理網站資料的狀況,網站也可以透過網站管理員工具告訴搜尋引擎網站的結構與設定。


Google 網站管理員工具上會顯示被搜尋關鍵字以及網頁等數據

我們曾經看過許多網站的網頁標題被搜尋引擎改寫,卻盼望網頁可以被搜尋到,但是就算等一千萬年,使用者也無法透過你設定的標題搜尋到你的網頁。

常見問題

曾經有些企業網頁已經被搜尋引擎抓走,但是卻沒有被索引,因為被判定大量重複。如果沒有注意網站管理員工具的訊息,根本無法得知網站存在重大問題。

在這階段,應該做的事情:
讓搜尋引擎正確而沒有重複的索引網站資料。


分析程序

了解搜尋引擎的分析重點

分析就是計算網頁內與網頁間的各項數據,像是網頁的信賴度、網頁的連結分析、及網頁的分類。

搜尋引擎在此階段當中,會進行兩種分析的過程。第一種跟關鍵字有關,第二種跟關鍵字無關。

關鍵字相關性

跟關鍵字有關的處理,就是網頁跟內容萃取出來的關鍵字的相關性。

網頁信賴度分析

跟關鍵字無關的處理,就是網頁信賴度之類的分析。

綜合性分析

另外搜尋引擎處理與關鍵字無關的網頁分析,也會透過各種不同的訊號,像是連結的質量、網站的歷史、網站的流量、網站的品牌知名度等因素,進行綜合性的分析。

Google 網站管理員工具顯示網站連結狀態

在這階段,應該做的事情:
提供搜尋引擎正確且足夠關鍵字資訊,建立充分的相關性。


過濾程序

避免違反搜尋引擎規範

過濾就是搜尋引擎運用規則資料庫把不合規範的網頁排除,就是 Google 所謂的清理垃圾網站 ( Spam Fighting )。

熊貓演算法

像是 Google 熊貓演算法更新於 2011 年 2 月 24日,目的是讓搜尋結果顯示的網站都能符合 Google 的品質要求,換句話也就是希望打擊低品質的網站,像是內容農場 ( Content Farm )。

企鵝演算法

Google 企鵝演算法更新是在 2012/4/24 推出的演算法更新,目的是為了處罰作弊的網站,像是連結作弊 ( Link Spam )。


雷大知識站

內容農場就是指以各種方式大量製造垃圾內容,來取得網路流量或是欺騙搜尋引擎為主要目標的網站。


專人介入處理

有些過濾程式處罰的網站可以在 Google 網站管理員內,在「專人介入處理」選單看到被處罰的項目。

Google 網站管理員工具會顯示專人介入處理項目。

在這階段,應該做的事情:
避免違反搜尋引擎規範,重視網頁內容與網頁連結品質。


解析程序

提高查詢關鍵字與關鍵字的吻合度

當使用者輸入查詢詞搜尋當下,搜尋引擎必須判斷查詢目的,才有辦法進行後續處理。

不同教育程度的使用者,或是不同工作類型的使用者,會使用搜尋的關鍵字可能天差地別。

查詢使用者的用詞素養,可能存在巫師與麻瓜的分別。所以解析程序的責任就相當重大,如果誤會了使用者的查詢目的,就功虧一簣。


雷大知識站

查詢詞 ( Search Queries ) 指使用者進行搜尋的用詞。

關鍵字 ( Keywords ) 指重要而關鍵的詞彙。通常關鍵字是 SEO 的用語,使用者並不太知道他的查詢詞中那些是關鍵字詞。


▲使用者使用各種查詢詞搜尋,請參考 Google Suggest

在這階段,應該做的事情:
了解妳的目標客戶會使用哪些查詢詞

以及目標客戶會希望看到哪些內容
並將查詢詞的內容安排在網頁之中。


排名程序

了解搜尋引擎的排名因素

解析結果後,搜尋引擎會把資料依照排名因素排序,即時決定排名所要顯示的資料。如果沒有特別說明,大家所說的 Google 演算法大多都是指排名程序演算法,其中的排名因素 ( Ranking Factors ) 就是用來決定排名的因素。

排名因素有哪些?

大致上可以分為整體網站的排名因素網頁內部的排名因素網頁間的排名因素使用者行為的排名因素等。

排名程序最讓大家頭痛的就是會經常更新個因素的權重,像是網頁本身的品質逐步變成重要因素。至於很容易操作的連結,搜尋引擎越來越重視連結品質,並非連結數量。

在這階段,應該做的事情:
經常性撰寫原創性內容

並在內文及網頁標題安排適當的關鍵字


展示程序

了解搜尋引擎的展示規則

展示就是決定要如何顯示給使用者瀏覽,包含網頁標題、網頁描述、以及搜尋結果下額外的連結 ( Site Link ) 資訊。Site Link 在搜尋結果的網頁下的惡外連結資訊。

這個過程是比較少被談論的議題,因為大部分網站都只在意是否被搜尋得到,而不在意網也被展示出來的樣子。但是網頁被展示的內容與方式,會決定被點選的機率。

常見情況

如果有特別注意,應該會看過搜尋結果被搜尋引擎更改標題,就因為沒有注意搜尋引擎的展示程序的處理原則,才會發生事情。

玩攻略 – 狼人殺的網頁標題,超過28 個中文字。

在這階段,應該做的事情:
標題長度應盡量保持在 28 個中文字以內

並適當使用語意標記。


雷大 SEO 小結論

操作 SEO 不能只注意搜尋引擎的排名因素,需要注意搜尋營的抓取、索引、分析、過濾、解析、排名、以及展示七個程序,網站在其中任何一個程序發生問題,就會影響 SEO 的操作成效。


延伸閱讀


Author: 雷大

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *