從零開始學 SEO(二):搜尋引擎是怎麼運作的?

這篇文章是 〈從零開始學 SEO 〉 的第二篇,如果你還沒有看過第一篇,建議從 〈 從零開始學 SEO(一):什麼是搜尋引擎優化(SEO)?〉 開始閱讀,會比較容易了解整個來龍去脈~

搜尋引擎是怎麼運作的?

搜索引擎有兩個主要功能:

  1. 抓取並建立索引。
  2. 把他們計算過後認為的最相關網站列表提供給搜尋用戶。

抓取並建立索引

網路就像是一個在大城市底下的地鐵系統

每個地鐵站都是一個唯一的文件(通常是一個網頁,但有時候可能是 PDF,JPG 或其他文件)。搜索引擎需要一種方式來「爬行」整個城市,並且使出渾身解數,開出一條路讓用戶可以到達到這些地鐵站。

從零開始學 SEO(二):搜尋引擎是怎麼運作的?
搜尋引擎的工作,就是把人們導引到正確的站點。

網頁的鏈接結構會把所有網頁綁在一起

鏈接讓搜尋引擎的自動化機器人,被稱為「爬蟲」或「蜘蛛」,可以存取在網絡上數十億的相互關聯的文件。

一旦引擎找到這些網頁,他們會讀取網頁中的程式碼,並選擇一部分存儲在海量的數據庫內,當被用戶搜索時,他們再將先前儲存的內容呈現出來。為了讓搜尋的結果可以在 0.0000001 秒內處理完畢,這些搜尋引擎的公司在世界各地都有資料中心。

這些資料中心儲存著令人難以想像的海量數據。當一個人在任何一個主要引擎進行搜索時, 他們都想要馬上找到答案 ;即使是一兩秒鐘的延遲也可能讓用戶感到不耐,所以 搜索引擎的目標就是盡可能快地提供答案


提供答案

搜尋引擎是一部 提供解答的機器 。當一個人在搜尋時,搜尋引擎會整理數十億的文件和語意庫並且做兩件事情:第一,它只返回那些相關的或有用的搜索者的查詢這些結果;第二,它根據服務信息的網站的 受歡迎程度 排名這些結果。SEO 的目的就是為了優化搜尋引擎對網站關連性和人氣的判斷。

搜尋引擎如何判斷關連性和人氣?

關連性 (Revelance) 是指搜尋引擎可以在頁面中找到對應的關鍵字。在網絡發展初期,搜尋引擎大致上都是遵照這個模式運作,所以搜尋引擎的結果相當有限。但是經過多年的發展,這些天才工程師已經設計出更好的方法來匹配搜尋結果。時至今日,已經有數以百計的因素可以判斷搜尋結果的相關性,我們在接下來的章節將討論最重要的幾個。

搜尋引擎通常會把它認為更有價值或是提供更多資訊的網站、網頁或是文件等,視為更有人氣 (Popularity) 的搜尋結果。這個假設已經被證明相當成功的在搜索結果的用戶滿意度方面。

然而人氣和相關性並不是手動設置的。事實上,搜尋引擎會透過某些公式(算法)進行將有價值的資訊篩選出來(關連性),然後以再把這些資訊按照人氣排序。

這些算法通常包含數百個變因。如果你對這些變量有興趣,可以參考 〈 搜索引擎排名的因素 〉。


如何達到目標?

或者說「如何成功打造你的 SEO 行銷計畫?」

根據前面的介紹,搜索引擎的複雜的算法看似沒有我們插手的餘地。事實上,搜尋引擎本身對提供更好的搜尋或獲得更多的流量沒有做太多工作。他們所做的事情就是告訴我們這些規則:

Google 的《搜尋引擎最佳化初學者指南》

Google 建議完成以下的事項:

  1. SEO 是為了讓用戶更容易找到資料,而不是針對搜尋引擎堆疊關鍵字。
  2. 不要欺騙用戶,或是刻意讓文章的標題、圖片和內文沒有關連,這種做法通常被稱為「隱藏」。(一旦被搜索引擎發現使用這樣的黑帽 SEO,就會被裁定作弊,並給以處罰。)
  3. 盡量使用文字超連結,並且文章的結構應該清晰(使用 h1, h2 等標籤)。
  4. 每個網頁裡面至少都要有一個超連結。
  5. 網站的資訊要有用,並寫清楚,準確地描述網頁內容。
  6. 請確保您的<title> 元素和 ALT 屬性是準確的。
  7. 使用關鍵字來創造描述性的,人性化的 URL。
  8. 一個文件只用一個 URL。使用 301 重定向或相對=“規範”的屬性,以解決重複的內容。

Bing 的《搜尋引擎最佳化初學者指南》

  1. 在微軟 Bing 的工程師推薦你可以這麼做:
  2. 確保乾淨、到位、關鍵字豐富的 URL 結構。
  3. 確保內容不被隱藏在 Rich Media(Adobe Flash Player,JavaScript,AJAX)內,並且確認這些 Rich Media 沒有隱藏惡意程式。
  4. 創建關鍵字豐富的內容。
  5. 經常產生新的內容。
  6. 不要把關鍵字放在圖片裡面。 例如,如果你想讓搜尋引擎索引你的公司名稱或地址,不要把這些資訊做成圖片。