搜尋引擎是怎麼運作的？

這篇文章是〈從零開始學 SEO 〉的第二篇，如果你還沒有看過第一篇，建議從〈從零開始學 SEO（一）：什麼是搜尋引擎優化（SEO）？〉開始閱讀，會比較容易了解整個來龍去脈～

搜索引擎有兩個主要功能：

抓取並建立索引。
把他們計算過後認為的最相關網站列表提供給搜尋用戶。

抓取並建立索引

網路就像是一個在大城市底下的地鐵系統

每個地鐵站都是一個唯一的文件（通常是一個網頁，但有時候可能是 PDF，JPG 或其他文件）。搜索引擎需要一種方式來「爬行」整個城市，並且使出渾身解數，開出一條路讓用戶可以到達到這些地鐵站。

網頁的鏈接結構會把所有網頁綁在一起

鏈接讓搜尋引擎的自動化機器人，被稱為「爬蟲」或「蜘蛛」，可以存取在網絡上數十億的相互關聯的文件。

一旦引擎找到這些網頁，他們會讀取網頁中的程式碼，並選擇一部分存儲在海量的數據庫內，當被用戶搜索時，他們再將先前儲存的內容呈現出來。為了讓搜尋的結果可以在 0.0000001 秒內處理完畢，這些搜尋引擎的公司在世界各地都有資料中心。

這些資料中心儲存著令人難以想像的海量數據。當一個人在任何一個主要引擎進行搜索時，他們都想要馬上找到答案；即使是一兩秒鐘的延遲也可能讓用戶感到不耐，所以搜索引擎的目標就是盡可能快地提供答案。

提供答案

搜尋引擎是一部提供解答的機器。當一個人在搜尋時，搜尋引擎會整理數十億的文件和語意庫並且做兩件事情：第一，它只返回那些相關的或有用的搜索者的查詢這些結果；第二，它根據服務信息的網站的受歡迎程度排名這些結果。SEO 的目的就是為了優化搜尋引擎對網站關連性和人氣的判斷。

搜尋引擎如何判斷關連性和人氣？

關連性 (Revelance) 是指搜尋引擎可以在頁面中找到對應的關鍵字。在網絡發展初期，搜尋引擎大致上都是遵照這個模式運作，所以搜尋引擎的結果相當有限。但是經過多年的發展，這些天才工程師已經設計出更好的方法來匹配搜尋結果。時至今日，已經有數以百計的因素可以判斷搜尋結果的相關性，我們在接下來的章節將討論最重要的幾個。

搜尋引擎通常會把它認為更有價值或是提供更多資訊的網站、網頁或是文件等，視為更有人氣 (Popularity) 的搜尋結果。這個假設已經被證明相當成功的在搜索結果的用戶滿意度方面。

然而人氣和相關性並不是手動設置的。事實上，搜尋引擎會透過某些公式（算法）進行將有價值的資訊篩選出來（關連性），然後以再把這些資訊按照人氣排序。

這些算法通常包含數百個變因。如果你對這些變量有興趣，可以參考〈搜索引擎排名的因素〉。

如何達到目標？

或者說「如何成功打造你的 SEO 行銷計畫？」

根據前面的介紹，搜索引擎的複雜的算法看似沒有我們插手的餘地。事實上，搜尋引擎本身對提供更好的搜尋或獲得更多的流量沒有做太多工作。他們所做的事情就是告訴我們這些規則：

Google 的《搜尋引擎最佳化初學者指南》

Google 建議完成以下的事項：

SEO 是為了讓用戶更容易找到資料，而不是針對搜尋引擎堆疊關鍵字。
不要欺騙用戶，或是刻意讓文章的標題、圖片和內文沒有關連，這種做法通常被稱為「隱藏」。（一旦被搜索引擎發現使用這樣的黑帽 SEO，就會被裁定作弊，並給以處罰。）
盡量使用文字超連結，並且文章的結構應該清晰（使用 h1, h2 等標籤）。
每個網頁裡面至少都要有一個超連結。
網站的資訊要有用，並寫清楚，準確地描述網頁內容。
請確保您的<title> 元素和 ALT 屬性是準確的。
使用關鍵字來創造描述性的，人性化的 URL。
一個文件只用一個 URL。使用 301 重定向或相對=“規範” 的屬性，以解決重複的內容。

Bing 的《搜尋引擎最佳化初學者指南》

在微軟 Bing 的工程師推薦你可以這麼做：
確保乾淨、到位、關鍵字豐富的 URL 結構。
確保內容不被隱藏在 Rich Media（Adobe Flash Player，JavaScript，AJAX）內，並且確認這些 Rich Media 沒有隱藏惡意程式。
創建關鍵字豐富的內容。
經常產生新的內容。
不要把關鍵字放在圖片裡面。例如，如果你想讓搜尋引擎索引你的公司名稱或地址，不要把這些資訊做成圖片。