從零開始學 SEO （五）：我的網址應該如何命名？

URL 構造指南

命名網址時最大的準則：我的用戶看的懂這串文字代表什麼意思嗎？

想想用戶

當你命名網址（URL）時，請試著站在用戶的角度查看您的網址。如果您可以輕鬆準確地預測網頁上可能會找到的內容，那麼您的網址具有相當的描述性。您不需要詳細說明網址中的每一個細節，但一個粗略的想法是一個好的起點。

比如說，Wordpress 可以直接把文章或是頁面的 ID 當成網址，如果你對網站的內容了然於心，當然可以快速透過數字查找任何頁面。但是如果你是一個剛好路過的用戶，通常不會知道 example.com/3221.htm 是什麼頁面。

如果可能的話，盡量使用人類可以看懂的字作為 URL 的命名標準。

網址越短越好

儘管讓用戶看懂網址很重要，但最小化長度和尾部斜線會使您的網址更容易複製和粘貼（包括電子郵件，部落格，簡訊等），並且會在搜索結果中完全顯示。

把關鍵字放在網址內是有幫助的（但過度使用會有點危險）。

如果您的網頁只有一個特定的關鍵字，請務必將其包含在網址中。但是，不要為了 SEO 的目的嘗試把所有關鍵字都放進去；過度使用將導致 URL 可讀性降低，並可能被視為垃圾連結。

靜態網址（盡量避免參數）

如果想要搜尋引擎索引的話，不要在網址內加入大量的參數，數字和符號。使用像 Apache 的 mod_rewrite 和 Microsoft 的 ISAPI_rewrite 這樣的技術，您可以輕鬆地將像 example.com/blog?id=123 這樣的動態 URL 轉換為更易讀的靜態版本，例如：example.com/blog/google-fresh-factor。即使 URL 中的單個動態參數也可能導致較低的總體排名和索引。

使用連字符分隔單詞

並非所有網絡應用程式都能讀取下劃線（_），加號（+）或空格（％20）等分隔符，因此請使用連字符（-）分隔網址中的字詞，如 “google-fresh-因子 “URL 示例。_

我可以用中文當做網址嗎？

可以，但是不建議。

可以的原因是因為尋引擎其實對你的 URL 不是特別在意，不管原本的網址是中文或是英文，Google 都可以將其編譯為 UTF-8 的格式，所以不會因為你的網址是中文而影響收錄情況。

不建議的原因是因為所有的瀏覽器都不能直接複製中文，假設我有一個頁面「dsgn.tw/比設計多一點點」，複製給別人的時候卻會變成「dsgn.tw/%E6%AF%94%E8%A8%AD%E8%A8%88%E6%9B%B4%E5%A4%9A%E4%B8%80%E9%BB%9E%E9%BB%9E」，用戶看不懂、網址過長、全部都是未知的符碼，上面談論的問題一次全部符合，這簡直是災難。

有部分 Windows 主機對於中文的編譯還不支援，如果你的網址都用中文，可能會造成某些用戶直接 404。

如果你的文章全部都是用這個方式命名，那麼你在生成 sitemap 的時候，根本是無法判斷哪一篇是哪一篇。最好的方法，還是用簡單的英文作為 URL（例如：dsgn.tw/more-than-design），這樣才是讓用戶理解，並且方便你的網頁被傳播的最好方法。

重複的內容和版本規範

重複的內容是任何網站可以面對的最煩躁和麻煩的問題之一。在過去幾年中，搜索引擎通過分配較低的排名，破解了內容較為複雜或重複的網頁。

當網頁的兩個或多個重複版本出現在不同的網址時，會發生規範化。這在現代內容管理系統中非常普遍。例如，您可以提供常規版本的網頁和打印優化版本。重複的內容甚至可能會出現在多個網站上。對於搜索引擎是一個大問題：我應該讓用戶搜尋到哪一個版本？在 SEO 行銷中，這個問題通常被稱為重複內容，這裡將更詳細地描述。

搜尋引擎對於內容的重複版本相當重視。為了提供最佳搜索者體驗，他們很少會展示多個重複的內容，而是選擇哪個版本最有可能是原始內容。最終結果是您的所有重複內容的排名都會低於預期。

假設你為網站的一個頁面〈柴犬嘟嘟大冒險〉製作了圖文版和純 HTML 版的兩種版本，這兩個的內容幾乎是一模一樣的，連關鍵字都一樣。那麼當用戶搜尋「柴犬嘟嘟」時，搜尋引擎要如何判斷應該顯示哪一個頁面呢？

這個時候我們就會需要使用「301」轉址，當我們設定〈柴犬嘟嘟 HTML〉301 轉址到〈柴犬嘟嘟圖文版〉，搜索引擎將只會把一個網頁顯示在該網站的列表中。

當具有潛在排名的多個頁面被組合到單個頁面中時，它們不僅停止彼此競爭，而且還產生整體上更強的相關性和流行性信號。這將積極影響您在搜索引擎排名的能力。

豐富網頁摘要

為什麼有些人的搜尋結果中可以有評分呢？因為搜索引擎從嵌入在網頁上的豐富網頁摘要中收到了該信息。豐富網頁摘要是一種結構化數據，允許網站管理員以向搜索引擎提供信息的方式標記內容。

雖然這些標記並不是必須的，但是隨著這些標記的普及，代表著用戶將會愈來愈習慣看到這些標籤。比如說食記的網站，就可以在每一篇文章加入這個顯示標記，讓用戶一目了然，也可以增加用戶點擊網站的比率。

結構化的數據目的就是讓尋引擎可以清楚的知道你的網站都在說些什麼。 Schema.org 提供了一些可以從結構化標記中受益的數據示例，包括人員，產品，評論，業務，食譜和活動。

通常，搜索引擎在搜索結果中包括結構化數據，諸如在用戶評論（星星）和作者簡介（圖片）的情況下。有幾個很好的資源可以在線了解有關豐富網頁摘要的詳細信息，包括 Schema.org，Google 的 Rich Snippet 測試工具以及使用 MozBar 的信息。

保護你的內容不被別人佔據

爬蟲如何偷竊你的排名

網絡上有很多內容農場或是從社群網站抓取文章發佈的類型網站，靠著複製別人的內容加上頁面廣告賺取利潤。這種抓取別人的內容再重新發佈的做法被稱為「刮擦」，可悲的是，如果你是一個小小的部落格寫手，這樣的網站竊取了你的文章之後，排名通常還會比你高。

當您以任何類型的 Feed 格式（例如 RSS 或 XML）發佈內容時，請務必 ping 主要的部落格和跟踪服務（Google，Technorati，Yahoo！等）。您可以直接在其網站上找到有關如 Google 和 Technorati 的服務的說明，或使用像 Pingomatic 這樣的服務來自動完成此過程。如果您的發佈軟件是自定義的，開發人員通常會在發佈時加入自動偵測功能。

接下來，你可以針對他們的複製進行反制。大多數網絡上的爬蟲會直接重新發佈你的內容而不進行編輯。因此，最好在你的文章內加入連回自己網站的連結，這樣可以確保尋引擎可以判斷你是這篇文章的原創者（表明您的來源可能是發起者）。為此，您需要在內部鏈接結構中使用絕對連結，而不是相對連結：

應該改成：

這樣，當對方複製你的內容時，鏈接仍然指向您的網站。

有更先進的方法來防止複製，但沒有一個是完全萬無一失。可以預期的是，你的網站能見度愈高，就表示愈多人看過你的文章，文章的流量愈大，被複製的機率就愈高。大部分的時候可以忽略這個問題：但是如果它變得非常嚴重，並且您發現這些網站已經威脅到你的排名和流量，你可以考慮使用一個稱為 DMCA 刪除的法律過程。 Moz 首席執行官 Sarah Bird 就此主題提供一些質量建議：四種強制執行您的版權的方法：[當您的在線內容被盜時該怎麼辦]。