重複內容和 SEO 的終極指南

重複內容是指在線上出現在多個地方的內容。「地點」是指具有唯一 URL 的頁面。它可以是完全相同的內容,也可以是幾乎完全相同的內容,可以在同一個網站上,也可以在另一個網站上。

從技術上講,您可能不會因重複內容而受到 Google 的處罰,但它可能會損害您的搜索引擎排名。這是因為搜索引擎很難確定內容的哪個位置最相關。結果,沒有一個 URL 最終排名很高,也沒有一個頁面獲得最高的搜索可見性。

Google 應該能夠檢測重複內容,將所有 URL 分組到一個集群中,然後選擇最佳結果。但這並不總是能正常工作,並且可能選擇了錯誤的 URL。最終,網站所有者可能會注意到由於重複內容而導致排名降低或流量減少。幸運的是,有一些方法可以防止此類事情發生在您的網站上。

為什麼重複內容是個問題

重複內容以多種方式影響搜索引擎和網站所有者:

  • 搜索引擎不知道索引中包含或不包含哪些 URL。
  • 搜索引擎不知道鏈接指標(權威、信任等)是否應該全部指向一個頁面或多個頁面。
  • 目前尚不清楚在 SERP(搜索引擎結果頁面)中對哪個 URL 進行排名,有時不受歡迎的 URL 可能會超過合法的 URL。
  • 鏈接資產(一個頁面傳遞給另一個頁面的許可權和價值)被稀釋了,因為其他想要包含指向內容的反向鏈接的站點必須在多個 URL 之間進行選擇。然後鏈接資產分布在重複項中,而不是只關注一頁。

即使所有 URL 都直接指向您的網站,如果一個鏈接屬性使其看起來對用戶不友好,並且 Google 對 URL 的該版本而不是原始 URL 進行排名,人們可能不想點擊它。例如,yoursite.com/besttrails 看起來比 yoursite.com/besttrails/?utm_content=buffer&utm_medium=social 更具吸引力。但如果谷歌排名第二,因為它認為這是重複內容的主要版本,人們不會點擊它,因為它看起來很嚇人而且不值得信賴。

此外,當您有重複的內容時,您網站的抓取「預算」也會用完。Google 會抓取網站以查找新內容,並且 Google 還會定期重新抓取網站以查看是否有任何新內容。如果您的網站上有重複的內容,這意味著徹底抓取所有頁面需要更多時間。這可能會導致谷歌索引和重新索引頁面並在搜索結果中顯示它們的時間表變慢。

Google 的重複內容政策

根據谷歌

站點上的重複內容不是對該站點採取行動的理由,除非重複內容的意圖似乎是具有欺騙性並操縱搜索引擎結果。

然而,雖然谷歌不會對大多數重複內容的網站所有者進行處罰,但該公司繼續說:

在極少數情況下,Google 認為顯示重複內容可能是為了操縱我們的排名和欺騙我們的用戶,我們也會對相關網站的索引和排名進行適當的調整。因此,該網站的排名可能會受到影響,或者該網站可能會完全從 Google 索引中刪除,在這種情況下,它將不再出現在搜索結果中。

谷歌可能會考慮欺騙用戶和/或操縱搜索引擎排名的意圖是什麼?故意製作具有重複內容的域、子域和頁面。此外,發布抓取的內容– 特別是如果您不添加任何其他有價值的內容。

但請記住這一點:即使 Google 不會正式懲罰您或認為您的重複內容是惡意的,它仍然會損害您的 SEO 工作。如果 Google 因重複內容問題而停止對您的網站進行排名,您可以在問題得到解決後提交重新審核請求。

重複內容是如何發生的

通常,網站所有者不會故意創建重複的內容。這就是為什麼谷歌不會對它進行過於嚴厲的懲罰。這也是複製內容和重複內容之間的區別。

複製內容是指您從另一個網站獲取確切的措辭並自行發布。重複內容是指您不小心或在不知情的情況下在線其他地方擁有您自己內容的另一個版本。

在這裡,我們將討論重複內容在線結束的常見方式。之後,我們將討論如何解決重複內容的問題。

HTTP、HTTPS、WWW 和非 WWW 頁面

如果您的站點有兩個不同的版本——例如 www.yoursite.com 和 yoursite.com——相同的內容將出現在站點的兩個版本上,這意味著存在重複的內容。http:// 和 https:// 站點也是如此。

分頁

當一篇文章或博客文章的評論部分跨越多個頁面時,可能會發生分頁。或者,也許有一個圖片庫,每個圖片都在一個單獨的頁面上。這種重複也可能發生在無限滾動的頁面上,當用戶不斷向下滾動時,新內容就會填充。

網址變體

URL 參數(如跟蹤代碼)可能會無意中創建重複的內容。例如,您網站上的一個頁面可能是 yoursite.com/sneakers,但如果您有一個跟蹤代碼來查看人們從何處點擊,它可能看起來像 yoursite.com/newsletter?utm_source=newsletter。即使 Google 和其他搜索引擎不考慮這種重複的內容,您也可能必須處理在您的分析平台中創建多個條目的單獨參數。

會話 ID 可以具有相同的效果。會話是訪問者在網站上所做操作的簡短歷史記錄,例如當他們將某些東西添加到購物車時。當該人點擊進入其他頁面時會話仍然存在,因此他們的購物車保持不變。會話 ID 是該會話的唯一修飾符,有時存儲在 URL 中 (yoursite.com?sessionId=jow8082345hnfn8456)。這可以創建具有相同頁面內容的多個不同 URL。

如果您擁有適合列印的版本或適合移動設備的內容版本,也會發生同樣的情況。搜索引擎會認為有多個相同內容的頁面。因為……有。

這在電子商務網站上也很常見,尤其是在用戶過濾搜索結果時。URL 幾乎保持不變,但最後有一個附錄,如大小或顏色。這稱為分面導航或過濾導航。頁面上的內容幾乎相同,但 URL 是唯一的。

即使是尾部斜杠也可以使 URL 唯一。例如,yoursite.com/page 和 yoursite.com/page/。查看這是否導致重複內容問題的最快方法是訪問頁面的兩個版本。如果沒有載入,您不必擔心。否則,重定向是一種選擇(稍後會詳細介紹)。

重複內容發生的更多方式

  • 電子商務產品描述:不同的電子商務網站在使用製造商對產品的描述時存在重複內容是很常見的。
  • 圖片附件頁面:當每個圖片附件都有單獨的頁面時,這可能會創建重複的內容。
  • 搜索結果頁面:這些頁面將參數添加到搜索 URL,例如 yoursite.com?q=search-term。
  • 暫存環境:這是用於測試的站點的重複版本。
  • 標籤和類別頁面:當您使用標籤或類別時,WordPress 將自動創建專用的標籤和類別頁面。當一個頁面有多個類別或標籤時,這有時會導致內容重複。

如何修復重複內容

對於上面列出的一些較小的問題,您可能會在您的 SEO 插件中找到一個有用的設置。例如,在 Yoast 插件中,您可以禁用圖片的附件頁面 URL:

the-ultimate-guide-to-duplicate-content-and-seo 複製內容和 SEO 的終極指南

WordPress 還有一個用於關閉評論分頁的內置選項:

the-ultimate-guide-to-duplicate-content-and-seo-1 複製內容和 SEO 的終極指南

否則,以下做法是解決重複內容問題的主要方法。

1. 查找重複內容

首先,您必須找到重複內容的實例。Ahrefs Site AuditGoogle Search Console等工具可以抓取您的網站,並讓您知道是否有任何重複的內容警告。

如果您想在您的網站上查找特定關鍵字的重複內容,您可以在 Google 中輸入以下內容:

站點:yoursite.com 標題:關鍵字

然後,您將看到您網站上包含該關鍵字的所有頁面。一個好的經驗法則是搜索特定的關鍵字,以便更容易梳理結果。

如果您認為某篇文章在網上其他地方被複制,您可以使用諸如Grammarly或 Copyscape 之類的抄襲檢查器來查找其他完全匹配句子的實例。或者,您可以將一兩個完整的句子粘貼到 Google 中,看看它是否顯示在您網站以外的其他地方。

2.通過規範化調整內容的URL

一旦您知道網上有重複的內容,就該確定要保留的主要頁面了。

您為搜索引擎規範化該主頁。規範化告訴搜索引擎 URL 是頁面的主版本——該頁面應該出現在搜索結果中,而不是引擎可能遇到的任何重複頁面。以下是規範化內容的兩種方法:

301重定向

創建從重複頁面到主頁的 301 重定向。重複頁面將停止相互競爭,主頁將變得更受歡迎和相關,這意味著它將開始排名更高。我們有一篇關於如何使用 WordPress 創建重定向來幫助您的文章。

您還可以從重定向的 URL 轉移到新目標中獲得任何鏈接汁/頁面許可權的額外好處。

Rel=」canonical」 屬性

此屬性讓搜索引擎知道頁面是 URL 的副本,並且任何鏈接、指標和排名能力都應應用於指定的主 URL,而不是複製的頁面。該屬性應包含在每個重複頁面的 HTML 頭中,並帶有指向您想要關注的原始頁面的鏈接。谷歌有深入介紹如何添加屬性的文檔,我們有關於規範 URL 和 WordPress 的更詳細的內容來補充它。

為避免內容抓取,即機器人複製、下載和重新發布您的網站內容時,請將 rel=」canonical」 屬性添加到您自己的網頁中。該屬性將是自引用的——它將指向它當前所在的 URL。即使內容確實被抓取,只要機器人移植完整的 HTML 代碼,您的版本仍將被視為原始版本。

3. 使用 Google Search Console 調整您的域 URL

例如,Google Search Console可讓您指定網站的首選域,例如 yoursite.com 而不是 www.yoursite.com。您還可以讓 Googlebot 知道如何處理不同的網址參數。這可能會清除您的部分或全部重複內容問題。但只有谷歌。不適用於其他搜索引擎。BingYandex等平台都有自己的網站管理員工具。

防止或修復重複內容的更多提示

  1. 例如,添加內部鏈接時,請使用相同版本的域,無論是否帶有 www。還要始終使用帶有或不帶有斜杠的相同版本的頁面。選擇哪種結構並不重要,但要與之保持一致。
  2. 如果您正在安排聯合內容,使用該內容的網站應添加指向原始內容的反向鏈接不是 URL 的變體。但原始的、主要的、規範的 URL。
  3. 不要將空頁面發布為佔位符。每個空頁面都會被索引,這會讓搜索引擎認為你有很多重複的內容。
  4. 減少您擁有的類似內容的數量。例如,假設您有一個合法網站,並且您服務於您所在地區的不同縣。如果您談論的是相同的法律主題,例如人身傷害法,每個縣的特定頁面可能包含類似的信息。一種選擇是將頁面合併成一個關於兩個縣的更大頁面,或者您可以更多地改變內容以保持頁面分開。

關於重複內容的最終想法

遇到少量重複內容通常不會引起關注。但是確實需要處理影響數百或數千頁的技術問題。另外,清除任何和所有重複的內容問題也沒有什麼壞處。這只是運行一個整潔且高性能的網站的一部分。畢竟,您要做的最後一件事就是與自己競爭並破壞自己的排名,因為您可以完全控制內容。

找出重複內容後,您可能還想查看我們關於如何處理關鍵字蠶食以防止重複關鍵字問題的文章。

您是如何設法處理網站上的重複內容的?讓我們在評論中討論現實世界的策略!

相關文章