掌握重複內容問題的完整指南

[ad_1]

掌握重複內容問題的完整指南

在網站架構的SEO領域中,毫無疑問,消除重複的內容可能是最艱難的戰鬥之一。

太多的內容管理系統和貧窮的開發人員構建的站點非常適合顯示內容,但從搜索引擎友好的角度出發,幾乎沒有考慮該內容的功能。

這通常會造成有害的重複內容困境,供SEO處理。

重複內容有兩種,兩種都可能是一個問題:

  • 站點複製是指將相同的內容複製到站點的兩個或多個唯一URL上。通常,這可以由站點管理員和Web開發團隊控制。

  • 異地複製是指兩個或多個網站發布完全相同的內容。這通常是無法直接控制的,而是依賴於與第三方和有問題的網站的所有者合作。

為什麼重複內容有問題?

解釋重複內容為什麼不好的最好方法是首先告訴您唯一內容為什麼很好。

獨特的內容是使自己與其他網站區分開的最好方法之一。當您網站上的內容僅由您自己決定時,您會脫穎而出。你有別人沒有的東西。

另一方面,當您使用相同的內容來描述您的產品或服務或在其他站點上重新發布內容時,您將失去獨特的優勢。

或者,在現場重複內容的情況下,單個頁面失去了唯一性的優勢。

請看下面的插圖。如果A表示在兩個頁面上重複的內容,並且B到Q表示鏈接到該內容的頁面,則複製會導致拆分鏈接值。

現在,假設B-Q頁僅鏈接到A頁。所有值都將分配給單個URL,而不是拆分每個鏈接提供的值,這增加了該內容在搜索中排名的機會。

重複的內容插圖「 width =」 329「 height =」 228「 srcset =」「 src =」 https://cdn.searchenginejournal.com/wp-content/uploads/2019/07/duplicate-content-illustration.jpg

無論是場內還是場外,所有重複內容都在與自己競爭。每個版本都可能吸引眼球和鏈接,但如果是唯一且唯一的版本,任何人都不會獲得全部價值。

但是,當在Web上的任何地方最多只能找到一個URL時,才可以找到有價值的獨特內容,因此,該URL是該內容的唯一授權信號收集者,因此被發現的可能性最大。

現在,有了這些了解之後,我們來看一下重複內容的問題和解決方案。

異地重複內容

異地複製有三個主要來源:

  • 您在自己的網站上重新發布的第三方內容。通常,這是以製造商提供的通用產品描述的形式。

  • 經您批准,您的內容已重新發布在第三方網站上。這通常是文章分發或反向文章分發的形式。

  • 有人從您的網站上竊取的內容,未經您的許可而重新發布。這是內容刮板和小偷變得令人討厭的地方。

讓我們看看每個。

內容刮板和小偷

內容抓取工具是重複創建內容中最大的違規行為之一。垃圾郵件發送者和其他邪惡的作惡者構建的工具可以從其他網站獲取內容,然後自行發布。

在大多數情況下,這些網站都在嘗試使用您的內容來吸引訪問他們自己網站的流量,以吸引人們點擊他們的廣告。 (是的,我在看著你,谷歌!)

不幸的是,除了提交 版權侵權報告 希望Google能夠將其從搜索索引中刪除。雖然在某些情況下,提交這些報告可能是一項全職工作。

處理此內容的另一種方法是忽略它,希望Google能夠分辨出高質量網站(您的網站)與抓取內容所在的網站之間的區別。由於我發現抓取的內容排名高於原始來源,因此屢見不鮮。

您可以採取以下措施來消除抓取的內容的影響:將內容內的絕對鏈接(完整URL)用於任何指向您網站的鏈接。那些竊取內容的人通常不會進行清理工作,因此,至少,訪問者可以將其追蹤給您。

您也可以嘗試將規範標籤添加回源頁面(無論如何都是一種好習慣)。如果抓取工具抓取了這些代碼中的任何一個,則規範標籤至少會為Google提供一個信號,使其將您識別為發起者。

文章分配

幾年前,似乎每個SEO都將其內容重新發布在「電子雜誌」上,以此作為建立鏈接的策略。當Google嚴厲打擊內容質量和鏈接方案時,重新發布的方式就被淘汰了。

但是只要有正確的重點,它就可以成為可靠的營銷策略。注意,我說的是「營銷」而不是「 SEO」策略。

在大多數情況下,無論何時您在其他網站上發布內容,他們都希望獲得該內容的唯一權利。

為什麼?因為他們不希望網路上該內容的多個版本貶低發布者所提供的內容。

但是隨著Google在向內容創作者分配權利方面做得更好(更好,但不是完美的),許多發布者也允許在作者的個人網站上重用內容。

這會造成重複的內容問題嗎?以較小的方式,它可以實現,因為仍然有兩個版本的內容,每個版本都可能生成鏈接。

但是最後,如果限制和控制重複版本的數量,那麼影響也將受到限制。實際上,主要缺點在於作者而不是次要出版商。

內容的第一個發布版本通常記為規範版本。在少數情況下,這些發布者將從重新發布該內容的作者網站上的內容中獲得更多價值。

通用產品說明

重複內容的一些最常見形式來自 產品說明 每個(幾乎每個)賣方都可以重複使用。

許多在線零售商出售與數千家其他商店完全相同的產品。在大多數情況下,產品說明由製造商提供,然後上傳到每個站點的資料庫中,並顯示在其產品頁面上。

儘管頁面的布​​局會有所不同,但大部分產品頁面內容(產品說明)都是相同的。

現在,將其乘以成千上萬種不同的產品以及成千上萬個銷售這些產品的網站,您會發現很多內容,總之,不是唯一。

搜索引擎在執行搜索時如何區分一個或另一個?

在純粹的內容分析級別上,它不能。這意味著搜索引擎必須查看其他信號來確定應該對哪個信號進行排名。

這些信號之一就是鏈接。獲取更多鏈接,即可贏得平淡無奇的內容抽獎。

但是,如果您要與實力更強的競爭對手抗衡,那麼在將其加入鏈接建設部門之前,您可能需要進行漫長的戰鬥。這使您重新尋找另一個競爭優勢。

實現這一目標的最佳方法是花費額外的精力為每種產品編寫獨特的說明。根據您提供的產品數量,這最終可能會是一個挑戰,但最終還是值得的。

看下面的插圖。如果所有灰色頁面代表具有相同產品描述的同一產品,則黃色代表具有唯一描述的同一產品。

如果您是Google,那麼您想排名哪個更高?

唯一的說明圖「 width =」 263「 height =」 265「 srcset =」「 src =」 https://cdn.searchenginejournal.com/wp-content/uploads/2019/07/unique-description-illustration.jpg

與獨特但相似的內容相比,具有獨特內容的任何頁面都將自動具有固有的優勢。這可能足以或可能不足以超越您的競爭對手,但這無疑是不僅在Google方面而且在您的客戶中脫穎而出的基準。

現場重複內容

從技術上講,Google對所有重複內容都一視同仁,因此現場重複內容與非現場重複實際上沒有什麼不同。

但是現場的可避免性卻較低,因為這是您可以實際控制的一種重複類型。它以眾所周知的腳步記錄著您的SEO努力。

現場重複內容通常源於不良的網站架構。或者更有可能是不良的網站開發!

一種 強大的網站架構 是強大網站的基礎。

如果開發人員不遵循對搜索友好的最佳做法,由於這種自我競爭,您可能會失去寶貴的機會來使您的內容排名。

有些人以谷歌關於谷歌如何「形象化」的宣傳為由反對良好的架構,這是一個問題,那就是它依靠谷歌弄清楚事情。

是的,Google可以確定應將某些重複內容視為相同內容,並且演算法可以在分析您的網站時將其考慮在內,但不能保證一定會。

換一種說法,就是因為您知道某人聰明,不一定意味著他們可以保護您免受自己的愚蠢之苦!如果您將事情留給Google,但Google失敗了,那您將為難。

現在,讓我們深入研究一些常見的現場重複內容問題和解決方案。

問題:產品分類重複

太多的電子商務網站都遭受這種重複。這通常是由內容管理系統引起的,該系統允許您按類別組織產品,其中可以在多個類別中標記單個產品。

這本身並不壞(對訪問者來說可能很好),但是這樣做時,系統會針對出現單個產品的每個類別生成一個唯一的URL。

假設您正在上門維修站點,並且正在尋找有關安裝浴室地板的書籍。您可以通過以下任一導航路徑找到所需的書:

  • 首頁>地板>浴室>書本
  • 首頁>浴室>書本>地板
  • 首頁>書籍>地板>浴室

這些都是可行的導航路徑,但是當為每個路徑生成唯一的URL時就會出現問題:

  • https://www.myfakesite.com/flooring/bathroom/books/fake-book-by-fake-author
  • https://www.myfakesite.com/bathroom/books/flooring/fake-book-by-fake-author
  • https://www.myfakesite.com/books/flooring/bathroom/fake-book-by-fake-author

我見過這樣的網站為每個產品最多創建十個URL,從而將一個5k產品的網站變成一個具有4.5k重複頁面的網站。那是個問題。

如果上面的示例產品生成了十個鏈接,那麼這些鏈接最終將被分成三種方式。

而如果同一個產品的競爭對手頁面具有相同的十個鏈接,但只有一個URL,那麼哪個URL可能在搜索中表現更好?

競爭對手的!

不僅如此,搜索引擎還限制了其爬網帶寬,因此他們可以將其用於索引獨特且有價值的內容。

當您的網站有很多重複的頁面時,引擎很有可能會停止抓取,甚至沒有索引到您的唯一內容的一小部分。

這意味著數百個有價值的頁面將不會出現在搜索結果中,而被索引的頁面是相互競爭的重複項。

解決方案:主URL分類

解決此問題的一種方法是僅將產品標記為一個類別,而不是多個。這樣就解決了重複問題,但對於購物者而言,不一定是最佳的解決方案,因為它消除了其他導航選項來查找他們想要的產品。因此,從列表中刪除該列表。

另一種選擇是從URL完全刪除任何類型的分類。這樣,無論用於查找產品的導航路徑如何,產品URL本身始終是相同的,並且可能看起來像這樣:

  • https://www.myfakesite.com/products/fake-book-by-fake-author

這可以修復重複項,而不會更改訪問者瀏覽產品的方式。這種方法的缺點是您會丟失URL中的類別關鍵字。雖然這對SEO的整體帶來了很小的好處,但一點點都可以幫助您。

如果您想將解決方案提高到一個新的水平,並在保持用戶體驗的同時獲得最大的優化價值,請建立一個選項,除其他產品外,還可以將每個產品分配到「主」類別。

在播放主類別時,可以繼續通過多個導航路徑找到產品,但是可以通過使用主類別的單個URL來訪問產品頁面。

這可能會使URL看起來像這樣:

  • https://www.myfakesite.com/flooring/fake-book-by-fake-author或
  • https://www.myfakesite.com/bathroom/fake-book-by-fake-author或
  • https://www.myfakesite.com/books/fake-book-by-fake-author

儘管確實需要一些額外的編程,但後一種解決方案是最佳的整體解決方案。但是,有一個相對較容易實現的「解決方案」,但我只能將其視為臨時解決方案,直到可以實施真正的解決方案為止。

創可貼解決方案:規範標籤

由於主分類選項並非總是可用於開箱即用的CMS或電子商務解決方案,因此有一個替代選項可以「幫助」解決重複內容的問題。

這涉及防止搜索引擎索引所有非規範的URL。儘管這樣做可以將重複的頁面排除在搜索索引之外,但不能解決拆分頁面許可權的問題。發送到不可索引URL的任何鏈接值都將丟失。

更好的創可貼解決方案是利用規範標籤。這類似於選擇主類別,但通常幾乎不需要任何其他編程。

您只需為每個產品添加一個欄位,即可為您分配一個規範的URL,這只是一種奇特的說法,即「您想在搜索中顯示的URL」。

規範標籤如下所示:

儘管訪問者使用的是URL,但每個重複的URL上的幕後規範標記都將指向單個URL。

從理論上講,這告訴搜索引擎不要索引非規範的URL,也不要將所有其他價值指標分配給規範的版本。

這在大多數情況下都有效,但實際上,搜索引擎僅將規範標記用作「信號」。然後,他們會選擇視情況應用或忽略該標記。

您可能會或可能不會將所有鏈接許可權傳遞給正確的頁面,並且可能會也可能不會將非規範頁面排除在索引之外。

我總是建議實施規範標籤,但由於它不可靠,因此在可以實施更正式的解決方案之前,應將其視為佔位符。

問題:URL冗餘複製

最基本的網站體系結構問題之一是如何在瀏覽器中訪問頁面。

默認情況下,幾乎可以使用稍微不同的URL訪問站點的每個頁面。如果未選中,則每個URL都將導致具有完全相同內容的完全相同頁面。

僅考慮主頁,可以使用四個不同的URL來訪問它:

  • http://site.com
  • http://www.site.com
  • https://site.com
  • https://www.site.com

在處理內部頁面時,您可以通過添加斜杠來獲得每個URL的附加版本:

  • http://site.com/page
  • http://site.com/page/
  • http://www.site.com/page
  • http://www.site.com/page/
  • 等等。

每個頁面最多有八個備用URL!當然,Google應該知道所有這些URL都應該被視為一個,但是哪個呢?

解決方案:301重定向和內部鏈接一致性

除了我在上面提到的規範標記之外,這裡的解決方案是確保您具有所有替代版本的URL重定向到規範URL。

請注意,這不僅是首頁問題。同一問題適用於您的每個網站URL。因此,實施的重定嚮應該是全局的。

確保強制每個重定向到規範版本。例如,如果規範URL為https://www.site.com,則每個重定向都應指向該URL。許多人都犯了錯誤,添加了如下所示的其他重定向躍點:

  • Site.com> https://site.com> https://www.site.com
  • Site.com> www.site.com> https://www.site.com

而是,重定嚮應如下所示:

  • http://site.com> https://www.site.com/
  • http://www.site.com> https://www.site.com/
  • https://site.com> https://www.site.com/
  • https://www.site.com> https://www.site.com/
  • http://site.com/> https://www.site.com/
  • http://www.site.com/> https://www.site.com/
  • https://site.com/> https://www.site.com/

通過減少重定向躍點的數量,您可以加快頁面載入速度,減少伺服器帶寬並減少一路上可能出現的錯誤。

最後,您需要確保網站中的所有內部鏈接也都指向規範版本。

雖然重定嚮應該解決重複的問題,但是如果伺服器或事物實現方面出現問題,則重定向可能會失敗。

如果發生這種情況,即使是暫時的情況,僅在內部鏈接規範頁面也可以防止突然出現大量重複內容問題。

問題:URL參數和查詢字元串

幾年前,會話ID的使用給SEO造成了主要的重複內容問題。

但是,當今的技術使會話ID幾乎已經過時,但是出現了另一個問題,即使不是更糟,它也是一樣:URL參數。

參數通常用於根據一個或多個過濾器或所做的選擇從伺服器提取新鮮內容。

以下兩個示例顯示了單個URL的備用URL:site.com/shirts/。

第一個顯示按顏色,尺寸和樣式過濾的襯衫,第二個URL顯示按價格排序的襯衫,然後每頁顯示一定數量的產品,

  • Site.com/shirts/?color=red&size=small&style=long_sleeve
  • Site.com/shirts/?sort=price&display=12

僅基於這些過濾器,搜索引擎可以找到三個可行的URL。但是,這些參數的順序可以根據選擇它們的順序而改變,這意味著您可能會獲得以下幾個更易於訪問的URL:

  • Site.com/shirts/?size=small&color=red&style=long_sleeve
  • Site.com/shirts/?size=small&style=long_sleeve&color=red
  • Site.com/shirts/?display=12&sort=price

還有這個:

  • Site.com/shirts/?size=small&color=red&style=long_sleeve&display=12&sort=price
  • Site.com/shirts/?display=12&size=small&color=red&sort=price
  • Site.com/shirts/?size=small&display=12&sort=price&color=red&style=long_sleeve
  • 等等。

您會看到它可以產生很多URL,其中大多數不會提取任何類型的唯一內容。

在上面的參數中,您可能要為其編寫銷售內容的唯一參數是樣式。剩下的就不多了。

解決方案:用於過濾器的參數,而非合法的著陸頁

從戰略上計劃您的導航和URL結構對於解決重複的內容問題至關重要。

該過程的一部分包括了解擁有合法登錄頁面和允許訪問者過濾結果的頁面之間的區別。

然後,在為它們開發URL時一定要相應地對待它們。

著陸頁(和規範網址)網址應如下所示:

  • Site.com/shirts/long-leeve/
  • Site.com/shirts/v-neck/
  • Site.com/shirts/collared/

過濾後的結果URL看起來像這樣:

  • Site.com/shirts/long-sleeve/?size=small&color=red&display=12&sort=price
  • Site.com/shirts/v-neck/?color=red
  • Site.com/shirts/collared/?size=small&display=12&sort=price&color=red

正確構建URL後,您可以執行以下兩項操作:

  • 添加正確的規範標記(URL中「?」之前的所有字元)。
  • 進入Google Search Console,讓Google忽略所有此類參數。

如果您一貫只將參數用於過濾和排序內容,則不必擔心會意外地告訴Google不要抓取有價值的參數……因為它們都不是。

但是因為規範標籤只是一個信號,所以您必須完成第二步才能獲得最佳結果。請記住,這隻會影響Google。您必須對Bing執行相同的操作。

Pro Developer的技巧:搜索引擎通常會忽略URL中井號「#」右側的所有內容。

如果您將其編程到任何參數之前的每個URL中,則不必擔心規範只是一個臨時解決方案:

  • Site.com/shirts/long-sleeve/#?size=small&color=red&display=12&sort=price
  • Site.com/shirts/v-neck/#?color=red
  • Site.com/shirts/collared/#?size=small&display=12&sort=price&color=red

如果任何搜索引擎要訪問上述URL,則它們只會索引URL的規範部分,而忽略其餘部分。

問題:廣告目標網頁和A / B測試重複

營銷人員開發大量類似內容的版本並不少見,無論是作為廣告的目標網頁還是用於A / B /多變數測試。

這通常可以為您提供一些不錯的數據和反饋,但是如果這些頁面打開供搜索引擎搜索和索引,則可能會造成重複的內容問題。

解決方案:NoIndex

更好的解決方案不是使用規範標籤指向母版頁,而是在每個頁面上添加noindex元標記,以將它們完全排除在搜索引擎的索引之外。

通常,這些頁面往往是孤立的,沒有從站點內部直接鏈接到它們的頁面。但這並不總是會使搜索引擎無法找到它們。

規範標記旨在將頁面值和許可權轉移到主頁面,但是由於這些頁面不應收集任何值,因此最好將它們保留在索引之外。

當重複內容不是(大部分)問題時

SEO最常見的神話之一是重複的內容懲罰。

沒有。至少不給汽油加油並讓其空行駛是有罪的。

Google可能不會積極懲罰重複的內容,但這並不意味著不會因此而導致自然後果。

在沒有罰款威脅的情況下,營銷人員可以更加靈活地確定他們願意承受的後果。

儘管我認為您應該積極消除(而不是臨時解決)所有現場重複內容,但異地重複實際上可能創造的價值大於後果。

將有價值的內容重新發布到異地可以幫助您建立品牌知名度,而您自己發布則無法。這是因為許多異地發布商擁有更大的受眾群體和更大的社會影響力。

在您自己的網站上發布的內容可能會引起數千人的關注,但在異地發布的內容可能會達到數十萬。

許多發布者確實希望保留其發布內容的專有權,但有些發布者允許您在短暫的等待期後將其重新用於自己的網站。這樣一來,您不僅可以獲得更多展示機會,還可以通過稍後在您的網站上重新發布內容來建立自己的受眾群體。

但是,為了使任何人都有效,需要限制這種類型的文章分發。如果您要將內容發布到其他數百個要重新發布的站點,則該內容的價值呈指數下降。

通常,它並不能增強您的品牌,因為願意發布大量重複內容的網站一開始就沒有什麼價值。

無論如何,都要權衡在多個地方發布內容的利弊。

如果您在自己的網站上通過獨特的內容進行大量品牌複製而獲得的較小的授權價值,則應採取合理的重新發布策略。

但是那裡的關鍵詞是衡量的。您不希望成為只有重複內容的網站。那時,您開始削弱為品牌創造的價值。

通過了解重複內容的問題,解決方案以及某些情況下的價值,您可以開始消除不需要的重複並繼續進行重複的過程。

最後,您要構建一個以強大而獨特的內容而聞名的網站,然後使用該內容獲得儘可能高的價值。

圖片積分

特色圖片:Paulo Bobita
後期圖片:作者提供

相關文章