404與軟404錯誤:有什麼區別以及如何同時解決

[ad_1]

404與軟404錯誤:有什麼區別以及如何同時解決

Web瀏覽器中載入的每個頁面都有一個包含在HTTP標頭中的響應代碼,該響應代碼可能在Web頁面本身上可見,也可能不可見。

有許多 不同的響應碼 伺服器給出通信頁面的載入狀態;最著名的代碼之一是 404響應碼

通常,任何介於400到499之間的代碼都表明該頁面未載入。 404響應代碼是唯一具有特定含義的代碼-該頁面實際上已經消失了,很可能很快就不會回來。

什麼是Soft 404錯誤?

404錯誤不是發送到網路瀏覽器的正式響應代碼。這只是Google在其索引內添加到頁面的標籤。

Google搜尋網頁時,會仔細分配資源,以確保不會因搜尋不需要索引的缺失網頁而浪費時間。

但是,有些伺服器的配置不正確,當它們應顯示404響應代碼時,缺少的頁面會載入200代碼。即使網頁清楚地指出未找到該頁面,如果不可見的HTTP標頭仍顯示200代碼,則該頁面可能已被編入索引,這對Google來說是浪費資源。

為解決此問題,Google注意到了404頁的特徵,並嘗試辨別404頁是否確實是404頁。換句話說,Google了解到,如果它看起來像404,聞起來像404,並且像404,那麼它可能就是一個真正的404頁面。

可能被誤認為是Soft 404

在某些情況下,該頁面實際上並沒有丟失,但是某些特徵觸發了Google將其歸類為丟失的頁面。

這些特徵中的一些特徵包括頁面上少量或缺乏內容以及站點上具有太多相似頁面。

這些特徵也類似於 熊貓演算法 鏟球。熊貓更新將稀疏和重複的內容視為負面排名因素。

因此,解決這些問題將有助於避免出現軟404和熊貓問題。

404錯誤有兩個主要原因:

  • 鏈接中的錯誤,將用戶定向到不存在的頁面。
  • 鏈接到曾經存在並突然消失的頁面。

鏈接錯誤

如果404錯誤的原因是鏈接錯誤,則只需修復鏈接。

此任務的困難部分是查找站點上所有斷開的鏈接。

對於具有數千或數百萬個頁面的大型複雜站點而言,這可能更具挑戰性。在這種情況下,抓取工具會派上用場。您可以嘗試使用Xenu,DeepCrawl,Screaming Frog或Botify之類的軟體。

不再存在的頁面

當頁面不再存在時,您有兩個選擇:

  • 如果頁面被意外刪除,請還原它。
  • 301將其重定向到最接近的相關頁面(如果有意將其刪除)。

首先,您必須在網站上找到所有鏈接錯誤。類似於查找大型網站鏈接中的所有錯誤,您可以使用爬網工具。但是,可能找不到抓取工具 孤立的頁面,這是未從導航鏈接中的任何位置或任何頁面鏈接的頁面。

如果以前孤立的頁面曾經是網站的一部分,則它們可能存在,然後在網站重新設計後,指向該舊頁面的鏈接消失了,但是其他網站的外部鏈接可能仍在鏈接到它們。要仔細檢查您的網站上是否存在此類頁面,可以使用多種工具。

Google Search Console

當Google的抓取工具瀏覽其可以找到的所有頁面時,Search Console將報告404個頁面。這可以包括來自其他站點的鏈接,這些鏈接將轉到您的網站上曾經存在的頁面。

谷歌分析

默認情況下,您不會在Google Analytics(分析)中找到缺少的頁面報告。但是,您可以通過多種方式跟蹤它們。

對於其中一個,您可以創建一個自定義報告,並細分出頁面標題為「錯誤404 –未找到頁面」的頁面。

在Google Analytics(分析)中查找孤立頁面的另一種方法是創建自定義內容分組並將所有404頁分配給一個內容組。

站點:操作員搜索命令

在Google中搜索「 site:example.com」,將列出被Google索引的example.com的所有頁面。然後,您可以分別檢查頁面是否正在載入或頁面是否顯示404。

為了大規模地做到這一點,我喜歡使用WebCEO,它具有運行站點的功能:運營商不僅在Google上,而且在Bing,Yahoo,Yandex,Naver,Baidu和Seznam上。

由於所有搜索引擎只會為您提供一個子集,因此在多個搜索引擎上運行它可以幫助提供更大的網站頁面列表。可以導出此列表並在工具上運行以進行批量404檢查。我只是通過將所有URL添加為HTML文件中的鏈接並將其載入到Xenu上以大量檢查404錯誤來做到這一點。

其他反向鏈接研究工具

諸如Majestic,Ahrefs,Moz Open Site Explorer,Sistrix,LinkResearchTools和CognitiveSEO之類的反向鏈接研究工具也可以提供幫助。

這些工具中的大多數將導出鏈接到您的域的反向鏈接列表。從那裡,您可以檢查所有鏈接到的頁面,並查找404錯誤。

如何修復Soft 404錯誤

檢索工具不會檢測到軟404,因為它實際上不是404錯誤。但是您可以使用爬網工具來檢測其他內容。以下是一些要查找的內容:

  • 內容稀少:某些爬網工具不僅會報告內容稀少的頁面,還會顯示總字數。在這裡,您可以根據內容的字數對網址進行排序。首先從單詞數量最少的頁面開始,然後評估頁面內容是否稀少。

  • 內容重複:某些爬網工具足夠複雜,無法識別頁面內容占模板內容的百分比。如果主要內容與許多其他頁面幾乎相同,則應調查這些頁面並確定為什麼網站上存在重複內容。

除了抓取工具外,您還可以使用Google Search Console並檢查抓取錯誤下的內容,以找到軟404下列出的頁面。

搜尋整個網站以查找導致軟404的問題,可以讓您在Google甚至檢測到它們之前就找到並糾正問題。

在檢測到這些軟404問題之後,您將需要糾正它們。

大多數時候,解決方案似乎是常識。這可能包括簡單的事情,例如用稀疏內容擴展頁面或用新的和唯一的內容替換重複的內容。

在此過程中,需要考慮以下幾點:

  • 合併頁面:有時內容稀少是由於頁面主題過於具體所致,這讓您無話可說。如果主題相關,則將多個薄頁合併為一頁可能更合適。這不僅解決了內容稀疏的問題,而且還可以解決重複的內容問題。例如,一個銷售顏色和尺寸不同的鞋子的電子商務網站可能為每種尺寸和顏色組合提供不同的URL。這使大量頁面的內容稀薄並且相對相同。更有效的方法是將所有內容放到一頁上,並列舉可用選項。

  • 查找導致重複內容的技術問題:即使使用最簡單的Web爬網工具(例如Xenu)(它不查找內容,僅查找URL,響應代碼和標題標籤),您仍然可以通過查看URL查找重複內容的問題。其中包括www或非www URL,http和https,帶有index.html和不帶有,跟蹤參數是否不帶有等的內容。可以在以下網址中找到這些常見重複內容問題的摘要: 本演示的幻燈片6

Google以相同方式處理404錯誤和軟404錯誤

軟404不是真正的404錯誤,但是如果這些頁面無法快速修復,Google會將其索引化。最好定期抓取您的站點,以查看是否發生404錯誤或軟404錯誤。搜尋工具應該是您的SEO工具庫的主要組成部分。

圖片積分

特色圖片:Paulo Bobita

相關文章