如何使用站點地圖驗證器解決錯誤

提交一份 XML 站點地圖 可以為搜索引擎提供您希望他們索引的每個網站頁面的完整細分。 因此,這是您的重要一步 搜索引擎優化 (SEO) 戰略。 但是,為了獲得最佳結果,您需要使用站點地圖驗證器來確保您不會發送有錯誤的文件。

在本文中,我們將討論什麼是站點地圖驗證器以及它們是如何工作的。 然後,我們將指導您解決在使用站點地圖驗證器時可能遇到的常見錯誤以及如何解決這些錯誤。 讓我們開始吧!

什麼是站點地圖驗證器?

站點地圖是一個文件,其中包含您希望搜索引擎索引的網站上每個 URL 的列表。 站點地圖進來 XML 或 HTML 格式,前者是最受歡迎的選項。

從技術上講,您不需要向 Google 或其他搜索引擎提交您網站的站點地圖。 這些平台 使用爬蟲 導航您的網站、識別每個 URL 並為這些頁面編製索引。 但是,創建站點地圖可以讓您完全控制搜索引擎索引哪些 URL 以及不應該索引哪些 URL(例如私有或冗餘內容)。

在大多數情況下,您將使用自動生成的站點地圖。 如果您使用 WordPress, Yoast 等 SEO 插件 可以幫助您創建可以提交的站點地圖 谷歌搜索控制台

how-to-use-a-sitemap-validator-to-troubleshoot-errors 如何使用站點地圖驗證器解決錯誤

站點地圖驗證器是一種可以處理這些 XML 或 HTML 文件並確保它們不包含錯誤的工具。 「錯誤」是指:

  • 搜索引擎無法抓取的頁面
  • 404 錯誤
  • 401 錯誤
  • 站點地圖中的 URL 過多
  • 非規範網址

如果您的站點地圖包含任何這些錯誤,則搜索引擎可能無法索引您列出的每個頁面。 手動讀取 XML 文件查找問題可能需要很長時間,並且您還需要測試 URL。 幸運的是,站點地圖驗證器使您能夠跳過所有工作並開始修復它們識別的任何錯誤。

如何使用站點地圖驗證器

使用站點地圖驗證器很簡單。 根據您使用的工具,您可能需要上傳 XML 文件或提供指向您網站站點地圖的 URL。 如果您使用諸如 XML 站點地圖驗證器.

how-to-use-a-sitemap-validator-to-troubleshoot-errors-1 如何使用 Sitemap Validator 排除錯誤

輸入您要檢查的站點地圖的 URL,該工具將返回一份報告,其中包括它發現的任何錯誤。

how-to-use-a-sitemap-validator-to-troubleshoot-errors-2 如何使用 Sitemap Validator 排除錯誤

如果您得到一份沒有問題的乾淨報告,搜索引擎可以將站點地圖中的 URL 編入索引。 您可以安全地將站點地圖提交到 谷歌, 必應, Yandex,或任何你想去的地方,不用擔心。 但是,如果您遇到錯誤,您需要知道如何修復它們。 這將我們帶到下一節。

5 個常見的站點地圖錯誤以及如何修復它們

不幸的是,一些站點地圖無法完美驗證,但我們將介紹一些站點地圖驗證器可以在您提交給他們的文件中發現的最常見錯誤。 讓我們從討論抓取「問題」的頁面開始。

1. 有抓取問題的頁面

爬取問題是驗證者返回的最常見問題之一。 此錯誤意味著該服務無法抓取您站點地圖中的某個頁面。

通常,當驗證器或搜索引擎無法抓取頁面時,意味著以下場景之一:

  • 頁面載入時間過長。 如果您的網站載入時間過長,與爬蟲的連接將超時。 這意味著某些頁面可能不會被索引。
  • 您的網站使用了過多的重定向。 什麼時候 重定向設置不正確,您的網站可能會進入重定向循環。 這意味著搜索引擎將無法抓取它。
  • 該網站阻止搜索引擎抓取它。 你可以 配置 WordPress 以阻止爬蟲 (使用 noindex 標籤),這樣您的網站就不會被索引。 通常,您可能會在構建站點或創建私有頁面時執行此操作。
  • 該頁面返回 404 或 401 以外的錯誤代碼。站點地圖驗證器可以解析 404 錯誤。 然而,其他 HTTP 錯誤代碼 將導致「抓取問題」警告。

「抓取問題」錯誤可能是模稜兩可的。 但是,您可以通過訪問有問題的 URL 來確定確切的問題。 如果頁面載入快速且正確,則您的網站可能會阻止搜索引擎對其進行抓取。

如果頁面載入沒有錯誤,我們建議 測試您網站的載入時間 看看是否有性能問題。 否則,您應該會看到特定的錯誤代碼或多個重定向的實例。

2. 404錯誤

404 錯誤 在站點地圖中很容易解決。 如果頁面不再存在,您可以手動從站點地圖中刪除該條目或為其設置重定向。 您的最佳選擇將取決於該頁面是否仍在獲得流量。

來自 Google Search Console 和其他服務的網站分析將顯示 404 頁面是否仍在接收訪問者。 在這種情況下,您最好的選擇是設置一個重定向到最近的相關頁面或帖子,這樣您就不會錯過該流量。 只要您使用單個重定向,就不會導致站點地圖驗證錯誤。

3. 401錯誤

一個 401「未經授權」錯誤 在站點地圖中意味著爬蟲無法訪問特定頁面,因為它們沒有必要的許可權。 當您處理需要用戶登錄的頁面時,通常會彈出此錯誤。

how-to-use-a-sitemap-validator-to-troubleshoot-errors-3 如何使用 Sitemap Validator 排除錯誤

解決此錯誤的唯一方法是從站點地圖中刪除需要授權的頁面。 任何只有登錄用戶才能看到的頁面不應被編入索引。 否則,在搜索引擎結果頁面 (SERP) 中單擊它的訪問者會發現自己面臨 401 錯誤。

4. 站點地圖中的 URL 過多

搜索引擎可以抓取具有數千個頁面的海量網站。 但是,根據我們的經驗,如果您列出接近(或超過)50,000 個頁面,站點地圖就會開始顯示錯誤。

如果那是您的情況,那麼為您的努力表示敬意。 50,000 頁是很多。 但是,大多數擁有超過 50,000 個頁面的網站可能具有來自用戶生成內容的多個 URL。 在這種情況下,您希望優先考慮站點上最重要的頁面,同時刪除用戶可能不想在 SERP 中看到的站點地圖條目。

5. 站點地圖中的非規範 URL

有時,搜索引擎在看到同一頁面的多個版本的 URL 時可能會感到困惑。 例如,您可能能夠使用以下任一 URL 訪問一個簡單的博客頁面:

  • http://yourwebsite.com
  • http://www.yourwebsite.com
  • https://yourwebsite.com
  • https://www.yourwebsite.com

實際上,所有這些 URL 都可以指向同一個頁面(如果您重定向 到 HTTPS 的 HTTP 流量)。 但是,搜索引擎可能會將這些 URL 視為站點地圖中的四個不同條目,從而導致驗證錯誤。

解決這個問題的簡單方法是 指定規範 URL 為您的 WordPress 網站。 Yoast 等 SEO 插件會自動為您的網站分配規範的 URL。 如果您使用的是由 SEO 插件生成的 XML 文件,則在使用站點地圖驗證器時不應遇到「非規範」錯誤。

結論

隨著您網站的發展, 使用站點地圖 變得更加關鍵。 站點地圖讓您告訴搜索引擎他們應該索引哪些頁面以及忽略哪些頁面。 此外,使用站點地圖驗證器將幫助您發現錯誤,以便爬蟲在索引您的網站時不會遇到問題。

回顧一下,使用站點地圖驗證器可能遇到的五個最常見錯誤是:

  1. 存在抓取問題的頁面:您需要檢查載入時間、重定向並訪問您的網站頁面以確定確切的問題。
  2. 404 錯誤:此錯誤意味著您應該從站點地圖中刪除不存在的頁面或為其設置重定向。
  3. 401 錯誤:考慮從站點地圖中刪除受限頁面。
  4. 站點地圖中的 URL 過多:您可能需要對站點地圖中的頁面有所選擇,並刪除不太有用的頁面。
  5. 站點地圖中的非規範 URL:我們建議為特定頁面設置規範 URL。

您對使用站點地圖驗證器有任何疑問嗎? 讓我們在下面的評論部分中討論它們!

特色圖片來自 hanss / shutterstock.com

來源

相關文章