如何使用XML網站地圖提升SEO

[ad_1]

如何使用XML網站地圖提升SEO

隨著網路的發展,Google和SEO也在發展。

這意味著被認為是最佳實踐的往往是不斷變化的。昨天可能是好的建議,而今天卻不是。

對於幾乎與SEO本身一樣古老的站點地圖尤其如此。

問題是,當每個人和他們的狗都在論壇上發布答案,在博客上發布建議並在社交媒體上放大意見時,需要花費時間來從錯誤信息中整理出有價值的建議。

因此,儘管我們大多數人都普遍認為向Google Search Console提交站點地圖很重要,但是您可能不知道如何以驅動SEO關鍵績效指標(KPI)的方式來實施這些站點。

讓我們澄清一下當今關於站點地圖最佳做法的困惑。

在本文中,我們涵蓋:

什麼是XML網站地圖

簡單來說,XML網站地圖是您網站網址的列表。

它充當了路線圖,告訴搜索引擎哪些內容可用以及如何到達。

網站地圖與網站抓取「 width =」 1147「 height =」 840「 data-srcset =」 http://tracking.feedpress.it/「 data-src =」 https://cdn.searchenginejournal.com/wp-content/ uploads / 2018/08 / sitemap-crawl.png

在上面的示例中,搜索引擎將在一次訪問XML網站地圖文件的情況下找到該網站地圖中的所有九個頁面。

在網站上,它必須跳過五個內部鏈接才能找到第9頁。

XML網站地圖協助爬蟲更快地建立索引的功能對於以下網站尤其重要:

  • 具有數千個頁面和/或深厚的網站架構。
  • 經常添加新頁面。
  • 經常更改現有頁面的內容。
  • 內部鏈接和孤立頁面較弱。
  • 缺乏強大的外部鏈接配置文件。

旁註:提交沒有索引網址的站點地圖也可以加快索引的刪除速度。如果要刪除許多URL,這比在Google Search Console中刪除URL更為有效。但請謹慎使用,並確保僅將此類URL臨時添加到站點地圖中。

重點介紹

即使搜索引擎可以從技術上找到沒有它的URL,但通過將頁面包含在XML網站地圖中,您仍表示您將其視為高質量的目標網頁。

儘管不能保證XML站點地圖會使您的頁面爬行,更不用說索引或排名了,但是提交一個肯定會增加您的機會。

XML Sitemap格式

使用所有可用標籤的一頁站點將具有以下XML站點地圖:

xml網站地圖格式和標籤「 width =」 503「 height =」 343「 data-srcset =」 http://tracking.feedpress.it/「 data-src =」 https://cdn.searchenginejournal.com/wp-content /uploads/2018/08/xm-sitemap-format.png

但是SEO應該如何使用這些標籤中的每一個?所有元數據有價值嗎?

Loc(又稱位置)標籤

此強制標記包含URL位置的絕對規範版本。

它應準確反映您的站點協議(http或https),以及您是否選擇包含或排除www。

對於國際網站,您也可以在這裡 實施您的hreflang處理

通過使用xhtml:link屬性指示每個URL的語言和區域變體,可以減少頁面載入時間,而頁面載入時間可以通過其他方式實現 或HTTP標頭無法提供。

酵母有史詩 發布 在hreflang上為那些想了解更多的人。

Lastmod(又稱Last Modified)標籤

一個可選的但強烈推薦的標籤,用於傳達文件的上次修改日期和時間。

John Mueller承認Google確實使用lastmod元數據來了解頁面的上次更改時間以及是否應對其進行爬網。來自的矛盾建議 伊利亞斯 在2015年。

最後修改時間對於內容網站尤其重要,因為它可以幫助Google了解您是原始發布者。

它也可以傳達新鮮度,但是請確保僅在進行了有意義的更改後才更新修改日期。

嘗試去 欺騙搜索引擎,使您的內容新鮮,否則可能會被Google處以罰款。

Changefreq(又稱更改頻率)標籤

曾幾何時,此可選標籤提示了預期URL上的內容更改為搜索引擎的頻率。

穆勒表示 「更改頻率在站點地圖中並沒有真正發揮重要作用」,「直接指定時間戳會更好」。

優先標籤

這個可選標籤表面上告訴搜索引擎頁面相對於其他URL的重要性在0.0到1.0之間。

充其量,這對搜索引擎以及Mueller和 伊利亞斯 明確表示他們將其忽略。

重點介紹

您的網站需要XML網站地圖,但不一定需要優先順序和更改頻率的元數據。

正確使用lastmod標籤,並集中精力確保您提交了正確的URL。

站點地圖的類型

有許多不同類型的站點地圖。讓我們看看您實際需要的那些。

XML Sitemap索引

XML網站地圖有兩個限制:

  • 最多50,000個URL。
  • 未壓縮的文件大小限制為50MB。

可以使用gzip壓縮站點地圖(文件名將類似於sitemap.xml.gz)以節省伺服器帶寬。但是,解壓縮後,站點地圖仍然不能超過任何一個限制。

每當超出任何限制時,您都需要在多個XML網站地圖中拆分URL。

然後可以將這些站點地圖合併為一個XML站點地圖索引文件,該文件通常稱為sitemap-index.xml。本質上是站點地圖的站點地圖。

對於希望採用更細粒度方法的超大型網站,您還可以創建多個站點地圖索引文件。例如:

  • sitemap-index-articles.xml
  • sitemap-index-products.xml
  • sitemap-index-categories.xml

但是請注意,您不能嵌套站點地圖索引文件。

為了使搜索引擎輕鬆一次找到每個站點地圖文件,您將需要:

  • 將您的站點地圖索引提交到Google Search Console和Bing網站管理員工具。
  • 在robots.txt文件中指定站點地圖索引網址。歡迎搜索引擎抓取,直接將它們指向您的站點地圖。

robots.txt中的xml網站地圖「 width =」 474「 height =」 115「 data-srcset =」 http://tracking.feedpress.it/「 data-src =」 https://cdn.searchenginejournal.com/wp-內容/上傳/2018/08/xml-sitemap-robots-txt.png

您也可以通過將其ping到Google來提交站點地圖。

但要注意:

Google不再關注「未經驗證的站點地圖」中的hreflang條目, 湯姆·安東尼 相信是指通過ping URL提交的內容。

XML圖片站點地圖

圖像站點地圖旨在改善圖像內容的索引編製。

但是,在當今的SEO中,圖像是嵌入在頁面內容中的,因此將與頁面URL一起進行爬網。

此外,最佳實踐是利用JSON-LD schema.org/ImageObject 標記,以向搜索引擎調用圖片屬性,因為它提供的屬性比圖片XML網站地圖更多。

因此,大多數網站都不需要XML圖片站點地圖。包含圖片站點地圖只會浪費抓取預算。

例外情況是圖像是否有助於推動您的業務發展,例如股票照片網站或電子商務網站從Google Image搜索獲得產品頁面會話。

請注意,圖像不必與您的網站位於同一域中,即可在站點地圖中提交。您可以使用CDN,只要已在Search Console中對其進行了驗證。

XML視頻站點地圖

與圖像類似,如果視頻對您的業務至關重要,請提交XML視頻站點地圖。如果不是,則不需要視頻站點地圖。

保存視頻嵌入頁面的抓取預算,確保您將所有視頻都標記為JSON-LD schema.org/VideoObject

Google新聞站點地圖

只有在Google新聞中註冊的網站才可以使用此站點地圖。

如果您願意,請包括最近兩天發布的文章,每個站點地圖最多包含1,000個URL,並在發布新文章時立即對其進行更新。

與某些在線建議相反,Google新聞站點地圖不支持圖片網址。

Google推薦 使用schema.org圖片或og:image為Google新聞指定文章縮略圖。

行動版網站地圖

大多數網站不需要這樣做。

為什麼?因為 穆勒證實 移動站點地圖僅適用於功能電話頁面。不適用於智能手機兼容性。

因此,除非您具有專門為特色手機設計的唯一URL,否則移動站點地圖將無濟於事。

HTML網站地圖

XML網站地圖可滿足搜索引擎的需求。 HTML網站地圖旨在幫助人類用戶查找內容。

問題是,如果您擁有良好的用戶體驗和精心設計的內部鏈接,是否需要HTML網站地圖?

在Google Analytics(分析)中檢查HTML網站地圖的頁面瀏覽量。可能性很低。如果不是,則表明您需要改善網站導航。

HTML網站地圖通常在網站頁腳中鏈接。從網站的每個頁面獲取鏈接資產。

問你自己。那是對鏈接資產的最佳利用嗎?或者,您是否包含HTML網站地圖以向傳統網站的最佳做法致敬?

如果很少有人使用它。搜索引擎不需要它,因為您具有強大的內部鏈接和XML網站地圖。該HTML網站地圖是否有理由存在?我會說不。

動態XML網站地圖

使用Screaming Frog等工具可以輕鬆創建靜態站點地圖。

問題是,一旦創建或刪除頁面,您的站點地圖就會過時。如果您修改頁面的內容,則站點地圖不會自動更新lastmod標記。

因此,除非您喜歡為每個更改手動創建和上傳站點地圖,否則最好避免使用靜態站點地圖。

另一方面,動態XML網站地圖會由您的伺服器自動更新,以反映相關的網站更改。

要創建動態XML網站地圖,請執行以下操作:

  • 請您的開發人員編寫自定義腳本的代碼,並確保提供清晰的規範
  • 使用動態站點地圖生成器工具
  • 為CMS安裝插件,例如WordPress的Yoast SEO插件

重點介紹

動態XML網站地圖和網站地圖索引是現代的最佳做法。移動和HTML網站地圖不是。

僅在這些內容類型的索引編製改善了您的KPI時,才使用圖像,視頻和Google新聞站點地圖。

XML Sitemap索引優化

現在是有趣的部分。您如何使用XML網站地圖來驅動SEO KPI。

在XML網站地圖中僅包含SEO相關頁面

XML網站地圖是您建議抓取的頁面列表,不一定是網站的每個頁面。

搜索蜘蛛會以「允許」的價格到達您的網站,它會爬行多​​少頁面。

XML站點地圖表示您認為所包含的URL比未阻止但不在站點地圖中的URL更重要。

您正在使用它來告訴搜索引擎「如果您特別關注這些URL,我將非常感謝。」

本質上,它可以幫助您有效地使用抓取預算。

通過僅包含SEO相關頁面,您可以幫助搜索引擎更智能地抓取您的網站,以便獲得更好的索引編製的好處。

您應該排除:

  • 非規範頁面。
  • 頁面重複。
  • 分頁頁面。
  • 基於參數或會話ID的URL。
  • 網站搜索結果頁面。
  • 回複評論網址。
  • 通過電子郵件URL共享。
  • 通過過濾創建的URL對於SEO來說是不必要的。
  • 存檔頁面。
  • 任何重定向(3xx),缺少頁面(4xx)或伺服器錯誤頁面(5xx)。
  • 被robots.txt阻止的頁面。
  • 沒有索引的頁面。
  • 潛在客戶表單可訪問的資源頁面(例如,白皮書PDF)。
  • 實用程序頁面對用戶有用,但不希望成為登錄頁面(登錄頁面,與我們聯繫,隱私政策,帳戶頁面等)。

我想分享一個例子 邁克爾·科塔姆 關於頁面優先順序:

假設您的網站有1,000頁。這1,000頁中的475頁是SEO相關內容。您在XML網站地圖中突出顯示了這475個頁面,實際上是要求Google取消對其餘部分的索引編製優先順序。

現在,假設Google抓取了這475個頁面,並通過演算法確定175個「 A」級,200個「 B +」級和100個「 B」或「 B-」。這是一個很不錯的平均成績,可能表明該網站可以吸引用戶。

相比之下,通過XML網站地圖提交所有1,000個頁面則相反。現在,Google查看了您說與SEO相關的1000個頁面,發現超過50%的頁面是「 D」或「 F」頁面。您的平均成績不再那麼好,這可能會損害您的自然訓練。

但是請記住,Google只會將您的XML網站地圖用作您網站上重要內容的線索。

僅僅因為它不在您的XML網站地圖中,並不一定意味著Google不會為這些頁面編製索引。

對於SEO,整體網站質量是關鍵因素。

要評估您的網站質量,請轉到Google Search Console(GSC)中與站點地圖相關的報告。

重點介紹

通過僅將XML站點地圖URL限制為SEO相關頁面來管理爬網預算,並投入時間以減少網站上劣質頁面的數量。

充分利用站點地圖報告

gsc-sitemap-report-new-old「 width =」 2376「 height =」 710「 Size =」(最大寬度:2376px)100vw,2376px「 data-srcset =」 https://cdn.searchenginejournal.com/wp -content / uploads / 2018/08 / gsc-sitemap-report-new-old.png 2376w,https://cdn.searchenginejournal.com/wp-content/uploads/2018/08/gsc-sitemap-report-new- old-480x143.png 480w,https://cdn.searchenginejournal.com/wp-content/uploads/2018/08/gsc-sitemap-report-new-old-680x203.png 680w,https://cdn.searchenginejournal。 com / wp-content / uploads / 2018/08 / gsc-sitemap-report-new-old-768x229.png 768w,https://cdn.searchenginejournal.com/wp-content/uploads/2018/08/gsc-sitemap -report-new-old-1024x306.png 1024w,https://cdn.searchenginejournal.com/wp-content/uploads/2018/08/gsc-sitemap-report-new-old-1600x478.png 1600w「 data-src =「 https://cdn.searchenginejournal.com/wp-content/uploads/2018/08/gsc-sitemap-report-new-old.png

新版Google Search Console中的Sitemaps部分沒有以前提供的那樣豐富的數據。

現在的主要用途是確認您的站點地圖索引已成功提交。

sitemap-naming「 width =」 1880「 height =」 507「 size =」(最大寬度:1880px)100vw,1880px「 data-srcset =」 https://cdn.searchenginejournal.com/wp-content/uploads/2018 /08/sitemap-naming.png 1880w,https://cdn.searchenginejournal.com/wp-content/uploads/2018/08/sitemap-naming-480x129.png 480w,https://cdn.searchenginejournal.com/wp -content / uploads / 2018/08 / sitemap-naming-680x183.png 680w,https://cdn.searchenginejournal.com/wp-content/uploads/2018/08/sitemap-naming-768x207.png 768w,https:/ /cdn.searchenginejournal.com/wp-content/uploads/2018/08/sitemap-naming-1024x276.png 1024w,https://cdn.searchenginejournal.com/wp-content/uploads/2018/08/sitemap-naming- 1600x431.png 1600w「 data-src =」 https://cdn.searchenginejournal.com/wp-content/uploads/2018/08/sitemap-naming.png

如果您選擇使用描述性的命名約定,而不是數字的,則還可以了解「發現」的不同類型的SEO頁面的數量,也就是Google通過站點地圖找到的所有URL以及其他方法,例如如以下鏈接。

在新的GSC中,對於SEO而言,與站點地圖有關的更有價值的領域是「索引覆蓋率」報告。

如何使用XML Sitemaps來提高SEO「 width =」 1160「 height =」 524「 size =」(最大寬度:1160px)100vw,1160px「 data-srcset =」 https://cdn.searchenginejournal.com/wp- content / uploads / 2018/08 / gsc-coverage-report.png 1160w,https://cdn.searchenginejournal.com/wp-content/uploads/2018/08/gsc-coverage-report-480x217.png 480w,https: //cdn.searchenginejournal.com/wp-content/uploads/2018/08/gsc-coverage-report-680x307.png 680w,https://cdn.searchenginejournal.com/wp-content/uploads/2018/08/gsc -coverage-report-768x347.png 768w,https://cdn.searchenginejournal.com/wp-content/uploads/2018/08/gsc-coverage-report-1024x463.png 1024w「 data-src =」 https:// cdn.searchenginejournal.com/wp-content/uploads/2018/08/gsc-coverage-report.png

該報告將默認為「所有已知頁面」。在這裡您可以:

  • 解決任何「錯誤」或「對警告有效」的問題。這些通常來自 機器人指令衝突。一個解決了,請確保通過「覆蓋率」報告驗證您的修復。
  • 查看索引趨勢。大多數網站都在不斷增加有價值的內容,因此「有效」頁面(又稱Google索引的頁面)應穩步增加。了解任何急劇變化的原因。
  • 選擇「有效」,然後在「索引中,未在站點地圖中提交」類型的詳細信息中查找。這些頁面上您和Google在其價值上存在分歧。例如,您可能尚未提交您的隱私權政策網址,但Google已將該頁面編入索引。在這種情況下,無需採取任何措施。您需要尋找的是源自以下網址的索引網址 分頁處理不佳參數處理不善,重複內容或網頁意外遺漏在站點地圖之外。

然後,通過將下拉列表更改為「所有提交的頁面」,將報告限制為您包含在站點地圖中的SEO相關URL。然後檢查所有「排除」頁面的詳細信息。

排除站點地圖URL的原因可以分為四個操作組:

  1. 快速獲勝:針對重複的內容,規範,機器人指令,40X HTTP狀態代碼,重定向或合法性排除,請進行適當的修復。

  2. 調查頁面:對於「提交的網址已刪除」和「爬網異常」排除項,請使用Google抓取方式進一步調查。

  3. 改善頁面:對於「已爬網-當前未建立索引」頁面,請查看頁面(或頁面類型,通常是具有相似種類的許多URL)的內容和內部鏈接。可能是因為內容稀少,內容原始或孤立。

  4. 改善域名:對於「已發現-當前未建立索引」頁面, Google筆記 他們被排除在外的典型原因是「他們試圖抓取網址,但網站超載」。不要上當。 Google更有可能決定「這不值得付出努力」,因為內部鏈接質量不佳或從域中看到的內容質量較低。如果您看到更多此類排除項,請查看通過站點地圖提交的頁面(或頁面類型)的SEO值,著重於優化抓取預算,並從鏈接和內容中查看信息架構(包括參數)透視。

無論您的行動計劃如何,請務必記下基準KPI。

評估站點地圖優化工作影響的最有用的指標是「所有提交的頁面」索引率-通過從已發現的URL總數中減去有效頁面的百分比來計算。

努力使這一比例達到80%以上。

為什麼不100%?因為如果您將所有精力都集中在確保對當前擁有的每個SEO相關URL進行索引,那麼您可能會錯失擴大內容覆蓋範圍的機會。

注意:如果您是一個較大的網站,並且選擇將其網站分為多個Sitemap索引,則可以按這些索引進行過濾。這不僅使您能夠:

  1. 請從更細緻的角度查看概述圖表。
  2. 調查排除類型時,請參閱大量相關示例。
  3. 逐段處理索引率優化。

重點介紹

除了識別警告和錯誤之外,您還可以將「索引覆蓋率」報告用作XML站點地圖偵查工具來隔離索引問題。

XML Sitemap最佳做法清單

花時間去:

✓在XML網站地圖中包含hreflang標籤

✓包括 標籤

✓使用gzip壓縮站點地圖文件

✓使用站點地圖索引文件

✓僅在索引驅動您的KPI時才使用圖像,視頻和Google新聞站點地圖

✓動態生成XML網站地圖

✓確保僅在單個站點地圖中包含URL

✓robots.txt中的參考站點地圖索引URL

✓將站點地圖索引提交到Google Search Console和Bing網站管理員工具

✓在XML網站地圖中僅包含SEO相關頁面

✓修復所有錯誤和警告

✓分析有效頁面的趨勢和類型

✓計算提交頁面的索引率

✓解決排除提交頁面的原因

現在,請檢查您自己的站點地圖,並確保您做對了。

圖片積分

特色圖片:Paulo Bobita
作者拍攝的所有屏幕截圖

相關文章