[ad_1]
隨著網路的發展,Google和SEO也在發展。
這意味著被認為是最佳實踐的往往是不斷變化的。昨天可能是好的建議,而今天卻不是。
對於幾乎與SEO本身一樣古老的站點地圖尤其如此。
問題是,當每個人和他們的狗都在論壇上發布答案,在博客上發布建議並在社交媒體上放大意見時,需要花費時間來從錯誤信息中整理出有價值的建議。
因此,儘管我們大多數人都普遍認為向Google Search Console提交站點地圖很重要,但是您可能不知道如何以驅動SEO關鍵績效指標(KPI)的方式來實施這些站點。
讓我們澄清一下當今關於站點地圖最佳做法的困惑。
在本文中,我們涵蓋:
什麼是XML網站地圖
簡單來說,XML網站地圖是您網站網址的列表。
它充當了路線圖,告訴搜索引擎哪些內容可用以及如何到達。
在上面的示例中,搜索引擎將在一次訪問XML網站地圖文件的情況下找到該網站地圖中的所有九個頁面。
在網站上,它必須跳過五個內部鏈接才能找到第9頁。
XML網站地圖協助爬蟲更快地建立索引的功能對於以下網站尤其重要:
- 具有數千個頁面和/或深厚的網站架構。
- 經常添加新頁面。
- 經常更改現有頁面的內容。
- 內部鏈接和孤立頁面較弱。
- 缺乏強大的外部鏈接配置文件。
@nishanthstephen 通常,您放置在站點地圖中的所有內容都會儘快被提取
-Gary「鯨理」 Illyes(@methode) 2015年10月13日
旁註:提交沒有索引網址的站點地圖也可以加快索引的刪除速度。如果要刪除許多URL,這比在Google Search Console中刪除URL更為有效。但請謹慎使用,並確保僅將此類URL臨時添加到站點地圖中。
重點介紹
即使搜索引擎可以從技術上找到沒有它的URL,但通過將頁面包含在XML網站地圖中,您仍表示您將其視為高質量的目標網頁。
儘管不能保證XML站點地圖會使您的頁面爬行,更不用說索引或排名了,但是提交一個肯定會增加您的機會。
XML Sitemap格式
使用所有可用標籤的一頁站點將具有以下XML站點地圖:
但是SEO應該如何使用這些標籤中的每一個?所有元數據有價值嗎?
Loc(又稱位置)標籤
此強制標記包含URL位置的絕對規範版本。
它應準確反映您的站點協議(http或https),以及您是否選擇包含或排除www。
對於國際網站,您也可以在這裡 實施您的hreflang處理。
通過使用xhtml:link屬性指示每個URL的語言和區域變體,可以減少頁面載入時間,而頁面載入時間可以通過其他方式實現
或HTTP標頭無法提供。酵母有史詩 發布 在hreflang上為那些想了解更多的人。
Lastmod(又稱Last Modified)標籤
一個可選的但強烈推薦的標籤,用於傳達文件的上次修改日期和時間。
John Mueller承認Google確實使用lastmod元數據來了解頁面的上次更改時間以及是否應對其進行爬網。來自的矛盾建議 伊利亞斯 在2015年。
URL +上次修改日期是我們對網路搜索所關心的。
-?約翰(@JohnMu) 2017年8月17日
最後修改時間對於內容網站尤其重要,因為它可以幫助Google了解您是原始發布者。
它也可以傳達新鮮度,但是請確保僅在進行了有意義的更改後才更新修改日期。
嘗試去 欺騙搜索引擎,使您的內容新鮮,否則可能會被Google處以罰款。
Changefreq(又稱更改頻率)標籤
曾幾何時,此可選標籤提示了預期URL上的內容更改為搜索引擎的頻率。
但 穆勒表示 「更改頻率在站點地圖中並沒有真正發揮重要作用」,「直接指定時間戳會更好」。
優先標籤
這個可選標籤表面上告訴搜索引擎頁面相對於其他URL的重要性在0.0到1.0之間。
充其量,這對搜索引擎以及Mueller和 伊利亞斯 明確表示他們將其忽略。
我們忽略站點地圖中的優先順序。
-?約翰(@JohnMu) 2017年8月17日
重點介紹
您的網站需要XML網站地圖,但不一定需要優先順序和更改頻率的元數據。
正確使用lastmod標籤,並集中精力確保您提交了正確的URL。
站點地圖的類型
有許多不同類型的站點地圖。讓我們看看您實際需要的那些。
XML Sitemap索引
XML網站地圖有兩個限制:
- 最多50,000個URL。
- 未壓縮的文件大小限制為50MB。
可以使用gzip壓縮站點地圖(文件名將類似於sitemap.xml.gz)以節省伺服器帶寬。但是,解壓縮後,站點地圖仍然不能超過任何一個限制。
每當超出任何限制時,您都需要在多個XML網站地圖中拆分URL。
然後可以將這些站點地圖合併為一個XML站點地圖索引文件,該文件通常稱為sitemap-index.xml。本質上是站點地圖的站點地圖。
對於希望採用更細粒度方法的超大型網站,您還可以創建多個站點地圖索引文件。例如:
- sitemap-index-articles.xml
- sitemap-index-products.xml
- sitemap-index-categories.xml
但是請注意,您不能嵌套站點地圖索引文件。
為了使搜索引擎輕鬆一次找到每個站點地圖文件,您將需要:
- 將您的站點地圖索引提交到Google Search Console和Bing網站管理員工具。
- 在robots.txt文件中指定站點地圖索引網址。歡迎搜索引擎抓取,直接將它們指向您的站點地圖。
您也可以通過將其ping到Google來提交站點地圖。
但要注意:
Google不再關注「未經驗證的站點地圖」中的hreflang條目, 湯姆·安東尼 相信是指通過ping URL提交的內容。
XML圖片站點地圖
圖像站點地圖旨在改善圖像內容的索引編製。
但是,在當今的SEO中,圖像是嵌入在頁面內容中的,因此將與頁面URL一起進行爬網。
此外,最佳實踐是利用JSON-LD schema.org/ImageObject 標記,以向搜索引擎調用圖片屬性,因為它提供的屬性比圖片XML網站地圖更多。
因此,大多數網站都不需要XML圖片站點地圖。包含圖片站點地圖只會浪費抓取預算。
例外情況是圖像是否有助於推動您的業務發展,例如股票照片網站或電子商務網站從Google Image搜索獲得產品頁面會話。
請注意,圖像不必與您的網站位於同一域中,即可在站點地圖中提交。您可以使用CDN,只要已在Search Console中對其進行了驗證。
XML視頻站點地圖
與圖像類似,如果視頻對您的業務至關重要,請提交XML視頻站點地圖。如果不是,則不需要視頻站點地圖。
保存視頻嵌入頁面的抓取預算,確保您將所有視頻都標記為JSON-LD schema.org/VideoObject。
Google新聞站點地圖
只有在Google新聞中註冊的網站才可以使用此站點地圖。
如果您願意,請包括最近兩天發布的文章,每個站點地圖最多包含1,000個URL,並在發布新文章時立即對其進行更新。
與某些在線建議相反,Google新聞站點地圖不支持圖片網址。
Google推薦 使用schema.org圖片或og:image為Google新聞指定文章縮略圖。
行動版網站地圖
大多數網站不需要這樣做。
為什麼?因為 穆勒證實 移動站點地圖僅適用於功能電話頁面。不適用於智能手機兼容性。
因此,除非您具有專門為特色手機設計的唯一URL,否則移動站點地圖將無濟於事。
HTML網站地圖
XML網站地圖可滿足搜索引擎的需求。 HTML網站地圖旨在幫助人類用戶查找內容。
問題是,如果您擁有良好的用戶體驗和精心設計的內部鏈接,是否需要HTML網站地圖?
在Google Analytics(分析)中檢查HTML網站地圖的頁面瀏覽量。可能性很低。如果不是,則表明您需要改善網站導航。
HTML網站地圖通常在網站頁腳中鏈接。從網站的每個頁面獲取鏈接資產。
問你自己。那是對鏈接資產的最佳利用嗎?或者,您是否包含HTML網站地圖以向傳統網站的最佳做法致敬?
如果很少有人使用它。搜索引擎不需要它,因為您具有強大的內部鏈接和XML網站地圖。該HTML網站地圖是否有理由存在?我會說不。
動態XML網站地圖
使用Screaming Frog等工具可以輕鬆創建靜態站點地圖。
問題是,一旦創建或刪除頁面,您的站點地圖就會過時。如果您修改頁面的內容,則站點地圖不會自動更新lastmod標記。
因此,除非您喜歡為每個更改手動創建和上傳站點地圖,否則最好避免使用靜態站點地圖。
另一方面,動態XML網站地圖會由您的伺服器自動更新,以反映相關的網站更改。
要創建動態XML網站地圖,請執行以下操作:
- 請您的開發人員編寫自定義腳本的代碼,並確保提供清晰的規範
- 使用動態站點地圖生成器工具
- 為CMS安裝插件,例如WordPress的Yoast SEO插件
重點介紹
動態XML網站地圖和網站地圖索引是現代的最佳做法。移動和HTML網站地圖不是。
僅在這些內容類型的索引編製改善了您的KPI時,才使用圖像,視頻和Google新聞站點地圖。
XML Sitemap索引優化
現在是有趣的部分。您如何使用XML網站地圖來驅動SEO KPI。
在XML網站地圖中僅包含SEO相關頁面
XML網站地圖是您建議抓取的頁面列表,不一定是網站的每個頁面。
搜索蜘蛛會以「允許」的價格到達您的網站,它會爬行多少頁面。
XML站點地圖表示您認為所包含的URL比未阻止但不在站點地圖中的URL更重要。
您正在使用它來告訴搜索引擎「如果您特別關注這些URL,我將非常感謝。」
本質上,它可以幫助您有效地使用抓取預算。
通過僅包含SEO相關頁面,您可以幫助搜索引擎更智能地抓取您的網站,以便獲得更好的索引編製的好處。
您應該排除:
- 非規範頁面。
- 頁面重複。
- 分頁頁面。
- 基於參數或會話ID的URL。
- 網站搜索結果頁面。
- 回複評論網址。
- 通過電子郵件URL共享。
- 通過過濾創建的URL對於SEO來說是不必要的。
- 存檔頁面。
- 任何重定向(3xx),缺少頁面(4xx)或伺服器錯誤頁面(5xx)。
- 被robots.txt阻止的頁面。
- 沒有索引的頁面。
- 潛在客戶表單可訪問的資源頁面(例如,白皮書PDF)。
- 實用程序頁面對用戶有用,但不希望成為登錄頁面(登錄頁面,與我們聯繫,隱私政策,帳戶頁面等)。
我想分享一個例子 邁克爾·科塔姆 關於頁面優先順序:
假設您的網站有1,000頁。這1,000頁中的475頁是SEO相關內容。您在XML網站地圖中突出顯示了這475個頁面,實際上是要求Google取消對其餘部分的索引編製優先順序。
現在,假設Google抓取了這475個頁面,並通過演算法確定175個「 A」級,200個「 B +」級和100個「 B」或「 B-」。這是一個很不錯的平均成績,可能表明該網站可以吸引用戶。
相比之下,通過XML網站地圖提交所有1,000個頁面則相反。現在,Google查看了您說與SEO相關的1000個頁面,發現超過50%的頁面是「 D」或「 F」頁面。您的平均成績不再那麼好,這可能會損害您的自然訓練。
但是請記住,Google只會將您的XML網站地圖用作您網站上重要內容的線索。
僅僅因為它不在您的XML網站地圖中,並不一定意味著Google不會為這些頁面編製索引。
對於SEO,整體網站質量是關鍵因素。
要評估您的網站質量,請轉到Google Search Console(GSC)中與站點地圖相關的報告。
重點介紹
通過僅將XML站點地圖URL限制為SEO相關頁面來管理爬網預算,並投入時間以減少網站上劣質頁面的數量。
充分利用站點地圖報告
新版Google Search Console中的Sitemaps部分沒有以前提供的那樣豐富的數據。
現在的主要用途是確認您的站點地圖索引已成功提交。
如果您選擇使用描述性的命名約定,而不是數字的,則還可以了解「發現」的不同類型的SEO頁面的數量,也就是Google通過站點地圖找到的所有URL以及其他方法,例如如以下鏈接。
在新的GSC中,對於SEO而言,與站點地圖有關的更有價值的領域是「索引覆蓋率」報告。
該報告將默認為「所有已知頁面」。在這裡您可以:
- 解決任何「錯誤」或「對警告有效」的問題。這些通常來自 機器人指令衝突。一個解決了,請確保通過「覆蓋率」報告驗證您的修復。
- 查看索引趨勢。大多數網站都在不斷增加有價值的內容,因此「有效」頁面(又稱Google索引的頁面)應穩步增加。了解任何急劇變化的原因。
- 選擇「有效」,然後在「索引中,未在站點地圖中提交」類型的詳細信息中查找。這些頁面上您和Google在其價值上存在分歧。例如,您可能尚未提交您的隱私權政策網址,但Google已將該頁面編入索引。在這種情況下,無需採取任何措施。您需要尋找的是源自以下網址的索引網址 分頁處理不佳, 參數處理不善,重複內容或網頁意外遺漏在站點地圖之外。
然後,通過將下拉列表更改為「所有提交的頁面」,將報告限制為您包含在站點地圖中的SEO相關URL。然後檢查所有「排除」頁面的詳細信息。
排除站點地圖URL的原因可以分為四個操作組:
-
快速獲勝:針對重複的內容,規範,機器人指令,40X HTTP狀態代碼,重定向或合法性排除,請進行適當的修復。
-
調查頁面:對於「提交的網址已刪除」和「爬網異常」排除項,請使用Google抓取方式進一步調查。
-
改善頁面:對於「已爬網-當前未建立索引」頁面,請查看頁面(或頁面類型,通常是具有相似種類的許多URL)的內容和內部鏈接。可能是因為內容稀少,內容原始或孤立。
-
改善域名:對於「已發現-當前未建立索引」頁面, Google筆記 他們被排除在外的典型原因是「他們試圖抓取網址,但網站超載」。不要上當。 Google更有可能決定「這不值得付出努力」,因為內部鏈接質量不佳或從域中看到的內容質量較低。如果您看到更多此類排除項,請查看通過站點地圖提交的頁面(或頁面類型)的SEO值,著重於優化抓取預算,並從鏈接和內容中查看信息架構(包括參數)透視。
無論您的行動計劃如何,請務必記下基準KPI。
評估站點地圖優化工作影響的最有用的指標是「所有提交的頁面」索引率-通過從已發現的URL總數中減去有效頁面的百分比來計算。
努力使這一比例達到80%以上。
為什麼不100%?因為如果您將所有精力都集中在確保對當前擁有的每個SEO相關URL進行索引,那麼您可能會錯失擴大內容覆蓋範圍的機會。
注意:如果您是一個較大的網站,並且選擇將其網站分為多個Sitemap索引,則可以按這些索引進行過濾。這不僅使您能夠:
- 請從更細緻的角度查看概述圖表。
- 調查排除類型時,請參閱大量相關示例。
- 逐段處理索引率優化。
重點介紹
除了識別警告和錯誤之外,您還可以將「索引覆蓋率」報告用作XML站點地圖偵查工具來隔離索引問題。
XML Sitemap最佳做法清單
花時間去:
✓在XML網站地圖中包含hreflang標籤
✓包括
✓使用gzip壓縮站點地圖文件
✓使用站點地圖索引文件
✓僅在索引驅動您的KPI時才使用圖像,視頻和Google新聞站點地圖
✓動態生成XML網站地圖
✓確保僅在單個站點地圖中包含URL
✓robots.txt中的參考站點地圖索引URL
✓將站點地圖索引提交到Google Search Console和Bing網站管理員工具
✓在XML網站地圖中僅包含SEO相關頁面
✓修復所有錯誤和警告
✓分析有效頁面的趨勢和類型
✓計算提交頁面的索引率
✓解決排除提交頁面的原因
現在,請檢查您自己的站點地圖,並確保您做對了。
圖片積分
特色圖片:Paulo Bobita
作者拍攝的所有屏幕截圖