URL参数处理的SEO指南

[ad_1]

URL参数处理的SEO指南

虽然参数受到开发人员和分析爱好者的喜爱,但它们通常是SEO的噩梦。无休止的参数组合可以从同一内容创建数千个URL变体。

问题是我们不能简单地希望参数消失。它们在网站的用户体验中起着重要作用。因此,我们需要了解如何以SEO友好的方式处理它们。

为此,我们探索:

什么是URL参数?

网址参数元素“ width =” 1199“ height =” 423“ size =”(最大宽度:1199px)100vw,1199px“ srcset =” https://cdn.searchenginejournal.com/wp-content/uploads/2019/01 /url-parameter-elements.png 1199w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/url-parameter-elements-480x169.png 480w,https://cdn.searchenginejournal.com /wp-content/uploads/2019/01/url-parameter-elements-680x240.png 680w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/url-parameter-elements-768x271。 png 768w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/url-parameter-elements-1024x361.png 1024w“ src =” https://cdn.searchenginejournal.com/wp-content /uploads/2019/01/url-parameter-elements.png

参数也称为查询字符串或URL变量的别名,是URL中问号后面的部分。它们由键和值对组成,并以等号分隔。可以使用与号将多个参数添加到单个页面。

参数的最常见用例是:

  • 跟踪–例如,?utm_medium =社交,?sessionid = 123或?affiliateid = abc

  • 重新排序-例如,?sort =最低价格,?order =最高评分或?so =最新

  • 过滤-例如?type = widget,colour = blue或?price-range = 20-50

  • 识别-例如?product = small-blue-widget,categoryid = 124或itemid = 24AU

  • 分页–例如,?page = 2,?p = 2或viewItems = 10-30

  • 搜索–例如,?query = users-query,?q = users-query或?search = drop-down-option

  • 翻译-例如,?lang = fr,?language = de或

URL参数的SEO问题

1.参数创建重复内容

通常,URL参数不会对页面内容进行重大更改。页面的重新排序版本通常与原始版本没有太大不同。具有跟踪标记或会话ID的页面URL与原始URL相同。

例如,以下URL将全部返回小部件的集合。

  • 静态网址:https://www.example.com/widgets

  • 跟踪参数:https://www.example.com/widgets?sessionID=32764

  • 重新排序参数:https://www.example.com/widgets?sort = newest

  • 识别参数:https://www.example.com?category=widgets

  • 搜索参数:https://www.example.com/products?search=widget

实际上,相同内容的网址很多。现在想象一下您网站上每个类别的内容。它真的可以加起来。

挑战在于搜索引擎将每个基于参数的URL视为一个新页面。因此他们看到同一页面的多个变体。所有提供的内容都是重复的,并且都针对同一关键字词组或语义主题。

虽然这种重复不太可能导致您完全被排除在搜索结果之外,但确实会导致 关键字蚕食 可能会降低Google对您的整体网站质量的看法,因为这些其他网址没有任何实际价值。

2.参数废物收集预算

搜寻多余的参数页面会浪费搜寻预算,从而降低您网站索引SEO相关页面的能力并增加服务器负载。

谷歌 合计 这一点完美。

“过于复杂的URL(尤其是包含多个参数的URL)会创建不必要的大量URL,这些URL指向您网站上的相同或相似内容,可能会对爬网程序造成问题。结果,Googlebot可能消耗比必要更多的带宽,或者可能无法完全索引您网站上的所有内容。”

3.参数拆分页面排名信号

如果您对同一页面内容有多个排列,则链接和社交共享可能会出现在各种版本中。

这会稀释您的排名信号。当您使搜寻器混乱时,它就不确定要为搜索查询索引哪些竞争页面。

4.参数使URL的点击率降低

基于参数的网址可点击性“ width =” 816“ height =” 460“ Size =”(最大宽度:816px)100vw,816px“ srcset =” https://cdn.searchenginejournal.com/wp-content/uploads/2019/ 01 / parameter-clickability.png 816w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/parameter-clickability-480x271.png 480w,https://cdn.searchenginejournal.com/wp- content / uploads / 2019/01 / parameter-clickability-680x383.png 680w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/parameter-clickability-768x433.png 768w“ src =” https ://cdn.searchenginejournal.com/wp-content/uploads/2019/01/parameter-clickability.png

面对现实吧。参数URL难看。他们很难读。他们似乎不值得信赖。因此,它们不太可能被单击。

这将影响页面性能。不仅因为点击率会影响排名,还因为它在社交媒体上,电子邮件中,在复制粘贴到论坛中或其他地方时的可点击性较差,因此可能会显示完整的URL。

虽然这可能只对单个页面的放大产生很小的影响,但每条推文(例如,共享,电子邮件,链接和提及)都与该域有关。

URL可读性差可能会导致品牌参与度下降。

评估参数问题的程度

了解您的网站上使用的每个参数很重要。但是您的开发人员可能没有及时更新列表。

那么,如何找到所有需要处理的参数呢?还是了解 搜索引擎如何爬行和建立索引 这样的页面?知道他们为用户带来的价值吗?

请遵循以下五个步骤:

  • 运行搜寻器:使用“尖叫青蛙”之类的工具,您可以在URL中搜索“?”。

  • 在Google Search Console URL参数工具中查找:Google自动添加找到的查询字符串。

  • 查看您的日志文件:查看Googlebot是否在抓取基于参数的网址。

  • 使用以下站点进行搜索:inurl:高级运算符:通过将密钥放入site:example.com inurl:key组合查询中,了解Google如何为找到的参数编制索引。

  • 在Google Analytics(分析)“所有页面”报告中查找:搜索“?”以查看用户如何使用找到的每个参数。确保检查视图设置中未排除URL查询参数。

有了这些数据,您现在可以决定如何最好地处理您的每个网站参数。

SEO解决方案,用于驯服URL参数

SEO库中有六个工具可以在战略层面上处理URL参数。

限制基于参数的URL

简单回顾一下如何以及为什么生成参数可以使SEO快速获胜。您通常会找到减少参数URL数量的方法,从而最大程度减少SEO的负面影响。有四个常见问题开始您的审查。

1.消除不必要的参数

删除不必要的参数“ width =” 1372“ height =” 324“ size =”(最大宽度:1372px)100vw,1372px“ srcset =” https://cdn.searchenginejournal.com/wp-content/uploads/2019/01 /unnecessary-parameters.png 1372w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/unnecessary-parameters-480x113.png 480w,https://cdn.searchenginejournal.com/wp-content /uploads/2019/01/unnecessary-parameters-680x161.png 680w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/unnecessary-parameters-768x181.png 768w,https:// cdn .searchenginejournal.com / wp-content / uploads / 2019/01 / unnecessary-parameters-1024x242.png 1024w“ src =” https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/unnecessary-parameters .png

向您的开发人员询问每个网站参数及其功能的列表。您可能会发现不再执行有价值功能的参数。

例如,可以通过以下方式更好地识别用户 饼干 而不是sessionID。然而,sessionID参数可能仍然存在,因为它曾经使用过。

或者,您可能会发现用户很少使用多面导航中的过滤器。

技术债务引起的任何参数应立即消除。

2.防止空值

没有空的参数值“ width =” 1372“ height =” 324“ size =”(最大宽度:1372px)100vw,1372px“ srcset =” https://cdn.searchenginejournal.com/wp-content/uploads/2019/ 01 / empty-value-parameters.png 1372w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/empty-value-parameters-480x113.png 480w,https://cdn.searchenginejournal。 com / wp-content / uploads / 2019/01 / empty-value-parameters-680x161.png 680w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/empty-value-parameters-768x181 .png 768w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/empty-value-parameters-1024x242.png 1024w“ src =” https://cdn.searchenginejournal.com/wp-内容/上传/2019/01/empty-value-parameters.png

URL参数仅在具有功能时才应添加到URL。如果值为空白,则不允许添加参数键。

在上面的示例中,key2和key3在字面上和图形上均未添加任何值。

3.仅使用一次按键

单键用法“ width =” 1372“ height =” 324“ Size =”(最大宽度:1372px)100vw,1372px“ srcset =” https://cdn.searchenginejournal.com/wp-content/uploads/2019/01 /single-key-usage.png 1372w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/single-key-usage-480x113.png 480w,https://cdn.searchenginejournal.com /wp-content/uploads/2019/01/single-key-usage-680x161.png 680w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/single-key-usage-768x181。 png 768w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/single-key-usage-1024x242.png 1024w“ src =” https://cdn.searchenginejournal.com/wp-content /uploads/2019/01/single-key-usage.png

避免应用具有相同参数名称和不同值的多个参数。

对于多选选项,最好在单个键后将这些值组合在一起。

4.订单网址参数

顺序url参数“ width =” 1372“ height =” 324“ size =”(最大宽度:1372px)100vw,1372px“ srcset =” https://cdn.searchenginejournal.com/wp-content/uploads/2019/01 /order-parameters.png 1372w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/order-parameters-480x113.png 480w,https://cdn.searchenginejournal.com/wp-content /uploads/2019/01/order-parameters-680x161.png 680w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/order-parameters-768x181.png 768w,https:// cdn .searchenginejournal.com / wp-content / uploads / 2019/01 / order-parameters-1024x242.png 1024w“ src =” https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/order-parameters .png

如果重新排列了相同的URL参数,则搜索引擎会将页面解释为相等。

因此,从重复的内容角度来看,参数顺序无关紧要。但是,这些组合中的每一个都会消耗抓取预算和拆分排名信号。

通过要求开发人员编写脚本以始终以一致的顺序放置参数,而无论用户如何选择它们,都可以避免这些问题。

我认为,您应该从任何翻译参数开始,然后识别,分页,然后分层筛选和重新排序或搜索参数,最后进行跟踪。

优点:

  • 允许更有效地使用抓取预算。
  • 减少重复内容的问题。
  • 将排名信号合并到更少的页面。
  • 适用于所有参数类型。

缺点:

  • 适中的技术实施时间

Rel =“规范”链接属性

rel =用于参数处理的规范“ width =” 526“ height =” 301“ Size =”(最大宽度:526px)100vw,526px“ srcset =” https://cdn.searchenginejournal.com/wp-content/uploads/ 2019/01 / parameter-rel-canonical.png 526w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/parameter-rel-canonical-480x275.png 480w“ src =” https:/ /cdn.searchenginejournal.com/wp-content/uploads/2019/01/parameter-rel-canonical.png

rel =“ canonical”链接属性指出页面具有与另一个页面相同或相似的内容。这鼓励搜索引擎将排名信号合并到指定为规范的URL。

您可以将基于参数的URL规范化为SEO友好的URL,以跟踪,识别或重新排序参数。但是,当参数页面的内容与规范(例如分页,搜索,翻译或某些过滤参数)不够接近时,此策略不适用。

优点:

  • 相对容易的技术实施。
  • 非常有可能防止重复的内容问题。
  • 将排名信号合并到规范URL。

缺点:

  • 在参数页面上浪费爬网预算。
  • 不适用于所有参数类型。
  • 搜索引擎将其解释为有力的提示,而不是指令。

Meta Robots Noindex标签

用于参数处理的meta robots noidex标记“ width =” 526“ height =” 301“ Size =”(最大宽度:526px)100vw,526px“ srcset =” https://cdn.searchenginejournal.com/wp-content/uploads /2019/01/parameter-noindex.png 526w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/parameter-noindex-480x275.png 480w“ src =” https:// cdn。 searchenginejournal.com/wp-content/uploads/2019/01/parameter-noindex.png

为任何不添加SEO值的基于参数的页面设置noindex指令。此标记将阻止搜索引擎将页面编入索引。

带有“ noindex”标记的网址也很可能不会被频繁抓取,如果存在时间较长,则最终会被抓取 引导Google跟随该页面的链接

优点:

  • 相对容易的技术实施。
  • 非常有可能防止重复的内容问题。
  • 适用于所有不希望被索引的参数类型。
  • 从索引中删除现有的基于参数的URL。

缺点:

  • 不会阻止搜索引擎抓取网址,但会鼓励它们更不频繁地抓取网址。
  • 不合并排名信号。
  • 搜索引擎将其解释为有力的提示,而不是指令。

Robots.txt不允许

机械手txt不允许进行参数处理“ width =” 526“ height =” 148“ size =”(最大宽度:526px)100vw,526px“ srcset =” https://cdn.searchenginejournal.com/wp-content/uploads/ 2019/01 / parameter-robots-disallow.png 526w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/parameter-robots-disallow-480x135.png 480w“ src =” https:/ /cdn.searchenginejournal.com/wp-content/uploads/2019/01/parameter-robots-disallow.png

robots.txt文件是搜索引擎在抓取您的网站之前首先要查看的文件。如果他们看到不允许的东西,他们甚至不会去那里。

您可以使用此文件来阻止搜寻器访问每个基于参数的URL(使用Disallow:/ *?*)或仅访问您不想被索引的特定查询字符串。

优点:

  • 简单的技术实施。
  • 允许更有效地使用抓取预算。
  • 避免重复的内容问题。
  • 适用于您不希望爬网的所有参数类型。

缺点:

  • 不合并排名信号。
  • 不会从索引中删除现有的网址。

Google Search Console中的网址参数工具

GSC URL参数处理“ width =” 1154“ height =” 375“ Size =”(最大宽度:1154px)100vw,1154px“ srcset =” https://cdn.searchenginejournal.com/wp-content/uploads/2019/ 01 / gsc-url-parameters.png 1154w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/gsc-url-parameters-480x156.png 480w,https://cdn.searchenginejournal。 com / wp-content / uploads / 2019/01 / gsc-url-parameters-680x221.png 680w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/gsc-url-parameters-768x250 .png 768w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/gsc-url-parameters-1024x333.png 1024w“ src =” https://cdn.searchenginejournal.com/wp-内容/上传/2019/01/gsc-url-parameters.png

配置Google的网址参数工具,以告知抓取工具您的参数用途以及如何处理它们。

Google Search Console发出警告消息,称使用该工具“可能导致许多页面从搜索中消失”。

听起来不祥。但是更令人生畏的是成千上万的重复页面损害了您网站的排名能力。

因此,最好是学习如何在Google Search Console中配置网址参数,而不要让Googlebot做出决定。

关键是要问自己,该参数如何影响页面内容。

  • 跟踪参数不会更改页面内容。将它们配置为“代表性URL”。
  • 配置将页面内容重新排序为“排序”的参数。如果用户选择添加此选项,请将爬网设置为“无URL”。如果默认情况下应用了排序参数,请使用“仅URL带值”,输入默认值。
  • 配置参数以将页面向下过滤到内容的子集为“窄”。如果这些过滤器与SEO不相关,请将抓取设置为“无URL”。如果它们与SEO相关,则将其设置为“每个URL”。
  • 将显示特定内容或一组内容的参数配置为“指定”。理想情况下,这应该是静态URL。如果可能,您可能需要将其设置为“每个URL”。
  • 配置将内容的翻译版本显示为“翻译”的参数。理想情况下,应通过子文件夹实现翻译。如果可能,您可能需要将其设置为“每个URL”。
  • 将较长序列的组件页显示为“分页”的配置参数。如果你已经实现 XML网站地图的高效索引,您可以保存抓取预算并将抓取设置为“无URL”。如果没有,请设置为“每个URL”以帮助爬网程序访问所有项目。

Google会自动在默认的“让Googlebot决定”下将参数添加到列表中。挑战在于,即使参数不再存在,也永远无法删除它们。

因此,最好是自己主动添加参数。这样,无论何时该参数不再存在,都可以将其从GSC中删除。

对于您在Google Search Console中设置为“无URL”的任何参数,还应该考虑将其添加到Bing的“忽略URL参数”工具中。

优点:

  • 无需开发人员时间。
  • 允许更有效地使用抓取预算。
  • 可能会防止出现重复内容问题。
  • 适用于所有参数类型。

缺点:

  • 不合并排名信号。
  • 由Google解释为有用的提示,而不是指令。
  • 仅适用于Google,对Bing的控制较少。

从动态URL转移到静态URL

许多人认为处理URL参数的最佳方法是首先避免使用它们。毕竟,子文件夹超越了参数来帮助Google理解网站结构,静态的,基于关键字的URL一直是页面SEO的基石。

为此,您可以使用服务器端URL重写将参数转换为子文件夹URL。

例如,URL:

www.example.com/view-product?id=482794

会成为:

www.example.com/widgets/blue

这种方法适用于基于描述性关键字的参数,例如用于标识类别,产品或用于搜索引擎相关属性的过滤器的参数。对于翻译内容也有效。

但是,对于与关键字无关的元素,它就成为问题 多面导航,例如价格。将此类过滤器作为静态,可索引的URL不会提供SEO值。

这也是搜索参数的问题,因为每个用户生成的查询都将创建一个静态页面,以针对规范进行排名-或更糟糕的是,每当用户搜索您不提供的商品时,它们就会向抓取质量较低的内容页面展示。

应用于分页时有些奇怪(尽管由于WordPress并不罕见),它会给出如下网址

www.example.com/widgets/blue/page2

重新排序非常奇怪,它会给出如下网址

www.example.com/widgets/blue/最低价格

而且通常不是可行的跟踪选项。 Google Analytics(分析)不会确认UTM参数的静态版本。

更重要的是,通过将静态参数替换为诸如分页,现场搜索框结果或排序之类的动态URL不能解决重复内容,爬网预算或内部链接净额稀释的问题。

而且,将多方面导航中的所有过滤器组合作为可索引的网址通常会导致 稀薄的内容 问题。特别是如果您提供多选过滤器。

许多SEO专家认为,可以在不影响URL的情况下提供相同的用户体验。例如,通过使用POST而不是GET请求来修改页面内容。因此,保留了用户体验并避免了SEO问题。

但是,以这种方式删除参数将消除受众群体添加书签或共享指向该特定页面的链接的可能性。并且如果显然对于跟踪参数不可行并且对于分页不是最优的。

问题的关键在于,对于许多网站而言,如果您想提供理想的用户体验,完全不可能避免参数的使用。 SEO也不是最佳实践。

因此,我们剩下了这个。对于您不想在搜索结果中索引的参数(分页,重新排序,跟踪等),请实现为查询字符串。对于确实要建立索引的参数,请使用静态URL路径。

优点:

  • 将搜寻器焦点从基于参数的URL转移到具有较高排名可能性的静态URL。

缺点:

  • URL重写和301重定向的大量开发时间投入。
  • 不能防止重复的内容问题。
  • 不合并排名信号。
  • 不适用于所有参数类型。
  • 可能会导致内容不足的问题。
  • 并非总是提供可链接或可收藏的URL。

SEO的最佳做法URL参数处理

那么您应该执行这六个SEO策略中的哪一个?

答案可能不是全部。

这不仅会造成不必要的复杂性。但是,通常,SEO解决方案之间会相互冲突。

例如,如果您实施禁止robots.txt,则Google将无法看到任何meta noindex标记。你也是 不应将meta noindex标记与rel = canonical结合使用 链接属性。

显而易见的是,没有一种完美的解决方案。

甚至Google的John Mueller也无法决定采用哪种方法。在 Google网站站长视频群聊, 他最初建议不要使用参数,但从多面导航角度对此提出疑问时,回答“取决于情况”。

在某些情况下,爬网效率比合并授权信号更重要。

最终,适合您的网站的方法取决于您的优先级。

网址参数处理选项的优缺点” width =“ 543” height =“ 312” size =“(最大宽度:543px)100vw,543px” srcset =“ https://cdn.searchenginejournal.com/wp-content/uploads /2019/01/parameter-handling-pros-cons.png 543w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/parameter-handling-pros-cons-480x276.png 480w“ src =“ https://cdn.searchenginejournal.com/wp-content/uploads/2019/01/parameter-handling-pros-cons.png

我个人不使用noindex或禁止访问参数页面。如果Google无法抓取并理解所有URL变量,则无法将排名信号合并到规范页面中。

我采取以下针对SEO友好参数处理的攻击计划:

  • 做关键字研究以了解哪些参数应该是搜索引擎友好的静态URL。
  • 实行 正确的分页处理 与rel =“ next&rel =” prev“。
  • 对于所有其余的基于参数的URL,请实施一致的排序规则,该规则仅使用键一次,并防止使用空值来限制URL的数量。
  • 将rel = canonical链接属性添加到合适的参数页面以组合排名能力。
  • 在Google和Bing中将URL参数处理配置为故障保护,以帮助搜索引擎了解每个参数的功能。
  • 仔细检查XML站点地图中没有提交基于参数的URL。

无论您选择实施哪种参数处理策略,请确保 记录影响 您在KPI上的努力。

图片积分

特色图片:Paulo Bobita
后期图片/屏幕截图:由作者创建/拍摄

相关文章