当两个或多个页面上出现完全相同或几乎完全相同的内容时,称为 重复内容. 重复内容的最大问题是搜索引擎不知道要索引或在搜索结果中显示哪个版本的内容。 也很难弄清楚在哪里直接链接指标,如权威和信任。 当其他站点需要在重复的内容版本之间进行选择以链接回时,可能会选择许多链接中的任何一个,这会稀释链接的公平性。 这就是规范 URL 的用武之地。它们用于清除重复内容带来的问题,从而提高您的搜索引擎排名。
什么是规范 URL?
由于 HTML 标签 rel=”canonical” 而引用的规范 URL 是搜索引擎在同一网站或不同网站上存在多个版本的页面时用来查找内容的主版本的方法。
例如,假设您在自己的网站上发布了一篇博文。 然后,您还想在您的 LinkedIn 和 Medium 帐户上发布该博客文章。 使用规范标签,您可以让搜索引擎知道,即使同一篇博客文章出现在多个网站上,您网站上的文章也是主版本,应该出现在搜索结果中。
请记住,从技术上讲,规范 URL 并不是真正的 URL — 它更多的是附加到 URL 以将其含义传达给搜索引擎的标签。 如果实际 URL 看起来像 http://example.com/blogpost,那么规范版本将如下所示:
您不能像访问主 URL 那样访问该规范 URL。 相反,规范化版本被放置在页面的 HTML 代码中(或通过插件为页面指定)。
为什么应该使用规范 URL
URL 的规范化告诉搜索引擎哪个是页面的主版本,这是应该出现在搜索结果中的页面,而不是页面的其他副本。 当人们在寻找要链接回的内容时,规范化的页面会出现,他们会选择那个建立链接公平性的页面。 此外,一条内容的指标会合并到一个页面中,这使您的指标报告更加可靠。
如何正确使用规范标签
假设您的网站(或两个不同的网站)上有重复的内容,但您希望将搜索引擎指向的主要版本是 http://example.com/blogpost。
您添加到博客文章源代码(页面 HTML 的 head 部分)的规范标签将如下所示:
如果您使用的是 WordPress,则不必像某些人那样摆弄 HTML 代码 其他 CMS 平台. 相反,您可以使用插件并为每个页面设置规范 URL。 我们稍后会详细介绍。
规范 URL 和复制的内容
复制的内容可能是个问题。 规范 URL 让任何要复制内容的人都知道要在其页面标题中使用哪个标签。 但是,复制者有责任通过将 rel=”canonical” 放在其网站的标题中并指向您的内容来告诉搜索引擎他们复制了内容。
其他时候,您可能想成为复印机。 这是常见的 新闻稿, 例如。 您可以先在公司网站上发布新闻稿,但将内容的原始来源归于联合网络。 这将使您成为联合组织者,而不是原始出版商——至少根据搜索引擎。
但是,我们应该注意,在复制的内容中包含规范 URL 并不总是必要的。 或者有时会被忽略。 搜索引擎在寻找内容的真正原始来源方面做得很好。 因此,如果您要使用规范 URL 指向非原始 URL,就像上面的新闻稿示例中一样,只需知道搜索引擎可能会忽略它。 自行决定使用该策略。 它有点恶心 SEO的灰色地带如果不是一个完整的 黑帽战术.
选择 URL 结构
即使您认为在线任何地方都没有重复内容,您的 URL 结构也可能会意外创建重复内容。 例如,即使以下 URL 显示相同的内容,并且您将它们视为同一页面,搜索引擎也会将它们视为单独的:
- http://www.examplesite.com – 包含“www”
- http://examplesite.com – 这不包括“www”
- https://examplesite.com – 这有“https”而不是“http”
- http://www.examplesite.com/ – 末尾有一个斜线
HTTPS 和尾部斜杠和 www 也有变化。 根据搜索引擎,它们都被视为单独的页面。
这意味着您需要对 URL 的结构做出最终决定。 然后,在任何地方使用该结构——在您的网站上以及在您引用网站的任何地方。 如果您必须更新您的 URL,请使用您最常使用的结构,以减少此过程的繁琐。 但是,如果您通过您的网站获取敏感信息,例如信用卡信息,您将需要使用 HTTPS.
您的 WordPress 类别和标签也可能意外创建重复的内容。 例如,这两个 URL 可能指向同一个页面,但搜索引擎会将它们视为具有重复内容的两个独立页面:
- http://examplesite.com/store/candy/chocolate-truffles
- http://examplesite.com/store/foods/chocolate-truffles
您可能希望用户在您的网站上查找“糖果”或“食品”类别时都能找到松露巧克力。 但是搜索引擎仍然需要知道要在搜索结果中排名哪一个。 这就是为什么大多数 SEO 插件(例如 Yoast 和 Rank Math)都提供了对您的档案页面取消索引的选项。 这样一来,这些重复项就不会显示给 Googlebot 及其同行。
何时不使用规范 URL
到那个时刻 301 重定向,您可能不想使用规范标签。 以这种方式思考不同之处:重定向意味着内容只出现在一个地方,并且您强制所有访问者转到该页面。 另一方面,使用规范 URL,可以存在和查看包含相同内容的多个页面,其中一个原始来源指定用于搜索引擎。
此外,rel=”canonical” URL 元素并不是所有重复内容问题的解决方案。 搜索引擎优化是一个复杂的话题,有时更合适的解决方案是使用机器人文件来代替页面索引。 建议您将不希望进入您网站的入口点的无索引页面以及对大多数访问者不是很有用的页面设置为无索引。 例如,您真的需要您的条款和条件页面出现在搜索结果中吗? 可能不是。 但是你的博客文章、产品描述和销售页面呢? 确实。
退房也是个好主意 谷歌的文章 使用规范标签时有五个常见错误。 你不能比谷歌直接说的更好。
规范 URL 如何影响 SEO?
现在,虽然我们绝对建议您使用规范 URL 清除重复内容问题,但重要的是要注意,Google 在技术上不会惩罚发布重复内容的网站。 但是,它可能会损害您的搜索引擎排名——这有点像受到惩罚。 当搜索引擎很难确定哪个是内容的主版本时,没有一个版本会获得很高的排名。
搜索引擎也可能会选择错误的版本并链接到不可信的站点,这意味着如果用户不喜欢 URL 的外观,它可能根本不会被点击和阅读。 此外,当您的网站上有重复的内容时,您的抓取预算就会被吃光。 搜索引擎抓取并重新抓取网站以查找新内容,如果您的网站上有重复的内容,则需要更长的时间才能全部抓取。 这意味着搜索引擎将花费更长的时间来索引这些新页面并在搜索结果中对它们进行排名。
您可以通过阅读我们的 重复内容和 SEO 的终极指南. 谷歌也有一个 有用的页面 关于合并重复的 URL。
如何设置规范 URL
在本节中,我们将引导您了解如何在 WordPress 和非 WordPress 网站上设置规范 URL。
使用 WordPress 设置规范 URL
虽然你可以 在没有 WordPress 插件的情况下设置规范 URL,我们认为最好、最简单、最灵活的选择是使用插件。 对于本演练,我们使用 Yoast 搜索引擎优化.
安装并激活 Yoast SEO 后,打开 WordPress 页面或帖子。 向下滚动到帖子底部,直到到达 Yoast SEO 框。 选择 SEO 选项卡(默认情况下),向下滚动到底部,然后单击高级。 在出现的菜单底部,您会看到一个标有规范 URL 的插槽。
在此框中输入完整的 URL,然后将更改保存到帖子或页面。
多合一搜索引擎优化 和 排名数学 SEO 是您可能要考虑的另外两个插件。
在 WordPress 之外设置规范 URL
如果您不使用 WordPress,您仍然可以设置规范 URL。 首先,您需要访问网页 HTML。 每个 Web 构建器都有自己的流程,但应该很容易找到。 例如,这里是 如何将代码添加到 Wix 站点. 对于大多数非 WP 构建器和 CMS 平台,该过程是相似的; 你只需要找到他们让你编辑页面/发布 HTML 的地方。
然后,您需要将带有 rel=“canonical” 标记的 URL 添加到 head 部分。 使用下面的示例,将 http://example.com/blogpost 替换为您的 URL:
HTML 头部部分是代码的第一部分。 它打开和关闭。 这是一个例子:
要将代码添加到 head 部分,您必须将其放置在打开和关闭标记之间的某个位置。 最好在结束标签上方添加一个链接,以保持一切井井有条。
如何查找规范 URL
如果您想查看网页是否有指定的规范 URL,这非常简单。 打开页面,然后右键单击,将弹出一个菜单。 选择显示页面源(或任何接近该选项的选项,例如查看页面源)。 这将打开一个带有 HTML 代码的源页面。 在顶部,您应该看到头部。 检查该部分的 rel=”canonical” 标签。
如何删除规范 URL
删除规范 URL 也很容易。 您只需采取与添加 URL 相同的步骤,但这次将其删除。 如果您使用了 Yoast 之类的插件,您可以进入该页面并从相关字段中删除规范 URL。 如果您直接将它添加到页面的 HTML 中,您可以简单地删除它然后更新页面。 这也是为什么总是在同一个位置添加您的规范 URL 是一个好主意,例如直接在结束的 head 标签上方。
关于规范 URL 的最终想法
您网站上的页面越多,制定规范 URL 策略的劳动强度就越大。 这就是为什么最好尽早处理此问题并密切关注您的内容在何处在线重新发布的原因。 借助 Yoast SEO 等有用的 WordPress 插件,设置规范 URL 比访问每个页面的 HTML 和手动编辑代码更容易。
使用规范 URL 的一些最佳做法是什么? 让我们在评论中知道!
Thepanyo / shutterstock.com 的文章特色图片