搜索引擎索引如何工作的基础知识

搜索引擎优化 (SEO) 是提高网站知名度和吸引更多自然流量的重要方法。 然而,这是一个复杂的策略,依赖于 理解算法 并利用各种排名因素。 如果你想成为一名 搜索引擎优化专家,您需要了解搜索引擎索引。

在这篇文章中,我们将解释搜索引擎如何索引网站以及如何提高排名。 我们还将回答有关此 SEO 概念的一些常见问题。 让我们开始吧!

什么是搜索引擎索引?

搜索引擎索引是指搜索引擎(例如 Google)在中央数据库(其索引)中组织和存储在线内容的过程。 然后,搜索引擎可以分析和理解内容,并在其排名列表中将其提供给读者 搜索引擎结果页面 (SERP).

在索引网站之前,搜索引擎会使用“爬虫”来调查链接和内容。 然后,搜索引擎获取爬取的内容并将其组织到其数据库中:

the-basics-of-how-search-engine-indexing-works-1 搜索引擎索引如何工作的基础知识

图片来源: 可操作性 – 许可证:CC BY-SA 4.0

我们将在下一节中仔细研究这个过程是如何工作的。 目前,将索引视为网站帖子和页面、视频、图像和其他内容的在线归档系统会有所帮助。 对于谷歌来说,这个系统是一个巨大的数据库,被称为 谷歌索引.

搜索引擎如何索引网站?

像谷歌这样的搜索引擎使用“爬虫”来探索在线内容并对其进行分类。 这些爬虫是跟踪链接、扫描网页并尽可能多地获取有关网站的数据的软件机器人。 然后,他们将信息传递到搜索引擎的服务器以进行索引:

the-basics-of-how-search-engine-indexing-works-2 搜索引擎索引如何工作的基础知识

图片来源: 可操作性 – 许可证:CC BY-SA 4.0

每次发布或更新内容时,搜索引擎都会对其进行抓取和索引,以将其信息添加到其数据库中。 这个过程可以自动发生,但你可以通过 向搜索引擎提交站点地图. 这些文档概述了您网站的基础架构(包括链接),以帮助搜索引擎更有效地抓取和理解您的内容。

搜索引擎爬虫以“爬网预算”运行。 此预算限制了机器人在设定的时间内将在您的网站上抓取和索引的页面数量。 (然而,他们确实回来了。)

爬虫编译有关基本数据的信息,例如关键字、发布日期、图像和视频文件。 搜索引擎还通过关注和索引来分析不同页面和网站之间的关系 内部链接外部网址.

请注意,搜索引擎爬虫不会跟踪网站上的所有 URL。 他们会自动抓取 dofollow 链接,忽略他们的 nofollow 等价物. 因此,您需要专注于您的 建立联系的努力. 这些是指向您的内容的外部站点的 URL。

如果外部链接来自高质量的来源,当爬虫从另一个站点跟踪它们到您的站点时,它们会传递它们的“链接汁”。 因此,这些 URL 可以提高您在 SERP 中的排名:

the-basics-of-how-search-engine-indexing-works-3 搜索引擎索引如何工作的基础知识

图片来源: 可操作性 – 许可证:CC BY-SA 4.0

此外,请记住,某些内容无法被搜索引擎抓取。 如果您的页面隐藏在登录表单、密码后面,或者您的图像中嵌入了文本,搜索引擎将无法访问和索引该内容。 (你可以 使用替代文字 但是,让这些图像单独出现在搜索中。)

4 搜索引擎索引工具

您可以使用多种工具来指导 Google 和其他搜索引擎如何抓取您的内容并将其编入索引。 让我们看一些最有用的选项!

1. 站点地图

请记住,有两种站点地图: XMLHTML. 这两个概念很容易混淆,因为它们都是以 -ML 结尾的站点地图类型,但它们的用途不同。

HTML 站点地图是用户友好的文件,列出了您网站上的所有内容。 例如,您通常会在站点的页脚中找到这些站点地图之一。 一直向下滚动 苹果网, 你会发现这是一个 HTML 站点地图:

the-basics-of-how-search-engine-indexing-works 搜索引擎索引如何工作的基础知识

该站点地图使访问者能够轻松浏览您的网站。 它充当一个通用目录,它可以对您的 SEO 产生积极影响并提供可靠的用户体验(用户体验)。

相比之下,XML 站点地图包含您网站上所有重要页面的列表。 您将此文档提交给搜索引擎,以便他们可以更有效地抓取和索引您的内容:

the-basics-of-how-search-engine-indexing-works-4 搜索引擎索引如何工作的基础知识

请记住,当我们在本文中讨论站点地图时,我们将指的是 XML 文档。 我们还建议您查看我们的指南 创建 XML 站点地图,因此您可以为不同的搜索引擎准备好文档。

2.谷歌搜索控制台

如果您想将您的 SEO 工作重点放在 Google 上, 谷歌搜索控制台 是掌握的必备工具:

the-basics-of-how-search-engine-indexing-works-1 搜索引擎索引如何工作的基础知识

在控制台中,您可以访问索引覆盖率报告,该报告会告诉您哪些页面已被 Google 索引并突出显示过程中的任何问题。 在这里,您可以分析问题 URL 并对其进行故障排除以使其“可索引”。

此外,您可以 将您的 XML 站点地图提交到 Google Search Console. 本文档充当“路线图”,帮助 Google 更有效地索引您的内容。 最重要的是,您可以要求 Google 重新抓取您网站的某些 URL 和部分内容,以便您的受众始终可以使用更新的主题,而无需等待 Google 的抓取工具返回您的网站。

3. 替代搜索引擎控制台

尽管 Google 是最受欢迎的搜索引擎,但它并不是唯一的选择。 将自己限制在 Google 上可能会使您的网站无法访问来自其他来源的流量,例如 必应

the-basics-of-how-search-engine-indexing-works-5 搜索引擎索引如何工作的基础知识

我们建议您查看我们关于提交 XML 站点地图的指南 必应网站管理员工具Yandex 网站管理员工具. 不幸的是,其他搜索引擎,包括 雅虎鸭鸭围棋,不允许您提交站点地图。

请记住,这些控制台中的每一个都提供了独特的工具来监控您网站在 SERP 中的索引和排名。 因此,如果您想扩展您的 SEO 策略,我们建议您尝试一下。

4.机器人.txt

我们已经介绍了如何使用站点地图来告诉搜索引擎索引您网站上的特定页面。 此外,您可以使用 robots.txt 文件排除某些内容。

robots.txt 文件包含有关您网站的索引信息。 它存储在您的根目录中,有两行:指定搜索引擎爬虫的用户代理行和阻止特定文件的禁止指令。

例如,robots.txt 文件可能如下所示:

用户代理:* 禁止:/example_page/ 禁止:/example_page_2/

在此示例中,* 涵盖所有搜索引擎爬虫。 然后,禁止行指定特定文件或 URL 路径。

您只需创建一个简单的文本文件并将其命名为 robots.txt。 然后,添加您的禁止数据并将文件上传到您的根目录 文件传输协议 (FTP) 客户端.

常见问题

到目前为止,我们已经介绍了搜索引擎索引的基础知识。 如果您对此 SEO 概念仍有疑问,我们将在这里回答! (如果您还有一个,请在评论中告诉我们,以便我们在那里回答!)

如何更好地被搜索引擎收录?

通过创建站点地图,您可以更好地被搜索引擎收录, 审核他们的抓取错误,并将它们提交给多个搜索引擎。 此外,您应该考虑 针对移动设备优化您的内容减少加载时间 加速爬取和索引。

经常更新您的内容还可以提醒搜索引擎抓取和索引您的“新”页面。 最后,我们建议通过使用 robots.txt 文件或将其删除来防止搜索引擎抓取重复内容。

我必须请求搜索引擎来抓取我的网站吗?

搜索引擎会在互联网上抓取新的公开内容,但这个过程可能需要数周或数月的时间。 因此,您可能更喜欢通过向您选择的搜索引擎提交站点地图来加快速度。

如果我发布新内容,我是否必须提醒搜索引擎?

我们建议您在发布新内容时更新您的站点地图。 这种方法可确保您的帖子被更快地抓取和索引。 我们建议使用插件,例如 Yoast 搜索引擎优化 轻松生成站点地图。

我的内容是否曾从 Google 或其他搜索引擎中删除?

谷歌可能 从其索引中删除帖子或页面 如果内容违反其服务条款。 这意味着内容在许多情况下违反了隐私、诽谤、版权或其他法律。 Google 还会从其索引中删除个人数据,例如可识别的财务或医疗信息。 最后,谷歌可能会惩​​罚使用 黑帽SEO 技巧。

如果我的内容已被删除,我如何才能将其重新编入索引?

您可以要求 Google 通过修改内容来重新索引您的内容以满足搜索引擎的要求 网站管理员质量指南. 然后,您可以提交一个 复议请求 并等待看到谷歌的回应。

如何防止搜索引擎索引某些页面?

您可以通过向页面的 部分添加 noindex 元标记来阻止搜索引擎对某些页面进行索引。 或者,如果您的内容是媒体文件,您可以将其添加到 robots.txt 文件中。 最后,Google 网站管理员工具使您可以使用 删除 URL 工具.

结论

SEO是一个广泛的领域,涵盖了从搜索引擎算法到 站外优化技术. 如果您是该主题的新手,您可能会对所有信息感到不知所措。 幸运的是,索引是更容易掌握的概念之一。

搜索引擎索引是将您的网站内容组织到中央数据库的基本过程。 搜索引擎爬虫分析您网站的内容和架构以对其进行分类。 然后,他们可以在结果页面中针对特定搜索词对您的页面进行排名。

您对搜索引擎索引还有其他问题吗? 在下面的评论部分让我们知道!

通过 Sammby / shutterstock.com 的特色图片

查看源代码

相关文章