搜索引擎如何抓取并编制索引:您需要知道的一切

[ad_1]

搜索引擎如何抓取并编制索引:您需要知道的一切

编者注:这篇文章摘自《搜索引擎期刊》的新电子书,《搜索引擎的工作原理》。本指南将教您搜索引擎的功能以及影响搜索引擎结果页面的关键因素。现在要你的副本吗? 在这里下载 或滚动到这篇文章的底部以获取更多详细信息。

在不首先了解搜索引擎如何工作的情况下优化网站,就像在不先学习如何写作的情况下出版您的小说一样。

当然,一千只打字机上的猴子最终会创造出有用的东西(至少这只猴子喜欢不时地以为自己会做),但是如果您事先了解任务的核心要素,就会容易得多。

因此,我们必须了解搜索引擎的工作方式,以充分了解如何针对搜索引擎进行优化。

当我们将重点放在自然搜索上时,我们必须首先简要讨论一下有关搜索引擎的一个关键事实。

付费搜索结果

并非Google,Bing或任何其他主要搜索引擎都在提供有机商家信息。

也就是说,自然结果是达到目的的手段,但不会直接为其带来收入。

如果没有自然搜索结果,则Google的付费搜索结果的相关性就会降低(序曲 有人吗?),从而减少了眼球和付费点击次数。

基本上,Google和Bing(及其他公司)是广告引擎,恰巧通过有机列表吸引用户访问其物业。那么,有机是达到目的的手段。

为什么这么重要?

这是驱动的关键点:

  • 他们的布局改变了。
  • 搜索功能(例如知识面板和精选片段)的存在。
  • 随机结果的点击率(CTR)。

因此,当Google将第四个付费搜索结果添加到有商业意图的查询中时。

当Google显示精选代码段时,您不必离开Goog​​le.com即可获得查询的答案……就是因为这个原因。

无论您可能会发生什么变化,都必须牢记这一点,并且不仅要质疑今天会产生什么影响,而且还暗示着即将发生什么进一步变化,这很重要。

搜索引擎如何今天工作:系列

好了,现在我们对Google为何能提供自然搜索结果有了基本的了解,现在让我们来看一下其运行方式的细节。

为此,我们将研究:

  • 检索和索引
  • 演算法
  • 机器学习
  • 用户意图

这一部分将重点介绍索引。因此,让我们潜入…

索引编制

索引就是一切的开始。

对于初学者而言,索引编制实际上是指将网页内容添加到Google中。

当您在网站上创建新页面时,可以通过多种方法对其进行索引。

获取页面索引的最简单方法是绝对不执行任何操作。

Google的链接具有爬网程序,因此,如果您的网站已经在索引中,并且从您的网站链接到新内容,则Google最终会发现它并将其添加到其索引中。稍后再详细介绍。

但是,如果您希望Googlebot更快进入您的页面怎么办?

如果您有及时的内容,或者对Google需要了解的页面进行了重要更改,那么这可能很重要。

我使用速度更快的方法的主要原因之一是,我优化了关键页面或调整了标题和/或描述以提高点击率,并且想特别了解何时在SERP中选择和显示它们。知道从哪里开始衡量改进。

在这些情况下,可以使用一些其他方法:

1. XML网站地图

总有 XML网站地图

基本上,这是一个站点地图,通过 搜索控制台

XML网站地图为搜索引擎提供了网站上所有页面的列表,以及有关它的其他详细信息,例如上次修改时间。

绝对推荐!

但是,当您需要立即将页面编入索引时,它并不是特别可靠。

2.请求索引

在Search Console中,您可以“请求索引”。

首先,请点击顶部的搜索字段,该字段默认显示为“ domain.com中的检查和URL”

输入您要建立索引的URL,然后按Enter。

如果该页面已为Google所熟知,则会向您显示大量信息。我们不会在这里进行介绍,但我建议您登录并查看其中的内容(如果您还没有的话)。

对于我们来说,这里的重要按钮会显示该页面是否已被编入索引-这意味着它对于内容发现或只是要求Google了解最近的更改都非常有用

您会发现按钮…

GSC-request-indexing“ width =” 1025“ height =” 423“ Size =”(最大宽度:1025px)100vw,1025px“ data-srcset =” https://cdn.searchenginejournal.com/wp-content/uploads /2019/10/gsc-request-indexing.jpg 1025w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/10/gsc-request-indexing-480x198.jpg 480w,https:// cdn .searchenginejournal.com / wp-content / uploads / 2019/10 / gsc-request-indexing-680x281.jpg 680w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/10/gsc-request- indexing-768x317.jpg 768w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/10/gsc-request-indexing-1024x423.jpg 1024w“ data-src =” https://cdn.searchenginejournal .com / wp-content / uploads / 2019/10 / gsc-request-indexing.jpg

在几秒钟到几分钟内,您可以在Google中搜索新内容或URL,并找到所做的更改或新内容。

3.在Google上托管您的内容

搜寻网站以对其进行索引是一个耗时且耗费资源的过程。

一种选择是直接与他们托管您的内容。

可以通过几种不同的方法来完成此操作,但是我们大多数人(包括我本人)并未采用所需的技术或方法,而Google并未将我们推向他们。

我们看到了能够通过XML供稿,API等使Google直接访问我们的内容,并从设计中拔出我们的内容的功能。

Google的移动应用程序平台Firebase使Google可以直接访问应用程序内容,而无需弄清楚如何对其进行爬网。

这就是未来-允许Google毫不费力地立即为内容编制索引,以便它可以根据访问技术以最可用的格式提供内容。

尽管我们在技术上所处的位置并不够,以至于对这方面的事情过分强调,但是知道它即将到来。

我对辛迪·克鲁姆(Cindy Krum) MobileMoxie博客,她在其中详细讨论了这些主题以及与移动相关的主题。

4.还有Bing,太!

要通过Bing快速索引您的内容和/或进行更新,您将需要一个Bing网站管理员工具帐户。

如果您没有,我推荐的不够。内提供的信息非常丰富,将帮助您更好地评估问题区域并提高您在Bing,Google和其他任何地方的排名-并可能还会提供更好的用户体验。

但是只需要将您的内容编入索引,只需单击:配置我的网站>提交URL

在此输入您想要索引的URL,然后单击“提交”。

bing-webmaster-submit-urls“ width =” 1055“ height =” 356“ size =”(最大宽度:1055px)100vw,1055px“ data-srcset =” https://cdn.searchenginejournal.com/wp-content /uploads/2019/10/bing-webmaster-submit-urls.jpg 1055w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/10/bing-webmaster-submit-urls-480x162.jpg 480w ,https://cdn.searchenginejournal.com/wp-content/uploads/2019/10/bing-webmaster-submit-urls-680x229.jpg 680w,https://cdn.searchenginejournal.com/wp-content/uploads/ 2019/10 / bing-webmaster-submit-urls-768x259.jpg 768w,https://cdn.searchenginejournal.com/wp-content/uploads/2019/10/bing-webmaster-submit-urls-1024x346.jpg 1024w“ data-src =“ https://cdn.searchenginejournal.com/wp-content/uploads/2019/10/bing-webmaster-submit-urls.jpg

因此,这几乎是您需要了解的有关索引以及搜索引擎如何进行索引的所有信息(着眼于事情的发展方向)。

搜寻预算

我们真的不能不谈索引而已 搜寻预算

基本上,抓取预算是一个术语,用于描述Google抓取网站将花费的资源量。

分配的预算是综合考虑因素而得出的,两个主要因素是:

  • 您的服务器有多快(即Google可以在不降低用户体验的情况下抓取多少)。
  • 您的网站有多重要。

如果您运行的主要新闻网站会不断更新内容,那么搜索引擎用户将希望知道您的网站会经常被抓取(我敢说……一直在不断)。

如果您经营一家小型理发店,拥有数十个链接,并且在这种情况下理应被认为不重要(您可能是该地区的重要理发师,但在抓取预算方面并不重要),那么预算将低。

您可以在Google的说明中详细了解抓取预算及其确定方式 这里

探索搜索引擎的工作方式

是否想以正确的方式优化您的网站并为成功做好准备?那么了解当今搜索引擎的运行方式至关重要。

由作者撰写的《搜索引擎的工作原理》探讨了搜索引擎的功能以及影响搜索引擎结果页面的关键因素。

在这里下载。

与HigherVisibility合作,我们为希望增强其SEO技术知识的SEO专业人员创建了这本电子书。

搜索引擎的工作方式分为九个易于理解的章节:

  • 第1章:搜索引擎如何抓取并编制索引:您需要了解的所有内容
  • 第2章:搜索引擎如何(以及为什么)呈现页面
  • 第3章:搜索引擎算法的工作原理:您需要了解的一切
  • 第4章:搜索引擎如何对页面进行排名
  • 第5章:搜索中的机器学习如何工作:您需要知道的一切
  • 第6章:搜索中用户行为的工作原理:您需要了解的所有内容
  • 第7章:搜索引擎如何显示搜索结果
  • 第8章:搜索引擎如何通过“有用的答案”和丰富的结果来回答直接答案
  • 第9章:通用搜索的工作方式

立即下载您的副本。

相关文章