[ad_1]
我是搜索极客。我通读了一些专利,这些专利提供了搜索引擎幕后的暗示和可能的隐喻,就像它们是小说一样。
我正在寻找特定发明家的专利,例如那些可能对新的Marvel电影新闻视而不见的人。
专利并不总是提供可行的见解,但是它们确实提出了一些问题和可能需要注意的问题,或者理解了搜索引擎的工作方式,甚至进行了测试。
我今年夏天找到了一项专利,使我想起了海变的概念以及搜索结果如何改变和经历海变。
我注意的一位发明家是 Trystan Upstill,有一次Google的核心网络排名和移动内容搜索负责人。
他参与了Google的一些更有趣的专利和流程,例如我在 Google如何根据分类质量对某些结果进行排名。
如果您阅读过该专利,可能会发现与我今天正在撰写的专利有一些相似之处。
他写了一些我们可能永远不会注意到的事情,在幕后(或幕后)发生的事情,并决定哪些页面可以填充我们为响应查询而看到的搜索结果。
Google授予了一项新授予的专利(2019年7月2日),他的名字是发明人之一,该专利是在他2015年仍担任Google核心网络排名的负责人时提出的。
调整后的搜索功能
告诉我们:
“搜索系统根据资源与查询的相关性和重要性对资源进行排名,并提供链接到已标识资源的搜索结果,并根据排名对搜索结果进行排序。”
显示的结果是对查询的响应,并且搜索引擎查看查询可能出现的网页的特征以及该查询的其他方面,以及在确定SERP中出现的资源的搜索分数时可能查看的其他信息。
但是大多数专利都描述了他们所报告的问题,并且该问题解释了需要撰写具有可能解决该问题的发明过程的专利。
有时,专利还会告诉我们有关专利撰写时的技术状态。这是问题所在,如专利摘要部分所述的技术状态:
“通常情况下,搜索操作会实现一种健壮的搜索算法,该算法在各种资源上都能表现出色。但是,有时,特定查询和特定资源集的特定功能对于确定资源的搜索分数可能非常重要,而对于其他查询,特定功能可能不那么重要。例如,对于具有某些术语的特定查询,这些术语在资源中的存在可能会对资源的搜索分数产生非常强烈的影响;相反,对于另一个具有不同术语的查询,权限图中资源的相对重要性可能比资源中查询词的存在对搜索得分的影响要大得多。
但是,对于特定的查询和资源而言,特定功能的相对重要性通常很难预测,即使不是不可能的话。”
对页面功能的这些更改可能意味着响应这些更改,有时Google可能会在一段时间后调整搜索功能并重新分配资源。
专利背后的过程可以包括:
- 接收指示由搜索操作标识的资源的数据,该资源响应于查询并按一阶进行排序,每个资源具有相应的搜索分数,通过该分数,资源相对于查询所标识的其他资源对查询具有响应性搜索操作响应于查询,其中搜索操作部分地基于资源和查询的特征来对每个资源进行评分,从而选择一组资源。
- 根据SERP以及资源和查询的每个功能,确定影响度量,该度量衡量功能对属于该集合的资源排名的影响。
- 对SERP中用于查询的资源进行重新计分(部分基于影响度量),并根据与第一顺序不同的第二顺序对资源集进行排名。
- 响应于该查询,向搜索者提供根据第二阶的搜索结果,每个搜索结果标识相应的资源。
许多专利在其摘要中都包含一个部分,列出了使用该专利中描述的方法的所谓“优势”。它们是对专利预期成果的预测。
对于该专利,预期的优点包括:
- 可以调整搜索操作以补偿影响资源评分的紧急现象。
- 可以在查询时确定那些调整,从而不需要调整基础搜索操作,因此基础搜索操作基于已知先验。
- 在给定一组已知先验的情况下,此方法可以保留基本搜索操作,该操作对于语料库中的大多数资源都能很好地执行,但是还可以灵活地在特定功能影响资源排名时基于每个查询调整搜索操作偏离预期效果的方式。
- 根据调整后的搜索操作对计分产生的资源进行重新排名,往往会浮出更多更有可能满足用户信息需求的突出资源,从而提高整体用户体验的质量。
此处的最终目标是提供“更可能满足用户的信息需求,从而提高整体用户体验质量的资源”。
可以在以下位置找到经过调整的搜索功能专利:
搜索操作调整和重新评分
发明人:Trystan G. Upstill,Andre Duque Madeira,Wisam Dakka和Zhong Xiu
受让人:Google LLC
美国专利:10,339,144
授予:2019年7月2日
提交日期:2015年5月21日
抽象
“方法,系统和装置,包括编码在计算机存储介质上的计算机程序,用于接收查询以及针对每个接收到的查询:接收指示由搜索操作标识为对查询有响应的资源的数据,其中搜索操作对每个信息都进行评分资源的一部分(部分)基于资源和查询的特征,选择资源的子集,从资源的子集以及资源和查询的每个特征中确定影响度量的影响度量特征对属于子集的资源的排名的影响,基于相应的影响度量来调整搜索操作,并启动搜索操作以部分地基于资源对资源子集中的资源进行重新评分进行调整,并根据与第一阶不同的第二阶对资源子集进行排名。”
有关可能会改变搜索引擎得分的调整后搜索功能的更多信息
我提到了可能根据“资源和查询的多个功能”创建的搜索引擎得分。这些功能可能与以下方面有关:
- 信息检索,例如与召回和精确度有关的功能。
- 资源图中资源的相对权限。
- 查询字词。
- 给定一个查询和其他查询的用户对资源的反馈。
该专利告诉我们“这些特征可以在搜索引擎中建模为参数,并且可以为每个参数选择各种参数值。”
如何评估这些搜索功能可能是使搜索引擎得分运作良好的部分原因。他们给了我们一个例子:
“例如,对于资源权限得分,参数值可以是权重,资源的特征值(权限得分)将被乘以该权重或以其他方式进行调整;关于资源术语和查询术语,
参数值可以包括同义词,相关术语以及权重,通过这些权重,术语和术语计数的匹配可以是多个或以其他方式进行调整;等等。”
因此,根据该专利,搜索可能是一个非常复杂的过程,该过程基于可能与来自查询内容的Web资源特征相关的许多不同类型的参数,寻找不同类型的多种类型的评分贡献。
搜索操作一旦建立,就可以在各种搜索查询和文档中表现良好。这可能会提出一些需要克服的问题,该专利为我们介绍了这些问题。
它告诉我们:
- 与其他查询和其他资源相比,某些功能对资源评分的影响可能更大。
- 与其他查询和其他资源相比,某些功能对资源评分的影响可能要小得多。
当某个主题是网络上的一个相当新的主题(他们称为“紧急主题”)时,分数的某些方面可能会比其他方面具有更大的影响:
“此外,这种影响可能是短暂的;例如,对于一个新兴对象,信息检索分数在最初的几周内可能会更具影响力,然后,在以后的某个时间,权威性分数和用户反馈分数可能会逐渐增加影响力。因此,在检测到这些特征之前,即使不是不可能,也很难调整搜索操作以补偿这些特征。
因此,该专利的重点在于“当某些功能对查询的搜索操作的资源排名产生或多或少的影响时,然后根据这些影响来调整搜索操作。”
如果您曾经在一个相对较新的主题区域中对页面进行排名,并且有一天它突然出现的搜索结果似乎发生了变化并发生变化(经历了巨变),那么专利的下一段可能会解释为什么调整搜索结果后可能会发生这种情况:
调整后的搜索操作是对确定的资源重新运行,以考虑到所检测到的影响的方式对资源重新排序。在一些实施方式中,执行对查询的初始搜索,并且处理排名资源的适当子集,例如,排名靠前的N个资源,以确定对搜索操作的适当修改。经过适当修改后调整的搜索操作将重新运行,以重新评分和重新排列资源。”
当我阅读专利的下一段内容时,我想起了杰森·巴纳德(Jason Barnard)撰写的一篇有关在Google排名的文章,该帖子基于他从Google网站管理员趋势分析师加里·伊利耶斯(Gary Illyes)那里获得的信息, Google搜索排名的工作原理–搜索达尔文主义:
“搜索引擎利用搜索操作为资源生成搜索分数,并根据搜索分数对资源进行排名。搜索操作量化资源与查询的相关性,并且量化可以基于多种因素。这样的因素包括信息检索(“ IR”)分数,用户反馈分数,以及可选地每个资源相对于其他资源的单独排名(例如,权限分数)。搜索结果根据这些搜索分数按一阶排序,并根据一阶提供给用户设备,或者在某些情况下,可以通过调整后的搜索操作对搜索结果进行重新排名,并以如下形式提供给用户设备:搜索结果按照与第一顺序不同的第二顺序进行排名。”
该专利还根据查询日志和点击日志中的信息告诉我们有关反馈分数的信息:
“在某些实现中,从用户设备提交的查询存储在查询日志中。查询的点击数据和搜索结果引用的网页均存储在点击日志中。查询日志和单击日志定义了搜索历史数据,其中包括来自先前搜索请求并与之相关的数据。查询日志和单击日志可用于将用户设备提交的查询映射到搜索结果中标识的网页以及用户采取的操作。点击日志和查询日志因此可以被搜索系统用来确定由用户设备提交的查询,响应于查询而采取的动作以及提交查询的频率。这样的信息可以存储为查询和资源的反馈分数。”
然后对结果进行排名或调整搜索功能
如专利中所述,这是结果调整的一部分,当对结果进行评分以修改搜索结果时,值可能会发生变化:
“……重新排序引擎针对每个查询处理由搜索操作标识为响应查询的资源,并根据第一顺序对其进行排序,选择资源的适当子集,并针对每个功能确定搜索操作考虑到影响度量,该度量衡量功能对资源排名的影响。然后,重新排序引擎可以基于相应的影响度量来调整搜索操作,并启动搜索操作的后续运行以部分地基于该调整来重新评分资源,从而得到搜索结果。”
搜索操作调整和重新排列资源
在对搜索结果进行排名时,将计算出对这些功能进行排名所涉及的每个功能的影响,并且可以通过这些功能的影响来衡量这些功能的任何更改。
如果影响未达到阈值,则重新排名引擎将不会重新排名搜索结果。如果确实达到该阈值,那么结果将重新排名。
该专利让人们窥见了Google决定使用调整后的搜索功能时,如何进行重新排名。
“ …然后,该过程会根据影响指标调整搜索操作(314)。可以使用各种调整。例如,根据查询的类别,可以以不同方式调整搜索算法。举例来说,如果查询被归类为“产品”搜索查询,则可以增加与诸如评论,定价信息等的某些商业内容有关的相关权重参数值;相反,如果查询被归类为“信息”搜索查询,则可以减少与某些商业内容(如评论,定价信息)相关的相关权重参数值,而与锚文本链接相关的相关权重参数值资源可能会增加,等等。”
同义词也可能起作用:
“…如果与同义词匹配项相关的影响度很高,则可以调整查询扩展的功能,以便使用更具攻击性的查询扩展形式。”
调整后的搜索功能要点
Barnard撰写的文章列举了可用于对页面进行排名的特定类型的功能,例如主题,质量,速度,RankBrain,实体,结构化数据,新鲜度。
这些内容并未在本专利中进行描述或进行任何详细讨论,但似乎确实可以作为已排序资源的功能或可能影响页面排名方式的查询(已在此专利中提及)。
如果您没有机会阅读Barnard的帖子,我会推荐。我是在第一次看到该专利的同时阅读它的,我强调了该专利中的一段,该段告诉我们,页面可能会基于多种因素进行排名。
尽管该专利没有告诉我们与Barnard所说的相同的因素,但如果可能的话,值得在Google上对网页进行排名的因素涉及多个因素。
这项专利使Barnard告诉我们的事情是,谷歌可能会在看到不同的排名信号所产生的影响变化时发现谷歌可能曾经使用某种排名来超过某个阈值,因此谷歌可能会通过应用重新排名过程来调整排名。
因此,如果您看到自己一直遵循的特定查询的结果,那么就会很好地了解该查询周围的SERP位置,以及谁在该SERP位置中占据其他位置,然后您可能会突然发现它在变化和改变。
Google可能已调整搜索功能并更改了这些结果,因为排名信号对这些功能的影响可能已更改。
图片积分
作者截取的所有屏幕截图,2019年9月