[ad_1]
Yandex宣布了他们搜索引擎的更新。该更新名为Vega。该更新提供了有关现代搜索引擎如何工作的许多详细信息。
Yandex的重大改进
Yandex将其称为更新Vega。此更新具有1,500项改进。在这些改进中,Yandex强调了两个,他们说这对搜索结果产生了重要影响。
更改之一是将专家的人工反馈添加到算法训练中。第二个变化是能够在不影响搜索结果速度的情况下将其搜索索引的大小加倍。
有关: Yandex SEO终极指南
众包搜索结果评级者
Google聘请了经过Google质量评估师指南培训的承包商来判断其搜索结果。 Yandex依靠其名为Yandex.Toloka的众包采购平台。
虽然看起来似乎比Google的方法受控制的程度要少一些,但Yandex提供了评分者指南,以提高评分的准确性。
“人们或评估者”长期以来一直通过我们的众包采购平台Yandex.Toloka帮助培训了我们的机器学习平台。
根据我们的搜索结果评估指南,Yandex.Toloka中的评估人员可以完成任务,以帮助我们找到与特定查询最相关的结果。”
人工输入算法训练
我们知道Google使用质量评估者来测试新算法的变化。 Yandex也做同样的事情。他们称他们为评估者评估者,是因为他们评估网络结果。
Yandex添加的更改是在给定主题中聘请专家来审核评估者的工作,以提高其工作的准确性。这意味着给定算法的训练数据会更好,因为它是由专家验证并保证的。
由于Yandex训练数据已由主题专家进行了审查,因此(可能)由于改进了训练数据,因此该算法将更加准确。
Yandex就是这样解释的:
“我们已经使用神经网络对排名算法进行了更新,该神经网络是根据多个领域的真正专家提供的数据进行训练的,为用户提供了更高质量的搜索解决方案。
评估评估人员的专业人员从IT管理员进行数据查询到水文学家在河流方面进行搜索。
专家评估者使用一百多种标准来评估评估者的工作…
通过使用专家评估来训练我们的机器学习算法,我们的搜索引擎将在高素质的个人团队的帮助下学会在结果中对相关信息进行排名。”
有关: Yandex搜索团队专访
通过聚类扩展搜索索引
Yandex引入了一种非常有趣的方式来处理局部相似的网页。 Yandex并未在整个索引中搜索答案,而是将网页聚类为主题聚类。据说通过允许搜索引擎从局部相关的页面中选择答案,可以改善并加快搜索结果。
“我们的算法现在使用神经网络根据页面的相似性将页面分组为簇。当用户输入查询时,它会在最相关的页面集群中进行搜索,而不是在我们的整个索引中进行搜索。”
Yandex群集技术使Yandex的搜索索引翻了一番,达到2,000亿个页面,而不会影响选择网页的速度。
这很有趣,因为它听起来类似于 链接排名算法 首先是种子站点作为主题的代表。链接更远的网页被认为与该主题的相关性较低。认为与该主题的种子更接近的页面更相关。
预测搜索查询和结果
Yandex的一个有趣更新是使用算法预测用户的要求并“预呈现”该搜索查询的结果。虽然这是在Vega更新的上下文中宣布的,但实际上是在2019年3月实施的。
使其具有良好功能的原因在于,它可以加快向用户显示他们正在寻找的搜索结果所需的时间。
“自3月以来,Android上的Yandex移动用户一直在使用预渲染技术进行搜索,该技术可以预测用户的查询并在用户键入内容时选择相关的结果。”
最新信息检索
Yandex是使用神经网络和机器学习的俄语搜索引擎。我发现了解世界各地使用的技术是件好事,因为它使我了解当今定义现代信息检索(搜索引擎业务)的最新信息。
在此处阅读Yandex官方算法更新公告: