链路距离排序算法

[ad_1]
链路距离排序算法

有一种链接算法没有被广泛讨论,但还不够。本文旨在介绍链接和链接距离排名算法。这可能会在网站排名方面发挥作用。在我看来,重要的是要意识到这一点。

Google会使用此功能吗?

虽然正在考虑的算法来自谷歌提交的专利,谷歌关于专利和研究论文的官方声明是,他们生产了许多专利和研究论文,但并非所有这些都被使用,有时它们的使用方式不同于所描述的内容。

也就是说,这个算法的细节似乎与谷歌正式谈到它如何处理链接的轮廓相似。

计算的复杂性

该专利有两个部分(在Web链接图中使用距离生成页面排名),说明计算的复杂程度:

“不幸的是,PageRank的这种变化需要分别为每个种子解决整个系统。因此,随着种子页数的增加,计算的复杂性线性增加,从而限制了实际使用的种子数量。“

因此,需要一种使用大量多样化种子页面为网页上的页面产生排名的方法和装置……“

以上指出由于数据点数量众多而难以在网络上进行这些计算。它指出,通过主题利弊打破这些,计算更容易计算。

该声明的有趣之处在于,原始企鹅算法每年计算一次或更长时间。受到惩罚的网站几乎都受到了惩罚,直到谷歌重新计算企鹅得分的下一个看似随机的日期。

在某个时刻,Google的基础设施必须得到改善。谷歌不断建立自己的基础设施,但显然没有公布。该 咖啡因网索引系统 是例外之一。

实时企鹅在2016年秋季推出。

值得注意的是,这些计算很困难。它指出Google可能会对整个网站进行定期计算,然后根据从受信任网站到所有其他网站的距离来分配分数。因此,一个巨大的计算,做了一年。

因此,当通过PageRank计算SERP时,也会计算距离分数。这听起来很像我们称为企鹅算法的过程。

“然后,系统根据链接的属性和链接所附页面的属性为链接分配长度。系统接下来基于页面之间的链接的长度来计算从种子页面集合到页面集合中的每个页面的最短距离。接下来,系统基于所计算的最短距离确定该组页面中的每个页面的排名分数。“

系统在做什么?

系统创建基于种子集与建议的排名页面之间的最短距离的分数。该分数用于对这些页面进行排名。

所以它基本上是在PageRank得分之上的叠加,以帮助清除被操纵的链接,基于操纵链接自然会在垃圾邮件页面和可信集之间具有更长的链接连接距离的理论。

对网页进行排名可以说包括三个过程。

  • 索引
  • 排行
  • 排名修改(通常与个性化相关)

这是排名过程的极端减少。还有很多事情要发生。

有趣的是,这个距离排名过程发生在过程的排名部分。在此算法下,除非页面与种子集相关联,否则没有机会对有意义的短语进行排名。

这是它说的:

“减少这些技术影响的PageRank的一个可能的变化是选择一些”可信“页面(也称为种子页面)并通过跟踪来自可信页面的链接发现可能是好的其他页面“。

这是一个重要的区别,要知道种子集计算在排名过程的哪个部分发生,因为它有助于我们制定我们的排名策略。

这与Yahoo TrustRank不同。 YTR被证明有偏见。

Majestic的Topical TrustFlow可以说是一个改进版本,类似于一篇研究论文,证明通过使用由利基主题组织的种子集更准确。研究还表明,按主题组织种子集算法比不这样做要好几个顺序。

因此,谷歌的距离排名算法也可以通过利基主题桶来组织它的种子集。

据我了解,此Google专利计算种子集之间的距离并指定距离分数。

减少链接图

“在该实施例的变型中,与计算的最短距离相关联的链路构成简化的链路图。”

这意味着有一个互联网地图,通常称为链接图,然后是一个较小的版本,链接图由填充了垃圾邮件页面的网页填充。主要获取简化链接图之外的链接的网站可能永远不会进入。因此,脏链接没有牵引力。

什么是精简链接图?

我会保持这简短而甜蜜。该文件的链接如下。

你真正需要知道的是这部分:

“基于链接的排名算法的早期成功是基于链接意味着目标页面的优点的假设。但是,今天存在许多链接而不是赋予权力。这种链接会将噪声带入链接分析并损害检索质量。

为了提供高质量的搜索结果,检测它们并减少它们的影响是很重要的……借助于分类器,可以检测和丢弃这些噪声链路。之后,在简化链接图上执行链接分析算法。“

阅读此PDF以获取更多信息 有关缩减链接图的信息

如果您从新闻机构等网站获取链接,可以公平地假设它们位于简化链接图的内部。但它们是种子集的一部分吗?也许我们不应该为此着迷。

这是为什么谷歌说负面的搜索引擎优化不存在?

“……与计算出的最短距离相关联的链接构成了简化的链接图”

简化链接图与链接图不同。链接图可以说是由站点,页面甚至页面的部分之间的链接关系组织的整个因特网的映射。

然后是一个简化的链接图,它是一个地图,减去某些不符合特定标准的网站。

缩小的链接图可以是网络地图减去非垃圾网站。简化链接图之外的网站对链接图内的网站没有任何影响,因为它们位于外部。

这可能是链接到普通网站的垃圾网站不会对非垃圾网站造成负面影响的原因。由于垃圾网站位于简化链接图之外,因此无效。该链接被忽略。

这可能就是为什么谷歌如此自信,它正在捕捉链接垃圾邮件和负面的搜索引擎优化不存在?

种子集的距离等于排名较低?

我认为没有必要尝试绘制种子集的内容。在我看来,更重要的是要了解主题社区以及与获取链接的位置有何关联。

谷歌曾经一度公开显示每个页面的PageRank分数,因此我记得哪些类型的网站往往得分较低。有一类网站具有较低的PageRank和较低的Moz DA,但它们与我认为可能距离种子集几次点击的网站密切相关。

Moz DA测量的是网站权威的近似值。这是一个很好的工具。但是,Moz DA所测量的内容可能与种子集的距离不同,因为它是谷歌的秘密而无法知晓。

所以我不会放下Moz DA工具,继续使用它。我只是建议您可能希望扩展您的标准和有用链接的定义。

靠近种子集是什么意思?

从一个 斯坦福大学课堂文件,第17页问:接近的好概念是什么?答案是:

  • 多个连接
  • 连接质量
  • 直接和间接连接
  • 长度,度,重量

这是一个有趣的考虑因素。

带走

有很多人担心锚文本比率,入站链接的DA / PA,但我认为这些考虑有点旧。

对DA / PA的关注是对从PageRank为4或更高的页面获取链接的烦恼的回归,这是一种从随机选择的PageRank得分(第四位)开始的做法。

当我们在排名的背景下讨论或考虑链接时,将距离排名视为该对话的一部分可能是有用的。

在这里阅读专利
https://www.google.com/patents/US9165040

Shutterstock的图片,作者修改

相关文章