[ad_1]
比尔·斯劳斯基(Bill Slawski)写了一篇有关Google专利的文章,该专利似乎可以解释名称不佳的Medic更新中发生的情况。比尔说,范围不仅限于医疗场所。该专利可能表明为什么某些网站无法排名。
注意专利
请务必注意,Google不会经常确认专利中所描述的算法是否正在使用中。该专利可能会或可能不会用于Google的算法中。
Google的专利是什么?
该专利描述了一种按主题划分搜索查询和搜索结果的方法。
这是一种类似于链接距离排名算法的方法,该算法按主题划分Internet地图(aka链接图)。这样,链接影响理论上可以从局部相关的站点流向相似的站点,从而更准确地表示站点的含义。
知识领域=主题
在该专利中,该算法正在与代表主题的所谓知识域一起工作。可以说搜索查询和网页属于特定的知识领域。
Bill就是这样描述知识领域的:
““知识领域”一词代表查询可能涉及的主题,而不是对知识图的引用。”
在他的文章中他指出:
“来自特定知识域的查询(包含特定主题)可能会使用分类为来自同一知识域的站点返回结果。”
主题页
简化此概念的一种方法是考虑主题存储桶。在主题存储桶中,有关医疗信息的页面在一个存储桶中,有关自然健康的页面进入另一个存储桶,有关手机评论的页面进入不同的存储桶,关于特定城市中的人身伤害律师的页面可能位于另一个存储桶,等等。
主题查询
根据该专利,搜索查询也可以被识别为属于它们自己的存储桶。因此,当有人搜索“什么是糖尿病”时,Google将此搜索查询理解为医学问题,而不是自然治愈问题。
Google专利描述了对网站和查询的分类
专利就是这样描述该分类系统的:
分类网站
“搜索引擎……可能会使用网站分类系统中的数据……来生成搜索结果。例如,网站分类系统…可以为多个网站的每个生成表示形式…,并使用这些表示形式来确定多个网站的每个分类…“
分类搜索查询
“搜索引擎…可以对搜索查询使用分类,以选择具有相同或相似分类的网站类别。
搜索引擎…可以从所选网站类别中确定搜索结果。”
将站点组织成集群
该专利描述了一种通过对网站进行分类来组织网站的过程。
“……本文中描述的系统和方法可以通过仅包括具有特定分类的网站的标识来改善由搜索系统生成的搜索结果页面……”
分类系统可以基于网站包含查询答案的可能性来创建聚类:
“网站分类系统…可以根据对相应集群中网站的可能响应度来确定分类。
例如,与第二集群中的网站相比,第一集群中的网站对特定知识领域中的查询做出响应的可能性更高。”
然后,它描述了可能会跳过站点而不对其进行分类的方案。
我发现有趣的是,它提到了跳过分析,因为站点所在的群集与有关某个主题的已知站点群集很远。
“在某些实施方式中,培训期间使用的一个或多个网站可能未分配给分类。
例如,当网站表示形式距群集的距离大于阈值距离,或者不包含在群集中时,网站分类系统…可以确定跳过使用网站表示形式来创建复合表示形式,例如可以确定在培训过程中跳过对该网站的进一步分析。”
权威性是一种分类
“……多个网站中的每个网站都可以得分。分数可以指示网站的分类,例如权威性,对特定知识领域的响应性,网站的其他属性,或这些中的两个或多个的组合。”
该专利不仅仅涉及医学领域
重要的是要理解,该专利中描述的过程适用于各种利基主题。这不是医学算法。它远远不只是与医学相关的专利。
根据比尔:
“该专利的重点不仅限于医疗场所。它按行业分类,健康只是其中之一。稍后按质量得分进行排序。
该专利提供了专门用于医疗场所的示例……但它明确表明涉及多个行业。
这些查询也基于知识领域进行了分类。”
外卖:排名的含义
关于群集的部分很有趣,因为它提到了诸如权威性和与其他站点群集的距离之类的功能。
权限的一种度量是链接。碰巧的是,有很多研究算法可以根据主题对网站进行分类。算法选择代表特定主题分类中最具权威性的站点的种子站点。然后根据其他站点与种子站点的距离对它们进行评分。
该算法采用了类似的系统,其中与其他群集距离较远的站点将被丢弃,并且不考虑对其进行排名。
在使用链接作为权限度量的上下文中,没有提及链接。但是,根据主题对站点进行分类并根据主题创建站点集群的链接距离排名算法之间的相似之处,可以反映出该算法如何对内容主题进行类似的聚类。
推测这加强了通常的信念(并使其更加紧迫),即相关页面的链接可以提高排名,这并非没有道理。
总结:Google更新恢复
对Google算法的这些见解验证了我有关以下方面的建议 Google更新恢复 一般而言,尤其是从所谓的“军医更新”中恢复过来。
“所谓的“医学”更新似乎显然是有关相关性的问题,而不是作者的简历或“专业知识”。”
该专利的主要见解之一可能是从相关性的角度看待问题的排名可能会有所帮助。如果您的网站排名遭受灾难性的崩溃,那么这可能与该专利中描述的内容部分相关。
如果您的网站全面下降了一些职位,那可能是其他问题,例如竞争加剧或相关性增加。
读:
链接距离排名