[ad_1]
追溯到2015年,我发表了一篇 文章 提供免费,简单的预测工具,并讨论用例以在SEO中进行预测。 这是一种快速有效的方法,可以查看网站流量的变化是否是您可以忽略的季节性因素,值得庆祝的因素或令人担忧的流量损失迹象。
简而言之:您可以输入一系列数据,并将其绘制在如上图所示的图形上。
五年后,从前同事到完全陌生的人,我仍然会向人们询问有关此工具的信息,而且,通常,我会要求我提供一个可直接在电子表格中使用的版本。
我发现这很容易让人同情:电子表格更灵活,更容易调试,更易于扩展,更易于维护以及人们非常熟悉的格式。
优化这些东西时的权衡是,尽管几年前我已经对该工具进行了改进,但我仍必须在著名的多变的编程环境Excel / Google Sheets中使这些东西易于管理。 这意味着与一些具有外部代码执行功能的工具(例如, 预测伪造)。
在这篇文章中,我将提供一个免费的模板,向您展示它的工作方式和使用方式,然后向您展示如何构建自己的(更好的)版本。 (如果您需要复习一般情况下何时使用预测以及诸如置信区间之类的概念,请参阅上面链接的原始文章。)
SEO预测的类型
在进入电子表格之前,我需要扩展一件事:不同类型的SEO预测。
大致来说,我认为您可以将SEO预测分为三类:
- “我感到乐观-今年要增加20%”或对现有数字进行类似的固定调整。 较复杂的版本可能只会向某些页面组或关键字组添加20%的内容。 我认为许多代理商都在使用这种预测,这取决于经验。
- 关键字/点击率模型,当您估算排名变化(或一系列排名变化),然后根据搜索量和点击率数据推断出流量的变化(您可以看到类似的方法) 这里)。 再次,更复杂的版本可能会为排名变化提供一些依据(例如“如果我们在X组的每个关键字中目前排名超过我们的位置与竞争对手A交换位置,该怎么办?”)
- 基于历史数据的统计预测,当您从以前的趋势和季节性推断出来时,如果一切保持不变(您和竞争对手的营销活动水平相同),将会发生什么。
第二种类型有其优点,但是如果将Ahrefs / SEMRush / Sistrix数据与自己的分析进行比较,您会发现这很难推广。 顺便说一句,我认为第一类并不像看起来那样荒谬,但这不是我将在本文中进一步探讨的内容。 无论如何,此职位中的模板都属于第三类。
是什么使它成为SEO预测?
为什么,什么都没有。 关于我上面对第三种类型的描述,您会注意到的一件事是,它没有提及任何特定于SEO的内容。 例如,它可以同样适用于直接流量。 就是说,有两个原因我建议将其作为SEO预测:
- 我们在Moz博客上,我是SEO顾问。
- 还有许多其他渠道可以使用的更好的方法。
我提到上述第二类非常具有挑战性,这是由于SEO的高度不确定性以及Search Console和其他特定于SEO的平台中详细数据的质量普遍较差。 此外,要准确了解季节性,您需要至少将Search Console数据存储几年。
对于许多其他渠道,确实存在高质量,详细的历史数据,并且关系更可预测,从而可以进行更精细的预测。 例如,对于付费搜索, 预测伪造 我上面提到的工具会根据您的历史数据建立诸如关键字级转化数据和每次点击费用之类的因素,这对于SEO来说是不切实际的。
也就是说,我们仍然可以在下面的模板中组合多种类型的预测。 例如,您可以单独预测子文件夹或分别对品牌/非品牌子文件夹进行预测,而不是整体预测网站的访问量,然后将百分比增长应用于某些区域或构建预期的排名变化。 但是,我们正在超越自己……
如何使用模板
您需要做的第一件事是制作一个副本(在左上角的“文件”菜单下,但是使用包含的链接自动生成)。 这意味着您可以输入自己的数据并随心所欲地播放内容,如果需要,您可以随时回来获取新的副本。
然后,在第一个标签上,您会注意到一些单元格具有绿色或蓝色突出显示:
您只应更改彩色单元格中的值。
E列中的蓝色单元格基本上是为了确保所有内容都正确地标记在输出中。 因此,例如,如果要粘贴会话数据,点击数据或收入数据,则可以设置该标签。 同样,如果您输入2018-01的开始月份和36个月的历史数据,则预测输出将从2021年1月开始。
关于这一点,它必须是月度数据—这是我前面提到的为简单起见而进行的折衷之一。 您可以从单元格B2开始将多达十年的历史月度数据粘贴到B列中,但是需要注意以下几点:
- 您需要至少24个月的数据才能使模型对季节性有所了解。 (如果您的历史数据中只有一个1月,并且这是交通高峰,我应该如何知道这是一次性的还是一年一度的?)
- 您需要完整的月份。 因此,如果您正在阅读2021年3月25日,则应该包含的数据的最后一个月是2021年2月。
确保您还删除了B列中示例数据的所有剩余内容。
产出
完成此操作后,您可以转到“输出”标签,在该标签中,您将看到以下内容:
C列可能是您感兴趣的列。请记住,这里充满了公式,但是您可以复制和 粘贴为值 放入另一张纸,或者只是转到文件>下载>逗号分隔值以获取原始数据。
您会注意到,默认情况下,我只会在该图中显示15个月的预测,因此建议您也这样做。 如上所述,预测的隐含假设是历史上下文会延续下去,除非您将更改的场景(例如COVID锁定)明确地包含到模型中(稍后再介绍!)。 这种假设在未来两三年内保持的可能性很小,因此,即使我在未来提供了更进一步的预测值,也应牢记这一点。
显示的上限和下限是95%置信区间-同样,您可以回顾一下这对我 以前的帖子 如果您愿意的话。
高级用例
您现在可能已经注意到“高级”标签:
尽管我说过要保持简单,但我觉得鉴于2020年发生的一切,许多人仍需要将主要的外部因素纳入其模型。
在上面的示例中,我在B列中填充了一个变量,用于确定英国是否处于COVID锁定之下。 我用“ 0.5”表示我们在三月中旬进入锁定状态。
您可能会因业务相关因素而更好地进行此操作,但是此选项卡需要牢记一些重要事项:
- 如果您不想添加这些额外的变量,则可以完全保留它。
- 从左到右-如果您使用的是B列,则将C列留空是可以的,但是如果您使用的是C列,则留存B列就可以。
- 如果您使用的是“假”变量(例如,“ 1”表示处于活动状态),则需要确保至少在历史数据期间内在其他单元格中填写0。
- 您可以输入将来的值-例如,如果您预测2021年3月的COVID锁定(您这个混蛋!),则可以在该单元格中输入内容,以便将其合并到预测中。
- 如果您不输入未来值,则模型将基于该数字将来为零进行预测。 因此,如果您输入“有效的品牌PPC”作为历史数据的虚拟变量,然后将其留空以备将来使用,则该模型将假定您将来已关闭品牌PPC。
- 在过去的历史时期内在此处添加太多数据将导致称为“过度拟合”-我不想对此进行详细介绍,这就是为什么将此选项卡称为“高级”的原因,但请尽量避免被忽略。
以下是此选项卡的一些示例用例,供您考虑:
- 输入品牌PPC是否处于活动状态(0或1)
- 输入您是否正在投放电视广告
- 输入COVID锁定
- 输入对您的业务很重要的算法更新(每个更新一列)
为什么我的估算值与您的旧工具不同? 其中之一是错的吗?
此模板和我的旧工具之间在方法上有两个主要区别:
- 旧工具使用了Google的 因果影响 库,新模板使用 普通最小二乘 回归。
- 旧工具通过使用平方的时间段作为预测变量来捕获非线性趋势(例如,月1 = 1,月2 = 4,月3 = 9,等等),然后尝试将流量曲线拟合到该曲线。 这叫做 二次回归。 新工具通过将每个时间段拟合为先前时间段的倍数来捕获非线性趋势(例如,第1个月= X *第2个月,其中X可以是任何值)。 这称为 AR(1)模型。
如果您看到两者之间的预测值存在显着差异,则几乎可以肯定地归结为第二个原因,尽管它增加了一些复杂性,但在大多数情况下,新技术更加实用和灵活。
如果出现严重的下降趋势,则预测零流量或负流量的可能性也大大降低,这很好。
它是如何工作的?
模板中有一个隐藏的标签,您可以查看一下,但简称为“LINEST()”电子表格公式。
我正在使用的输入是:
- 因变量
- 无论您在“输入”标签中将B列中的内容(例如点击量)
- 自变量
- 线性时间流逝
- 前期的流量
- 11个月的虚拟变量(第12个月由其他11个变量均为0表示)
- 最多三个“高级”变量
然后,该公式给出了一系列“系数”作为输出,可以将它们与值相乘并相加在一起以形成如下预测:
- “时间段10”流量=拦截+(时间系数* 10)+(上一个周期系数*周期9流量)
您可以在该隐藏的工作表中看到,我已经标记了Linest公式的许多输出并对其进行了颜色编码,如果您想自己使用它,这可能会帮助您入门。
潜在的扩展
如果您确实想自己玩这个游戏,那么我个人考虑了一些进一步扩展的领域,您可能会发现一些有趣的地方:
- 每日数据,而不是每月数据,具有每周季节性(例如,每个星期天逢低)
- 内置的增长目标(例如,到2021年底达到20%的增长)
理查德·费吉,我在上面几次提到过他的Forecast Forge工具,它还提供了一些很好的建议,以相当有限的额外复杂性来提高预测准确性:
- 通过采用输入的log()并提供输出的指数来平滑数据并避免在极端情况下产生负面预测(根据您的观点,平滑数据可能不是好事!)。
- 在前12个月进行回归,而不是使用前1个月+季节性(这需要至少3年的历史数据)
随着时间的推移,我可能会也可能不会包括上述部分或全部内容,但是如果是这样,我将确保使用相同的链接并在电子表格中注明该链接,因此本文始终会链接到最新的链接。日期版本。
如果您已经做到了这一点,那么您想看到什么? 在评论中让我知道!