Page Authority 2.0:關於測試和計時的更新

[ad_1]

在任何領域做出的最困難的決定之一是有意識地選擇錯過最後期限。 在過去的幾個月中,由一些最聰明的工程師,數據科學家,項目經理,編輯和營銷人員組成的團隊 努力爭取新的頁面授權機構(PA)的發布日期 到2020年9月30日。新模型幾乎在所有方面都不同於當前的功率放大器,但我們最近的質量控制措施顯示了我們不能忽略的異常情況。

因此,我們做出了艱難的決定,推遲了Page Authority 2.0的發布。 因此,讓我花點時間回顧一下我們如何到達這裡,離開我們的地方以及我們打算如何進行的步驟。

睜大眼睛看老問題

從歷史上看,Moz反覆使用相同的方法來建立Page Authority模型(以及Domain Authority)。 該模型的優點是它的簡單性,但是還有很多不足之處。

上一頁頁面授權模型針對SERP進行了訓練,試圖根據從鏈接資源管理器反向鏈接索引計算出的一組鏈接度量標準來預測一個URL是否會在另一個URL上排名。 這種類型的模型的關鍵問題是,它無法有意義地解決一組特定鏈接指標的最大強度。

例如,想像一下Internet上最強大的URL,這些URL的鏈接是:Google,Youtube,Facebook的主頁,或跟隨的社交網路按鈕的共享URL。 沒有任何SERP可以使這些URL相互抵觸。 取而代之的是,這些功能非常強大的URL通常排名第一,其後的指標則大大降低。 試想一下,如果邁克爾·喬丹,科比·布萊恩特和勒布朗·詹姆斯各自對高中生都一對一地抓緊時間。 每個人每次都會贏。 但是,從邁克爾·喬丹,科比·布萊恩特或勒布朗·詹姆斯是否會在一對一的比賽中獲勝,我們很難從這些結果中推斷出來。

當負責重新訪問域授權時,我們最終選擇了一個擁有豐富經驗的模型:原始的SERP培訓方法(儘管有很多調整)。 藉助Page Authority,我們決定通過預測哪個頁面的自然訪問量會更多,一起採用另一種培訓方法。 該模型提出了一些有希望的品質,例如能夠比較不在同一SERP上出現的URL,但是還提出了其他困難,例如頁面具有較高的鏈接公平性,而只是處於不經常搜索的主題區域中。 我們解決了許多此類問題,例如增強培訓集,以使用非鏈接指標來衡量競爭力。

衡量新的Page Authority的質量

結果是而且非常令人鼓舞。

首先,新模型顯然預測了一頁將比另一頁擁有更多有價值的自然流量的可能性。 這是預料之中的,因為新模型是針對此特定目標的,而當前的「頁面授權機構」僅試圖預測一個頁面是否會排在另一頁面之上。

其次,我們發現,新模型預測的一頁是否比以前的Page Authority更好。 這特別令人愉悅,因為它使我們許多擔憂,因為新的培訓模型使新模型在舊質量控制方面表現不佳。

新模型在預測SERP方面比當前的PA好多少? 在每個時間間隔(一直下降到位置4對5)上,新模型都與當前模型並列或表現不佳。 它永遠不會丟失。

一切都很好。 然後,我們開始分析異常值。 我喜歡稱其為「看起來愚蠢嗎?」 測試。 機器學習會像人類一樣犯錯誤,但是人類傾向於以非常特殊的方式犯錯誤。 當一個人犯了一個錯誤時,我們經常會確切地理解為什麼會犯錯。 ML並非如此,尤其是神經網路。 我們在新的模式下將碰巧具有零自然訪問量的URL的URL授予了URL,並將其包含在訓練集中以學習這些錯誤。 我們很快就看到90+的奇異PA下降到了更合理的60和70年代……又是一個勝利。

我們進行了最後一次測試。

品牌搜索的問題

網路上一些最受歡迎的關鍵字是導航性的。 人們在Google上搜索Facebook,Youtube,甚至Google本身。 這些關鍵字相對於其他關鍵字的搜索量是天文數字。 隨後,少數幾個強大的品牌可能會對將總搜索量作為其核心培訓目標一部分的模型產生巨大影響。

最後一個測試包括將當前的頁面授權機構與新的頁面授權機構進行比較,以確定是否存在任何離奇的異常值(PA發生明顯變化且沒有明顯原因)。 首先,讓我們看一下鏈接根域的LOG與頁面許可權的簡單比較。

不是太寒酸。 我們看到鏈接根域和頁面許可權之間通常呈正相關。 但是你能發現奇怪之處嗎? 繼續,花一點時間…

此圖表中有兩個異常現象:

  1. URL的主要分布與上方和下方的異常值之間存在一個奇怪的鴻溝。
  2. 單個分數的最大差異是PA99。PA99的數量很多,具有廣泛的鏈接根域。

這是一個可視化視圖,將有助於找出這些異常:

綠色和紅色之間的灰色空間代表分布的大部分與離群值之間的奇數間隙。 異常值(紅色)趨於聚集在一起,尤其是在主要分布上方。 當然,我們可以看到PA 99s頂部的分布不均。

請記住,這些問題不足以使新的Page Authority模型不如當前模型更準確。 但是,在進一步檢查後,我們發現該模型確實產生的錯誤非常嚴重,足以對客戶的決策產生不利影響。 最好有一個到處都有一點點偏離的模型(因為SEO所做的調整沒有得到令人難以置信的微調),比擁有一個幾乎在所有地方都正確但在少數情況下異常錯誤的模型要好。

幸運的是,我們對問題出在哪裡很有信心。 似乎首頁的PA膨脹得過高,可能的罪魁禍首是訓練集。 在我們完成再培訓之前,我們無法確定這是原因,但這是一個強有力的線索。

好消息和壞消息

就目前而言,我們處於良好狀態,因為我們擁有多個勝過現有Page Authority的候選模型。 我們正處在漏洞壓縮的階段,而不是模型構建。 但是,除非我們有信心它將引導我們的顧客朝正確的方向發展,否則我們不會發布新的分數。 我們高度重視客戶根據我們的指標做出的決策,而不僅僅是這些指標是否滿足某些統計標準。

考慮到所有這些,我們決定推遲啟動Page Authority 2.0。 這將為我們提供必要的時間來解決這些主要問題並制定出出色的指標。 令人沮喪嗎? 是的,但也有必要。

與往常一樣,我們感謝您的耐心配合,我們期待產生我們有史以來發布的最佳Page Authority指標。

訪問PA資源中心

相關文章