[ad_1]
Yandex宣布了他們搜索引擎的更新。該更新名為Vega。該更新提供了有關現代搜索引擎如何工作的許多詳細信息。
Yandex的重大改進
Yandex將其稱為更新Vega。此更新具有1,500項改進。在這些改進中,Yandex強調了兩個,他們說這對搜索結果產生了重要影響。
更改之一是將專家的人工反饋添加到演算法訓練中。第二個變化是能夠在不影響搜索結果速度的情況下將其搜索索引的大小加倍。
有關: Yandex SEO終極指南
眾包搜索結果評級者
Google聘請了經過Google質量評估師指南培訓的承包商來判斷其搜索結果。 Yandex依靠其名為Yandex.Toloka的眾包採購平台。
雖然看起來似乎比Google的方法受控制的程度要少一些,但Yandex提供了評分者指南,以提高評分的準確性。
「人們或評估者」長期以來一直通過我們的眾包採購平台Yandex.Toloka幫助培訓了我們的機器學習平台。
根據我們的搜索結果評估指南,Yandex.Toloka中的評估人員可以完成任務,以幫助我們找到與特定查詢最相關的結果。」
人工輸入演算法訓練
我們知道Google使用質量評估者來測試新演算法的變化。 Yandex也做同樣的事情。他們稱他們為評估者評估者,是因為他們評估網路結果。
Yandex添加的更改是在給定主題中聘請專家來審核評估者的工作,以提高其工作的準確性。這意味著給定演算法的訓練數據會更好,因為它是由專家驗證並保證的。
由於Yandex訓練數據已由主題專家進行了審查,因此(可能)由於改進了訓練數據,因此該演算法將更加準確。
Yandex就是這樣解釋的:
「我們已經使用神經網路對排名演算法進行了更新,該神經網路是根據多個領域的真正專家提供的數據進行訓練的,為用戶提供了更高質量的搜索解決方案。
評估評估人員的專業人員從IT管理員進行數據查詢到水文學家在河流方面進行搜索。
專家評估者使用一百多種標準來評估評估者的工作…
通過使用專家評估來訓練我們的機器學習演算法,我們的搜索引擎將在高素質的個人團隊的幫助下學會在結果中對相關信息進行排名。」
有關: Yandex搜索團隊專訪
通過聚類擴展搜索索引
Yandex引入了一種非常有趣的方式來處理局部相似的網頁。 Yandex並未在整個索引中搜索答案,而是將網頁聚類為主題聚類。據說通過允許搜索引擎從局部相關的頁面中選擇答案,可以改善並加快搜索結果。
「我們的演算法現在使用神經網路根據頁面的相似性將頁面分組為簇。當用戶輸入查詢時,它會在最相關的頁面集群中進行搜索,而不是在我們的整個索引中進行搜索。」
Yandex群集技術使Yandex的搜索索引翻了一番,達到2,000億個頁面,而不會影響選擇網頁的速度。
這很有趣,因為它聽起來類似於 鏈接排名演算法 首先是種子站點作為主題的代表。鏈接更遠的網頁被認為與該主題的相關性較低。認為與該主題的種子更接近的頁面更相關。
預測搜索查詢和結果
Yandex的一個有趣更新是使用演算法預測用戶的要求並「預呈現」該搜索查詢的結果。雖然這是在Vega更新的上下文中宣布的,但實際上是在2019年3月實施的。
使其具有良好功能的原因在於,它可以加快向用戶顯示他們正在尋找的搜索結果所需的時間。
「自3月以來,Android上的Yandex移動用戶一直在使用預渲染技術進行搜索,該技術可以預測用戶的查詢並在用戶鍵入內容時選擇相關的結果。」
最新信息檢索
Yandex是使用神經網路和機器學習的俄語搜索引擎。我發現了解世界各地使用的技術是件好事,因為它使我了解當今定義現代信息檢索(搜索引擎業務)的最新信息。
在此處閱讀Yandex官方演算法更新公告: