[ad_1]
我是搜索極客。我通讀了一些專利,這些專利提供了搜索引擎幕後的暗示和可能的隱喻,就像它們是小說一樣。
我正在尋找特定發明家的專利,例如那些可能對新的Marvel電影新聞視而不見的人。
專利並不總是提供可行的見解,但是它們確實提出了一些問題和可能需要注意的問題,或者理解了搜索引擎的工作方式,甚至進行了測試。
我今年夏天找到了一項專利,使我想起了海變的概念以及搜索結果如何改變和經歷海變。
我注意的一位發明家是 Trystan Upstill,有一次Google的核心網路排名和移動內容搜索負責人。
他參與了Google的一些更有趣的專利和流程,例如我在 Google如何根據分類質量對某些結果進行排名。
如果您閱讀過該專利,可能會發現與我今天正在撰寫的專利有一些相似之處。
他寫了一些我們可能永遠不會注意到的事情,在幕後(或幕後)發生的事情,並決定哪些頁面可以填充我們為響應查詢而看到的搜索結果。
Google授予了一項新授予的專利(2019年7月2日),他的名字是發明人之一,該專利是在他2015年仍擔任Google核心網路排名的負責人時提出的。
調整後的搜索功能
告訴我們:
「搜索系統根據資源與查詢的相關性和重要性對資源進行排名,並提供鏈接到已標識資源的搜索結果,並根據排名對搜索結果進行排序。」
顯示的結果是對查詢的響應,並且搜索引擎查看查詢可能出現的網頁的特徵以及該查詢的其他方面,以及在確定SERP中出現的資源的搜索分數時可能查看的其他信息。
但是大多數專利都描述了他們所報告的問題,並且該問題解釋了需要撰寫具有可能解決該問題的發明過程的專利。
有時,專利還會告訴我們有關專利撰寫時的技術狀態。這是問題所在,如專利摘要部分所述的技術狀態:
「通常情況下,搜索操作會實現一種健壯的搜索演算法,該演算法在各種資源上都能表現出色。但是,有時,特定查詢和特定資源集的特定功能對於確定資源的搜索分數可能非常重要,而對於其他查詢,特定功能可能不那麼重要。例如,對於具有某些術語的特定查詢,這些術語在資源中的存在可能會對資源的搜索分數產生非常強烈的影響;相反,對於另一個具有不同術語的查詢,許可權圖中資源的相對重要性可能比資源中查詢詞的存在對搜索得分的影響要大得多。
但是,對於特定的查詢和資源而言,特定功能的相對重要性通常很難預測,即使不是不可能的話。」
對頁面功能的這些更改可能意味著響應這些更改,有時Google可能會在一段時間後調整搜索功能並重新分配資源。
專利背後的過程可以包括:
- 接收指示由搜索操作標識的資源的數據,該資源響應於查詢並按一階進行排序,每個資源具有相應的搜索分數,通過該分數,資源相對於查詢所標識的其他資源對查詢具有響應性搜索操作響應於查詢,其中搜索操作部分地基於資源和查詢的特徵來對每個資源進行評分,從而選擇一組資源。
- 根據SERP以及資源和查詢的每個功能,確定影響度量,該度量衡量功能對屬於該集合的資源排名的影響。
- 對SERP中用於查詢的資源進行重新計分(部分基於影響度量),並根據與第一順序不同的第二順序對資源集進行排名。
- 響應於該查詢,向搜索者提供根據第二階的搜索結果,每個搜索結果標識相應的資源。
許多專利在其摘要中都包含一個部分,列出了使用該專利中描述的方法的所謂「優勢」。它們是對專利預期成果的預測。
對於該專利,預期的優點包括:
- 可以調整搜索操作以補償影響資源評分的緊急現象。
- 可以在查詢時確定那些調整,從而不需要調整基礎搜索操作,因此基礎搜索操作基於已知先驗。
- 在給定一組已知先驗的情況下,此方法可以保留基本搜索操作,該操作對於語料庫中的大多數資源都能很好地執行,但是還可以靈活地在特定功能影響資源排名時基於每個查詢調整搜索操作偏離預期效果的方式。
- 根據調整後的搜索操作對計分產生的資源進行重新排名,往往會浮出更多更有可能滿足用戶信息需求的突出資源,從而提高整體用戶體驗的質量。
此處的最終目標是提供「更可能滿足用戶的信息需求,從而提高整體用戶體驗質量的資源」。
可以在以下位置找到經過調整的搜索功能專利:
搜索操作調整和重新評分
發明人:Trystan G. Upstill,Andre Duque Madeira,Wisam Dakka和Zhong Xiu
受讓人:Google LLC
美國專利:10,339,144
授予:2019年7月2日
提交日期:2015年5月21日
抽象
「方法,系統和裝置,包括編碼在計算機存儲介質上的計算機程序,用於接收查詢以及針對每個接收到的查詢:接收指示由搜索操作標識為對查詢有響應的資源的數據,其中搜索操作對每個信息都進行評分資源的一部分(部分)基於資源和查詢的特徵,選擇資源的子集,從資源的子集以及資源和查詢的每個特徵中確定影響度量的影響度量特徵對屬於子集的資源的排名的影響,基於相應的影響度量來調整搜索操作,並啟動搜索操作以部分地基於資源對資源子集中的資源進行重新評分進行調整,並根據與第一階不同的第二階對資源子集進行排名。」
有關可能會改變搜索引擎得分的調整後搜索功能的更多信息
我提到了可能根據「資源和查詢的多個功能」創建的搜索引擎得分。這些功能可能與以下方面有關:
- 信息檢索,例如與召回和精確度有關的功能。
- 資源圖中資源的相對許可權。
- 查詢字詞。
- 給定一個查詢和其他查詢的用戶對資源的反饋。
該專利告訴我們「這些特徵可以在搜索引擎中建模為參數,並且可以為每個參數選擇各種參數值。」
如何評估這些搜索功能可能是使搜索引擎得分運作良好的部分原因。他們給了我們一個例子:
「例如,對於資源許可權得分,參數值可以是權重,資源的特徵值(許可權得分)將被乘以該權重或以其他方式進行調整;關於資源術語和查詢術語,
參數值可以包括同義詞,相關術語以及權重,通過這些權重,術語和術語計數的匹配可以是多個或以其他方式進行調整;等等。」
因此,根據該專利,搜索可能是一個非常複雜的過程,該過程基於可能與來自查詢內容的Web資源特徵相關的許多不同類型的參數,尋找不同類型的多種類型的評分貢獻。
搜索操作一旦建立,就可以在各種搜索查詢和文檔中表現良好。這可能會提出一些需要克服的問題,該專利為我們介紹了這些問題。
它告訴我們:
- 與其他查詢和其他資源相比,某些功能對資源評分的影響可能更大。
- 與其他查詢和其他資源相比,某些功能對資源評分的影響可能要小得多。
當某個主題是網路上的一個相當新的主題(他們稱為「緊急主題」)時,分數的某些方面可能會比其他方面具有更大的影響:
「此外,這種影響可能是短暫的;例如,對於一個新興對象,信息檢索分數在最初的幾周內可能會更具影響力,然後,在以後的某個時間,權威性分數和用戶反饋分數可能會逐漸增加影響力。因此,在檢測到這些特徵之前,即使不是不可能,也很難調整搜索操作以補償這些特徵。
因此,該專利的重點在於「當某些功能對查詢的搜索操作的資源排名產生或多或少的影響時,然後根據這些影響來調整搜索操作。」
如果您曾經在一個相對較新的主題區域中對頁面進行排名,並且有一天它突然出現的搜索結果似乎發生了變化並發生變化(經歷了巨變),那麼專利的下一段可能會解釋為什麼調整搜索結果後可能會發生這種情況:
調整後的搜索操作是對確定的資源重新運行,以考慮到所檢測到的影響的方式對資源重新排序。在一些實施方式中,執行對查詢的初始搜索,並且處理排名資源的適當子集,例如,排名靠前的N個資源,以確定對搜索操作的適當修改。經過適當修改後調整的搜索操作將重新運行,以重新評分和重新排列資源。」
當我閱讀專利的下一段內容時,我想起了傑森·巴納德(Jason Barnard)撰寫的一篇有關在Google排名的文章,該帖子基於他從Google網站管理員趨勢分析師加里·伊利耶斯(Gary Illyes)那裡獲得的信息, Google搜索排名的工作原理–搜索達爾文主義:
「搜索引擎利用搜索操作為資源生成搜索分數,並根據搜索分數對資源進行排名。搜索操作量化資源與查詢的相關性,並且量化可以基於多種因素。這樣的因素包括信息檢索(「 IR」)分數,用戶反饋分數,以及可選地每個資源相對於其他資源的單獨排名(例如,許可權分數)。搜索結果根據這些搜索分數按一階排序,並根據一階提供給用戶設備,或者在某些情況下,可以通過調整後的搜索操作對搜索結果進行重新排名,並以如下形式提供給用戶設備:搜索結果按照與第一順序不同的第二順序進行排名。」
該專利還根據查詢日誌和點擊日誌中的信息告訴我們有關反饋分數的信息:
「在某些實現中,從用戶設備提交的查詢存儲在查詢日誌中。查詢的點擊數據和搜索結果引用的網頁均存儲在點擊日誌中。查詢日誌和單擊日誌定義了搜索歷史數據,其中包括來自先前搜索請求並與之相關的數據。查詢日誌和單擊日誌可用於將用戶設備提交的查詢映射到搜索結果中標識的網頁以及用戶採取的操作。點擊日誌和查詢日誌因此可以被搜索系統用來確定由用戶設備提交的查詢,響應於查詢而採取的動作以及提交查詢的頻率。這樣的信息可以存儲為查詢和資源的反饋分數。」
然後對結果進行排名或調整搜索功能
如專利中所述,這是結果調整的一部分,當對結果進行評分以修改搜索結果時,值可能會發生變化:
「……重新排序引擎針對每個查詢處理由搜索操作標識為響應查詢的資源,並根據第一順序對其進行排序,選擇資源的適當子集,並針對每個功能確定搜索操作考慮到影響度量,該度量衡量功能對資源排名的影響。然後,重新排序引擎可以基於相應的影響度量來調整搜索操作,並啟動搜索操作的後續運行以部分地基於該調整來重新評分資源,從而得到搜索結果。」
搜索操作調整和重新排列資源
在對搜索結果進行排名時,將計算出對這些功能進行排名所涉及的每個功能的影響,並且可以通過這些功能的影響來衡量這些功能的任何更改。
如果影響未達到閾值,則重新排名引擎將不會重新排名搜索結果。如果確實達到該閾值,那麼結果將重新排名。
該專利讓人們窺見了Google決定使用調整後的搜索功能時,如何進行重新排名。
「 …然後,該過程會根據影響指標調整搜索操作(314)。可以使用各種調整。例如,根據查詢的類別,可以以不同方式調整搜索演算法。舉例來說,如果查詢被歸類為「產品」搜索查詢,則可以增加與諸如評論,定價信息等的某些商業內容有關的相關權重參數值;相反,如果查詢被歸類為「信息」搜索查詢,則可以減少與某些商業內容(如評論,定價信息)相關的相關權重參數值,而與錨文本鏈接相關的相關權重參數值資源可能會增加,等等。」
同義詞也可能起作用:
「…如果與同義詞匹配項相關的影響度很高,則可以調整查詢擴展的功能,以便使用更具攻擊性的查詢擴展形式。」
調整後的搜索功能要點
Barnard撰寫的文章列舉了可用於對頁面進行排名的特定類型的功能,例如主題,質量,速度,RankBrain,實體,結構化數據,新鮮度。
這些內容並未在本專利中進行描述或進行任何詳細討論,但似乎確實可以作為已排序資源的功能或可能影響頁面排名方式的查詢(已在此專利中提及)。
如果您沒有機會閱讀Barnard的帖子,我會推薦。我是在第一次看到該專利的同時閱讀它的,我強調了該專利中的一段,該段告訴我們,頁面可能會基於多種因素進行排名。
儘管該專利沒有告訴我們與Barnard所說的相同的因素,但如果可能的話,值得在Google上對網頁進行排名的因素涉及多個因素。
這項專利使Barnard告訴我們的事情是,谷歌可能會在看到不同的排名信號所產生的影響變化時發現谷歌可能曾經使用某種排名來超過某個閾值,因此谷歌可能會通過應用重新排名過程來調整排名。
因此,如果您看到自己一直遵循的特定查詢的結果,那麼就會很好地了解該查詢周圍的SERP位置,以及誰在該SERP位置中佔據其他位置,然後您可能會突然發現它在變化和改變。
Google可能已調整搜索功能並更改了這些結果,因為排名信號對這些功能的影響可能已更改。
圖片積分
作者截取的所有屏幕截圖,2019年9月