天天看點

阿裡雲飛天大資料産品價值解讀——《一站式高品質搜尋開放搜尋》一、如何評估搜尋品質、體驗與業務價值二、OpenSearch背景與核心能力介紹三、典型案例

演講嘉賓簡介:阿裡雲智能進階産品專家——吳世龍(染天)

以下内容根據演講視訊以及PPT整理而成。

觀看回放:

https://yq.aliyun.com/live/43343

本次分享主要圍繞以下三個方面:

一、如何評估搜尋品質、體驗與業務價值

二、OpenSearch背景與核心能力介紹

三、典型案例

1.搜尋-無處不在

生活中多種不同場景需要進行搜尋,在企業内部産品中也需要使用多種搜尋功能,友善使用者快捷地擷取企業相關商品、服務、内容等資訊。搜尋在不同的企業業務中的角色可能有所不同。如下圖所示,搜尋在電商行業是十分重要的業務流量轉化入口,在其他領域也必不可少。

搜尋是使用者擷取資訊的基礎手段與能力,如果搜尋不好用,使用者信任度必會降低。如果搜尋在某業務場景中使用不多,建議衡量業務的全站流量結構。

阿裡雲飛天大資料産品價值解讀——《一站式高品質搜尋開放搜尋》一、如何評估搜尋品質、體驗與業務價值二、OpenSearch背景與核心能力介紹三、典型案例

2. 評估搜尋品質、體驗與業務價值

六成左右客戶不清楚如何評估搜尋品質、體驗與業務價值,那麼引出以下問題。

  • 搜尋的業務價值驅動力是什麼?搜尋在企業内部的業務價值驅動一般依靠被動的Bad case、KPI或業務需求。依靠Bad case驅動,搜尋結果具有随機性,不固定時間地點場合,搜尋體驗差。KPI名額判斷,容易片面和不知是以然。依靠業務需求指業務方或營運指明将某些搜尋結果置于前排,意味着結果排序相關性勢必會完全依賴于業務方經驗而無法客觀的保障使用者的體驗與業務轉化,不具備可控性。以上三種業務價值驅動方式都存在較大問題。

    目前許多企業的做法是根據上述所謂的内部搜尋業務價值驅動力,做召回、排序、業務需求以及擴充搜尋曆史等功能。

  • 如何衡量?主觀?客觀?如果明确了搜尋的業務價值驅動力,如何衡量驅動效果,即業務價值?具有客觀的體系化衡量手段才有可能實作客觀的判斷。

    下圖所列舉為一套以淘寶内部為典型的搜尋上線流程。首先需要有監控/評估搜尋使用者體驗的方法,周期性評測使用者體驗。通過監控/評估明确疊代/專項。在上線前做一些A/B Test或灰階測試,如果沒有問題可全量上線,并監控線上效果。例如翻頁率下降,說明使用者以往搜尋10頁才能找到的内容現在1、2頁就可以找到,搜尋體驗提升。

該鍊路是主動監控、評估搜尋業務價值的,好的驅動力應該是高效的體系化的持續化的實作傳遞價值。

那麼如何衡量搜尋業務價值?該鍊路源頭是監控/評估能力,需要有體系化、專業的報表與評估服務。報表是客觀性資料,隻能反映果而不能展現因,評估服務是人工主觀評估服務。監控/評估取代了所謂Bad case、KPI、業務需求,更加體系化地衡量搜尋體驗。

阿裡雲飛天大資料産品價值解讀——《一站式高品質搜尋開放搜尋》一、如何評估搜尋品質、體驗與業務價值二、OpenSearch背景與核心能力介紹三、典型案例

如下圖所示,OpenSearch報表評估提供5大次元的30+名額。報表隻能展現整體結果,而局部效果的評估可以根據大量名額從不同視角得出不同結論。五大次元分為流量名額、點選類名額、使用者分析類名額、Query分析類名額、成交名額,核心名額由其提煉而來。

以往每天上班第一件事是檢視關鍵名額,如發現可能存在問題,需要檢查連帶影響,確定報表各項核心名額正常後才會展開其他工作。是以該體系化、專業的報表與評估服務不僅帶給客戶一種技術能力,更使客戶能夠在平台上完整落地、驅動搜尋業務。

阿裡雲飛天大資料産品價值解讀——《一站式高品質搜尋開放搜尋》一、如何評估搜尋品質、體驗與業務價值二、OpenSearch背景與核心能力介紹三、典型案例
  • 如何高效、可持續、體系化地傳遞搜尋價值?搜尋的相關市場、場景、使用者、文化一直處于變化中,明确搜尋業務價值驅動力、衡量方式後,如何高效、可持續、體系化地傳遞搜尋價值?

    與一般開源不同,OpenSearch提供的不是需要客戶自行拼搭開發的零散工具,而是一套完整服務,一切皆為提升業務價值、展現大家的專業能力。OpenSearch服務主要有以下四個特點。第一,免運維,客戶隻需要提供資料并配置滿足自身業務訴求的政策。第二,開箱即用,隻需提供資料與配置政策,操作便捷。第三,一站式,提供搜尋核心功能、擴充功能。第四,高搜尋品質。

下圖所示為搜尋上線流程,建立應用、上傳資料并進行簡單調試後即可釋出上線。若過程順利半天即可完成。

阿裡雲飛天大資料産品價值解讀——《一站式高品質搜尋開放搜尋》一、如何評估搜尋品質、體驗與業務價值二、OpenSearch背景與核心能力介紹三、典型案例

OpenSearch是阿裡巴巴自研的搜尋引擎,過去一直支援并服務阿裡内部應用,經過千錘百煉才沉澱到可以賦能市場上其他企業。

阿裡雲飛天大資料産品價值解讀——《一站式高品質搜尋開放搜尋》一、如何評估搜尋品質、體驗與業務價值二、OpenSearch背景與核心能力介紹三、典型案例

搜尋的核心是做召回、排序、業務需求以及功能擴充,投入重、依賴多、周期長,一般企業難以投入大規模人力與資源。是以開發性能與體驗優秀的搜尋引擎并非易事。

阿裡雲飛天大資料産品價值解讀——《一站式高品質搜尋開放搜尋》一、如何評估搜尋品質、體驗與業務價值二、OpenSearch背景與核心能力介紹三、典型案例

召回核心子產品為分析器與查詢分析。中文博大精深,易生歧義,分詞效果至關重要。召回内置多種分析器,分析語言意圖。查詢分析提供同義詞、糾錯、詞權重、實體識别、停用詞分析等必備功能。

排序方面支援二次排序,是大資料量召回的有效解決方式。還支援類目預測、人氣模型,支援表達式以及Cava排序定制。

根據業務需求需要支援混排、打散、詞典管理等功能實作。混排指在搜尋召回結果中根據業務需求相應展示視訊、文字、圖檔等不同媒體類型結果。例如在淘寶搜尋結果中,打散指品牌、價格等打散展示。

擴充即功能性擴充,如A/B Test、搜尋框下拉提示、熱搜&底紋(預設搜尋詞)、飄紅、Debug工具等。

召回、排序、業務、擴充都是為了服務客戶,使客戶能以最小成本、最短時間傳遞高品質業務價值而提供的能力。

1.分析器

分析器是影響搜尋效果的基礎子產品,不同業務場景需要使用不同分析器,需要使用者結合自身業務場景自行選擇。目前OpenSearch內建了12種分析器供使用者選擇,使用者也可上傳自己的分詞詞條個性化定制分析器。

阿裡雲飛天大資料産品價值解讀——《一站式高品質搜尋開放搜尋》一、如何評估搜尋品質、體驗與業務價值二、OpenSearch背景與核心能力介紹三、典型案例

下圖所示為阿裡OpenSearch電商分析器與開源IK分析器對比資料,可見OpenSearch分析器的分詞效果相對優于IK開源分析器。該對比随機抽取100個電商類Query,下圖列舉部分結果。例如925銀耳飾,開源IK分析器分詞有“銀耳”一項,OpenSearch電商分詞了解顯然更優。

阿裡雲飛天大資料産品價值解讀——《一站式高品質搜尋開放搜尋》一、如何評估搜尋品質、體驗與業務價值二、OpenSearch背景與核心能力介紹三、典型案例

2.類目預測

使用者搜尋意圖可分為精搜、泛搜,類目預測即預測使用者搜尋某一Query時目标類目的結果。類目預測并非依靠個人體感,而需要符合市場需求,根據行為資料盡可能快速滿足使用者需求。

如下圖所示,使用類目預測前在淘寶搜尋光明,可能出現米、面、奶等多種相關商品。而根據使用者點選行為資料,100個使用者搜尋光明,絕大多數點選的商品是光明牛奶,意味着使用者搜尋光明通常是搜尋光明牛奶,是以使用類目預測後前排推薦商品變化為光明牛奶。

類目預測也可使用純文字方式。

案例——雙面膠:多數時候搜尋雙面膠指辦公用品,然而一段時間内電視劇《雙面膠》很熱,出現了許多相關周邊産品。那麼使用者在該階段搜尋雙面膠想要的商品或許會發生變化,可通過使用者行為資料進行類目預測。

案例——播、海賊王、柯南:“播”是一個服裝品牌,多數時候需要召回的内容為該品牌服裝。海賊王、柯南等Query,需要根據市場需求,通過類目預測提供更合适的結果。

阿裡雲飛天大資料産品價值解讀——《一站式高品質搜尋開放搜尋》一、如何評估搜尋品質、體驗與業務價值二、OpenSearch背景與核心能力介紹三、典型案例

3.人氣模型

淘寶早期搜尋結果排序方式非常簡單,寶貝釋出後上架試7天,剩餘下架時間越短排序越靠前,所有賣家都有相同的機會獲得流量,對賣家、買家都相對公平。然而該模式無法将價值最大化,并不經濟。

是以淘寶很早釋出了人氣模型,盡可能與市場趨勢比對,使使用者更加滿意,進而轉化為最大價值。使用者體驗好,對優質賣家、商品也更公平,是目前預設模型。

阿裡雲飛天大資料産品價值解讀——《一站式高品質搜尋開放搜尋》一、如何評估搜尋品質、體驗與業務價值二、OpenSearch背景與核心能力介紹三、典型案例

4.熱搜&底紋

阿裡雲飛天大資料産品價值解讀——《一站式高品質搜尋開放搜尋》一、如何評估搜尋品質、體驗與業務價值二、OpenSearch背景與核心能力介紹三、典型案例

1.召回

下圖所示站點是以UGC内容為主的論壇。由于站内搜尋使用者地域表達與文化習慣差異大,易生歧義,導緻搜尋體驗差。是以該類搜尋場景要求搜尋引擎具備較強的語義了解能力,根據搜尋和文檔的真實語義進行智能比對。

詞權重分析:如下圖所示,搜尋問題為“胎停有什麼症狀”,基于優秀的召回品質,通過詞權重分析能夠給出較好的結果排序。

拼寫糾錯、同義詞擴大召回:如下圖所示,由于使用者方言習慣等問題,搜尋關鍵詞時将“剖腹産”誤輸入為“抛婦産”,通過拼寫糾錯等功能,仍然可以正确識别使用者意圖,提供相關内容。

**客戶評價-1:簡單無門檻,連不懂技術的産品經理都可以使用OpenSearch對業務進行疊代,大大縮短了項目的疊代周期。

客戶評價-2:提高效率,目前技術團隊沒有專職優化搜尋的技術人員,隻是根據項目需求做臨時優化即可,省力省心。**

阿裡雲飛天大資料産品價值解讀——《一站式高品質搜尋開放搜尋》一、如何評估搜尋品質、體驗與業務價值二、OpenSearch背景與核心能力介紹三、典型案例

2.技術類内容社群

某國内最大的中文IT内容社群,涉及衆多業務場景,由于是技術類内容社群,需要提供強大、優秀的搜尋服務。

該社群花一年時間基于開源自建搜尋服務,效果不佳。是以該社群試行OpenSearch。

下圖所示為基于開源自建搜尋服務與基于OpenSearch服務的搜尋效果對比。搜尋同一關鍵詞Win10重裝,可見基于OpenSearch服務的搜尋語義了解更優,提供的搜尋結果相關性更高。

由于該社群搜尋詞專業垂直度高,通用分詞不足以支援,需要自定義詞典,并結合了阿裡NLP通用Query智能分析+人氣模型。

效果:對比基于開源自建的搜尋服務CTR提升80%+,對比友商CTR提升3%。

阿裡雲飛天大資料産品價值解讀——《一站式高品質搜尋開放搜尋》一、如何評估搜尋品質、體驗與業務價值二、OpenSearch背景與核心能力介紹三、典型案例

如果你想與更多開發者們進行交流、了解最前沿的搜尋與推薦技術,可以釘釘掃碼加入社群~

阿裡雲飛天大資料産品價值解讀——《一站式高品質搜尋開放搜尋》一、如何評估搜尋品質、體驗與業務價值二、OpenSearch背景與核心能力介紹三、典型案例

【開放搜尋】新使用者活動:阿裡雲實名認證使用者享1個月免費試用~

https://www.aliyun.com/product/opensearch

繼續閱讀