天天看點

【活動精彩回顧】搜尋&推薦技術分享沙龍電商專場(附視訊)十大精選問答嘉賓分享加入社群

1月9日,阿裡雲搜尋&推薦技術分享會順利舉辦。活動期間,我們收集了許多來自行業使用者的回報,并從中精選了10個熱點問題,請專家做出解答,為讀者應用搜尋&推薦技術提供參考。同時,我們整理了活動過程中,嘉賓分享的幹貨内容,以飨讀者。

十大精選問答

1、搜尋技術具體使用産品以及常用的場景?産品的基本叢集規模如何?是否有可替換的開源産品?

答:開放搜尋(OpenSearch:

https://www.aliyun.com/product/opensearch

) 是阿裡巴巴自主研發的大規模分布式搜尋引擎平台,其核心引擎HA3(問天3)系統為包括淘寶、天貓在内的阿裡集團核心業務提供搜尋服務支援。內建了智能查詢語義了解、機器學習排序算法等能力。與電商行業相關的場景主要包括以下幾個:商品搜尋、基于地理位置的O2O場景、訂單等大資料查詢分析。

(1)商品搜尋場景:

搜尋效果的好壞在商品搜尋場景中直接決定着GMV的轉化。通常該場景下:資料的更新極快,包括商品的描述、價格等,這些變化需要實時更新到索引中;商品需要在多元度互相比較,比如按價格、按銷量進行比較,友善使用者做多層次的挑選;使用者對商品偏好個性化十足,為了提升效果,需要收集豐富的行為資料設計千人千面的排序算法。

具體請參考文檔「基于OpenSearch實作電商場景商品搜尋原型」:

https://help.aliyun.com/document_detail/99739.html

(2)O2O等基于地理位置的搜尋場景:

開放搜尋支援類似附近人或地點的搜尋。如果希望按照地點或附近人傳入的坐标,那麼可以使用開放搜尋,提高搜尋效率,也同時提供排序功能。

使用方法參考:

https://help.aliyun.com/document_detail/130253.html

(3)大資料檢索場景:

ERP、CRM、物流、訂單、日志及背景管理系統是企業基本設施環境,這些場景的共同特點是資料量大、檢索及篩選條件複雜,資料庫查詢性能較差,使用搜尋引擎可以滿足功能及性能的雙項保證。

開放搜尋是開箱即用的雲搜尋托管服務,可以根據使用者的實際資料量按需使用,使用者隻需要管理搜尋應用,并不用關心背後的搜尋叢集的配置和運維問題。

在開源領域,Elasticsearch 和 Solr是常見的選擇,他們具備業務開發的靈活度,也是非常成熟的搜尋技術。相比開源架構,開放搜尋主要在産品易用性、搜尋相關性等效果、大資料量下的性能等方面展現自己的産品價值。

2、搜尋執行時間過長怎麼辦?

首先,檢查搜尋條件設定是否合理。搜尋查詢的效果主要跟query關鍵詞中命中的文檔數有關,命中的文檔數越多,系統要進行的計算就越多,那麼耗時就會越高。是以優化的一個重要手段就是盡量降低query召回的文檔數。可參考文檔:

https://help.aliyun.com/document_detail/29191.html?spm=a2c4g.11186623.6.753.43344a11efwG0c

其次, 選擇合适的應用規格;存儲型, 通用型,計算型在相同的條件下,搜尋執行時間是依次減少的,可以根據業務的需要選擇購買相應的規格。

最後,如果仍存在問題,可以送出工單回報,具體問題具體分析。

3、搜尋召回側除文本外,還有哪些次元可以提升相關性?

目前提供特征大緻有:類目相關性(類目預測),文檔的熱度(人氣模型),地理位置(距離),文本特征(query,doc,query-doc),以及一些基礎的功能函數。使用者可以通過表達式的方式,自由組合這些特征和文檔自身的字段内容對文檔算分,進行排序,提升相關性。

Open Search對于幾種經典的應用(如論壇、資訊等)提供了表達式模闆,使用者可根據自己資料的特點,選擇合适的表達式模闆,并以此為基礎進行修改,生成自己的表達式。

具體可見以下文檔:

https://help.aliyun.com/document_detail/29130.html?spm=a2c4g.11186623.6.598.5677a63dei1lNq

4、能介紹下實體識别大緻的實作邏輯嗎?以及如何衡量實體識别的效果?

目前實體識别的幹預主要包括兩個對實體識别結果本身的幹預,以及實體類型重要性的幹預。當實體識别的結果不準時,應該通過實體識别的幹預來進行幹預。實體識别使用了标注資料、行業知識、語言模型等資料訓練的一個NLP模型。通過對一批标注資料的評測,主要考察了一些重要實體類型的召回率和準确率。

通過建立實體幹預的詞典,并在查詢分析中實體識别中配置相應的幹預詞典,可以幹預實體識别的結果。由于語義實體是和分詞器密切相關的,是以,建立實體識别幹預詞典時,必須選擇分詞器。且在查詢分析配置使用時,隻有索引對應的分詞器和幹預詞典的分詞器一緻,才能被選擇使用。

https://help.aliyun.com/document_detail/124934.html

5、搜尋場景下如何與推薦相結合? 如何選取與定位推薦的業務提升效果名額,如點選率、購買轉化率等等?

搜尋、推薦作為引導GMV的重要入口,承載着購買轉化的重要作用。搜尋發生在使用者購買意願已基本确認時,推薦主要承載引導使用者得以“逛起來”并結合長、短期興趣進行購買預測,對于智能推薦而言,目前可以利用起由搜尋觸發的點選行為,并作為興趣學習的重要一環輸入。

在選取與定位推薦業務提升效果上,主要以點選率為衡量名額,推薦主要承載起商品分發的能力,至于使用者是否收藏、購買也同時受到商品本身配圖、評價、品質等多方影響,衡量分發效率直接采用購買轉化率有一定的變量因素幹擾,但智能推薦也會同時結合收藏、購買、評價等行為表現對商品的品質進行學習并表現在推薦高品質商品的結果上。在推薦分發效率提升的同時,表現為點選率的提升,轉化率的提升以及使用者駐留時長,留存率的提升等。綜上,主要以點選率為衡量名額,其他名額為輔助參考。

6、使用者在買完某個商品之後,首頁還在持續推薦同類型産品,該問題怎麼解決?

這個問題本質與商品的類型有關,對于類似于美妝-口紅的商品,購買後的二次推薦也具備極大的複購可能,但對于類似于數位-冰箱的商品,購買後的短期二次推薦基本不具備複購可能。

針對此類問題,智能推薦主要可通過3種方法解決,首先使用者具備長期與短期興趣,推薦的商品本身就不會局限于使用者短期購買的商品;其次,利用模型快速學習與更新的能力,實時捕捉使用者的行為變化,當曝光已購買同類商品後缺少點選行為,模型會接收到負面的回報資訊,在下一次重新整理就會減少此類商品的推薦;最後,可以配置打散的規則,設定一次結果出現的類目分布情況,進而避免使用者興趣過于集中發生過購買行為後即興趣丢失,不再願意繼續逛下去的問題。

7、直播中說到友盟提供大量的資料積累,但是這些資料對我們客戶有什麼幫助呢?

推薦效果的好壞是跟資料的質和量緊密相關的,當客戶本身行為資料或者畫像資料比較稀缺的時候,推薦效果相對也不會特别的好。友盟大資料的能力就是彌補資料側可能存在的短闆問題。相關産品連結,請參考:

https://umeng.aliyun.com/product/urec

友盟提供的大資料積累,能夠很大程度幫助app、站點等的新使用者第一次入站浏覽即可準确把握使用者的興趣、喜好、關注内容,可以大幅提升新使用者留存、轉化、粘性增加的能力。

8、資料安全性如何保證?

開放搜尋會對每個通路的請求都會通過阿裡雲官方頒發給通路者的Access Key Id 和Access Key Secret做身份驗證,隻有身份驗證後的請求才會被開發搜尋服務響應處理。使用者自身需要對Access Key Id和Access Key Secret嚴格保密。加密方法見:

https://help.aliyun.com/document_detail/54237.html?spm=a2c4g.11186623.6.646.14c875aevLqQuJ

智能推薦目前在公共雲上部署。智能推薦底層的資料存儲依賴于阿裡雲Maxcompute,以執行個體為細粒度建立通過項目空間、項目名稱以及具體的分區對不同的使用者資料進行隔離,客戶需要通過阿裡雲的賬号資訊才能通路對應的資料。此外也支援客戶對于重要的資訊進行加密等措施。

9、推薦系統有沒有外部調用接口?可以基于智能推薦做二次開發嗎?

外部調用推薦系統可使用API進行結果的擷取,對于控制台已支援的功能,包括建立打散規則、設定曝光過濾時間、設定混排規則、查詢使用者/物品資料/更新記錄等均可使用提供的API接口調用。

目前暫時不支援模型内(包括召回和排序兩個過程)的二次開發,如果具備一些特殊的業務規則,涉及過濾、強推邏輯建議針對請求的推薦結果篩選,但不建議基于推薦結果定義二次重排序,這将違背模型學習的真實結果。支援二次接口的開發在我們的規劃中,但目前不支援,業務幹預可通過權重、打散、混排政策設定等實作。

10、目前這套服務故障率是接近0嗎?有做高可用嗎?

開放搜尋的服務可用性不低于99.95%,并有服務等級協定(Service Level Agreement,簡稱 “SLA”),規定了阿裡雲向客戶提供的開放搜尋(OpenSearch)的服務可用性等級名額及賠償方案。具體可見文檔:

https://help.aliyun.com/document_detail/64789.html?spm=a2c4g.11186623.2.11.137448f0Tx5kMt

嘉賓分享

1、智能搜尋技術在電商行業的最佳實踐

分享嘉賓:阿裡巴巴技術專家 項招貴

針對電商行業特點和面臨的問題,分析在具體的技術實踐中,針對多元化商品形态、多樣的使用者行為,如何做到搜尋的智能化和效果評測等。

【活動精彩回顧】搜尋&推薦技術分享沙龍電商專場(附視訊)十大精選問答嘉賓分享加入社群

點選檢視視訊:

智能搜尋技術在電商行業的最佳實踐

2、煉數成金:智能推薦大資料和AI實踐

分享嘉賓:友盟+ 算法專家 楊玉蓮

從電商行業推薦場景及挑戰、基于大資料與AI的解決方案、新使用者冷啟動的解決方案、推薦技術在電商行業的發展方向四個方面分析智能推薦如何得以更懂使用者的訴求與心智。

【活動精彩回顧】搜尋&推薦技術分享沙龍電商專場(附視訊)十大精選問答嘉賓分享加入社群
煉數成金:智能推薦大資料和AI實踐

以下為本次問題征選的獲獎名單,禮品擷取資訊請關注短信通知。

【活動精彩回顧】搜尋&推薦技術分享沙龍電商專場(附視訊)十大精選問答嘉賓分享加入社群

加入社群

點選訂閱

《阿裡雲搜尋與推薦技術交流期刊》

掃碼加群,了解更多資訊

【活動精彩回顧】搜尋&推薦技術分享沙龍電商專場(附視訊)十大精選問答嘉賓分享加入社群

繼續閱讀