天天看點

201608北京雲栖大會Workshop - 視訊場景下的雲搜尋實踐目标 建立應用 激活應用 進階配置 結束

熟悉opensearch搜尋服務建立流程;

學會配置opensearch相關性表達式;

完成一個視訊搜尋服務搭建。

登入到opensearch控制台,點選右上角“建立應用”按鈕,開始建立一個搜尋應用;

填寫應用名稱、選擇地域以及應用描述資訊(地域選擇必須選擇“華東1(北京)”】)。點選下一步;

201608北京雲栖大會Workshop - 視訊場景下的雲搜尋實踐目标 建立應用 激活應用 進階配置 結束

勾選“通過資料源建立應用結構”,opensearch支援rds與odps的表來直接建立應用結構,這裡我們示範下如何通過rds源來生成應用結構,odps類似;

201608北京雲栖大會Workshop - 視訊場景下的雲搜尋實踐目标 建立應用 激活應用 進階配置 結束
201608北京雲栖大會Workshop - 視訊場景下的雲搜尋實踐目标 建立應用 激活應用 進階配置 結束

找到對應的表,點選确定。

201608北京雲栖大會Workshop - 視訊場景下的雲搜尋實踐目标 建立應用 激活應用 進階配置 結束

opensearch支援多表簡單join關系,時間關系,我們這裡以單表為例。 這裡面包含了視訊媒體的主要資訊,如title:标題、keyword:關鍵詞、type:類型、user:上傳者、director:導演、actor:演員、plays:播放次數、img_name:展示圖檔、area:釋出地區、language:語言、description:簡介、year:上映時間、length:時長、create_time:上傳時間、play_url:視訊播放位址;

201608北京雲栖大會Workshop - 視訊場景下的雲搜尋實踐目标 建立應用 激活應用 進階配置 結束

點選下一步,進行搜尋字段設定。索引字段主要指需要查詢的集合,同類型字段可以做組合查詢,比如下例中default索引,如果query=default:’哈利波特’,則會到title、keyword、director、actor、description字段中統一查找。如果query=title:’哈利波特’,則隻從title字段中去查找,可以實作影片查詢和全庫查詢的功能。 屬性字段主要用來做過濾、統計和排序等功能,這裡我們主要提供對時長等的過濾、對釋出時間、播放次數等的排序功能。

201608北京雲栖大會Workshop - 視訊場景下的雲搜尋實踐目标 建立應用 激活應用 進階配置 結束

點選完成後,應用建立成功。

點選激活應用,進行激活。這裡請務必選擇免費容量,以免産生費用,影響使用。

201608北京雲栖大會Workshop - 視訊場景下的雲搜尋實踐目标 建立應用 激活應用 進階配置 結束

這時候可以跳轉到應用清單頁面,看到我們剛建立的應用,已經在全量資料建構中了。點選進入管理界面,可以對應用進行更多功能的配置。

201608北京雲栖大會Workshop - 視訊場景下的雲搜尋實踐目标 建立應用 激活應用 進階配置 結束

一個搜尋應用已經建立成功,全量建構完成後,就可以搜尋了。但是搜尋出内容後,如何将最優的結果展示出來呢?接下來我們就來對優化項進行配置。

opensearch開放了兩階段的相關性排序,可以很好的相容性能和複雜排序功能的需求。粗排也就是海選,目的是選擇盡量好的文檔,精排會對已選取的top文檔進行更細粒度的排序算分。

粗排為:static_bm25(),搜尋關鍵詞的文本比對度;

精排為:text_relevance(title)*6+text_relevance(director)*2+text_relevance(actor)*2+timeliness(creat_time)+gauss_decay(0,plays,5000,0.000001,0.1),主要參考title、director、actor三部分的比對度、釋出時間的時效性以及播放次數,并進行權重配置。

201608北京雲栖大會Workshop - 視訊場景下的雲搜尋實踐目标 建立應用 激活應用 進階配置 結束

将新配置排序表達式設定為預設,點選儲存後即可對查詢起作用。

201608北京雲栖大會Workshop - 視訊場景下的雲搜尋實踐目标 建立應用 激活應用 進階配置 結束

opensearch允許對搜尋結果命中比對詞進行飄紅展示和摘要截取,更有利于搜尋結果的展示。

201608北京雲栖大會Workshop - 視訊場景下的雲搜尋實踐目标 建立應用 激活應用 進階配置 結束

 下拉提示 接下來我們來配置一個在搜尋場景中非常常見且有用的功能:下拉提示。目前系統支援支援拼音、字首、中文等的查詢提示。

下拉提示會從目前已有的字段中來選取常用關鍵詞,以保證查詢是有結果的。同時支援下拉提示中黑白名單的配置。配置完畢後點選“生效下拉提示”即可。

201608北京雲栖大會Workshop - 視訊場景下的雲搜尋實踐目标 建立應用 激活應用 進階配置 結束

生效完畢後,可以做下效果測試。

201608北京雲栖大會Workshop - 視訊場景下的雲搜尋實踐目标 建立應用 激活應用 進階配置 結束

搜尋測試頁面是個界面化的搜尋測試工具,在排查問題及日常測試過程中非常好用。

201608北京雲栖大會Workshop - 視訊場景下的雲搜尋實踐目标 建立應用 激活應用 進階配置 結束

至此,一個完整的視訊搜尋已經完成了,簡單吧?接下來,讓我們在demo環境中實際建立一個視訊看下吧。

繼續閱讀