案例背景
某技術社群作為國内的中文IT内容社群,緻力于為中國軟體開發者提供知識傳播、線上學習、職業發展等全生命周期服務,旗下包括多款産品。
自開始接觸阿裡雲開放搜尋産品,在一年的時間裡逐漸上量,陸續接入PC端、移動端的多個平台,覆寫首頁搜尋、部落格、下載下傳、問答等細分業務的頻道搜尋。通過開放搜尋,為旗下産品的使用者提供高品質的搜尋服務,并通過搜尋能力的優化帶來更多的業務轉化,以提升整體業務收入。
内容搜尋場景需求:
»更多的曝光機會——空結果率低;
»更好的搜尋品質——搜尋相關性高;
»更豐富的業務特征——結合業務特性調整搜尋結果;
»更全面的配套功能——智能糾錯、下拉提示等配套能力;
»更低的擁有成本——相較自建搜尋引擎更低的TCO成本;
»更便捷的開發使用——上線周期短,降低搜尋引擎開發、效果調優難度;
以某論壇社群為例,産品線覆寫多個平台,包含網頁、APP、小程式等形式,同時業務上區分多個頻道。随着業務的發展,首頁綜合搜尋(後簡稱“主搜”)的流量越來越大,各種付費、引流業務接入,對搜尋流量的營運變得更加重要,對主搜的業務訴求越來越多,需要聚合多個頻道的内容,同時搜尋結果相關性要求更加精準,在考慮文本相關性的前提下,要加入更多的商業因素考慮,如eCPM等。
成熟的搜尋引擎涉及離線子產品、線上子產品、查詢了解服務、算法平台等系統組成,所需大量開發、算法調優以及持續的複雜運維工作,由于人力有限,社群論壇經過多方競品調研和産品試用,最終接入阿裡雲開放搜尋。
開放搜尋最佳實踐

更符合IT行業的查詢了解功能
在核心索引上配置使用針對IT行業定制了詞權重模型,糾錯模型,改寫模型等,擴大召回結果,精準命中需求;
排序優化
- 排序表達式應用
支援制兩輪相關性排序規則來準确控制搜尋結果的排序。第一輪為基礎排序(粗排),從命中的文檔集合裡海選出相關文檔。第二輪為業務排序(精排),對粗排的結果做更精細篩選,支援任意複雜的表達式和特征函數應用,友善更準确控制排序效果,優化系統性能,提高搜尋響應速度。定制CTR點選率預估模型,實作更智能的排序效果.
- 算法調優-人氣模型
人氣模型是淘寶搜尋最基礎的排序算法模型,計算量化出每個産品的靜态品質及受歡迎的程度的值,将人氣模型引入到排序表達式中,可建構更精細化的排序模型;
- 進階定制排序插件-Cava語言
更強的靈活性和定制能力:Cava提供了較表達式更加豐富的文法功能,支援及時編譯,滿足更多個性化的業務需求。
搜尋引導功能
下拉提示
是搜尋服務的基礎功能,在使用者輸入查詢詞的過程中,智能推薦候選query,提高使用者輸入效率,幫助使用者盡快找到想要的内容。
下拉提示實作了基于使用者文檔内容的query智能抽取,可以通過中文字首,拼音全拼,拼音首字母簡拼查詢以及漢字加拼音,分詞後字首,中文同音别字等查詢下拉提示的候選query。
業務價值
• 對比客戶基于開源自建的服務CTR提升超過80%
• 經疊代,開放搜尋傳回的搜尋結果首位點選率高于某D站内搜尋服務的點選率,期間多日點選率高出3%
配置前後效果對比
以上就是社群論壇行業開放搜尋最佳實踐的内容,如果您對搜尋與推薦相關技術感興趣,歡迎加入釘釘群内交流~
【開放搜尋】新使用者活動:阿裡雲實名認證使用者享1個月免費試用
戳我