天天看點

618 技術特輯(一)不知不覺超預算3倍,你為何買買買停不下來?

摘要: 這背後到底是我們自制力不夠,還是電商平台太會讀懂人心,我們不妨從技術次元,抽絲剝繭一探究竟。

作者:技術火炬手。

又是一年618,大家控制不住買買買的同時,會不會有這樣一種感覺:好像有一股神奇的力量牽引着自己,一旦把商品加入了購物車,再也停不下來。

看直播帶貨也是如此,聽到主播在耳邊大喊着:買一件再送一件,買兩件再送三件,手一抖就下單了。

這背後到底是我們自制力不夠,還是電商平台太會讀懂人心,我們不妨從技術次元,抽絲剝繭一探究竟。

圖資料庫:建立實體間關系,洞察你的喜好

菊廠小王是個新手爸爸,準備在618好好表現一下,給寶寶買點奶粉奶瓶。小王打開某電商APP,把奶粉加入購物車,随手往下一滑,看到這個小玩具不錯,那套衣服也很酷……一頓操作猛如虎,小王越買越興奮,最後買的東西超出他計劃的3倍。

是的,在大促期間,小王無意中陷入了電商系統的推薦大網中。APP首頁,購物車頁,商品詳情頁……推薦系統無處不在,電商APP的背景早根據所掌握的小王的使用者畫像(性别、年齡、購物記錄、搜尋記錄等)給他準備了一系列商品。

在電商領域,推薦系統作用強大,它使使用者花費更多的時間來浏覽商品,達到提高客單價的目的,背後所應用的正是圖資料庫技術。

初次接觸圖資料庫的人,很容易被它字面上的意思所誤導,以為這是一個存儲圖像的資料庫,實則不然。就像雷鋒和雷峰塔是完全不一樣的兩種概念,圖資料庫指的是以圖結構存儲資料的線上資料庫管理系統。

舉個例子,菊廠小王和小李是同僚,都喜歡打乒乓球。這裡的小王、小李分别是一個實體,代表一個點,小王和小李的關系——同僚,就是連接配接兩個點的邊,這就是一個簡單的圖結構。

618 技術特輯(一)不知不覺超預算3倍,你為何買買買停不下來?

通過圖結構,我們可以對各種有關聯的場景進行模組化,小到社交網絡、電商平台的推薦系統,大到整個城市的交通運輸系統。

比如,電商平台會根據小王的特點(程式員、奶爸、愛打乒乓球等等)給他打标簽,用标簽判斷使用者屬性:小王平常愛逛A品牌的數位産品的,并習慣買B品牌的嬰兒用品。但同樣經常去看A品牌手機資訊的小李,就不會購買B品牌的産品,借助圖結構就可以将這種關聯給找出來,實作精準營銷。

如果想讓圖結構找到這種關系,就得依賴圖計算的查詢分析、計算、存儲管理、可視化等。比如圖資料庫Neo4j就擅長圖資料的實時查詢;圖引擎則重于在海量圖資料中利用成熟的圖算法進行離線分析和挖掘。

華為雲的圖引擎服務(GES)就是為以關系為基礎的圖結構資料,提供查詢、分析服務。以華為商城為例,借助GES可以實作商品的實時推薦,它分析對比目标使用者和其他使用者的喜好,找到相似點後,把這些其他使用者購買過的商品推薦給目标使用者。

GES之是以能做到實時大量的推薦,“功臣”之一就是EYWA,它提供了從底層圖存儲和管理、核心的高性能計算引擎,到面向上層的圖分析、圖查詢的一整套解決方案。

具體在技術上,EYWA做了這些優化:

  • 分布式優化Parallel Sliding Window(PSW)的圖計算架構,高效加載圖資料,以滿足業務大規模的計算需要;
  • 兼顧圖計算與點查詢效率,開發基于邊集流(edge-set)的塊狀資料組織以合理組織資料;
  • 通過邊集合的prefetch政策來隐藏磁盤的IO操作以及松弛的BSP模型來隐藏通信IO,進而提升性能;

另一大“功臣”是GES所擁有的圖場景和圖優化算法, 以其中的Pixie算法為例,Pixie是華為雲嘗試将多中繼資料建構到同一張圖,并在這個異構圖上配置相應的schema、點邊屬性、權重而設計的算法。它是一種全新的實時推薦算法,克服了異構圖的資料擷取和融合問題,支援多請求節點下綜合推薦,能滿足各種複合型、時變、多樣性推薦場景需求。

618 技術特輯(一)不知不覺超預算3倍,你為何買買買停不下來?

是以GES圖引擎服務提供的實時推薦算法,在多重關系(使用者與商品的曆史互動資訊,人與人、商品與商品等背後潛在關系)共同作用下進行推薦,精度更高;大資料量下,依然能夠達到較好的實時推薦效果,可擴充性強,具體資料可以參考這篇文章:​​《華為雲新一代黑科技核心算法揭秘》​​。

知識圖譜:米其林大廚“加工”資料原料,智能推薦快,準,狠

如果說圖資料庫強調對“資料原料”的存儲、查詢和管理,那麼知識圖譜就是米其林餐廳的大廚,進一步加工資料。基于圖引擎服務的知識圖譜,融合各種異構異質資料,形成大規模的知識庫支撐業務應用,讓搜尋結果更準确。

基于圖資料庫,知識圖譜擴充了各種商品的關聯屬性(商品的各種次元、這些次元屬性的喜好度、商品的社會化評價等),由于擴充了使用者與商品之間存在的隐藏關聯關系,補充了使用者與物品的互動資料,基于人-人關聯,實作人-物關聯。是以可以更進一步提升推薦效果。

比如擁有同種屬性的使用者可能會對同一類物品感興趣,當愛打乒乓球的小王在電商APP上購買了品牌A的速幹衣,那麼同樣喜歡乒乓球的同僚小李打開APP時,排在前面的可能就是小王剛買的那家店。你看,這樣基于熟人屬性的推薦系統,已認證知識圖譜悄然地自動上演。

618 技術特輯(一)不知不覺超預算3倍,你為何買買買停不下來?

知識圖譜的建構一方面提高了電商平台的個性化推薦的準确度,它還能應用于智能客服,幫助建立知識系統卡片,實作智能問答。

例如,當你在某電商企業的客服對話框内輸入:“顯示器”,知識卡片會列出産品介紹、特點(螢幕尺寸、像素等)、款式分類、适宜人群、适宜場合、制作工藝等。

華為商城線上客服也是一種典型的應用,它能夠處理消費者在售前及售後中的各類問題咨詢,及時回複你需要的商品促銷資訊。

而且基于産品建構的知識圖譜,它比普通的FAQ系統更加精準地完成問答,實作産品對比、産品常見問題支援、屬性查詢等能力。

那麼,知識圖譜是如何解放人力,讓智能客服如此優秀呢?

業界主流的知識圖譜建構方式是基于企業内部資料、公開資料,圖譜服務商以解決方案形式幫助客戶定制建構知識圖譜。這種方式成本高且效率低,制作周期長,一個電商企業做完某個産品的知識圖譜,主打産品可能就過時賣不動了。

為了提供流水線式圖譜建構能力,華為雲知識圖譜雲服務将圖譜建構抽象為:本體建構、資料源配置、資訊抽取、知識映射以及知識融合。

618 技術特輯(一)不知不覺超預算3倍,你為何買買買停不下來?

因為将每一個流程子產品抽象成插件形式,并通過組合配置生成圖譜建構任務,是以隻需要修改插件配置即可完成不同領域的企業知識圖譜的建構。同時,基于流水線設計,知識圖譜雲服務可以在隻修改資料源的前提下完成更新操作,非常适用于需要頻繁更新的知識圖譜。至于它是如何建構本體、配置資料源、完成資訊抽取和知識融合,

繼續閱讀