天天看點

StartDT_AI_Lab | 開啟“資料+算法”定義的新世界

繼「資料中台技術彙」欄目推出以來,獲得了不少技術極客的喜愛。作為AI驅動的資料中台創導者,深度關注核心算法技術的自研創新、融合探索,故推出全新AI算法欄目「StartDT_AI_Lab」,主要介紹算法團隊所承擔的角色與工作。本文先回顧這些年大資料之路,幫大家了解在奇點雲發展過程中,人工智能技術是如何由業務需求孵化并成長為産品一部分的,同時為今後的分享内容做一個宏觀概述。

2013年,一本《大資料》成了不少技術人案頭必備的讀物。它像是一盞照燈,将數字世界的完整尺度突然照亮,這時大家才意識到原來數字世界已經長如此大了。

從彼時起,大資料成了之後幾年最熱門的話題。随之而出的各類概念,如“DT時代”、“雲計算”、 “DMP”等等,層出不窮。而其中的核心要素就是 “資料” ,資料兩字似乎已成為技術界的圭臬。很多人将這次由大資料而帶起的技術革新浪潮譽為“第四次工業革命”,而将資料比喻為本次工業革命的 “石油”。恍惚間,頗有 “得之則生,弗得則死”之意。随後幾年,各家公司都掀起了“囤資料”運動,凡是能存入硬碟的,絕不删除。“不管現在有用沒用,先存着,未來一定有用”的觀念,成了各家公司CIO、CDO們的指導思想。

然而,在“囤資料”運動方興未艾,正推着硬碟價格也一路上漲的發展程序中,卻有一個聲音如幽靈般飄來,并日漸響亮:資料無用!這聲音來自于這一運動中“出師未捷身先死”的烈士們,他們曾是“大資料”最忠實的擁趸,卻在資料價值的追尋中日趨迷茫,最終被“囤資料”、“開采資料”所帶來的成本飙漲壓垮。

資料有用還是無用,成了一個可以讨論的辯題。雙方各執一詞,誰也說服不了誰,共同在這DT時代吐出了這樣一句飽含憧憬卻無奈的歎息:

如果你愛他,請給他資料,因為資料為王。

如果你恨他,請給他資料,因為資料為亡。

那麼資料到底有沒有用呢?不妨從奇點雲多年積累的資料經驗視角,我們一起來認真審視一下。

如果隻是裸資料本身,可能确實是用處不大,正如汽車無法通過灌注原油驅動一樣。

是以從資料中提取的資訊才有用是嗎?也不盡然,因為提取出來的資訊大都支離破碎,并無法直接洞察商業情報。那麼從資訊中組合分析得出的商業情報才是價值點?還不夠,因為情報本身如果不能轉化為決策去執行,再多的情報也無法帶來收益。

那以情報為依據,通過業務經驗分析判斷進行決策,是否就是DT時代的智能商業呢?還不完整,因為同一業務問題,解法是多元的,決策還需有效評估與優化疊代才能補全資料回環。

現在,一幅比較完整的資料轉化利用的回環已經形成,而這也是我們的使命「讓商業更智能」背後的方法論。

StartDT_AI_Lab | 開啟“資料+算法”定義的新世界

有了這一方法論為依歸,整體建設思路也就基本明晰了。目前大家在已有的文章中,已知道我們的Simba和資料中台,其在商業智能化回環中的位置如下圖所示:

StartDT_AI_Lab | 開啟“資料+算法”定義的新世界

顯然,這一産品架構并沒有覆寫整條商業智能化回環。尤其,從我們的願景出發,幫助實體商家擁有淘寶一樣的資料化營運能力,其中很重要的一點是幫助實體商家把線下非數字化、非結構化的各類商業場景數字化、結構化并上雲,否則商業智能化回環将無法覆寫實體商家的主要商業場景,所謂的商業效益的提升也就無從談起了。這其中缺失的便是本文介紹的重點,也是「StartDT_AI_Lab」的主體工作。為了實作覆寫實體商家全面商業場景的完整商業智能化回環而特别研發的三大智能化引擎。其在産品架構中的位置如下:

StartDT_AI_Lab | 開啟“資料+算法”定義的新世界

現在簡單為大家介紹一下這三大引擎。

視覺智能引擎,作為資料入口,顯然是重中之重。其肩負着為數字世界開疆拓土的重任,有點石成金,化水為油之魔力。

在對其進行産品定義時,我們主要從三個必然和兩個凡是對其進行了概念描述:

在戰略意義層面:

達成公司願景的必然前提。

·将實體商家線下場景進行數字化并上線。

線下場景在數字化改造中對于實施成本,部署難度,複制性,易用性等方面要求下的必然要求。

資訊革命浪潮中的必然途徑。

·拓展網際網路,萬物互聯,全部線上。

在産品定義層面:

凡是實體商家數字化場景需要的。

凡是計算機視覺技術可以發揮比較優勢的。

在産品功能定義方面:

可回溯實時多級标簽政策

·基礎單元->單元屬性->行業行為屬性->情報摘要,例如人為一級标簽,穿着衣飾為二級,是否 試穿某服裝為三級,當天這件服裝試穿客戶的畫像分析是四級;

·有業務分析需求反向要求線下數字化;

視訊檢索

可以回溯視訊檢索,例如要抽取二級标簽相關的資訊,隻需要根據一級标簽的時序、位置資訊進行結構化更新和搜尋即可;

Vision AI + X:從行業中來的特異性視覺模型

比如“雙偷模型”這樣的特異模型;

而關于商業洞察引擎和業務決策引擎,在之前的中台欄目中已做過相關介紹,在此不再贅述,隻做一點補充。在兩個引擎中廣泛使用的大資料分析和預測模型得益于視覺智能引擎提供的線下場景數字化後的結構資料,形成了一系列緊貼實體商家實際商業邏輯和經驗的特有的大資料模型。

從今日起,本欄目将圍繞這三大引擎,自下而上逐一介紹其建構中用到的各類型算法技術和背後的故事,敬請期待!

繼續閱讀