天天看點

資料分析起家的海雲資料,還想向唇語識别沖刺

再次談起公司發展的下一步時,馮一村難掩興奮。

作為海雲資料創始人兼 CEO,不僅是因為其自主研發的唇語識别技術,提高英文識别準确率,更重要的是,馮一村找到了唇語識别的變現之道。

「唇語識别能幫助聾啞人、老人交流,裁定體育賽事語言暴力。在公安領域,也具有颠覆意義。」馮一村分析。因為大量視訊隻有圖像,沒有聲音,如能識别視訊中犯罪嫌疑人的講話内容,将會提高刑偵效率。

正因如此,馮一村說,海雲資料未來将不遺餘力地投入唇語識别的研究。

成立于 2013 年的海雲資料,以資料可視化分析起家,旗下資料可視化分析平台「圖易」具備 12 層神經網絡,分布式 GPU,可實作資料自動比對,并能通過智能資料實作深度學習。當馮一村無意中發現,企業内部研究院将唇語識别加入現有的資料可視分析系統,他很快意識到,這個嘗試對現有業務的突破具有重要價值。

2016 年 12 月,海雲資料聯合重慶公安科研所研究唇語識别。

資料分析起家的海雲資料,還想向唇語識别沖刺

海雲唇語識别

馮一村介紹,唇語識别是典型的 AI 應用,集機器視覺與自然語言處理,從圖像中連續識别出人臉,并提取此人連續的口型變化特征,将其輸入模型,識别出講話人口型對應的發音,進而計算出可能性最大的表達語句。而成熟的唇語識别系統需要建立在大量人臉特征樣本的基礎之上,通過帶記憶的深度神經網絡,保證結果的最大準确性。

在 2017 年 3 月的亞洲大資料可視分析峰會上,海雲資料在正式釋出唇語識别技術時稱,其由 1 萬小時新聞式唇語節目訓練而成的唇語識别 AI,英文識别準确率達 80%,中文準确率達到 71%。不過,馮一村認為,「若要投入實戰,準确率需要 90% 甚至 95% 以上。」

資料分析起家的海雲資料,還想向唇語識别沖刺

 1萬小時新聞類節目進行唇語識别訓練

更早一些時候,一則唇語識别 AI 超過人類專家的消息還曾刷屏研究界。2016 年 11 月,牛津大學工程科學系與谷歌母公司 Alphabet 下屬公司 DeepMind 合作進行唇語識别開發,選擇英國 BBC 5000 個小時的電視節目,總共 118000 個句子作為訓練素材,最終結果是相比人類專家 12.4% 的準确率,AI 的準确率為 46.8%。

但對一家商業化公司來說,縮小準确率差距的前提下找準方向也同樣重要。「AI 要在特定領域解決特定問題,初創企業更需要找準細分領域。」馮一村分析他的業務邏輯,「我們做唇語識别,至少公安、政法委、軍隊、教育四個行業可以應用。」

馮一村尤其看好唇語識别在公安領域的應用,因為這是海雲資料的優勢。事實上,海雲資料正是發家于此。

衆所周知,城市交通卡口處都有攝像頭,但大量攝像頭的背後需要公安指揮中心部署更多警力監控視訊。而海雲資料的資料可視化分析技術則能有效改善這類狀況,通過将卡口處的視訊、犯罪分子的資料、戶籍資料、車輛資料等實時呈現在同一個平台,公安人員能直覺了解卡口資料、警力部署、出警資訊、犯罪線索等資訊,既能實時判斷警力部署、犯罪分子行動軌迹等情況,還能降低人力成本,提高效率。

為了深入了解公安業務,海雲資料聘請了老專家,他們熟悉公安業務系統,從業經驗長達數十年。正是如此,海雲資料占據了公安領域三分之一的市場佔有率。

實際上,海雲資料并非第一天就做資料可視化分析,也并非第一天就将公安領域确定為目标。從創業之初的資料新聞,到資料可視化,再到奠定核心競争力的資料可視化分析,海雲資料花了兩年試錯。

馮一村表示,傳統的資料可視化是将資料以圖形、圖表等形式呈現,強調結果的呈現效果,而資料可視化分析能實時有效地表達過程資料,可以實時分析,實時決策。

2015 年 6 月,馮一村重新确定技術方向——資料可視化分析,并将目标瞄向公安領域。「大資料可視化分析業務要産生商業價值,就需要與行業結合,落地業務層。」馮一村如此表示。而這需要真實有效的資料,同一領域不同客戶的業務邏輯也不能有太大差異,進而易于标準化并實作快速複制。公安領域就符合這樣的标準,舉個例子,北京與重慶的公安系統,業務都是刑偵,無太大變化。

由此,海雲資料建立了對 B 端客戶收取管理服務費的營收模式,馮一村稱,找到準确方向的海雲資料很快就實作了盈利,并在公安領域站穩腳跟。

2015 年 11 月,海雲資料在此前的底層架構基礎上,釋出可視化分析平台「圖易 4.0」,經過疊代,「圖易 5.0」已具有一定 AI 智能,覆寫 323 種資料源,651 個 API 接口,318729TB 資料量,涵蓋 20 多種行業。而基于圖易,海雲資料已推出「智航順」、「智警」、「金智」、「醫智佳」、「智勝」等細分領域産品。

如今,海雲資料團隊成員已達 300 多人,服務将近 90 家客戶,其中 76 家是世界 500 強企業,覆寫行業也早已突破公安、民航等達到 13 個。

而在馮一村的規劃中,2017 年,海雲資料将拓展全新行業,發力大交通、大公安、軍民融合以及智慧城市四大領域。技術方向上,則雙管齊下,在深耕資料可視化分析的同時,繼續向唇語識别沖刺。

海雲資料融資進展:

  • 2013 年 4 月,種子資金 20 萬,投資人為海量創始人郝玺龍。
  • 2014 年 4 月,天使投資 300 萬,投資機構為華創盛景。
  • 2015 年 4 月,Pre-A 輪 1500 萬元,投資機構為東方富海。
  • 2016 年 3 月,A 輪 1 億元,上古資本(華創盛景創始人李漢生主導的另一家投資機構)領投,東方富海跟投。

繼續閱讀