天天看點

王俊談基因測序将免費,阿裡金榕談線上廣告背後的随機算法

中國計算機大會(China National Computer Congress,簡稱“ CNCC”)是由中國計算機學會(CCF)主辦的全國計算機領域規模最大、規格最高的學術、技術、産業交融互動的大會。

2015年中國計算機大會

前天在合肥開幕 (檢視前兩天詳細報道請點選: 第一天 第二天 ),今天會場中的精彩報告有:

  • 王俊:基因測序将免費
  • 阿裡金榕:線上廣告背後的随機算法

華大基因董事會合夥人,現已創業的王俊今天在中國計算機大會上發表題為碳基智能的主旨演講,他表示:基因測序将免費。

王俊談基因測序将免費,阿裡金榕談線上廣告背後的随機算法

王俊認為,如果計算機為矽為基礎,那麼生命本身為碳基礎。而基因就是人類數字化的信号,王俊列舉了基因測序的幾個作用,比如研究個體族群的遷徙;目前我國新生兒的出生缺陷率大約5.6%,絕大多數與基因有關,目前也有機構開始;第三有可能實作惡性良性腫瘤個體化治療方案。

王俊談基因測序将免費,阿裡金榕談線上廣告背後的随機算法

但王俊也承認,目前距離人類健康的了解還很遠,更不用提了解生命。這其中最具挑戰性的就是基因資料量太小,而這也是王俊此次創業的原因。根據王俊的說法,如果把每個人資料都連起來,形成基因組網絡,其中的機會不可估量。這和早年間的列印機效應類似。王俊也列舉了IBM Watson在醫療行業的巨大潛力,其核心競争力就是算法和大資料,尤其是高品質的基因資料。

王俊談基因測序将免費,阿裡金榕談線上廣告背後的随機算法

王俊進一步指出,基因測序在過去幾年間的成本已經顯著下降,未來一定會免費。而未來也将呈現出「基因+」,比如基因與各種智能裝置的結合,會給基因測序帶來巨大變革,而如此大的基因網絡最終要做的是需要人工智能、深度學習技術來實作。

IDST号稱阿裡最神秘的部門,按照王堅的說法,「IDST要做阿裡其他部門不願做也做不了的事情。」而在今天中國計算機大會上,來自阿裡ISDT的金榕分享了阿裡對于大資料的解決方案。

王俊談基因測序将免費,阿裡金榕談線上廣告背後的随機算法

金榕擁有美國卡内基梅隆大學博士學位,也是美國密歇根州立大學終身教授。長期緻力于統計機器學習研究,重點關注大資料分析及其在網際網路資訊檢索、電子商務等領域中的應用。金榕認為,大資料時代的挑戰不是資料量,還有高維資料,如在圖像分類和線上廣告投放中需要上百萬維的特征資料,而一般的機器學習算法在處理這些問題上有一些難度。

王俊談基因測序将免費,阿裡金榕談線上廣告背後的随機算法

金榕介紹了阿裡使用随機算法的方法,随機算法快速應對大規模樣本資料和高維資料問題,并能最小化誤差。但随機算法也有自己的問題:

王俊談基因測序将免費,阿裡金榕談線上廣告背後的随機算法

金榕提出了随機投影的方法讓随機算法更好地找到最優解,這類算法也廣泛運用在淘寶平台的線上廣告展示中,效果顯著。

繼續閱讀