天天看點

博鳌直擊 | 大資料開發的最大障礙是什麼?

雷鋒網3月26日報道,今日第16屆博鳌亞洲論壇2017年年會在海南繼續進行中。據雷鋒網了解,在日前的資料價值分論壇上,騰雲天下ceo崔曉波、微軟全球資深副總裁洪小文、palantir副總裁kevin kawasaki、聯合利華公司前董事長michael treschow、平安普惠副總裁兼首席市場官cmo徐漢華、碳雲智能ceo王俊參與了主題為“大資料開發的最大障礙”讨論。主持人是上海第一财經傳媒有限公司首席顧問張力奮。

以下與雷鋒網(公衆号:雷鋒網)一起圍觀論壇精彩發言吧:

張力奮:現在大資料開發面臨很多障礙,中國地方政府想建設智慧城市,但是要整合政府内部資料源的話,幾乎是不可能的事情。如果資料源的問題不解決的話,大資料的開發幾乎是無法完成的。

微軟全球資深副總裁洪小文:未來大資料的挑戰,一在于政府内部,二是資料安全問題,特别是消費者的隐私權。各公司持有不同的資料,舉個例子,信用卡公司有人的消費記錄,而買什麼是不知道的,但是每一個櫃台知道,這些資料是不是可以串起來,但問題是誰有這個權利說這個資料可以用,這牽扯到法律。第三,我擔心在資料閉環之後,社會多樣性會減少。就像今日頭條,你喜歡什麼我就多給你一些,難免就囿于這個圈子。是以我們需要傾聽不同的聲音,比如聽分析大資料後那些非主流的意見。不去思考就全盤接受,我認為這可能是未來大資料發展中必須要面對的一個課題。

平安普惠副總裁兼首席市場官cmo徐漢華:今天搜集資料很容易陷入一個局面,強調資料之“大”,忽視了資料的有用性。很多大資料公司與我們合作時表示,他們有很多資料和使用者資訊,但問題是他們的資料跟我的目标的關系何在,這才是最重要的。

第二點,需要的資料依然短缺,如何收集需要的資料是個問題。比如說中國真正有信用記錄不到4個億,還有許多人沒有信用記錄。有些網際網路公司聲稱他們有很多客戶的資料,這些資料可能會是某人上個禮拜買了雙鞋,這禮拜去了肯德基消費,但問題是這些資料對于信貸沒有任何的幫助。這背後的邏輯其實與洪院長所說相同。

第三,我很贊同陸金所董事長計葵生先生的觀點,他認為資料不是斷開的,資料是連接配接的。斷開的資料不足以支援準确的判斷,曆史資料可以提高準确度,我們需要持續地累積資料,這是讓資料更有效的方法。

此外,也是資料安全問題。現在黑客衆多,如何保密,如何合法合理地使用資料都是處理資料時需要考慮的問題。

palantir副總裁 kevin kawasaki:我們不提供資料,也不存儲資料,我們幫助客戶使用他們自有或者從第三方擷取的資料,使之成為重要資産。我們面臨的挑戰之一就是世界始終在變化,我們不知道明天會有什麼樣新的資料源,怎樣的新問題,是以我們需要不斷地适應,要能夠不斷地整合新生資料到現有的模型當中來,不斷解決新問題。

張力奮:我問一下王俊先生,涉及跟個人生命健康有關的隐私問題時,當時的華大基因,現在的碳雲智能是如何來收集資料的?有沒有你們說的基本準則?

碳雲智能ceo王俊:這其中有兩個問題需要考量,第一是資料的所有權。比如我們去醫院抽血、看病,醫院獲得了我的資料,那麼這個資料是屬于醫院還是我的?再比如其他健康資料,運動手環,微信運動記步,這個資料是屬于微信還是我的?資料所有權的歸屬非常重要,而毫無疑問資料屬于個人,這是我們生命體産生的資料自然歸屬于個人,這是最基本的權利。

王俊:這涉及到第二問題——資料價值。每個人願意分享資料的意願和他能獲得的價值有很大關系。比如說我已經病入膏肓了,一個藥廠表示若我能把資料共享給他們,他們可能開發新藥品治愈我。我相信99%的人都願意共享資料。退一步講,不說疾病,舉個例子問個人是否願意參與科學研究,而這科研成果會對世人的生活産生長遠的影響,很多人可能也會願意。從我的價值觀來說,如果把我的資料放到一個公衆的可供科學研究使用的地方,我是非常願意的。

曾經我在丹麥做過演講,議題是與會者是否願意測試基因并貢獻個人基因資料。當我第一次問大家分享基因資料是用來看自己的父親是不是真正的父親時,舉手的不到10%。我問了五次,在第五次舉手前我講了一個案例,全球5%—6%兒童有出生缺陷,基因疾病可能有上萬種。比如說漸凍症也是一種基因疾病,有這個基因卻不發病的人占擁有這種基因的十分之一,如果把這個人找出來,搞清楚基因,那麼就可以找到治愈病人的方法,你願意不願意做幫助别人的人,然後所有的人都舉手了。是以我覺得事情的做法取決于個人價值觀,取決于你用什麼方式來對待這個資料。

聯合利華公司前董事長michael treschow:資料政策肯定是以個人的安全性為第一位,因為資料牽扯到每個人的安全,你必須確定不會洩露任何的個人身份資訊。

另外一個越來越重要的事情就是需要區分哪些資料可以自己留着,哪些東西可以分享。開源其實是一個好東西,但從另一個角度來說,在知識産權受資料驅動的現在,特别是我們在研發産品的時候,你要決定哪些是專屬的資料,哪些是可以與其他人共享的,這是特别有意思的一點。

第三涉及到跨國情況。不同的國家對于這些事情有不同的看法和政策。比如說醫療方面,在我的國家甚至都不能洩露醫院挂号資訊,如果說你去了另外一個醫院,他們根本都不知道你的病史。是以對我們來說,我們需要找到一個方式,使得立法者、監管者不會特别恐慌,并幫助他們知道,哪些可以分享,哪些不可以分享。譬如工程、藝術等,這是可以分享的。

繼續閱讀