天天看點

大資料可以創造出更高品質的價值

作為最早洞見大資料時代發展趨勢的資料科學家之一,舍恩伯格在數博會“資料資産化發展論壇”上發表了《大資料的大價值》主題演講。舍恩伯格認為,大資料是可以反複使用的資源,人們可以利用大資料創造出更高品質的價值。

舍恩伯格說,如今,資料已經成為了有價值的公司資産、重要的經濟投入和新興商業模式的基石。雖然資料還沒有被列入企業的資産負債表,但這隻是一個時間問題。人們必須意識到資料價值,并合理加以利用。

什麼樣的資料可與未來潛在因素發生更加緊密的聯系?舍恩伯格認為,關鍵就在于讓資料“說話”,展現出資料之間真正的聯系。通過小資料到大資料的累計,可以創造出更高品質價值。就像拍一個人騎馬,随着照片數量的增加,畫面就會連續起來變成電影那樣,小數字增量到大資料也是一個質變。

對于如何利用資料做出決策,舍恩伯格以一個英文學習軟體duolinga為例。這個軟體通過資料研究發現,西班牙母語的人學習英文會犯很多錯誤,是以他們根據回報的資料又開發出了對西班牙母語人士最好的學習課程。資料幫助duolinga發現了看問題的新角度,并創造出了比其他産品更優秀的軟體,是以,資料能夠幫助人們做出更加準确的決策。

舍恩伯格認為,資料産生的價值從過去到現在已經發生了改變,在過去的小資料時代,人們是根據一個問題去搜集回答這個問題的資料,得到針對這個問題的答案,就像找到了水面上的冰山,而忽略了水面以下大部分具有價值的資料。而在未來,資料大部分的價值都藏在水面下,在對資料的重複使用當中,人們可以更多地挖掘出冰山下面的那一部分價值。比如一個來自mit的初創公司,通過每天搜集10億項阿裡巴巴、亞馬遜等電商網的資料,并作出針對通貨膨脹比率的預測,2008年9月之前,他們就通過這些資料預測出了經濟危機。

舍恩伯格指出,谷歌的無人駕駛車之是以比大衆、寶馬、奔馳生産的無人汽車效果更好,其原因就在于他們的資料和經驗更多。谷歌通過不斷地使用和試驗,累計了大量的資料來讓其系統獲得更好地學習,就像人工智能的不斷進化也是要依靠試錯資料的累積,而這也展現出大資料的價值。

舍恩伯格說,未來當人們意識到大資料的價值後,它将會在一些行業帶來颠覆性變革。例如,醫療研究應該将以萬計的人、數以萬計的資料資料進行接合,才能加速醫療行業發展。現在中國已經有了資料中心、貴陽有了大資料交易所,又有大體量的人口樣本,應該有信心将醫療資料投入研究之中,推進醫療發展。

本文轉自d1net(轉載)

繼續閱讀