天天看點

大資料科學認識與了解論壇全攻略

說到貴陽,你會想到什麼?這裡有文峰塔、陽明書院,然而毫無疑問,這兩天這座城市擁有了一個别樣的關鍵詞:大資料。街道兩旁的宣傳廣告随處可見。2016年5月25日,第一屆大資料科學與工程國際會議——大資料科學認識與了解在貴陽召開。據說此前貴陽已陰雨連綿數日,而雨停,也許就是一種美好的昭示。

上午8:30,大會準時開始,清華大學教授,原中國計算機學會理事長鄭緯民先生擔任本次大會主持人。出席大會的嘉賓有:中國工信出版集團董事長,人民郵電出版社社長季仲華;

中國計算機學會大資料專家委員會秘書長,中國科學院計算機技術研究所研究員、所長助理、副總工程師程學旗;中國工程院院士邬賀铨;美國伊利諾伊大學芝加哥分校特聘主任教授,清華大學資料科學研究院院長,acm/ieee fellow俞士綸;美國特拉華大學電子與集散機工程學院終身教授,eti公司的創始人與首席科學家,acm/eee fellow高光榮;英國帝國理工學院資料科學研究所終生教授/所長郭毅可;香港中文大學常務副校長,偉倫電腦科學與工程學講座教授,acm/eee fellow華雲生;中國科學院院士,上海交通大學副校長,ieee,fellow梅宏。

貴陽市政協副主席孫袁為大會作為開場嘉賓發表緻辭。她在現場表示:“此次數博會來自全國嘉賓和國際嘉賓預計達到2萬人次,作為2016年的重磅學術活動,貴陽非常重視,我們要發展大資料,就應該對于大資料理念、内涵,關鍵資料以及人才培養的研究。我們希望本次會議在國家行業專家學者及全體人員的共同努力下,有效推動貴陽、貴州、中國乃至全球的大資料發展,為使我國走在大資料前端而共同努力奮鬥。”

共八位專家在本場大會上分享了自己的觀點,快和小編去現場看看,和大資料來一場“零距離”的接觸吧!

邬賀铨:大資料總量巨大

大資料從結構上來看可以分成結構化、半結構化、非結構化。大資料是多來源的。大資料之大,這是全世界網民平均每個月上網的流量,2013年全球網際網路流量每年為2.7eb,全年達到1zb。2015年和2016年全世界新産生的資料量等于人類有曆史以來一直累計到2014年全球資料重量的總和,量非常大。

高光榮:大資料系統軟體前沿的幾個開放問題

高性能并非計算的“又一春”,接着是高性能計算/大資料面臨的挑戰,既有挑戰也有機遇。接着是大資料系統和軟體,搞的開放問題。往往是你腦子裡有一個思路,要怎麼做。絕對不能忽悠,忽悠解決不了問題。二十五年以前認為計算機不用再發展了,已經很前沿了,但是現在這個觀點已經不适用了。你想解決的問題,人工智能沒有達到效果。二十五年以後情況不一樣。山窮水盡無疑路,柳暗花明又一村,為什麼這個事又活了?并非結構活了,并非資料活了,人工智能進入第二春。沒有經過頭一次死的人,現在看到的是第二次的出現。

俞士綸:對異構資料源的思考

把不同資料庫聯在一起,這些資料來自不同的領域,合并在一起的話,使我們能做更好的預測。現在是大資料時代,一個重要的事情是我們要怎麼融合不同的資料?資料是很值錢的事情,其實ibm做氣象預測,有不同的應用可以預測天氣,根本賺不了什麼錢。像運輸路線怎麼走的話,一定要知道天氣,如果不知道天氣的話,他可能開到一半,被大風吹走了,也可能會淹水。如果做奇貨買賣的話一定要知道天氣,比如這個地方有幹旱、洪澇等等。像做農業的話也需要知道天氣,天氣這個資料可以應用在不同方面,知道這個資料可以改變很多細節。要了解到什麼資料是很有意義的資料。

張曉東:大資料分析将對人類社會本身的了解達到前所未有的高度

算機是為網絡研制的,網際網路和無線上網是一個資料世界的基礎。從1986年281pb,到2013年667ep,增加了2.9倍。這支援了我們的資料結構。計算機是一個資料中心,這個資料中心主要來源,這些資料,進去出來的資料相當多。是以從這個角度來講,當資料量這麼大,對我們資料處理有很多新的挑戰。

郭毅可:資料科學與科學資料

我們知道科學研究有三個主要要素,理論、計算、實驗。這三個理論是這樣的,從理論出發,我們可以建立模型。對這個模型的模拟可以産生資料。我們理論至上,對事件進行假設,并進行觀察,得到資料。我認為資料科學是當代科學的重要基礎和方法論。實際上資料科學在當代的用處極其廣泛,而且推動了許多技術的研究和發展。我們就是基于這個基礎上做努力。

華雲生:大資料研究的戰略思考

資料特性的多樣性,不同的應用有不同的特性,有些資料可能有規律的,有一些是沒有規律的。他們的概念,表示方法也不一樣,也有多樣性。資料的目标也有多樣性。資料的原因。不同的資料、不同的應用有不同的目标。算法的多樣性,有不同的算法。基建的多樣性,是以資料也有不同的地方。理論基礎多樣性。不像以前做做法有很好的規律、很好的算法。大資料其實是個現象。?現在從做大資料來講,很多沒有辦法從一個應用上面找出一個規律,找出一個方法,很容易應用到其他應用上。

方濱興:雲監控與雲加密——打造可信的雲

雲安全的四個層面,第一個是可靠的雲,能夠始終可靠地提供服務。安全雲,保障使用者及租戶在雲中不會因攻擊而受到損害。可信雲,保障雲服務商不會對租戶的運作進行侵害。客戶把資料傳到雲上?怎麼保障資訊的安全?這是一個很大的問題。雲加密,降低洩密風險。上網前把個人資訊送出給網絡才能上網,這叫上網實名制。不作為怎麼辦?我們能怎麼辦?無縫資料加密傳輸、支援任意雲端平台。雲監控,你不作為,不能亂作為,是以我要監督你,發現你是不是做了不該做的事情。

梅宏:對大資料熱潮的若幹反思

我們看到了很多資料應用的成功案例,在商業智能、在智能交通、在自然語言處理、在自動問答系統、下棋機器人等等。我想機器替代人做勞動、做體育、做計算到現在幫助人下棋,毫無疑問,還會繼續往下走。在這個意義下,我們對大資料高度重視。大資料的應用仍處于初級發展階段。現在的很多案例都很難被看作典型的大資料應用案例,很多都屬于初級階段。真正的大資料應用應該展現在資料挖掘的深度和多源(跨界)資料的融合的廣度,絕不是資料的“海量”,這才是所謂的大資料。

本文轉自d1net(轉載)

繼續閱讀