天天看點

了解大資料的特點、來源與資料呈現方式

1.這些分析所采用資料的來源是什麼?

(1)交易軟體産生的交易資料

(2)移動通訊裝置記錄的資料

(3)人為資料

2.大資料的呈現方式有哪些?

大資料采用可視化的呈現方式;分為:名額值圖形化,名額關系圖形化,時間和空間可視化。

3.大資料的特點是什麼?結合大資料應用案例,分析大資料對思維方式有何影響?

大資料有四個特點:Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價值)。

(1)大資料的特征首先就展現為“大”,從先Map3時代,一個小小的MB級别的Map3就可以滿足很多人的需求,然而随着時間的推移,存儲機關從過去的GB到TB,乃至現在的PB、EB級别。随着資訊技術的高速發展,資料開始爆發性增長。社交網絡(微網誌、推特、臉書)、移動網絡、各種智能工具,服務工具等,都成為資料的來源。淘寶網近4億的會員每天産生的商品交易資料約20TB;臉書約10億的使用者每天産生的日志資料超過300TB。迫切需要智能的算法、強大的資料處理平台和新的資料處理技術,來統計、分析、預測和實時處理如此大規模的資料。

(2)廣泛的資料來源,決定了大資料形式的多樣性。任何形式的資料都可以産生作用,目前應用最廣泛的就是推薦系統,如淘寶,網易雲音樂、今日頭條等,這些平台都會通過對使用者的日志資料進行分析,進而進一步推薦使用者喜歡的東西。日志資料是結構化明顯的資料,還有一些資料結構化不明顯,例如圖檔、音頻、視訊等,這些資料因果關系弱,就需要人工對其進行标注。

(3)大資料的産生非常迅速,主要通過網際網路傳輸。生活中每個人都離不開網際網路,也就是說每天個人每天都在向大資料提供大量的資料。并且這些資料是需要及時處理的,因為花費大量資本去存儲作用較小的曆史資料是非常不劃算的,對于一個平台而言,也許儲存的資料隻有過去幾天或者一個月之内,再遠的資料就要及時清理,不然代價太大。基于這種情況,大資料對處理速度有非常嚴格的要求,伺服器中大量的資源都用于處理和計算資料,很多平台都需要做到實時分析。資料無時無刻不在産生,誰的速度更快,誰就有優勢。

(4)這也是大資料的核心特征。現實世界所産生的資料中,有價值的資料所占比例很小。相比于傳統的小資料,大資料最大的價值在于通過從大量不相關的各種類型的資料中,挖掘出對未來趨勢與模式預測分析有價值的資料,并通過機器學習方法、人工智能方法或資料挖掘方法深度分析,發現新規律和新知識,并運用于農業、金融、醫療等各個領域,進而最終達到改善社會治理、提高生産效率、推進科學研究的效果。

大資料塑造人類向前發展的方式,影響我們的生活方式,購物方式,甚至影響我們的行為方式。

4.設計完成一個Mad Libs遊戲:

1).創造一個讓人歡樂的有趣的故事;

2).提示夥伴輸入相應類别的詞;

3).将故事完整地輸出。

代碼截圖:

了解大資料的特點、來源與資料呈現方式

運作:

了解大資料的特點、來源與資料呈現方式