天天看點

了解大資料的特點、來源與資料呈現方式

作業要求來源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2639

1.浏覽2019春節各種大資料分析報告,例如:

  • 這世間,再無第二個國家有能力承載如此龐大的人流量。
  • http://www.sohu.com/a/290025769_313993
  • 春節人口遷徙大資料報告!
  • http://www.sohu.com/a/293854116_679156
  • 春節大資料:消費首破萬億 最佳伴手禮竟是教輔書?
  • http://news.163.com/19/0211/19/E7OPDBBU0001899N.html
  • 大資料中的春節
  • http://www.xinhuanet.com/politics/2019-02/13/c_1124110671.htm
  • 春節年味大資料都有啥 90後年味就是搶紅包
  • http://news.zol.com.cn/708/7087625.html
  • 春節大資料出爐
  • http://www.sohu.com/a/223982938_100012490
  • 2019年微信春節大資料:收發紅包人數超8億
  • http://www.hnbstx.com/zixun/caijingzawen/20190212/124158.html

2.分析所采用資料的來源有哪些?

來源于交易資料,移動通信資料,人為資料,機器和傳感器資料,網際網路上的開放資料等等。

3.大資料的呈現方式有哪些?

①、面積&尺寸可視化對同一類圖形(例如柱狀、圓環和蜘蛛圖等)的長度、高度或面積加以差別,來清晰的表達不同名額對應的名額值之間的對比。

②、顔色可視化,通過顔色的深淺來表達名額值的強弱和大小,是資料可視化設計的常用方法,使用者一眼看上去便可整體的看出哪一部分名額的資料值更突出。

③、圖形可視化在我們設計名額及資料時,使用有對應實際含義的圖形來結合呈現,會使資料圖表更加生動的被展現,更便于使用者了解圖表要表達的主題。

④、地域空間可視化當名額資料要表達的主題跟地域有關聯時,我們一般會選擇用地圖為大背景。

⑤、概念可視化通過将抽象的名額資料轉換成我們熟悉的容易感覺的資料時,使用者便更容易了解圖形要表達的意義。

4.大資料的特點是什麼?對思維方式有何影響?

特點:海量性;高速性;易變性;多樣性;價值型。

對思維方式的影響:

①全樣而非抽樣

谷歌可以提供谷歌流感趨勢的原因就在于它幾乎覆寫了7成以上的北美搜尋市場,而在這些資料中,已經完全沒有必要去抽樣調查這些資料:資料倉庫,所有的記錄都在那裡躺着等待人們的挖掘和分析。

②效率而非精确

精确的計算是以時間消耗為代價的。在小資料時代,追求精确是為了避免放大的偏差而不得已為之(設想一下,在一個總樣本為1億人口随機抽取1000人,如果在1000人上的運算出現錯誤的話,那麼放大到1億中會有多大的偏差)

但在樣本=總體的大資料時代(有多少偏差就是多少偏差而不會被放大),快速獲得一個大概的輪廓和發展脈絡,就要比嚴格的精确性要重要得多。

③相關而非因果

舍恩伯格認為,大資料時代隻需要知道是什麼,而無需知道為什麼,就像亞馬遜推薦算法一樣,知道喜歡A的人很可能喜歡B但卻不知道其中的原因。

5.準備、安裝python程式設計環境

1、安裝Python環境

2、安裝PyCharm軟體

6.簡單的輸入輸出程式設計練習

設計完成一個Mad Libs遊戲:

1).創造一個讓人歡樂的有趣的故事;

2).提示夥伴輸入相應類别的詞;

3).将故事完整地輸出。

了解大資料的特點、來源與資料呈現方式
了解大資料的特點、來源與資料呈現方式