天天看點

了解大資料的特點、來源與資料呈現方式

本作業要求來自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2639

一、.浏覽2019春節各種大資料分析報告

  • 這世間,再無第二個國家有能力承載如此龐大的人流量。http://www.sohu.com/a/290025769_313993
  • 春節人口遷徙大資料報告!http://www.sohu.com/a/293854116_679156
  • 春節大資料:消費首破萬億 最佳伴手禮竟是教輔書?http://news.163.com/19/0211/19/E7OPDBBU0001899N.html
  • 大資料中的春節http://www.xinhuanet.com/politics/2019-02/13/c_1124110671.htm
  • 春節年味大資料都有啥 90後年味就是搶紅包http://news.zol.com.cn/708/7087625.html
  • 春節大資料出爐http://www.sohu.com/a/223982938_100012490
  • 2019年微信春節大資料:收發紅包人數超8億http://www.hnbstx.com/zixun/caijingzawen/20190212/124158.html

二、這些分析所采用資料的來源

1、春運:春運的資料都是呈現在旅途上,是以一般資料會來自于鐵路、航空、水運等交通運輸部門,可以采用各種平台上春運售票的基本資訊、機器和傳感器資料如旅客的定位/ GPS 系統資料等來分析

2、購物:購物大資料主要還是來自于網上的購物平台,如天貓、淘寶等,由于資訊量龐大,是分析購物大資料的資訊必要來源

3、消費:分析人們的消費習慣的資訊可以來自于支付寶等支付平台,它可以對消費資訊進行一個分類,能更好的擷取到有益的資訊

4、娛樂:春節的娛樂方式如旅遊、看電影之類的活動,主要可以從美團、貓眼等各種APP或者政府機構、非營利組織和企業免費提供的資料等上面擷取

5、微信:春節微信上面的資訊發送量主要來自于移動通信等上面得到的資料

三、大資料的呈現方式

大資料主要可以有以下幾種呈現方式:

資料統計圖、資料圖形化、資料統計表、資料可視化、資料關系圖形化等

四、大資料的特點

大資料的特點主要是四個“V”:

1、 資料量大(Volume):有大量的資料需要總結處理。

2、 處理速度快(Velocity):市場變化快,是以資料量對速度要求有些“大”。

3、資料類型繁多(Variety):不同的資料源,非結構化資料越來越多,需要進行清洗,整理,篩選等操作。

4、價值密度低(Value):資料樣本不全面資料可能會失真,可以通過更多的資料達到更真實全面的回報。

五、大資料對思維方式有何影響

1、資料量的變化:人們處理的資料從樣本資料變成全部資料;

2、宏觀處理資料:由于是擷取到全樣本資料,人們不得不接受資料的混雜性,而放棄對精确性的追求;

3、關注資料關系:人類通過對大資料的處理,放棄對因果關系的渴求,轉而關注相關關系。

六、準備、安裝python程式設計環境

1、安裝Python環境、

了解大資料的特點、來源與資料呈現方式

2、安裝PyCharm軟體

了解大資料的特點、來源與資料呈現方式

七、設計完成一個Mad Libs遊戲

print('~~ss講故事時間~~')
tq=input('請輸入天氣情況:')
name=input('請輸入故事主人公名字:')
pet=input('請輸入一隻動物名稱:')
thing=input('請輸入一種東西名稱:')
eat=input('請輸入一種食物:')
xq=input('請輸入一種心情:')

print('今天是{},{}帶着他的寶貝{}去爬山,沿途看到了很多{},而且還吃了很多{},{}也很喜歡,是以今天{}的心情很{}!'.format(tq,name,pet,thing,eat,pet,name,xq))      

完成截圖:

了解大資料的特點、來源與資料呈現方式