作業要求源自https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/2620
1.分析所采用資料的來源有哪些?
浏覽了2019春節各種大資料分析報告,資料的來源大概分為以下幾類:
- 交易資料。包括POS機資料、信用卡刷卡資料、電子商務資料、網際網路點選資料、“企業資源規劃”(ERP)系統資料、銷售系統資料、客戶關系管理(CRM)系統資料、公司的生産資料、庫存資料、訂單資料、供應鍊資料等。
- 移動通訊資料。能夠上網的智能手機等移動裝置越來越普遍。移動通信裝置記錄的資料量和資料的立體完整度,常常優于各家網際網路公司掌握的資料。移動裝置上的軟體能夠追蹤和溝通無數事件,從運用軟體儲存的交易資料(如搜尋産品的記錄事件)到個人資訊資料或狀态報告事件(如地點變更即報告一個新的地理編碼)等。
- 機器和傳感器資料。來自感應器、量表和其他設施的資料、定位/GPS系統資料等。來自物聯網的資料可以用于建構分析模型,連續監測預測性行為(如當傳感器值表示有問題時進行識别),提供規定的指令(如警示技術人員在真正出問題之前檢查裝置)等。
- 網際網路上的“開放資料”來源。如政府機構,非營利組織和企業免費提供的資料。
- 人為資料即通過人類行為産生的資料。人為資料包括電子郵件、文檔、圖檔、音頻、視訊,以及通過微信、部落格、推特、維基、臉書等社交媒體産生的資料流。這些資料大多數為非結構性資料,需要用文本分析功能進行分析。
2.大資料的呈現方式有哪些?
大資料一般借助于圖形化的手段,清晰、快捷有效的傳達與溝通資訊。比較常用的呈現方式大概有以下幾個分類:
- 名額值圖形化。(例如柱狀、圓環和曲線圖等)

- 顔色可視化。
- 關系圖形化。
- 關鍵詞可視化。
3.大資料的特點是什麼?對思維方式有何影響?
大資料的特點是大量化、快速化、多樣化、價值化四種特點。
對思維方式有全樣而非抽樣、效率而非明确和相關而非因果三種影響。
- 全樣而非抽樣。就是直接擷取總體資訊,不必通過樣本參數去推斷總體參數。
- 效率而非明确。在樣本=總體的大資料時代(有多少偏差就是多少偏差而不會被放大),快速獲得一個大概的輪廓和發展脈絡,就要比嚴格的精确性要重要得多。
- 相關而非因果。因為無法控制無關因素,是以隻能得到相關結論,而非因果。
4.python輸入輸出程式設計練習
print('大富翁遊戲開始!')
name1=input('請輸入玩家1的名字:')
name2=input('請輸入玩家2的名字:')
name3=input('請輸入玩家3的名字:')
print('{}運氣與謀略加成,如日中天,成為國内的房地産産業第一巨頭。\n{}家道中落,投資失敗,終日靠救濟金過活。\n{}早年投資幾套熱門地段房産,外租别人賺點小錢,過上小康生活。'.format(name1,name2,name3))
具體代碼
下面為程式結果截圖: