天天看點

資料分析

matpotlib 

numpy 

pandas 

有崗位需求

是python資料科學的基礎

是機器學習課程的基礎

資料分析是适用的方法收集來大量資料時行分析

幫助人們作出判斷,以便采取适當行動

提出問題-->準備資料-->分析資料-->獲得結論-->成果可視化

                                                                        -->輔助決策

conda:data science package & environment manager 

建立環境

conda create --name python3 python=3

切換環境

windows:active python3

Liunx:source active python3 

jupyter notebook:一款程式設計、文檔、筆記展示軟體

啟動jupyter notebook

環境安裝

認識jupyter notebook

能将資料進行可視化,更直覺的呈現

使用資料更加客觀,更具說明力

matplotlib:最流行的python底層繪圖庫,主要給資料可視化圖表,名字取材于matlab,仿真matlab建構

matplotlib: axis軸,指的x或y這種坐标軸

每個紅色的點是坐标,把5個點的坐連接配接成一條線,組成一個折線圖

那麼到底如何把它通過代碼畫出來呢?

通過下面的小例子我們來看一下matplotlib該如何簡單的使用

假設一天中每隔兩小時(range(2,26,2))的氣溫(攝氏度)分别是

【15,13,14,5,17,20,25,26,26,27,22,18,15】

matplotlib基本要點

matplotlib的散點圖、直方圖、柱狀圖

更多的圖形工具

可以更多的設定

但是目前存在以下問題:

1、設定圖檔的大小(想要一個高清無碼大圖)

2、儲存到本地

3、描述資訊,比如x軸和y軸表示什麼,這個圖表示什麼

4、調整x或者y的刻度的間距

5、線條的樣條(比如顔色、透明色等)

6、标記出特殊的點(比如告訴别人最高點和最低點在哪裡)

7、給圖檔添加一個水印(防僞,防止盜用)

那麼問題來了:

如果清單A表示10點到12點的每一分鐘的氣溫,如何繪制折線圖觀察每分鐘氣溫變化情況。

a=[random.randint(20,35) for i in range(20) ]

為什麼無法顯示中文

matplotlib預設不支援中文字元,因為預設的英文顯示漢字

檢視

fc-list 檢視支援的字型

 fc-list :lang=zh  檢視支援的中文(冒号前面有空格)

那麼問題來了,如何修改matplotlib的預設字休?

執行個體示例:

假設在30歲的時候,根據自己的執行個體情況,統計出來了從11歲到30歲每年交的女(男)朋友的數量如清單a

請繪制出該資料的折線圖,以便分析自已的交女(男)朋友的數量走勢

a=[1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,2,1,1,1]

要求:

y軸表示個數

x軸表示歲數,比如11歲、12歲等

假設通過爬蟲擷取到了北京2016年3,10月份每天白天的最高氣溫(分别位于清單a,b)那麼此時如何尋找氣濁

a=[11,17,16,11,12,11,12,6,6,7,8,9,12,15,14,17,18,21,16,17,20,14,15,15,15,19,21,22,22,22,23]

b=[26,26,28,]

繼續閱讀