1. 前言
本周學習計劃是對于前兩周學習的統計學理論基礎上,将描述性統計理論進行python實踐。
前兩周其實就是看了下統計學基礎理論和同步視訊,補充基礎知識,順便在不是很了解的基礎上安裝了python,是以本周實踐起來雖然還是有困難,但是上手容易了許多。
2. Jupyter Notebook介紹
2.1. 什麼是Jupyter Notebook
首先,先簡單介紹一下jupyter,前兩周隻是在前人經驗上,安裝了Anaconda,然後進入了jupyter編譯環境,還沒有在這個編譯環境下調試過代碼,其實由于是第一次接觸python,也不知道為什麼要安裝這個,為什麼一定是這個,這個和python的關系又是什麼?其實腦袋裡面是有很多問号的,本周通過網上查找資料和翻閱書籍,将相關理論做了一個整理。
Jupyter Notebook(此前被稱為 IPython notebook)是一個互動式筆記本,支援運作 40 多種程式設計語言。它的本質是一個 Web 應用程式,便于建立和共享文學化程式文檔,支援實時代碼,數學方程,可視化和 markdown。 用途包括:資料清理和轉換,數值模拟,統計模組化,機器學習等等,是資料科學/機器學習社群内一款非常流行的工具。
簡單來說就是它提供了一個環境,你可以在其中記錄代碼,運作代碼,檢視結果,可視化資料并在檢視輸出結果。這些特性使其成為一款執行端到端資料科學工作流程的便捷工具 ,可以用于資料清理,統計模組化,建構和訓練機器學習模型,可視化資料以及許多其他用途。
2.2. 如何安裝Jupyter Notebook
要使用Jupyter Notebook,首先你要確定自己已經安裝了Python(2.7/3.3或更高),這是必備條件。
安裝Anaconda,可以打包安裝Python和Anaconda,是以第一步是安裝Anaconda。
其實除了提到的兩個工具,Anaconda還包含資料科學和機器學習中經常需要用到的各種軟體包,隻需下載下傳、解壓、安裝,所有工具就都一步到位了。
下載下傳位址:https://jupyter.readthedocs.io/en/latest/install.html
安裝完成後,如果要運作Jupyter Notebook
- 在控制台輸入以下指令:jupyter notebook
- 在開始裡面選擇Anaconda3(64位)->Jupyter Notebook
上面任意一種方法,都可以讓電腦打開預設浏覽器,網址為http:// localhost:8888/tree。
參考網址:http://www.elecfans.com/d/687743.html
相關快捷鍵:
Shift+Enter : 運作本單元,選中下個單元
Ctrl+Enter : 運作本單元
Alt+Enter : 運作本單元,在其下插入新單元
Y:單元轉入代碼狀态
M:單元轉入markdown狀态
A :在上方插入新單元
B:在下方插入新單元
X:剪切選中的單元
Shift +V:在上方粘貼單元
在執行沒有輸出的語句的時候,執行完後界面沒有變化,例如下面的導入庫的操作,執行後沒有變化,不知道有沒有執行成功:
咨詢完學習小組的小夥伴們後,他們告訴我 In [*]代表正在執行,In []代表沒有執行,In [1] 裡面帶數字的說明已經成功執行完成,試了下果然是這樣。
3. 執行腳本
由于自己學習時間有限,是以我是緊跟老師給的學習計劃及給的參考材料進行參考學習,是以第一遍的時候沒有太多的思考,更多的是執行,下面更多就是列一下自己的執行結果,可能在第四周的時候會有點感悟。
3.1. 導入基礎庫:
Python最基礎的資料類型包括數組、清單、字典比較常見的。而Numpy和Pandas的資料類型是在基礎資料類型上建立,彼此相關,又彼此不同。np對象最重要特點向量化運算,pandas對象最重要特點是字典和清單混合。
-
NumPy
是高性能科學計算和資料分析的基礎包。部分功能如下:
-
Pandas
pandas 是基于NumPy 的一種工具,該工具是為了解決資料分析任務而建立的。Pandas 納入了大量庫和一些标準的資料模型,提供了高效地操作大型資料集所需的工具。pandas提供了大量能使我們快速便捷地處理資料的函數和方法。
- 資料可視化matplotlib.pyplot