天天看點

統計學學習筆記-第三周1. 前言2. Jupyter Notebook介紹2.1. 什麼是Jupyter Notebook2.2. 如何安裝Jupyter Notebook3. 執行腳本

1. 前言

本周學習計劃是對于前兩周學習的統計學理論基礎上,将描述性統計理論進行python實踐。

前兩周其實就是看了下統計學基礎理論和同步視訊,補充基礎知識,順便在不是很了解的基礎上安裝了python,是以本周實踐起來雖然還是有困難,但是上手容易了許多。

2. Jupyter Notebook介紹

2.1. 什麼是Jupyter Notebook

首先,先簡單介紹一下jupyter,前兩周隻是在前人經驗上,安裝了Anaconda,然後進入了jupyter編譯環境,還沒有在這個編譯環境下調試過代碼,其實由于是第一次接觸python,也不知道為什麼要安裝這個,為什麼一定是這個,這個和python的關系又是什麼?其實腦袋裡面是有很多問号的,本周通過網上查找資料和翻閱書籍,将相關理論做了一個整理。

Jupyter Notebook(此前被稱為 IPython notebook)是一個互動式筆記本,支援運作 40 多種程式設計語言。它的本質是一個 Web 應用程式,便于建立和共享文學化程式文檔,支援實時代碼,數學方程,可視化和 markdown。 用途包括:資料清理和轉換,數值模拟,統計模組化,機器學習等等,是資料科學/機器學習社群内一款非常流行的工具。

簡單來說就是它提供了一個環境,你可以在其中記錄代碼,運作代碼,檢視結果,可視化資料并在檢視輸出結果。這些特性使其成為一款執行端到端資料科學工作流程的便捷工具 ,可以用于資料清理,統計模組化,建構和訓練機器學習模型,可視化資料以及許多其他用途。

2.2. 如何安裝Jupyter Notebook

要使用Jupyter Notebook,首先你要確定自己已經安裝了Python(2.7/3.3或更高),這是必備條件。

安裝Anaconda,可以打包安裝Python和Anaconda,是以第一步是安裝Anaconda。

其實除了提到的兩個工具,Anaconda還包含資料科學和機器學習中經常需要用到的各種軟體包,隻需下載下傳、解壓、安裝,所有工具就都一步到位了。

下載下傳位址:https://jupyter.readthedocs.io/en/latest/install.html

安裝完成後,如果要運作Jupyter Notebook

  1. 在控制台輸入以下指令:jupyter notebook
  2. 在開始裡面選擇Anaconda3(64位)->Jupyter Notebook

上面任意一種方法,都可以讓電腦打開預設浏覽器,網址為http:// localhost:8888/tree。

參考網址:http://www.elecfans.com/d/687743.html

相關快捷鍵:

Shift+Enter : 運作本單元,選中下個單元

Ctrl+Enter : 運作本單元

Alt+Enter : 運作本單元,在其下插入新單元

Y:單元轉入代碼狀态

M:單元轉入markdown狀态

A :在上方插入新單元

B:在下方插入新單元

X:剪切選中的單元

Shift +V:在上方粘貼單元

在執行沒有輸出的語句的時候,執行完後界面沒有變化,例如下面的導入庫的操作,執行後沒有變化,不知道有沒有執行成功:

統計學學習筆記-第三周1. 前言2. Jupyter Notebook介紹2.1. 什麼是Jupyter Notebook2.2. 如何安裝Jupyter Notebook3. 執行腳本

咨詢完學習小組的小夥伴們後,他們告訴我 In [*]代表正在執行,In []代表沒有執行,In [1] 裡面帶數字的說明已經成功執行完成,試了下果然是這樣。

3. 執行腳本

由于自己學習時間有限,是以我是緊跟老師給的學習計劃及給的參考材料進行參考學習,是以第一遍的時候沒有太多的思考,更多的是執行,下面更多就是列一下自己的執行結果,可能在第四周的時候會有點感悟。

3.1. 導入基礎庫:

統計學學習筆記-第三周1. 前言2. Jupyter Notebook介紹2.1. 什麼是Jupyter Notebook2.2. 如何安裝Jupyter Notebook3. 執行腳本

Python最基礎的資料類型包括數組、清單、字典比較常見的。而Numpy和Pandas的資料類型是在基礎資料類型上建立,彼此相關,又彼此不同。np對象最重要特點向量化運算,pandas對象最重要特點是字典和清單混合。

  • NumPy

    是高性能科學計算和資料分析的基礎包。部分功能如下:

  • Pandas

    pandas 是基于NumPy 的一種工具,該工具是為了解決資料分析任務而建立的。Pandas 納入了大量庫和一些标準的資料模型,提供了高效地操作大型資料集所需的工具。pandas提供了大量能使我們快速便捷地處理資料的函數和方法。

  • 資料可視化matplotlib.pyplot

3.2. 導入excel資料

統計學學習筆記-第三周1. 前言2. Jupyter Notebook介紹2.1. 什麼是Jupyter Notebook2.2. 如何安裝Jupyter Notebook3. 執行腳本

3.3. 描述性統計實踐

統計學學習筆記-第三周1. 前言2. Jupyter Notebook介紹2.1. 什麼是Jupyter Notebook2.2. 如何安裝Jupyter Notebook3. 執行腳本
統計學學習筆記-第三周1. 前言2. Jupyter Notebook介紹2.1. 什麼是Jupyter Notebook2.2. 如何安裝Jupyter Notebook3. 執行腳本
統計學學習筆記-第三周1. 前言2. Jupyter Notebook介紹2.1. 什麼是Jupyter Notebook2.2. 如何安裝Jupyter Notebook3. 執行腳本

繼續閱讀