天天看點

資料分析基本概念

1 Anaconda

Anaconda包括Conda、Python以及一大堆安裝好的工具包,比如:numpy、pandas、matplotlib等。

Conda是一個開源的包、環境管理器(相當于centos裡面的yum),可以用于在同一個機器上安裝不同版本的軟體包及其依賴,并能夠在不同的環境之間切換。

虛拟環境管理

  • 建立虛拟環境

    conda create -n 虛拟環境名稱 python=版本号

  • 删除虛拟環境

    conda remove -n 虛拟環境名稱 --all

  • 激活(進入)虛拟環境

    activate 虛拟環境名稱

     windows環境

    source activate 虛拟環境名稱

     Linux環境
  • 離開虛拟環境

    deactivate 虛拟環境名稱

     windows環境

    source deactivate

     Linux環境

說明:

  • 當建立虛拟環境後,就會在Anaconda安裝目錄下的envs目錄下,建立虛拟環境相關的檔案。
  • 在Linux環境下,需要使用source,Windows需要省去source。
  • 建立虛拟環境後,虛拟環境中僅會安裝一些必須的軟體包,例如pip等。如果需要安裝Anaconda所有的庫,需要:

    conda create -n 虛拟環境名稱 python=版本号 anaconda

包管理

  • 安裝包

    conda install 包

  • 解除安裝包

    conda remove 包

  • 更新包

    conda update 包

  • 檢視包

    conda list

Anaconda Navigator

Anaconda Navigator是Anaconda提供的一款圖形化界面工具,我們可以友善的實作虛拟環境以及軟體包的管理。

Spyder

類似于Matlib的一款內建開發工具。提供代碼的編寫,變量的展示與檢視,代碼調試等豐富的功能。

2 Jupyter notebook

Jupyter notebook是一款開源的Web應用程式,該應用程式可以用來建立并共享實施代碼,方程式,可視化以及文本說明。Jupyter notebook基于IPython解釋器,是一個基于Web的互動式計算環境。從不正規的角度講,可以将Jupyter notebook看成是一個Web版的IPython,實際上,jupyter notebook之前的名稱就叫做IPython notebook。

啟動Jupyter

啟動jupyter可以使用指令:

jupyter notebook

即可。當執行指令後,就會啟動jupyter服務,同時打開浏覽器頁面,顯示jupyter的home頁面。預設情況下,會使用目前所在的目錄作為根目錄。

上傳與建立檔案

  • 如果我們需要打開的檔案不在目前的主目錄下,我們可以點選upload進行上傳。
  • 我們也可以點選new建立檔案或目錄。

修改預設的主目錄

home頁面會顯示在目前主目錄下的檔案以及路徑(檔案夾),我們可以直接打開檢視檔案或進入目錄。如果我們需要打開的檔案不在根目錄下,但又不想上傳,我們可以修改啟動jupyter後預設的主目錄:

  1. 切換到指定目錄後,啟動jupyter服務。
  2. 在啟動jupyter服務時,同時使用--notebook-dir=主目錄。

單元格

jupyter notebook文檔由一些列單元格組成,我們可以在單元格中輸入相關的代碼或者說明文字。單元格我們用的主要有以下二種類型:

  • code 代碼單元格,用來編寫程式。
  • Markdown 支援Markdown文法的單元格,用來編寫描述程式的文字。

指令模式與編輯模式

此外,jupyter notebook的單元格分為兩種模式:

  • 指令模式 單元格處于選中狀态,此時單元格左側為粗藍色線條,其餘為細灰色線條。
  • 編輯模式 單元格處于編輯狀态,此時單元格左側為粗綠色線條,其餘為細綠色線條。

常用快捷鍵

jupyter notebook常用的快捷鍵如下:

指令模式

  • Y 單元格轉換成code類型。
  • M 單元格轉換成Markdown類型。
  • R 單元格轉換成Raw NBConvert類型。
  • Enter 進入編輯模式。
  • A 在目前單元格上方插入新單元格。
  • B 在目前單元格下方插入新單元格。
  • C 複制目前單元格。
  • D(兩次) 删除目前單元格。
  • V 粘貼到目前單元格的下方。
  • Shift + V 粘貼到目前單元格的上方。
  • Z 撤銷删除。

編輯模式

  • Tab 代碼補全
  • Shift + Tab 顯示doc文檔資訊。
  • Esc 進入指令模式。

通用模式

  • Ctrl + Enter 運作單元格,然後該單元格處于指令模式。
  • Shift + Enter 運作單元格,并切換到下一個單元格,如果下方沒有單元格,則會建立一個單元格。
  • Alt + Enter 運作單元格,并在下方新增一個單元格。
print("hello world")      
hello world      
print("再執行下一個單元格")      
再執行下一個單元格
      

Markdown

Markdown是一種使用純文字格式文法的輕量級标記語言,它允許人們使用易讀易寫的純文字格式編寫文檔,然後轉換成格式豐富的HTML頁面。Markdown同時也支援HTML标簽。在Markdown類型的單元格中,支援使用Markdown文法與LaTex數學公式。

标題

标題可以使用1 ~ 6個

#

跟随一個空格來表示1 ~ 6級标題。

無序清單

無序清單可以使用

*

-

+

後跟随一個空格來表示。也可以通過不同的符号混合表示多級清單。

有序清單

有序清單使用數字跟随一個點(.)表示。

一級标題 1~6個#号,表示1~6級标題。

你喜歡的語言是:

  • 英語
    • 3214
      • 421412
  • 法語
  • 漢語

課堂要求:

  1. 不遲到
  2. 不早退
  3. 不睡覺

換行

使用兩個或以上的空白符。

粗體 / 斜體

使用

**

__

包圍的字型為粗體。使用

*

_

包圍的字型為斜體。

思考:怎麼表示粗斜體?

删除線

使用

~~

包圍的字型會帶有删除線效果。

代碼

可以使用`代碼`來标記代碼部分。

使用```(或Tab縮進)來标記代碼塊。在```後面加上相應的語言,可以使代碼的關鍵字高亮顯示。

寫入一行内容。

換一行顯示。

粗體

粗體

斜體

斜體

粗斜體

粗斜體

删除線

print("hello world")

print("123123")
print("34324")           

引用

使用

>

字首來引用一段内容。

分割線

使用

***

或者

---

來加入分割線。

連結與圖檔

圖檔:

![圖像說明](圖檔連結位址 "圖檔說明資訊")

連結:

[文字](連結位址)

這是引用的内容

華麗的分割線

資料分析基本概念

點選我通路百度

LaTex

LaTex是一個檔案準備系統(document preparation system),用來進行排版,支援複雜的數學公式表示。LaTex公式使用

$ //公式 $

$$ //公式 $$

進行界定。 在Markdown類型的單元格中,支援LaTex數學公式。

LaTex線上編輯:http://latex.codecogs.com/eqneditor/editor.php