
Pandas 是 Python 語言的一個擴充程式庫,用于資料分析。
Pandas 是一個開放源碼、BSD 許可的庫,提供高性能、易于使用的資料結構和資料分析工具。
Pandas 名字衍生自術語 "panel data"(面闆資料)和 "Python data analysis"(Python 資料分析)。
Pandas 一個強大的分析結構化資料的工具集,基礎是 Numpy(提供高性能的矩陣運算)。
Pandas 可以從各種檔案格式比如 CSV、JSON、SQL、Microsoft Excel 導入資料。
Pandas 可以對各種資料進行運算操作,比如歸并、再成形、選擇,還有資料清洗和資料加工特征。
Pandas 廣泛應用在學術、金融、統計學等各個資料分析領域。
在開學習 Pandas 教程之前,我們需要具備基本的 Python 基礎,如果你對 Python還不了解,可以閱讀我們的教程:
Python 2.x 版本
Python 3.x 版本
Pandas 的主要資料結構是 Series (一維資料)與 DataFrame(二維資料),這兩種資料結構足以處理金融、統計、社會科學、工程等領域裡的大多數典型用例。
Series 是一種類似于一維數組的對象,它由一組資料(各種Numpy資料類型)以及一組與之相關的資料标簽(即索引)組成。
DataFrame 是一個表格型的資料結構,它含有一組有序的列,每列可以是不同的值類型(數值、字元串、布爾型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 組成的字典(共同用一個索引)。
Pandas 官網 https://pandas.pydata.org/
Pandas 源代碼:https://github.com/pandas-dev/pandas