天天看點

Pandas 教程

你好,我是悅創。

pandas 是一款開放源碼的 bsd 許可的 python 庫,為 python 程式設計語言提供了高性能,易于使用的資料結構和資料分析工具。pandas 用于廣泛的領域,包括金融,經濟,統計,分析等學術和商業領域。在本教程中,我們将學習 python pandas 的各種功能以及如何在實踐中使用它們。

python pandas的官方網站是: http://pandas.pydata.org/ ,打開後如下所示 -

Pandas 教程

pandas 是一個開放源碼的 python 庫,它使用強大的資料結構提供高性能的資料操作和分析工具。它的名字:pandas 是從 panel data - 多元資料的計量經濟學( an econometrics from multidimensional data)。

2008 年,為滿足需要高性能,靈活的資料分析工具,開發商 wes mckinney 開始開發 pandas。

在 pandas 之前,python 主要用于資料遷移和準備。它對資料分析的貢獻更小。 pandas 解決了這個問題。 使用 pandas 可以完成資料處理和分析的五個典型步驟,而不管資料的來源 - 加載,準備,操作,模型和分析。

python pandas用于廣泛的領域,包括金融,經濟,統計,分析等學術和商業領域。

快速高效的 dataframe 對象,具有預設和自定義的索引。

将資料從不同檔案格式加載到記憶體中的資料對象的工具。

丢失資料的資料對齊和綜合處理。

重組和擺動日期集。

基于标簽的切片,索引和大資料集的子集。

可以删除或插入來自資料結構的列。

按資料分組進行聚合和轉換。

高性能合并和資料加入。

時間序列功能。

本教程為準備學習 pandas 基礎知識和各種功能的人員而做準備的。它對資料清理和分析的人員特别有用。 完成本教程之後,将發現自己處于适度的專業知識水準,可以從中獲得更高水準的專業知識。

要求對計算機程式設計術語有一個基本的了解。 對任何程式設計語言的基本了解是一個加分。pandas庫使用numpy的大部分功能。建議在繼續本教程之前,先閱讀 numpy 的教程( python科學計算:用numpy快速處理資料 )。之後也會出 numpy 系列專欄。

繼續閱讀