天天看點

python第三方庫的意義_淺談python的第三方庫——pandas(一)

pandas作為python進行資料分析的常用第三方庫,它是基于numpy建立的,使得運用numpy的程式也能更好地使用pandas。

1 pandas資料結構

1.1 Series

注:由于pandas與numpy關系密切,是以在代碼中經常将二者一同導入使用。

python第三方庫的意義_淺談python的第三方庫——pandas(一)

上圖中,先利用numpy建立一個一維數組,再利用pandas的内置方法将其轉換為pandas的序列類型Series。可以看到,pandas會自動将原有資料轉換成一列,并添加行的索引。

1.2 DataFrame

pandas的第二種也是最具代表性的資料結構就是DataFrame。

python第三方庫的意義_淺談python的第三方庫——pandas(一)

顯然,DataFrame就是矩陣類型的資料,隻不過pandas中會給矩陣添加行列索引,以便使用與查找元素。

2 建立DataFrame

由于Series可以視為DataFrame的一種簡單情況,是以後面将主要介紹DataFrame,關于Series的情況可以類比過去。

從前一小節可以看到,pandas的資料可以通過運用内置方法轉換numpy建立的資料得到,但也可以直接在pandas庫内建立DataFrame。

python第三方庫的意義_淺談python的第三方庫——pandas(一)

建立DataFrame時,可以手動給資料添加行列名,否則pandas會自動添加形如“0,1,2,3”的行列名。

由于pandas基于numpy制作,是以numpy中的一些常用方法可以直接移植過來。

python第三方庫的意義_淺談python的第三方庫——pandas(一)

pandas中也有shape方法檢視矩陣大小。

3 查找DataFrame的元素

因為pandas中的矩陣允許自定義行列名,是以定位其中的元素分為如下幾種方式:使用行列名稱,使用行列位置,名稱位置混合。

3.1 行列名稱定位

python第三方庫的意義_淺談python的第三方庫——pandas(一)

3.2 行列位置定位

python第三方庫的意義_淺談python的第三方庫——pandas(一)

3.3 名稱位置混合定位

python第三方庫的意義_淺談python的第三方庫——pandas(一)

一般常用的還是前兩種定位手段,混合定位了解即可。

小結:作為pandas系列的開篇,本文就介紹到此,沿用numpy系列的模式,後面的博文将介紹pandas中關于DataFrame的常用方法。