python第三方庫的意義_淺談python的第三方庫——pandas（一）

pandas作為python進行資料分析的常用第三方庫，它是基于numpy建立的，使得運用numpy的程式也能更好地使用pandas。

1 pandas資料結構

1.1 Series

注：由于pandas與numpy關系密切，是以在代碼中經常将二者一同導入使用。

上圖中，先利用numpy建立一個一維數組，再利用pandas的内置方法将其轉換為pandas的序列類型Series。可以看到，pandas會自動将原有資料轉換成一列，并添加行的索引。

1.2 DataFrame

pandas的第二種也是最具代表性的資料結構就是DataFrame。

python第三方庫的意義_淺談python的第三方庫——pandas（一）

顯然，DataFrame就是矩陣類型的資料，隻不過pandas中會給矩陣添加行列索引，以便使用與查找元素。

2 建立DataFrame

由于Series可以視為DataFrame的一種簡單情況，是以後面将主要介紹DataFrame，關于Series的情況可以類比過去。

從前一小節可以看到，pandas的資料可以通過運用内置方法轉換numpy建立的資料得到，但也可以直接在pandas庫内建立DataFrame。

python第三方庫的意義_淺談python的第三方庫——pandas（一）

建立DataFrame時，可以手動給資料添加行列名，否則pandas會自動添加形如“0，1，2，3”的行列名。

由于pandas基于numpy制作，是以numpy中的一些常用方法可以直接移植過來。

python第三方庫的意義_淺談python的第三方庫——pandas（一）

pandas中也有shape方法檢視矩陣大小。

3 查找DataFrame的元素

因為pandas中的矩陣允許自定義行列名，是以定位其中的元素分為如下幾種方式：使用行列名稱，使用行列位置，名稱位置混合。

3.1 行列名稱定位

python第三方庫的意義_淺談python的第三方庫——pandas（一）

3.2 行列位置定位

python第三方庫的意義_淺談python的第三方庫——pandas（一）

3.3 名稱位置混合定位

python第三方庫的意義_淺談python的第三方庫——pandas（一）

一般常用的還是前兩種定位手段，混合定位了解即可。

小結：作為pandas系列的開篇，本文就介紹到此，沿用numpy系列的模式，後面的博文将介紹pandas中關于DataFrame的常用方法。

繼續閱讀