1. Introduction

PIL(Python Image Library)是python的第三方圖像處理庫，但是由于其強大的功能與衆多的使用人數，幾乎已經被認為是python官方圖像處理庫了。其官方首頁為: PIL 。 PIL曆史悠久，原來是隻支援python2.x的版本的，後來出現了移植到python3的庫 pillow ,pillow号稱是 `friendly fork for PIL` ,其功能和PIL差不多，但是支援python3。本文主要介紹PIL那些最常用的特性與用法,主要參考自: http://www.effbot.org/imagingbook 。

2. What PIL can do?

PIL可以做很多和圖像處理相關的事情:

圖像歸檔(Image Archives)。PIL非常适合于圖像歸檔以及圖像的批處理任務。你可以使用PIL建立縮略圖，轉換圖像格式，列印圖像等等。
圖像展示(Image Display)。PIL較新的版本支援包括Tk PhotoImage，BitmapImage還有Windows DIB等接口。PIL支援衆多的GUI架構接口，可以用于圖像展示。
圖像處理(Image Processing)。PIL包括了基礎的圖像處理函數，包括對點的處理，使用衆多的卷積核(convolution kernels)做過濾(filter),還有顔色空間的轉換。PIL庫同樣支援圖像的大小轉換，圖像旋轉，以及任意的仿射變換。PIL還有一些直方圖的方法，允許你展示圖像的一些統計特性。這個可以用來實作圖像的自動對比度增強，還有全局的統計分析等。

3. How to use PIL?

3.1 Image class

Image類是PIL中的核心類，你有很多種方式來對它進行初始化，比如從檔案中加載一張圖像，處理其他形式的圖像，或者是從頭創造一張圖像等。下面是PIL Image類中常用的方法:

open(filename,mode)(打開一張圖像)。下面的代碼示範了如何從檔案打開一張圖像:

>>> from PIL import Image
>>> Image.open("dog.jpg","r")
<PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=296x299 at 0x7F62BDB5B0F0
>
>>> im = Image.open("dog.jpg","r")
>>> print(im.size,im.format,im.mode)
(296, 299) JPEG RGB

Image.open

傳回一個Image對象，該對象有

size,format,mode

等屬性，其中

size

表示圖像的寬度和高度(像素表示);

format

表示圖像的格式,常見的包括JPEG,PNG等格式;

mode

表示圖像的模式，定義了像素類型還有圖像深度等，常見的有RGB,HSV等。一般來說'L'(luminance)表示灰階圖像,'RGB'表示真彩圖像,'CMYK'表示預先壓縮的圖像。一旦你得到了打開的Image對象之後，就可以使用其衆多的方法對圖像進行處理了，比如使用

im.show()

可以展示上面得到的圖像。

save(filename,format)(儲存指定格式的圖像)

>>> im.save("dog.png",'png')

上面的代碼将圖像重新儲存成png格式。

thumbnail(size,resample)(建立縮略圖)

>>> im.thumbnail((50,50),resample=Image.BICUBIC)
>>> im.show()

上面的代碼可以建立一個指定大小(size)的縮略圖,需要注意的是，thumbnail方法是原地操作，傳回值是None。第一個參數是指定的縮略圖的大小，第二個是采樣的，有

Image.BICUBIC

，

PIL.Image.LANCZOS

PIL.Image.BILINEAR

PIL.Image.NEAREST

這四種采樣方法。預設是

Image.BICUBIC

crop(box)(裁剪矩形區域)

>>> im = Image.open("dog.jpg","r")
>>> box = (100,100,200,200)
>>> region = im.crop(box)
>>> region.show()
im.crop()

上面的代碼在im圖像上裁剪了一個box矩形區域，然後顯示出來。box是一個有四個數字的元組(upper_left_x,upper_left_y,lower_right_x,lower_right_y),分别表示裁剪矩形區域的左上角x,y坐标,右下角的x,y坐标,規定圖像的最左上角的坐标為原點(0,0),寬度的方向為x軸，高度的方向為y軸，每一個像素代表一個坐标機關。crop()傳回的仍然是一個Image對象。

transpose(method)(圖像翻轉或者旋轉)

>>> im_rotate_180 = im.transpose(Image.ROTATE_180)
>>> im_rotate_180.show()

上面的代碼将im逆時針旋轉180°，然後顯示出來,

method

是transpose的參數，表示選擇什麼樣的翻轉或者旋轉方式，可以選擇的值有:

- Image.FLIP_LEFT_RIGHT,表示将圖像左右翻轉

- Image.FLIP_TOP_BOTTOM,表示将圖像上下翻轉

- Image.ROTATE_90,表示将圖像逆時針旋轉90°

- Image.ROTATE_180,表示将圖像逆時針旋轉180°

- Image.ROTATE_270,表示将圖像逆時針旋轉270°

- Image.TRANSPOSE,表示将圖像進行轉置(相當于順時針旋轉90°)

- Image.TRANSVERSE,表示将圖像進行轉置,再水準翻轉

paste(region,box,mask)(将一個圖像粘貼到另一個圖像)

>>> im.paste(region,(100,100),None)
>>> im.show()

上面的代碼将region圖像粘貼到左上角為(100,100)的位置。region是要粘貼的Image對象,box是要粘貼的位置，可以是一個兩個元素的元組，表示粘貼區域的左上角坐标,也可以是一個四個元素的元組，表示左上角和右下角的坐标。如果是四個元素元組的話,box的size必須要和region的size保持一緻，否則将會被convert成和region一樣的size。

split()(顔色通道分離)

>>> r,g,b = im.split()
>>> r.show()
>>> g.show()
>>> b.show()

split()方法可以原來圖像的各個通道分離,比如對于RGB圖像，可以将其R,G,B三個顔色通道分離。

merge(mode,channels)(顔色通道合并)

>>> im_merge = Image.merge("RGB",[b,r,g])
>>> im_merge.show()

merge方法和split方法是相對的，其将多個單一通道的序列合并起來，組成一個多通道的圖像，mode是合并之後圖像的模式，比如"RGB",channels是多個單一通道組成的序列。

resize(size,resample,box)

>>> im_resize = im.resize((200,200))
>>> im_resize
<PIL.Image.Image image mode=RGB size=200x200 at 0x7F62B9E23470>
>>> im_resize.show()
>>> im_resize_box = im.resize((100,100),box = (0,0,50,50))
>>> im_resize_box.show()

resize方法可以将原始的圖像轉換大小,size是轉換之後的大小,resample是重新采樣使用的方法，仍然有

Image.BICUBIC

PIL.Image.LANCZOS

PIL.Image.BILINEAR

PIL.Image.NEAREST

這四種采樣方法，預設是

PIL.Image.NEAREST

,box是指定的要resize的圖像區域，是一個用四個元組指定的區域(含義和上面所述box一緻)。

convert(mode,matrix,dither,palette,colors)(mode轉換)

>>> im_L = im.convert("L")
>>> im_L.show()
>>> im_rgb = im_L.convert("RGB")
>>> im_rgb.show()
>>> im_L.mode
'L'
>>> im_rgb.mode
'RGB'

convert方法可以改變圖像的mode,一般是在'RGB'(真彩圖)、'L'(灰階圖)、'CMYK'(壓縮圖)之間轉換。上面的代碼就是首先将圖像轉化為灰階圖，再從灰階圖轉化為真彩圖。值得注意的是,從灰階圖轉換為真彩圖，雖然理論上确實轉換成功了，但是實際上是很難恢複成原來的真彩模式的(不唯一)。

filter(filter)(應用過濾器)

>>> im = Image.open("dog.jpg","r")
>>> from PIL import ImageFilter
>>> im_blur = im.filter(ImageFilter.BLUR)
>>> im_blur.show()
>>> im_find_edges = im.filter(ImageFilter.FIND_EDGES)
>>> im_find_edges.show()
>>> im_find_edges.save("find_edges.jpg")
>>> im_blur.save("blur.jpg")

filter方法可以将一些過濾器操作應用于原始圖像，比如模糊操作，查找邊、角點操作等。filter是過濾器函數，在

PIL.ImageFilter

函數中定義了大量内置的filter函數，比如

BLUR

(模糊操作),

GaussianBlur

(高斯模糊),

MedianFilter

(中值過濾器)，

FIND_EDGES

(查找邊)等。上面得到原始圖像dog.jpg,find_edges.jpg以及blur.jpg從左到右如下圖1所示:

圖1 從左到右分别是:dog.jpg,find_edges.jpg以及blur.jpg

point(lut,mode)(對圖像像素操作)

>>> im_point = im.point(lambda x:x*1.5)
>>> im_point.show()
>>> im_point.save("im_point.jpg")

point方法可以對圖像進行單個像素的操作，上面的代碼對point方法傳入了一個匿名函數,表示将圖像的每個像素點大小都乘以1.5,mode是傳回的圖像的模式，預設是和原來圖像的mode是一樣的。圖2是原來的dog.jpg和point操作之後的im_point.jpg之間的對比。

圖2 dog.jpg和point操作之後的im_point.jpg

下面是一個結合了

point

函數,

split

paste

函數以及

merge

函數的小例子。

>>> source = im.split()
>>> R,G,B = 0,1,2
>>> mask = source[R].point(lambda x: x<100 and 255) 
>>> # x<100,return 255,otherwise return 0
>>> out_G = source[G].point(lambda x:x*0.7)
>>> # 将out_G粘貼回來，但是隻保留'R'通道像素值<100的部分
>>> source[G].paste(out_G,None,mask)
>>> # 合并成新的圖像
>>> im_new = Image.merge(im.mode,source)
>>> im_new.show()
>>> im.show()

ImageEnhance()(圖像增強)

>>> from PIL import ImageEnhance
>>> brightness = ImageEnhanBce.Brightness(im)
>>> im_brightness = brightness.enhance(1.5)
>>> im_brightness.show()
>>> im_contrast = ImageEnhance.Contrast(im)
>>> im_contrast.enhance(1.5)
<PIL.Image.Image image mode=RGB size=296x299 at 0x7F62AE271AC8>
>>> im_contrast.enhance(1.5).show()

ImageEnhance是PIL下的一個子類，主要用于圖像增強，比如增加亮度(Brightness),增加對比度(Contrast)等。上面的代碼将原來圖像的亮度增加50%,将對比度也增加了50%。

ImageSequence()(處理圖像序列)

下面的代碼可以周遊gif圖像中的所有幀，并分别儲存為圖像

>>> from PIL import ImageSequence
>>> from PIL import Image 
>>> gif = Image.open("pipixia.gif")
>>> for i,frame in enumerate(ImageSequence.Iterator(gif),1):
...     if frame.mode == 'JPEG':
...         frame.save("%d.jpg" %i)
...     else:
...         frame.save("%d.png" % i)

除了上面使用疊代器的方式以外，還可以一幀一幀讀取gif,比如下面的代碼:

>>> index = 0
>>> while 1:
...     try:
...         gif.seek(index)
...         gif.save("%d.%s" %(index,'jpg' if gif.mode == 'JPEG' else 'png'))
...         index += 1
...     except EOFError:
...         print("Reach the end of gif sequence!")
...         break

上面的代碼在讀取到gif的最後一幀之後，會throw 一個 EOFError,是以我們隻要捕獲這個異常就可以了。

熱愛程式設計，熱愛機器學習！

github:http://www.github.com/Lyrichu

github blog:http://Lyrichu.github.io

個人部落格站點:http://www.movieb2b.com(不再維護)

python PIL 圖像處理庫簡介(一)1. Introduction

1. Introduction

2. What PIL can do?

PIL可以做很多和圖像處理相關的事情:

3. How to use PIL?

3.1 Image class

Image類是PIL中的核心類，你有很多種方式來對它進行初始化，比如從檔案中加載一張圖像，處理其他形式的圖像，或者是從頭創造一張圖像等。下面是PIL Image類中常用的方法:

繼續閱讀

無法解析的外部符号 wmain，該符号在函數 "void cdecl mainCRTStartupHelper(struct HINSTANCE *,unsigned short con......

TestLink導出用例轉換工具(XML2Excel)

YAML簡介和PyYAML安全操作YAML支援的類型YAML的優點：yaml的基本文法python操作

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

Small tricks

libsvm for python 安裝

學習軟體測試基礎測試第七天

Zeppelin 配置通路 REST APIApache Zeppelin Configuration REST API

【Torch】最簡潔logging使用指南

27. Remove Element(清單)題目代碼

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

在python中建立excel并寫入