天天看點

Python進階:切片的誤區與進階用法

2018-12-31 更新聲明:切片系列文章本是分三篇寫成,現已合并成一篇。合并後,修正了一些嚴重的錯誤(如自定義序列切片的部分),還對行文結構與章節銜接做了大量改動。原系列的單篇就不删除了,畢竟也是有單獨成篇的作用。特此聲明,請閱讀改進版—— Python進階:全面解讀進階特性之切片!https://mp.weixin.qq.com/s/IRAjR-KHZBPEEkdiofseGQ

衆所周知,我們可以通過索引值(或稱下标)來查找序列類型(如字元串、清單、元組...)中的單個元素,那麼,如果要擷取一個索引區間的元素該怎麼辦呢?

切片(slice)就是一種截取索引片段的技術,借助切片技術,我們可以十分靈活地處理序列類型的對象。通常來說,切片的作用就是截取序列對象,然而,它還有一些使用誤區與進階用法,都值得我們注意。是以,本文将主要跟大家一起來探讨這些内容,希望你能學有所獲。

事先聲明,切片并非清單的專屬操作,但因為清單最具有代表性,是以,本文僅以清單為例作探讨。

1、切片的基礎用法

清單是 Python 中極為基礎且重要的一種資料結構,我曾寫過一篇彙總文章(連結見文末)較全面地學習過它。文中詳細地總結了切片的基礎用法,現在回顧一下:

切片的書寫形式:[i : i+n : m] ;其中,i 是切片的起始索引值,為清單首位時可省略;i+n 是切片的結束位置,為清單末位時可省略;m 可以不提供,預設值是1,不允許為0 ,當m為負數時,清單翻轉。注意:這些值都可以大于清單長度,不會報越界。

切片的基本含義是:從序列的第i位索引起,向右取到後n位元素為止,按m間隔過濾 。

li = [1, 4, 5, 6, 7, 9, 11, 14, 16]
  ​
  # 以下寫法都可以表示整個清單,其中 X >= len(li)
  li[0:X] == li[0:] == li[:X] == li[:] == li[::] == li[-X:X] == li[-X:]
  ​
  li[1:5] == [4,5,6,7] # 從1起,取5-1位元素
  li[1:5:2] == [4,6] # 從1起,取5-1位元素,按2間隔過濾
  li[-1:] == [16] # 取倒數第一個元素
  li[-4:-2] == [9, 11] # 從倒數第四起,取-2-(-4)=2位元素
  li[:-2] == li[-len(li):-2] == [1,4,5,6,7,9,11] # 從頭開始,取-2-(-len(li))=7位元素
  ​
  # 步長為負數時,清單先翻轉,再截取
  li[::-1] == [16,14,11,9,7,6,5,4,1] # 翻轉整個清單
  li[::-2] == [16,11,7,5,1] # 翻轉整個清單,再按2間隔過濾
  li[:-5:-1] == [16,14,11,9] # 翻轉整個清單,取-5-(-len(li))=4位元素
  li[:-5:-3] == [16,9] # 翻轉整個清單,取-5-(-len(li))=4位元素,再按3間隔過濾
  ​
  # 切片的步長不可以為0
  li[::0]  # 報錯(ValueError: slice step cannot be zero)      

上述的某些例子對于初學者(甚至很多老手)來說,可能還不好了解。我個人總結出兩條經驗:(1)牢牢記住公式

[i : i+n : m]

,當出現預設值時,通過想象把公式補全;(2)索引為負且步長為正時,按倒數計算索引位置;索引為負且步長為負時,先翻轉清單,再按倒數計算索引位置。

2、切片是僞獨立對象

切片操作的傳回結果是一個新的獨立的序列(PS:也有例外,參見《Python是否支援複制字元串呢?》)。以清單為例,清單切片後得到的還是一個清單,占用新的記憶體位址。

當取出切片的結果時,它是一個獨立對象,是以,可以将其用于指派操作,也可以用于其它傳遞值的場景。但是,切片隻是淺拷貝,它拷貝的是原清單中元素的引用,是以,當存在變長對象的元素時,新清單将受制于原清單。

li = [1, 2, 3, 4]
  ls = li[::]
  ​
  li == ls # True
  id(li) == id(ls) # False
  li.append(li[2:4]) # [1, 2, 3, 4, [3, 4]]
  ls.extend(ls[2:4]) # [1, 2, 3, 4, 3, 4]
  ​
  # 下例等價于判斷li長度是否大于8
  if(li[8:]):
      print("not empty")
  else:
      print("empty")
  ​
  # 切片清單受制于原清單
  lo = [1,[1,1],2,3]
  lp = lo[:2] # [1, [1, 1]]
  lo[1].append(1) # [1, [1, 1, 1], 2, 3]
  lp # [1, [1, 1, 1]]      

由于可見,将切片結果取出,它可以作為獨立對象使用,但是也要注意,是否取出了變長對象的元素。

3、切片可作為占位符

切片既可以作為獨立對象被“取出”原序列,也可以留在原序列,作為一種占位符使用。

在寫《詳解Python拼接字元串的七種方式》的時候,我介紹了幾種拼接字元串的方法,其中三種格式化類的拼接方法(即 %、format()、template)就是使用了占位符的思想。對于清單來說,使用切片作為占位符,同樣能夠實作拼接清單的效果。特别需要注意的是,給切片指派的必須是可疊代對象。

li = [1, 2, 3, 4]
  ​
  # 在頭部拼接
  li[:0] = [0] # [0, 1, 2, 3, 4]
  # 在末尾拼接
  li[len(li):] = [5,7] # [0, 1, 2, 3, 4, 5, 7]
  # 在中部拼接
  li[6:6] = [6] # [0, 1, 2, 3, 4, 5, 6, 7]
  ​
  # 給切片指派的必須是可疊代對象
  li[-1:-1] = 6 # (報錯,TypeError: can only assign an iterable)
  li[:0] = (9,) #  [9, 0, 1, 2, 3, 4, 5, 6, 7]
  li[:0] = range(3) #  [0, 1, 2, 9, 0, 1, 2, 3, 4, 5, 6, 7]      

上述例子中,若将切片作為獨立對象取出,那你會發現它們都是空清單,即

li[:0]==li[len(li):]==li[6:6]==[]

,我将這種占位符稱為“純占位符”,對純占位符指派,并不會破壞原有的元素,隻會在特定的索引位置中拼接進新的元素。删除純占位符時,也不會影響清單中的元素。

與“純占位符”相對應,“非純占位符”的切片是非空清單,對它進行操作(指派與删除),将會影響原始清單。如果說純占位符可以實作清單的拼接,那麼,非純占位符可以實作清單的替換。

li = [1, 2, 3, 4]
  ​
  # 不同位置的替換
  li[:3] = [7,8,9] # [7, 8, 9, 4]
  li[3:] = [5,6,7] # [7, 8, 9, 5, 6, 7]
  li[2:4] = ['a','b'] # [7, 8, 'a', 'b', 6, 7]
  ​
  # 非等長替換
  li[2:4] = [1,2,3,4] # [7, 8, 1, 2, 3, 4, 6, 7]
  li[2:6] = ['a']  # [7, 8, 'a', 6, 7]
  ​
  # 删除元素
  del li[2:3] # [7, 8, 6, 7]      

切片占位符可以帶步長,進而實作連續跨越性的替換或删除效果。需要注意的是,這種用法隻支援等長替換。

li = [1, 2, 3, 4, 5, 6]
  ​
  li[::2] = ['a','b','c'] # ['a', 2, 'b', 4, 'c', 6]
  li[::2] = [0]*3 # [0, 2, 0, 4, 0, 6]
  li[::2] = ['w'] # 報錯,attempt to assign sequence of size 1 to extended slice of size 3
  ​
  del li[::2] # [2, 4, 6]      

4、更多思考

其它程式設計語言是否有類似于 Python 的切片操作呢?有什麼差異?

我在交流群裡問了這個問題,小夥伴們紛紛說 Java、Go、Ruby......在檢視相關資料的時候,我發現 Go 語言的切片是挺奇怪的設計。首先,它是一種特殊類型,即對數組(array)做切片後,得到的竟然不是一個數組;其次,你可以建立和初始化一個切片,需要聲明長度(len)和容量(cap);再者,它還存在超出底層數組的界限而需要進行擴容的動态機制,這倒是跟 Python 清單的超額配置設定機制有一定相似性......

在我看來,無論是用意,還是寫法和用法,都是 Python 的切片操作更明了與好用。是以,本文就不再進行跨程式設計語言的比較了(唔,好吧我承認,其實是我不怎麼懂其它程式設計語言......)

最後,還有一個問題:Python 的切片操作有什麼底層原理呢? 我們是否可以自定義切片操作呢?限于篇幅,我将在下次推文中跟大家一起學習,敬請期待。

延伸閱讀 :

超強彙總:學習Python清單,隻需這篇文章就夠了

詳解Python拼接字元串的七種方式

Python是否支援複制字元串呢?

PS:本公衆号(Python貓)已開通讀者交流群,詳情請通過菜單欄中的“交流群”了解。

-----------------

本文原創并首發于微信公衆号【Python貓】,背景回複“愛學習”,免費獲得20+本精選電子書。