python 生成器和疊代器有這篇就夠了

　　本節主要記錄一下清單生成式，生成器和疊代器的知識點

　　清單生成器

　　首先舉個例子

現在有個需求，看清單 [0，1，2，3，4，5，6，7，8，9]，要求你把清單裡面的每個值加1，你怎麼實作呢？

方法一（簡單）：

info

[]

# for index,i in enumerate(info):

#     print(i+1)

#     b.append(i+1)

# print(b)

for

index,i

in

enumerate

(info):

info[index]

print

(info)

方法二（一般）：

info

map

lambda

x:x

,info)

print

(a)

for

in

a:

print

(i)

方法三（進階）：

+ View Code

　　生成器

什麼是生成器？

　　通過清單生成式，我們可以直接建立一個清單，但是，受到記憶體限制，清單容量肯定是有限的，而且建立一個包含100萬個元素的清單，不僅占用很大的存儲空間，如果我們僅僅需要通路前面幾個元素，那後面絕大多數元素占用的空間都白白浪費了。

　　是以，如果清單元素可以按照某種算法推算出來，那我們是否可以在循環的過程中不斷推算出後續的元素呢？這樣就不必建立完整的list，進而節省大量的空間，在Python中，這種一邊循環一邊計算的機制，稱為生成器：generator

　　生成器是一個特殊的程式，可以被用作控制循環的疊代行為，python中生成器是疊代器的一種，使用yield傳回值函數，每次調用yield會暫停，而可以使用next()函數和send()函數恢複生成器。

　　生成器類似于傳回值為數組的一個函數，這個函數可以接受參數，可以被調用，但是，不同于一般的函數會一次性傳回包括了所有數值的數組，生成器一次隻能産生一個值，這樣消耗的記憶體數量将大大減小，而且允許調用函數可以很快的處理前幾個傳回值，是以生成器看起來像是一個函數，但是表現得卻像是疊代器

python中的生成器

　　要建立一個generator，有很多種方法，第一種方法很簡單，隻有把一個清單生成式的[]中括号改為（）小括号，就建立一個generator

　　舉例如下：

#清單生成式

lis

[x

for

in

range

)]

print

(lis)

#生成器

generator_ex

(x

for

in

range

))

print

(generator_ex)

結果：

<generator

object

<genexpr> at

0x000002A4CBF9EBA0

　　那麼建立lis和generator_ex，的差別是什麼呢？從表面看就是[ ]和（）,但是結果卻不一樣，一個列印出來是清單（因為是清單生成式），而第二個列印出來卻是<generator object <genexpr> at 0x000002A4CBF9EBA0>，那麼如何列印出來generator_ex的每一個元素呢？

　　如果要一個個列印出來，可以通過next（）函數獲得generator的下一個傳回值：

#生成器

generator_ex

(x

for

in

range

))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

結果：

Traceback (most recent call last):

File

"清單生成式.py"

, line

in

<module>

print

next

(generator_ex))

StopIteration

　　大家可以看到，generator儲存的是算法，每次調用next(generaotr_ex)就計算出他的下一個元素的值，直到計算出最後一個元素，沒有更多的元素時，抛出StopIteration的錯誤，而且上面這樣不斷調用是一個不好的習慣，正确的方法是使用for循環，因為generator也是可疊代對象：

#生成器

generator_ex

(x

for

in

range

))

for

in

generator_ex:

print

(i)

結果：

　　是以我們建立一個generator後，基本上永遠不會調用next()，而是通過for循環來疊代，并且不需要關心StopIteration的錯誤，generator非常強大，如果推算的算法比較複雜，用類似清單生成式的for循環無法實作的時候，還可以用函數來實作。

比如著名的斐波那契數列，除第一個和第二個數外，任何一個數都可以由前兩個相加得到：

1，1，2，3，5，8，12，21，34.....

斐波那契數列用清單生成式寫不出來，但是，用函數把它列印出來卻很容易：

#fibonacci數列

def fib(max):

n,a,b =0,0,1

while

n < max:

a,b =b,a+b

n = n+1

print(a)

return

'done'

a = fib(10)

print(fib(10))

　　a,b = b ,a+b 其實相當于 t =a+b ,a =b ,b =t ，是以不必寫顯示寫出臨時變量t，就可以輸出斐波那契數列的前N個數字。上面輸出的結果如下：

+ View Code

　　仔細觀察，可以看出，

fib

函數實際上是定義了斐波拉契數列的推算規則，可以從第一個元素開始，推算出後續任意的元素，這種邏輯其實非常類似generator。

　　也就是說上面的函數也可以用generator來實作，上面我們發現，print(b)每次函數運作都要列印，占記憶體，是以為了不占記憶體，我們也可以使用生成器，這裡叫yield。如下：

def

fib(

max

):

n,a,b

while

n <

max

yield

a,b

b,a

return

'done'

fib(

print

(fib(

))

　　但是傳回的不再是一個值，而是一個生成器，和上面的例子一樣，大家可以看一下結果：

1	`<generator` `object` `fib at` `0x000001C03AC34FC0` `>`

　　那麼這樣就不占記憶體了，這裡說一下generator和函數的執行流程，函數是順序執行的，遇到return語句或者最後一行函數語句就傳回。而變成generator的函數，在每次調用next()的時候執行，遇到yield語句傳回，再次被next（）調用時候從上次的傳回yield語句處急需執行，也就是用多少，取多少，不占記憶體。

def

fib(

max

):

n,a,b

while

n <

max

yield

a,b

b,a

return

'done'

fib(

print

(fib(

))

print

(a.__next__())

print

(a.__next__())

print

(a.__next__())

print

"可以順便幹其他事情"

print

(a.__next__())

print

(a.__next__())

結果：

<generator

object

fib at

0x0000023A21A34FC0

可以順便幹其他事情

　　在上面fib的例子，我們在循環過程中不斷調用

yield

，就會不斷中斷。當然要給循環設定一個條件來退出循環，不然就會産生一個無限數列出來。同樣的，把函數改成generator後，我們基本上從來不會用

next()

來擷取下一個傳回值，而是直接使用

for

循環來疊代：

def

fib(

max

):

n,a,b

while

n <

max

yield

a,b

b,a

return

'done'

for

in

fib(

):

print

(i)

結果：

　　但是用for循環調用generator時，發現拿不到generator的return語句的傳回值。如果拿不到傳回值，那麼就會報錯，是以為了不讓報錯，就要進行異常處理，拿到傳回值，如果想要拿到傳回值，必須捕獲StopIteration錯誤，傳回值包含在StopIteration的value中：

def

fib(

max

):

n,a,b

while

n <

max

yield

a,b

b,a

return

'done'

fib(

while

True

try

next

(g)

print

'generator: '

,x)

except

StopIteration as e:

print

"生成器傳回值："

,e.value)

break

結果：

generator:

generator:

generator:

generator:

generator:

generator:

生成器傳回值： done

還可以通過yield實作在單線程的情況下實作并發運算的效果

+ View Code

　　由上面的例子我麼可以發現，python提供了兩種基本的方式

生成器函數：也是用def定義的，利用關鍵字yield一次性傳回一個結果，阻塞，重新開始

生成器表達式：傳回一個對象，這個對象隻有在需要的時候才産生結果

——生成器函數

為什麼叫生成器函數？因為它随着時間的推移生成了一個數值隊列。一般的函數在執行完畢之後會傳回一個值然後退出，但是生成器函數會自動挂起，然後重新拾起急需執行，他會利用yield關鍵字關起函數，給調用者傳回一個值，同時保留了目前的足夠多的狀态，可以使函數繼續執行，生成器和疊代協定是密切相關的，疊代器都有一個__next__()__成員方法，這個方法要麼傳回疊代的下一項，要買引起異常結束疊代。

# 函數有了yield之後，函數名+（）就變成了生成器

# return在生成器中代表生成器的中止，直接報錯

# next的作用是喚醒并繼續執行

# send的作用是喚醒并繼續執行，發送一個資訊到生成器内部

'''生成器'''

def

create_counter(n):

print

"create_counter"

while

True

yield

print

"increment n"

gen

create_counter(

print

(gen)

print

next

(gen))

print

next

(gen))

結果：

<generator

object

create_counter at

0x0000023A1694A938

create_counter

increment n

Process finished with exit code

——生成器表達式

生成器表達式來源于疊代和清單解析的組合，生成器和清單解析類似，但是它使用尖括号而不是方括号

>>>

# 清單解析生成清單

>>> [ x

for

in

range

)]

>>>

>>>

# 生成器表達式

>>> (x

for

in

range

))

<generator

object

<genexpr> at

0x000000000315F678

>>>

# 兩者之間轉換

>>>

list

(x

for

in

range

))

　　一個疊代既可以被寫成生成器函數，也可以被協程生成器表達式，均支援自動和手動疊代。而且這些生成器隻支援一個active疊代，也就是說生成器的疊代器就是生成器本身。

疊代器（疊代就是循環）

　　疊代器包含有next方法的實作，在正确的範圍内傳回期待的資料以及超出範圍後能夠抛出StopIteration的錯誤停止疊代。

　　我們已經知道，可以直接作用于for循環的資料類型有以下幾種：

一類是集合資料類型，如list,tuple,dict,set,str等

一類是generator，包括生成器和帶yield的generator function

這些可以直接作用于for 循環的對象統稱為可疊代對象：Iterable

可以使用isinstance()判斷一個對象是否為可Iterable對象

>>>

from

collections

import

Iterable

>>>

isinstance

([], Iterable)

True

>>>

isinstance

({}, Iterable)

True

>>>

isinstance

'abc'

, Iterable)

True

>>>

isinstance

((x

for

in

range

)), Iterable)

True

>>>

isinstance

, Iterable)

False

　　而生成器不但可以作用于for循環，還可以被next()函數不斷調用并傳回下一個值，直到最後抛出StopIteration錯誤表示無法繼續傳回下一個值了。

是以這裡講一下疊代器

一個實作了iter方法的對象時可疊代的，一個實作next方法的對象是疊代器

可以被next()函數調用并不斷傳回下一個值的對象稱為疊代器：Iterator。

可以使用isinstance()判斷一個對象是否是Iterator對象：

>>>

from

collections

import

Iterator

>>>

isinstance

((x

for

in

range

)), Iterator)

True

>>>

isinstance

([], Iterator)

False

>>>

isinstance

({}, Iterator)

False

>>>

isinstance

'abc'

, Iterator)

False

生成器都是

Iterator

對象，但

list

、

dict

、

str

雖然是

Iterable（可疊代對象）

，卻不是

Iterator（疊代器）

。

把

list

、

dict

、

str

等

Iterable

變成

Iterator

可以使用

iter()

函數：

>>>

isinstance

iter

([]), Iterator)

True

>>>

isinstance

iter

'abc'

), Iterator)

True

你可能會問，為什麼

list

、

dict

、

str

等資料類型不是

Iterator

？

這是因為Python的

Iterator

對象表示的是一個資料流，Iterator對象可以被

next()

函數調用并不斷傳回下一個資料，直到沒有資料時抛出

StopIteration

錯誤。可以把這個資料流看做是一個有序序列，但我們卻不能提前知道序列的長度，隻能不斷通過

next()

函數實作按需計算下一個資料，是以

Iterator

的計算是惰性的，隻有在需要傳回下一個資料時它才會計算。

Iterator

甚至可以表示一個無限大的資料流，例如全體自然數。而使用list是永遠不可能存儲全體自然數的。

　　判斷下列資料類型是可疊代對象or疊代器

'hello'

'a'

set

open

'a.txt'

s=

'hello'

#字元串是可疊代對象，但不是疊代器

l=[1,2,3,4]     #清單是可疊代對象，但不是疊代器

t=(1,2,3)       #元組是可疊代對象，但不是疊代器

d={

'a'

:1}        #字典是可疊代對象，但不是疊代器

set

={1,2,3}     #集合是可疊代對象，但不是疊代器

# *************************************

f=open(

'test.txt'

) #檔案是可疊代對象，是疊代器

#如何判斷是可疊代對象，隻有__iter__方法，執行該方法得到的疊代器對象。

# 及可疊代對象通過__iter__轉成疊代器對象

from

collections import Iterator  #疊代器

from

collections import Iterable  #可疊代對象

print(isinstance(s,Iterator))     #判斷是不是疊代器

print(isinstance(s,Iterable))       #判斷是不是可疊代對象

#把可疊代對象轉換為疊代器

print(isinstance(iter(s),Iterator))

　注意：檔案的判斷

f = open(

'housing.csv'

from

collections import Iterator

from

collections import Iterable

print(isinstance(f,Iterator))

print(isinstance(f,Iterable))

True

True

　　結論：檔案是可疊代對象，也是疊代器

小結：

凡是可作用于 for 循環的對象都是 Iterable 類型；
凡是可作用于 next() 函數的對象都是 Iterator 類型，它們表示一個惰性計算的序列；
集合資料類型如 list 、 dict 、 str 等是 Iterable 但不是 Iterator ，不過可以通過 iter() 函數獲得一個 Iterator 對象。

Python3的

for

循環本質上就是通過不斷調用

next()

函數實作的，例如：

1 2	`for` `x` `in` `[` `1` `,` `2` `,` `3` `,` `4` `,` `5` `]:` `pass`

　實際上完全等價于

# 首先獲得Iterator對象:

it

iter

([

])

# 循環:

while

True

try

# 獲得下一個值:

next

(it)

except

StopIteration:

# 遇到StopIteration就退出循環

break

對yield的總結

　　（1）通常的for..in...循環中，in後面是一個數組，這個數組就是一個可疊代對象，類似的還有連結清單，字元串，檔案。他可以是a = [1,2,3]，也可以是a = [x*x for x in range(3)]。

它的缺點也很明顯，就是所有資料都在記憶體裡面，如果有海量的資料，将會非常耗記憶體。

　　（2）生成器是可以疊代的，但是隻可以讀取它一次。因為用的時候才生成，比如a = (x*x for x in range(3))。!!!!注意這裡是小括号而不是方括号。

　　（3）生成器（generator）能夠疊代的關鍵是他有next()方法，工作原理就是通過重複調用next()方法，直到捕獲一個異常。

　　（4）帶有yield的函數不再是一個普通的函數，而是一個生成器generator，可用于疊代

　　（5）yield是一個類似return 的關鍵字，疊代一次遇到yield的時候就傳回yield後面或者右面的值。而且下一次疊代的時候，從上一次疊代遇到的

python 生成器和疊代器有這篇就夠了

　　本節主要記錄一下清單生成式，生成器和疊代器的知識點

　　清單生成器

　　首先舉個例子

現在有個需求，看清單 [0，1，2，3，4，5，6，7，8，9]，要求你把清單裡面的每個值加1，你怎麼實作呢？

方法一（簡單）：

info

[]

# for index,i in enumerate(info):

#     print(i+1)

#     b.append(i+1)

# print(b)

for

index,i

in

enumerate

(info):

info[index]

print

(info)

方法二（一般）：

info

map

lambda

x:x

,info)

print

(a)

for

in

a:

print

(i)

方法三（進階）：

+ View Code

　　生成器

什麼是生成器？

python中的生成器

　　要建立一個generator，有很多種方法，第一種方法很簡單，隻有把一個清單生成式的[]中括号改為（）小括号，就建立一個generator

　　舉例如下：

#清單生成式

lis

[x

for

in

range

)]

print

(lis)

#生成器

generator_ex

(x

for

in

range

))

print

(generator_ex)

結果：

<generator

object

<genexpr> at

0x000002A4CBF9EBA0

　　如果要一個個列印出來，可以通過next（）函數獲得generator的下一個傳回值：

#生成器

generator_ex

(x

for

in

range

))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

結果：

Traceback (most recent call last):

File

"清單生成式.py"

, line

in

<module>

print

next

(generator_ex))

StopIteration

#生成器

generator_ex

(x

for

in

range

))

for

in

generator_ex:

print

(i)

結果：

比如著名的斐波那契數列，除第一個和第二個數外，任何一個數都可以由前兩個相加得到：

1，1，2，3，5，8，12，21，34.....

斐波那契數列用清單生成式寫不出來，但是，用函數把它列印出來卻很容易：

#fibonacci數列

def fib(max):

n,a,b =0,0,1

while

n < max:

a,b =b,a+b

n = n+1

print(a)

return

'done'

a = fib(10)

print(fib(10))

　　a,b = b ,a+b 其實相當于 t =a+b ,a =b ,b =t ，是以不必寫顯示寫出臨時變量t，就可以輸出斐波那契數列的前N個數字。上面輸出的結果如下：

+ View Code

　　仔細觀察，可以看出，

fib

函數實際上是定義了斐波拉契數列的推算規則，可以從第一個元素開始，推算出後續任意的元素，這種邏輯其實非常類似generator。

def

fib(

max

):

n,a,b

while

n <

max

yield

a,b

b,a

return

'done'

fib(

print

(fib(

))

　　但是傳回的不再是一個值，而是一個生成器，和上面的例子一樣，大家可以看一下結果：

1	`<generator` `object` `fib at` `0x000001C03AC34FC0` `>`

def

fib(

max

):

n,a,b

while

n <

max

yield

a,b

b,a

return

'done'

fib(

print

(fib(

))

print

(a.__next__())

print

(a.__next__())

print

(a.__next__())

print

"可以順便幹其他事情"

print

(a.__next__())

print

(a.__next__())

結果：

<generator

object

fib at

0x0000023A21A34FC0

可以順便幹其他事情

　　在上面fib的例子，我們在循環過程中不斷調用

yield

，就會不斷中斷。當然要給循環設定一個條件來退出循環，不然就會産生一個無限數列出來。同樣的，把函數改成generator後，我們基本上從來不會用

next()

來擷取下一個傳回值，而是直接使用

for

循環來疊代：

def

fib(

max

):

n,a,b

while

n <

max

yield

a,b

b,a

return

'done'

for

in

fib(

):

print

(i)

結果：

def

fib(

max

):

n,a,b

while

n <

max

yield

a,b

b,a

return

'done'

fib(

while

True

try

next

(g)

print

'generator: '

,x)

except

StopIteration as e:

print

"生成器傳回值："

,e.value)

break

結果：

generator:

generator:

generator:

generator:

generator:

generator:

生成器傳回值： done

還可以通過yield實作在單線程的情況下實作并發運算的效果

+ View Code

　　由上面的例子我麼可以發現，python提供了兩種基本的方式

生成器函數：也是用def定義的，利用關鍵字yield一次性傳回一個結果，阻塞，重新開始

生成器表達式：傳回一個對象，這個對象隻有在需要的時候才産生結果

——生成器函數

# 函數有了yield之後，函數名+（）就變成了生成器

# return在生成器中代表生成器的中止，直接報錯

# next的作用是喚醒并繼續執行

# send的作用是喚醒并繼續執行，發送一個資訊到生成器内部

'''生成器'''

def

create_counter(n):

print

"create_counter"

while

True

yield

print

"increment n"

gen

create_counter(

print

(gen)

print

next

(gen))

print

next

(gen))

結果：

<generator

object

create_counter at

0x0000023A1694A938

create_counter

increment n

Process finished with exit code

——生成器表達式

生成器表達式來源于疊代和清單解析的組合，生成器和清單解析類似，但是它使用尖括号而不是方括号

>>>

# 清單解析生成清單

>>> [ x

for

in

range

)]

>>>

>>>

# 生成器表達式

>>> (x

for

in

range

))

<generator

object

<genexpr> at

0x000000000315F678

>>>

# 兩者之間轉換

>>>

list

(x

for

in

range

))

疊代器（疊代就是循環）

　　疊代器包含有next方法的實作，在正确的範圍内傳回期待的資料以及超出範圍後能夠抛出StopIteration的錯誤停止疊代。

　　我們已經知道，可以直接作用于for循環的資料類型有以下幾種：

一類是集合資料類型，如list,tuple,dict,set,str等

一類是generator，包括生成器和帶yield的generator function

這些可以直接作用于for 循環的對象統稱為可疊代對象：Iterable

可以使用isinstance()判斷一個對象是否為可Iterable對象

>>>

from

collections

import

Iterable

>>>

isinstance

([], Iterable)

True

>>>

isinstance

({}, Iterable)

True

>>>

isinstance

'abc'

, Iterable)

True

>>>

isinstance

((x

for

in

range

)), Iterable)

True

>>>

isinstance

, Iterable)

False

　　而生成器不但可以作用于for循環，還可以被next()函數不斷調用并傳回下一個值，直到最後抛出StopIteration錯誤表示無法繼續傳回下一個值了。

是以這裡講一下疊代器

一個實作了iter方法的對象時可疊代的，一個實作next方法的對象是疊代器

可以被next()函數調用并不斷傳回下一個值的對象稱為疊代器：Iterator。

可以使用isinstance()判斷一個對象是否是Iterator對象：

>>>

from

collections

import

Iterator

>>>

isinstance

((x

for

in

range

)), Iterator)

True

>>>

isinstance

([], Iterator)

False

>>>

isinstance

({}, Iterator)

False

>>>

isinstance

'abc'

, Iterator)

False

生成器都是

Iterator

對象，但

list

、

dict

、

str

雖然是

Iterable（可疊代對象）

，卻不是

Iterator（疊代器）

。

把

list

、

dict

、

str

等

Iterable

變成

Iterator

可以使用

iter()

函數：

>>>

isinstance

iter

([]), Iterator)

True

>>>

isinstance

iter

'abc'

), Iterator)

True

你可能會問，為什麼

list

、

dict

、

str

等資料類型不是

Iterator

？

這是因為Python的

Iterator

對象表示的是一個資料流，Iterator對象可以被

next()

函數調用并不斷傳回下一個資料，直到沒有資料時抛出

StopIteration

錯誤。可以把這個資料流看做是一個有序序列，但我們卻不能提前知道序列的長度，隻能不斷通過

next()

函數實作按需計算下一個資料，是以

Iterator

的計算是惰性的，隻有在需要傳回下一個資料時它才會計算。

Iterator

甚至可以表示一個無限大的資料流，例如全體自然數。而使用list是永遠不可能存儲全體自然數的。

　　判斷下列資料類型是可疊代對象or疊代器

'hello'

'a'

set

open

'a.txt'

s=

'hello'

#字元串是可疊代對象，但不是疊代器

l=[1,2,3,4]     #清單是可疊代對象，但不是疊代器

t=(1,2,3)       #元組是可疊代對象，但不是疊代器

d={

'a'

:1}        #字典是可疊代對象，但不是疊代器

set

={1,2,3}     #集合是可疊代對象，但不是疊代器

# *************************************

f=open(

'test.txt'

) #檔案是可疊代對象，是疊代器

#如何判斷是可疊代對象，隻有__iter__方法，執行該方法得到的疊代器對象。

# 及可疊代對象通過__iter__轉成疊代器對象

from

collections import Iterator  #疊代器

from

collections import Iterable  #可疊代對象

print(isinstance(s,Iterator))     #判斷是不是疊代器

print(isinstance(s,Iterable))       #判斷是不是可疊代對象

#把可疊代對象轉換為疊代器

print(isinstance(iter(s),Iterator))

　注意：檔案的判斷

f = open(

'housing.csv'

from

collections import Iterator

from

collections import Iterable

print(isinstance(f,Iterator))

print(isinstance(f,Iterable))

True

True

　　結論：檔案是可疊代對象，也是疊代器

小結：

凡是可作用于 for 循環的對象都是 Iterable 類型；
凡是可作用于 next() 函數的對象都是 Iterator 類型，它們表示一個惰性計算的序列；
集合資料類型如 list 、 dict 、 str 等是 Iterable 但不是 Iterator ，不過可以通過 iter() 函數獲得一個 Iterator 對象。

Python3的

for

循環本質上就是通過不斷調用

next()

函數實作的，例如：

1 2	`for` `x` `in` `[` `1` `,` `2` `,` `3` `,` `4` `,` `5` `]:` `pass`

　實際上完全等價于

# 首先獲得Iterator對象:

it

iter

([

])

# 循環:

while

True

try

# 獲得下一個值:

next

(it)

except

StopIteration:

# 遇到StopIteration就退出循環

break

對yield的總結

它的缺點也很明顯，就是所有資料都在記憶體裡面，如果有海量的資料，将會非常耗記憶體。

　　（2）生成器是可以疊代的，但是隻可以讀取它一次。因為用的時候才生成，比如a = (x*x for x in range(3))。!!!!注意這裡是小括号而不是方括号。

　　（3）生成器（generator）能夠疊代的關鍵是他有next()方法，工作原理就是通過重複調用next()方法，直到捕獲一個異常。

　　（4）帶有yield的函數不再是一個普通的函數，而是一個生成器generator，可用于疊代

　　（5）yield是一個類似return 的關鍵字，疊代一次遇到yield的時候就傳回yield後面或者右面的值。而且下一次疊代的時候，從上一次疊代遇到的yield後面的代碼開始執行

　　（6）yield就是return傳回的一個值，并且記住這個傳回的位置。下一次疊代就從這個位置開始。

　　（7）帶有yield的函數不僅僅是隻用于for循環，而且可用于某個函數的參數，隻要這個函數的參數也允許疊代參數。

　　（8）send()和next()的差別就在于send可傳遞參數給yield表達式，這時候傳遞的參數就會作為yield表達式的值，而yield的參數是傳回給調用者的值，也就是說send可以強行修改上一個yield表達式值。

　　（9）send()和next()都有傳回值，他們的傳回值是目前疊代遇到的yield的時候，yield後面表達式的值，其實就是目前疊代yield後面的參數。

　　（10）第一次調用時候必須先next（）或send（）,否則會報錯，send後之是以為None是因為這時候沒有上一個yield，是以也可以認為next（）等同于send(None)

不經一番徹骨寒怎得梅花撲鼻香

python 生成器和疊代器有這篇就夠了

　　本節主要記錄一下清單生成式，生成器和疊代器的知識點

　　清單生成器

　　首先舉個例子

現在有個需求，看清單 [0，1，2，3，4，5，6，7，8，9]，要求你把清單裡面的每個值加1，你怎麼實作呢？

方法一（簡單）：

info

[]

# for index,i in enumerate(info):

#     print(i+1)

#     b.append(i+1)

# print(b)

for

index,i

in

enumerate

(info):

info[index]

print

(info)

方法二（一般）：

info

map

lambda

x:x

,info)

print

(a)

for

in

a:

print

(i)

方法三（進階）：

+ View Code

　　生成器

什麼是生成器？

python中的生成器

　　要建立一個generator，有很多種方法，第一種方法很簡單，隻有把一個清單生成式的[]中括号改為（）小括号，就建立一個generator

　　舉例如下：

#清單生成式

lis

[x

for

in

range

)]

print

(lis)

#生成器

generator_ex

(x

for

in

range

))

print

(generator_ex)

結果：

<generator

object

<genexpr> at

0x000002A4CBF9EBA0

　　如果要一個個列印出來，可以通過next（）函數獲得generator的下一個傳回值：

#生成器

generator_ex

(x

for

in

range

))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

print

next

(generator_ex))

結果：

Traceback (most recent call last):

File

"清單生成式.py"

, line

in

<module>

print

next

(generator_ex))

StopIteration

#生成器

generator_ex

(x

for

in

range

))

for

in

generator_ex:

print

(i)

結果：

比如著名的斐波那契數列，除第一個和第二個數外，任何一個數都可以由前兩個相加得到：

1，1，2，3，5，8，12，21，34.....

斐波那契數列用清單生成式寫不出來，但是，用函數把它列印出來卻很容易：

#fibonacci數列

def fib(max):

n,a,b =0,0,1

while

n < max:

a,b =b,a+b

n = n+1

print(a)

return

'done'

a = fib(10)

print(fib(10))

　　a,b = b ,a+b 其實相當于 t =a+b ,a =b ,b =t ，是以不必寫顯示寫出臨時變量t，就可以輸出斐波那契數列的前N個數字。上面輸出的結果如下：

+ View Code

　　仔細觀察，可以看出，

fib

函數實際上是定義了斐波拉契數列的推算規則，可以從第一個元素開始，推算出後續任意的元素，這種邏輯其實非常類似generator。

def

fib(

max

):

n,a,b

while

n <

max

yield

a,b

b,a

return

'done'

fib(

print

(fib(

))

　　但是傳回的不再是一個值，而是一個生成器，和上面的例子一樣，大家可以看一下結果：

1	`<generator` `object` `fib at` `0x000001C03AC34FC0` `>`

def

fib(

max

):

n,a,b

while

n <

max

yield

a,b

b,a

return

'done'

fib(

print

(fib(

))

print

(a.__next__())

print

(a.__next__())

print

(a.__next__())

print

"可以順便幹其他事情"

print

(a.__next__())

print

(a.__next__())

結果：

<generator

object

fib at

0x0000023A21A34FC0

可以順便幹其他事情

　　在上面fib的例子，我們在循環過程中不斷調用

yield

，就會不斷中斷。當然要給循環設定一個條件來退出循環，不然就會産生一個無限數列出來。同樣的，把函數改成generator後，我們基本上從來不會用

next()

來擷取下一個傳回值，而是直接使用

for

循環來疊代：

def

fib(

max

):

n,a,b

while

n <

max

yield

a,b

b,a

return

'done'

for

in

fib(

):

print

(i)

結果：

def

fib(

max

):

n,a,b

while

n <

max

yield

a,b

b,a

return

'done'

fib(

while

True

try

next

(g)

print

'generator: '

,x)

except

StopIteration as e:

print

"生成器傳回值："

,e.value)

break

結果：

generator:

generator:

generator:

generator:

generator:

generator:

生成器傳回值： done

還可以通過yield實作在單線程的情況下實作并發運算的效果

+ View Code

　　由上面的例子我麼可以發現，python提供了兩種基本的方式

生成器函數：也是用def定義的，利用關鍵字yield一次性傳回一個結果，阻塞，重新開始

生成器表達式：傳回一個對象，這個對象隻有在需要的時候才産生結果

——生成器函數

# 函數有了yield之後，函數名+（）就變成了生成器

# return在生成器中代表生成器的中止，直接報錯

# next的作用是喚醒并繼續執行

# send的作用是喚醒并繼續執行，發送一個資訊到生成器内部

'''生成器'''

def

create_counter(n):

print

"create_counter"

while

True

yield

print

"increment n"

gen

create_counter(

print

(gen)

print

next

(gen))

print

next

(gen))

結果：

<generator

object

create_counter at

0x0000023A1694A938

create_counter

increment n

Process finished with exit code

——生成器表達式

生成器表達式來源于疊代和清單解析的組合，生成器和清單解析類似，但是它使用尖括号而不是方括号

>>>

# 清單解析生成清單

>>> [ x

for

in

range

)]

>>>

>>>

# 生成器表達式

>>> (x

for

in

range

))

<generator

object

<genexpr> at

0x000000000315F678

>>>

# 兩者之間轉換

>>>

list

(x

for

in

range

))

疊代器（疊代就是循環）

　　疊代器包含有next方法的實作，在正确的範圍内傳回期待的資料以及超出範圍後能夠抛出StopIteration的錯誤停止疊代。

　　我們已經知道，可以直接作用于for循環的資料類型有以下幾種：

一類是集合資料類型，如list,tuple,dict,set,str等

一類是generator，包括生成器和帶yield的generator function

這些可以直接作用于for 循環的對象統稱為可疊代對象：Iterable

可以使用isinstance()判斷一個對象是否為可Iterable對象

>>>

from

collections

import

Iterable

>>>

isinstance

([], Iterable)

True

>>>

isinstance

({}, Iterable)

True

>>>

isinstance

'abc'

, Iterable)

True

>>>

isinstance

((x

for

in

range

)), Iterable)

True

>>>

isinstance

, Iterable)

False

　　而生成器不但可以作用于for循環，還可以被next()函數不斷調用并傳回下一個值，直到最後抛出StopIteration錯誤表示無法繼續傳回下一個值了。

是以這裡講一下疊代器

一個實作了iter方法的對象時可疊代的，一個實作next方法的對象是疊代器

可以被next()函數調用并不斷傳回下一個值的對象稱為疊代器：Iterator。

可以使用isinstance()判斷一個對象是否是Iterator對象：

>>>

from

collections

import

Iterator

>>>

isinstance

((x

for

in

range

)), Iterator)

True

>>>

isinstance

([], Iterator)

False

>>>

isinstance

({}, Iterator)

False

>>>

isinstance

'abc'

, Iterator)

False

生成器都是

Iterator

對象，但

list

、

dict

、

str

雖然是

Iterable（可疊代對象）

，卻不是

Iterator（疊代器）

。

把

list

、

dict

、

str

等

Iterable

變成

Iterator

可以使用

iter()

函數：

>>>

isinstance

iter

([]), Iterator)

True

>>>

isinstance

iter

'abc'

), Iterator)

True

你可能會問，為什麼

list

、

dict

、

str

等資料類型不是

Iterator

？

這是因為Python的

Iterator

對象表示的是一個資料流，Iterator對象可以被

next()

函數調用并不斷傳回下一個資料，直到沒有資料時抛出

StopIteration

錯誤。可以把這個資料流看做是一個有序序列，但我們卻不能提前知道序列的長度，隻能不斷通過

next()

函數實作按需計算下一個資料，是以

Iterator

的計算是惰性的，隻有在需要傳回下一個資料時它才會計算。

Iterator

甚至可以表示一個無限大的資料流，例如全體自然數。而使用list是永遠不可能存儲全體自然數的。

　　判斷下列資料類型是可疊代對象or疊代器

'hello'

'a'

set

open

'a.txt'

s=

'hello'

#字元串是可疊代對象，但不是疊代器

l=[1,2,3,4]     #清單是可疊代對象，但不是疊代器

t=(1,2,3)       #元組是可疊代對象，但不是疊代器

d={

'a'

:1}        #字典是可疊代對象，但不是疊代器

set

={1,2,3}     #集合是可疊代對象，但不是疊代器

# *************************************

f=open(

'test.txt'

) #檔案是可疊代對象，是疊代器

#如何判斷是可疊代對象，隻有__iter__方法，執行該方法得到的疊代器對象。

# 及可疊代對象通過__iter__轉成疊代器對象

from

collections import Iterator  #疊代器

from

collections import Iterable  #可疊代對象

print(isinstance(s,Iterator))     #判斷是不是疊代器

print(isinstance(s,Iterable))       #判斷是不是可疊代對象

#把可疊代對象轉換為疊代器

print(isinstance(iter(s),Iterator))

　注意：檔案的判斷

f = open(

'housing.csv'

from

collections import Iterator

from

collections import Iterable

print(isinstance(f,Iterator))

print(isinstance(f,Iterable))

True

True

　　結論：檔案是可疊代對象，也是疊代器

小結：

凡是可作用于 for 循環的對象都是 Iterable 類型；
凡是可作用于 next() 函數的對象都是 Iterator 類型，它們表示一個惰性計算的序列；
集合資料類型如 list 、 dict 、 str 等是 Iterable 但不是 Iterator ，不過可以通過 iter() 函數獲得一個 Iterator 對象。

Python3的

for

循環本質上就是通過不斷調用

next()

函數實作的，例如：

1 2	`for` `x` `in` `[` `1` `,` `2` `,` `3` `,` `4` `,` `5` `]:` `pass`

　實際上完全等價于

# 首先獲得Iterator對象:

it

iter

([

])

# 循環:

while

True

try

# 獲得下一個值:

next

(it)

except

StopIteration:

# 遇到StopIteration就退出循環

break

對yield的總結

它的缺點也很明顯，就是所有資料都在記憶體裡面，如果有海量的資料，将會非常耗記憶體。

　　（2）生成器是可以疊代的，但是隻可以讀取它一次。因為用的時候才生成，比如a = (x*x for x in range(3))。!!!!注意這裡是小括号而不是方括号。

　　（3）生成器（generator）能夠疊代的關鍵是他有next()方法，工作原理就是通過重複調用next()方法，直到捕獲一個異常。

　　（4）帶有yield的函數不再是一個普通的函數，而是一個生成器generator，可用于疊代

　　（6）yield就是return傳回的一個值，并且記住這個傳回的位置。下一次疊代就從這個位置開始。

　　（7）帶有yield的函數不僅僅是隻用于for循環，而且可用于某個函數的參數，隻要這個函數的參數也允許疊代參數。

　　（9）send()和next()都有傳回值，他們的傳回值是目前疊代遇到的yield的時候，yield後面表達式的值，其實就是目前疊代yield後面的參數。

　　（10）第一次調用時候必須先next（）或send（）,否則會報錯，send後之是以為None是因為這時候沒有上一個yield，是以也可以認為next（）等同于send(None)

不經一番徹骨寒怎得梅花撲鼻香

yield後面的代碼開始執行

　　（6）yield就是return傳回的一個值，并且記住這個傳回的位置。下一次疊代就從這個位置開始。

　　（7）帶有yield的函數不僅僅是隻用于for循環，而且可用于某個函數的參數，隻要這個函數的參數也允許疊代參數。

　　（9）send()和next()都有傳回值，他們的傳回值是目前疊代遇到的yield的時候，yield後面表達式的值，其實就是目前疊代yield後面的參數。

　　（10）第一次調用時候必須先next（）或send（）,否則會報錯，send後之是以為None是因為這時候沒有上一個yield，是以也可以認為next（）等同于send(None)

不經一番徹骨寒怎得梅花撲鼻香

生成器疊代器python 生成器和疊代器有這篇就夠了python 生成器和疊代器有這篇就夠了python 生成器和疊代器有這篇就夠了

python 生成器和疊代器有這篇就夠了

清單生成器

生成器

疊代器（疊代就是循環）

對yield的總結

python 生成器和疊代器有這篇就夠了

清單生成器

生成器

疊代器（疊代就是循環）

對yield的總結

python 生成器和疊代器有這篇就夠了

清單生成器

生成器

疊代器（疊代就是循環）

對yield的總結

繼續閱讀

12 個要收藏的前端 CSS 網站

Vue開發中可以使用的 ES6新特征

16個實用的背景生成器工具

用圖表學習掌握異步/同步知識

靜态部落格網站——vuepress功能進化

新星計劃Day3【JavaSE】集合 Part1

擺脫缺陷樣本少的煩惱！基于正樣本的布匹表面缺陷檢測

java集合之ArrayList 源碼閱讀記錄

真人視訊秒變高清動漫臉，數十種“濾鏡”可選，無需注冊線上可玩｜SIGGRAPH Asia 2022

提升 Python 程式性能的7個習慣

yield語句

Unity3d中協程的原理，你要的yield return new xxx的真正了解之道之前還是要說一下疊代器c#裡的yield return回到unity3d應用之二強行總分總

Python3學習筆記（2）——特性和語句1 特性2 語句

python遞歸生成式解包周遊嵌套清單

【python】可疊代對象（Iterable）與疊代器（Iterator）

Python程式可列印今天的年，月和日

生成器 疊代器python 生成器和疊代器有這篇就夠了python 生成器和疊代器有這篇就夠了python 生成器和疊代器有這篇就夠了

python 生成器和疊代器有這篇就夠了

清單生成器

生成器

疊代器（疊代就是循環）

對yield的總結

python 生成器和疊代器有這篇就夠了

清單生成器

生成器

疊代器（疊代就是循環）

對yield的總結

python 生成器和疊代器有這篇就夠了

清單生成器

生成器

疊代器（疊代就是循環）

對yield的總結

繼續閱讀

生成器疊代器python 生成器和疊代器有這篇就夠了python 生成器和疊代器有這篇就夠了python 生成器和疊代器有這篇就夠了

　　清單生成器

　　生成器

　　清單生成器

　　生成器

　　清單生成器

　　生成器