4.1. if 語句
可能最為人所熟知的程式設計語句就是 if 語句了。例如
>>> x = int(input("Please enter an integer: "))
Please enter an integer: 42
>>> if x < 0:
... x = 0
... print('Negative changed to zero')
... elif x == 0:
... print('Zero')
... elif x == 1:
... print('Single')
... else:
... print('More')
...
More
可以有零個或多個 elif 部分,以及一個可選的 else 部分。 關鍵字 ‘elif’ 是 ‘else if’ 的縮寫,适合用于避免過多的縮進。 一個 if … elif … elif … 序列可以看作是其他語言中的 switch 或 case 語句的替代。
4.2. for 語句
Python 中的 for 語句與你在 C 或 Pascal 中所用到的有所不同。 Python 中的 for 語句并不總是對算術遞增的數值進行疊代(如同 Pascal),或是給予使用者定義疊代步驟和暫停條件的能力(如同 C),而是對任意序列進行疊代(例如清單或字元串),條目的疊代順序與它們在序列中出現的順序一緻。 例如(此處英文為雙關語):
>>> # Measure some strings:
... words = ['cat', 'window', 'defenestrate']
>>> for w in words:
... print(w, len(w))
...
cat 3
window 6
defenestrate 12
在周遊同一個集合時修改該集合的代碼可能很難獲得正确的結果。通常,更直接的做法是循環周遊該集合的副本或建立新集合:
# Strategy: Iterate over a copy
for user, status in users.copy().items():
if status == 'inactive':
del users[user]
# Strategy: Create a new collection
active_users = {}
for user, status in users.items():
if status == 'active':
active_users[user] = status
4.3. range() 函數
如果你确實需要周遊一個數字序列,内置函數 range() 會派上用場。它生成算術級數:
>>> for i in range(5):
... print(i)
...
0
1
2
3
4
給定的終止數值并不在要生成的序列裡;range(10) 會生成10個值,并且是以合法的索引生成一個長度為10的序列。range也可以以另一個數字開頭,或者以指定的幅度增加(甚至是負數;有時這也被叫做 ‘步進’)
range(5, 10)
5, 6, 7, 8, 9
range(0, 10, 3)
0, 3, 6, 9
range(-10, -100, -30)
-10, -40, -70
要以序列的索引來疊代,您可以将 range() 和 len() 組合如下:
>>> a = ['Mary', 'had', 'a', 'little', 'lamb']
>>> for i in range(len(a)):
... print(i, a[i])
...
0 Mary
1 had
2 a
3 little
4 lamb
然而,在大多數這類情況下,使用 enumerate() 函數比較友善,請參見 循環的技巧 (後續補充)。
如果你隻列印 range,會出現奇怪的結果:
>>> print(range(10))
range(0, 10)
range() 所傳回的對象在許多方面表現得像一個清單,但實際上卻并不是。此對象會在你疊代它時基于所希望的序列傳回連續的項,但它沒有真正生成清單,這樣就能節省空間。
我們稱這樣對象為 iterable,也就是說,适合作為這樣的目标對象:函數和結構期望從中擷取連續的項直到所提供的項全部耗盡。 我們已經看到 for 語句就是這樣一種結構,而接受可疊代對象的函數的一個例子是 sum():
>>> sum(range(4)) # 0 + 1 + 2 + 3
6
4.4. break 和 continue 語句,以及循環中的 else 子句
break 語句,和 C 中的類似,用于跳出最近的 for 或 while 循環.
循環語句可能帶有 else 子句;它會在循環耗盡了可疊代對象 (使用 for) 或循環條件變為假值 (使用 while) 時被執行,但不會在循環被 break 語句終止時被執行。 以下搜尋素數的循環就是這樣的一個例子:
>>> for n in range(2, 10):
... for x in range(2, n):
... if n % x == 0:
... print(n, 'equals', x, '*', n//x)
... break
... else:
... # loop fell through without finding a factor
... print(n, 'is a prime number')
...
2 is a prime number
3 is a prime number
4 equals 2 * 2
5 is a prime number
6 equals 2 * 3
7 is a prime number
8 equals 2 * 4
9 equals 3 * 3
(是的,這是正确的代碼。仔細看: else 子句屬于 for 循環, 不屬于 if 語句。)
當和循環一起使用時,else 子句與 try 語句中的 else 子句的共同點多于 if 語句中的同類子句: try 語句中的 else 子句會在未發生異常時執行,而循環中的 else 子句則會在未發生 break 時執行。 有關 try 語句和異常的更多資訊,請參閱 處理異常。
continue 語句也是借鑒自 C 語言,表示繼續循環中的下一次疊代:
>>> for num in range(2, 10):
... if num % 2 == 0:
... print("Found an even number", num)
... continue
... print("Found an odd number", num)
Found an even number 2
Found an odd number 3
Found an even number 4
Found an odd number 5
Found an even number 6
Found an odd number 7
Found an even number 8
Found an odd number 9
4.5. pass 語句
pass 語句什麼也不做。當文法上需要一個語句,但程式需要什麼動作也不做時,可以使用它。例如:
>>> while True:
... pass # Busy-wait for keyboard interrupt (Ctrl+C)
...
這通常用于建立最小的類:
>>> class MyEmptyClass:
... pass
...
pass 的另一個可以使用的場合是在你編寫新的代碼時作為一個函數或條件子句體的占位符,允許你保持在更抽象的層次上進行思考。 pass 會被靜默地忽略:
>>> def initlog(*args):
... pass # Remember to implement this!
...
4.6. 定義函數
我們可以建立一個輸出任意範圍内 Fibonacci 數列的函數:
>>> def fib(n): # write Fibonacci series up to n
... """Print a Fibonacci series up to n."""
... a, b = 0, 1
... while a < n:
... print(a, end=' ')
... a, b = b, a+b
... print()
...
>>> # Now call the function we just defined:
... fib(2000)
0 1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987 1597
關鍵字 def 引入一個函數 定義。它必須後跟函數名稱和帶括号的形式參數清單。構成函數體的語句從下一行開始,并且必須縮進。
函數體的第一個語句可以(可選的)是字元串文字;這個字元串文字是函數的文檔字元串或 docstring 。(有關文檔字元串的更多資訊,請參閱 文檔字元串 部分)有些工具使用文檔字元串自動生成線上或印刷文檔,或者讓使用者以互動式的形式浏覽代碼;在你編寫的代碼中包含文檔字元串是一種很好的做法,是以要養成習慣。
函數的 執行 會引入一個用于函數局部變量的新符号表。 更确切地說,函數中所有的變量指派都将存儲在局部符号表中;而變量引用會首先在局部符号表中查找,然後是外層函數的局部符号表,再然後是全局符号表,最後是内置名稱的符号表。 是以,全局變量和外層函數的變量不能在函數内部直接指派(除非是在 global 語句中定義的全局變量,或者是在 nonlocal 語句中定義的外層函數的變量),盡管它們可以被引用。
在函數被調用時,實際參數(實參)會被引入被調用函數的本地符号表中;是以,實參是通過 按值調用 傳遞的(其中 值 始終是對象 引用 而不是對象的值)。1 當一個函數調用另外一個函數時,将會為該調用建立一個新的本地符号表。
函數定義會将函數名稱與函數對象在目前符号表中進行關聯。 解釋器會将該名稱所指向的對象識别為使用者自定義函數。 其他名稱也可指向同一個函數對象并可被用來通路訪函數:
>>> fib
<function fib at 10042ed0>
>>> f = fib
>>> f(100)
0 1 1 2 3 5 8 13 21 34 55 89
如果你學過其他語言,你可能會認為 fib 不是函數而是一個過程,因為它并不傳回值。事實上,即使沒有 return 語句的函數也會傳回一個值,盡管它是一個相當無聊的值。這個值稱為 None (它是内置名稱)。一般來說解釋器不會列印出單獨的傳回值 None ,如果你真想看到它,你可以使用 print()
>>> fib(0)
>>> print(fib(0))
None
寫一個傳回斐波那契數列的清單(而不是把它列印出來)的函數,非常簡單:
>>> def fib2(n): # return Fibonacci series up to n
... """Return a list containing the Fibonacci series up to n."""
... result = []
... a, b = 0, 1
... while a < n:
... result.append(a) # see below
... a, b = b, a+b
... return result
...
>>> f100 = fib2(100) # call it
>>> f100 # write the result
[0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89]
此示例中,像往常一樣,示範了一些新的 Python 功能:
return 語句會從函數内部傳回一個值。 不帶表達式參數的 return 會傳回 None。 函數執行完畢退出也會傳回 None。
result.append(a) 語句調用了清單對象 result 的 方法 。方法是“屬于”一個對象的函數,它被命名為 obj.methodname ,其中 obj 是某個對象(也可能是一個表達式), methodname 是由對象類型中定義的方法的名稱。不同的類型可以定義不同的方法。不同類型的方法可以有相同的名稱而不會引起歧義。(可以使用 類 定義自己的對象類型和方法,請參閱 類 )示例中的方法 append() 是為清單對象定義的;它會在清單的最後添加一個新的元素。在這個示例中它相當于 result = result + [a] ,但更高效。
4.7. 函數定義的更多形式
給函數定義有可變數目的參數也是可行的。這裡有三種形式,可以組合使用。
4.7.1. 參數預設值
最有用的形式是對一個或多個參數指定一個預設值。這樣建立的函數,可以用比定義時允許的更少的參數調用,比如:
def ask_ok(prompt, retries=4, reminder='Please try again!'):
while True:
ok = input(prompt)
if ok in ('y', 'ye', 'yes'):
return True
if ok in ('n', 'no', 'nop', 'nope'):
return False
retries = retries - 1
if retries < 0:
raise ValueError('invalid user response')
print(reminder)
這個函數可以通過幾種方式調用:
隻給出必需的參數:ask_ok(‘Do you really want to quit?’)
給出一個可選的參數:ask_ok(‘OK to overwrite the file?’, 2)
或者給出所有的參數:ask_ok(‘OK to overwrite the file?’, 2, ‘Come on, only yes or no!’)
這個示例還介紹了 in 關鍵字。它可以測試一個序列是否包含某個值。
預設值是在 定義過程 中在函數定義處計算的,是以:
i = 5
def f(arg=i):
print(arg)
i = 6
f()
會列印 5。
重要警告: 預設值隻會執行一次。這條規則在預設值為可變對象(清單、字典以及大多數類執行個體)時很重要。比如,下面的函數會存儲在後續調用中傳遞給它的參數:
def f(a, L=[]):
L.append(a)
return L
print(f(1))
print(f(2))
print(f(3))
[1]
[1, 2]
[1, 2, 3]
如果你不想要在後續調用之間共享預設值,你可以這樣寫這個函數:
def f(a, L=None):
if L is None:
L = []
L.append(a)
return L
4.7.2. 關鍵字參數
也可以使用形如 kwarg=value 的 關鍵字參數 來調用函數。例如下面的函數:
def parrot(voltage, state='a stiff', action='voom', type='Norwegian Blue'):
print("-- This parrot wouldn't", action, end=' ')
print("if you put", voltage, "volts through it.")
print("-- Lovely plumage, the", type)
print("-- It's", state, "!")
接受一個必需的參數(voltage)和三個可選的參數(state, action,和 type)。這個函數可以通過下面的任何一種方式調用:
parrot(1000) # 1 positional argument
parrot(voltage=1000) # 1 keyword argument
parrot(voltage=1000000, action='VOOOOOM') # 2 keyword arguments
parrot(action='VOOOOOM', voltage=1000000) # 2 keyword arguments
parrot('a million', 'bereft of life', 'jump') # 3 positional arguments
parrot('a thousand', state='pushing up the daisies') # 1 positional, 1 keyword
但下面的函數調用都是無效的:
parrot() # required argument missing
parrot(voltage=5.0, 'dead') # non-keyword argument after a keyword argument
parrot(110, voltage=220) # duplicate value for the same argument
parrot(actor='John Cleese') # unknown keyword argument
在函數調用中,關鍵字參數必須跟随在位置參數的後面。傳遞的所有關鍵字參數必須與函數接受的其中一個參數比對(比如 actor 不是函數 parrot 的有效參數),它們的順序并不重要。這也包括非可選參數,(比如 parrot(voltage=1000) 也是有效的)。不能對同一個參數多次指派。下面是一個因為此限制而失敗的例子:
>>> def function(a):
... pass
...
>>> function(0, a=0)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: function() got multiple values for keyword argument 'a'
當存在一個形式為 **name 的最後一個形參時,它會接收一個字典 (參見 映射類型 — dict),其中包含除了與已有形參相對應的關鍵字參數以外的所有關鍵字參數。 這可以與一個形式為 *name,接收一個包含除了已有形參清單以外的位置參數的 元組 的形參 (将在下一小節介紹) 組合使用 (*name 必須出現在 **name 之前。) 例如,如果我們這樣定義一個函數:
def cheeseshop(kind, *arguments, **keywords):
print("-- Do you have any", kind, "?")
print("-- I'm sorry, we're all out of", kind)
for arg in arguments:
print(arg)
print("-" * 40)
for kw in keywords:
print(kw, ":", keywords[kw])
它可以像這樣調用:
cheeseshop("Limburger", "It's very runny, sir.",
"It's really very, VERY runny, sir.",
shopkeeper="Michael Palin",
client="John Cleese",
sketch="Cheese Shop Sketch")
當然它會列印:
-- Do you have any Limburger ?
-- I'm sorry, we're all out of Limburger
It's very runny, sir.
It's really very, VERY runny, sir.
----------------------------------------
shopkeeper : Michael Palin
client : John Cleese
sketch : Cheese 4.7.3. 特殊參數 Sketch
意列印時關鍵字參數的順序保證與調用函數時提供它們的順序是相比對的
4.7.3. 特殊參數
預設情況下,函數的參數傳遞形式可以是位置參數或是顯式的關鍵字參數。 為了確定可讀性和運作效率,限制允許的參數傳遞形式是有意義的,這樣開發者隻需檢視函數定義即可确定參數項是僅按位置、按位置也按關鍵字,還是僅按關鍵字傳遞。
函數的定義看起來可以像是這樣:
def f(pos1, pos2, /, pos_or_kwd, *, kwd1, kwd2):
----------- ---------- ----------
| | |
| Positional or keyword |
| - Keyword only
-- Positional 在這裡 / 和 * 是可選的。 如果使用這些符号則表明可以通過何種形參将參數值傳遞給函數:僅限位置、位置或關鍵字,以及僅限關鍵字。 關鍵字形參也被稱為命名形參。
4.7.3.1. 位置或關鍵字參數
如果函數定義中未使用 / 和 *,則參數可以按位置或按關鍵字傳遞給函數。
4.7.3.2. 僅限位置參數
在這裡還可以發現更多細節,特定形參可以被标記為 僅限位置。 如果是 僅限位置 的形參,則其位置是重要的,并且該形參不能作為關鍵字傳入。 僅限位置形參要放在 / (正斜杠) 之前。 這個 / 被用來從邏輯上分隔僅限位置形參和其它形參。 如果函數定義中沒有 /,則表示沒有僅限位置形參。
在 / 之後的形參可以為 位置或關鍵字 或 僅限關鍵字。
4.7.3.3. 僅限關鍵字參數
要将形參标記為 僅限關鍵字,即指明該形參必須以關鍵字參數的形式傳入,應在參數清單的第一個 僅限關鍵字 形參之前放置一個 *。
4.7.3.4. 函數示例
請考慮以下示例函數定義并特别注意 / 和 * 标記:
>>> def standard_arg(arg):
... print(arg)
...
>>> def pos_only_arg(arg, /):
... print(arg)
...
>>> def kwd_only_arg(*, arg):
... print(arg)
...
>>> def combined_example(pos_only, /, standard, *, kwd_only):
... print(pos_only, standard, kwd_only)
第一個函數定義 standard_arg 是最常見的形式,對調用方式沒有任何限制,參數可以按位置也可以按關鍵字傳入:
>>> standard_arg(2)
2
>>> standard_arg(arg=2)
2
第二個函數 pos_only_arg 在函數定義中帶有 /,限制僅使用位置形參:
>>> pos_only_arg(1)
1
>>> pos_only_arg(arg=1)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: pos_only_arg() got an unexpected keyword argument 'arg'
第三個函數 kwd_only_args 在函數定義中通過 * 指明僅允許關鍵字參數:
>>> kwd_only_arg(3)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: kwd_only_arg() takes 0 positional arguments but 1 was given
>>> kwd_only_arg(arg=3)
3
而最後一個則在同一函數定義中使用了全部三種調用方式:
>>> combined_example(1, 2, 3)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: combined_example() takes 2 positional arguments but 3 were given
>>> combined_example(1, 2, kwd_only=3)
1 2 3
>>> combined_example(1, standard=2, kwd_only=3)
1 2 3
>>> combined_example(pos_only=1, standard=2, kwd_only=3)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: combined_example() got an unexpected keyword argument 'pos_only'
最後,請考慮這個函數定義,它的位置參數 name 和 **kwds 之間由于存在關鍵字名稱 name 而可能産生潛在沖突:
ef foo(name, **kwds):
return 'name' in kwds
任何調用都不可能讓它傳回 True,因為關鍵字 ‘name’ 将總是綁定到第一個形參。 例如:
>>> foo(1, **{'name': 2})
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: foo() got multiple values for argument 'name'
>>>
但使用 / (僅限位置參數) 就可能做到,因為它允許 name 作為位置參數,也允許 ‘name’ 作為關鍵字參數的關鍵字名稱:
def foo(name, /, **kwds):
return 'name' in kwds
>>> foo(1, **{'name': 2})
True
換句話說,僅限位置形參的名稱可以在 **kwds 中使用而不産生歧義。
4.7.4. 任意的參數清單
最後,最不常用的選項是可以使用任意數量的參數調用函數。這些參數會被包含在一個元組裡(參見 元組和序列 )。在可變數量的參數之前,可能會出現零個或多個普通參數。:
def write_multiple_items(file, separator, *args):
file.write(separator.join(args))
一般來說,這些 可變參數 将在形式參數清單的末尾,因為它們收集傳遞給函數的所有剩餘輸入參數。出現在 *args 參數之後的任何形式參數都是 ‘僅限關鍵字參數’,也就是說它們隻能作為關鍵字參數而不能是位置參數。:
>>> def concat(*args, sep="/"):
... return sep.join(args)
...
>>> concat("earth", "mars", "venus")
'earth/mars/venus'
>>> concat("earth", "mars", "venus", sep=".")
'earth.mars.venus'
4.7.5. 解包參數清單
當參數已經在清單或元組中但要為需要單獨位置參數的函數調用解包時,會發生相反的情況。例如,内置的 range() 函數需要單獨的 start 和 stop 參數。如果它們不能單獨使用,可以使用 * 操作符 來編寫函數調用以便從清單或元組中解包參數:
>>> list(range(3, 6)) # normal call with separate arguments
[3, 4, 5]
>>> args = [3, 6]
>>> list(range(*args)) # call with arguments unpacked from a list
[3, 4, 5]
同樣的方式,字典可使用 ** 操作符 來提供關鍵字參數:
>>> def parrot(voltage, state='a stiff', action='voom'):
... print("-- This parrot wouldn't", action, end=' ')
... print("if you put", voltage, "volts through it.", end=' ')
... print("E's", state, "!")
...
>>> d = {"voltage": "four million", "state": "bleedin' demised", "action": "VOOM"}
>>> parrot(**d)
-- This parrot wouldn't VOOM if you put four million volts through it. E's bleedin' demised !
>>> def make_incrementor(n):
... return lambda x: x + n
...
>>> f = make_incrementor(42)
>>> f(0)
42
>>> f(1)
43
>>> pairs = [(1, 'one'), (2, 'two'), (3, 'three'), (4, 'four')]
>>> pairs.sort(key=lambda pair: pair[1])
>>> pairs
[(4, 'four'), (1, 'one'), (3, 'three'), (2, 'two')]