Python 為什麼能支援任意的真值判斷？

本文出自“Python為什麼”系列，請檢視全部文章

Python 在涉及

真值判斷

（Truth Value Testing）時，文法很簡便。

比如，在判斷某個對象是否不為 None 時，或者判斷容器對象是否不為空時，并不需要顯示地寫出判斷條件，隻需要在 if 或 while 關鍵字後面直接寫上該對象即可。

下圖以清單為例，

if my_list

這個簡短的寫法可以表達出兩層意思：

如果需要作出相反的判斷，即“如果為 None 或為空”，隻需要寫成

if not my_list

即可。

與衆不同的真值判斷方式

通常而言，當一個值本身是布爾類型時，寫成"if xxx"（如果真），在語義上就很好了解。如果 xxx 本身不是布爾類型時，寫成“if xxx”（如果某東西），則在語義上并不好了解。

在 C/C++/Java 之類的

靜态語言

中，通常要先基于 xxx 作一個比較操作，比如“if (xxx == null)”，以此得到一個布爾類型的值的結果，然後再進行真值判斷。否則的話，若“if xxx”中有非布爾類型的值，則會報類型錯誤。

Python 這門

動态語言

在這種場景中表現出了一種靈活性，那麼，我們的問題來了：為什麼 Python 不需要先做一次比較操作，直接就能對任意對象作真值判斷呢？

先來看看文檔中對真值判斷的描述：

簡單而言，Python 的任何對象都可以用在 if 或 while 或布爾操作（and、or、not）中，預設情況下認為它是 true，除非它有__bool__() 方法傳回

False

或者有__len__() 方法傳回

。

對于前面的例子，my_list 沒有__bool__() 方法，但是它有__len__() 方法，是以它是否為 true，取決于這個方法的傳回值。

真值判斷的位元組碼

接着，我們繼續刨根問底：Python 為什麼可以支援如此寬泛的真值判斷呢？在執行

if xxx

這樣的語句時，它到底在做些什麼？

對于第一個問題，Python 有個内置的 bool() 類型，可以将任意對象轉化成布爾值。那麼，這是否意味着 Python 在進行真值判斷時，會

隐式地

調用 bool() 呢（即轉化成

if bool(xxx)

）？（答案為否，下文有分析）

對于第二個問題，可以先用

dis

子產品來檢視下：

POP_JUMP_IF_FALSE

指令對應的是 if 語句那行，它的含義是：

If TOS is false, sets the bytecode counter to target. TOS is popped.

如果棧頂元素為 false，則跳轉到目标位置。

這裡隻有跳轉動作的描述，仍看不到一個普通對象是如何變成布爾對象的。

Python 在解釋器中到底是如何實作真值判斷的呢？

真值判斷的源碼實作

在微信群友 Jo 的幫助下，我找到了 CPython 的源碼（檔案：ceval.c、object.c）：

可以看出，對于布爾類型的對象（即 Py_True 和 Py_False），代碼會進入到快速處理的分支；而對于其它對象，則會用 PyObject_IsTrue() 計算出一個 int 類型的值。

PyObject_IsTrue() 函數在計算過程中，依次會擷取 nb_bool、mp_length 和 sq_length 的值，對應的應該就是 __bool__() 和 __len__() 這兩個魔術方法的傳回值。

這個過程就是前文中所引用的官方文檔的描述，正是我們想要找的答案！

另外，對于内置的 bool()，它的核心實作邏輯正是上面的 PyObject_IsTrue() 函數，源碼如下（boolobject.c）：

是以，Python 在對普通對象作真值判斷時，并沒有隐式地調用 bool()，相反它調用了一個獨立的函數（PyObject_IsTrue()），而這個函數又被 bool() 所使用。

也就是說，bool() 與 if/while 語句對普通對象的真值判斷，事實上是基本相同的處理邏輯。知道了原理，就會明白

if bool(xxx)

這種寫法是多此一舉的了（我曾見到過）。

至此，我們已經回答了前文中提出的問題。

驗證真值判斷的過程

接下來，有 3 個測試例子，可以作進一步的驗證：

你可以暫停而思考下：

bool(Test1)

與

bool(Test1())

各是什麼結果？然後依次判斷剩下的兩個類，結果又會是什麼？

揭曉答案：

bool(Test1)    # True
bool(Test2)    # True
bool(Test3)    # True

bool(Test1())  # True
bool(Test2())  # False
bool(Test3())  # True

原因如下：

類對象沒被執行個體化時，bool() 不會調用它的 __bool__() 或 __len__() 這兩個魔術方法
類對象被執行個體化後，若同時存在 __bool__() 或 __len__() 魔術方法，則 bool() 會先調用 __bool__() 方法（PS：這個方法要求傳回值必須為 bool 類型，是以隻要有它，就必然不需要再用__len__() 方法來判斷真假）

數字類型如何作真值判斷？

除了這 3 個例子，還有一種情況值得驗證，那就是對于數字類型，它們是怎麼做真值判斷的呢？

我們可以驗證一下數字類型是否擁有那兩個魔術方法：

hasattr(2020, "__bool__")
hasattr(2020, "__len__")

不難驗證出，數字擁有的是 __bool__() 魔術方法，并沒有__len__() 魔術方法，而且所有類型的數字其實被分成了兩類：

__bool__() 傳回 False：所有表示 0 的數字，例如 , 0.0 0j Decimal(0) Fraction(0, 1)
__bool__() 傳回 True：所有其它非 0 的數字

文章小結

Python 中

if xxx

這種簡便的寫法，雖然是正規的真值判斷文法，并它但并不符合正常的語義。在 C/C++/Java 之類的語言中，要麼 xxx 本身是布爾類型的值，要麼是一種可傳回布爾類型值的操作，但是在 Python 中，這個“xxx”竟然還可以是任意的 Python 對象！

本文通過對文檔、位元組碼和 CPython 解釋器的源碼逐漸分析，發現了 Python 的真值判斷過程并不簡單，可以提煉出以下的幾個要點：

if/while 是隐性的布爾操作符：它們除了有“判斷”真假的作用，還具有隐式地将普通對象計算出布爾結果的功能。實際的操作是解釋器根據“POP_JUMP_IF_FALSE”指令來完成的，其核心邏輯跟内置的 bool() 是共用了一個底層方法
真值判斷過程依賴兩個魔術方法：除非被判斷對象有__bool__() 方法傳回 False ，否則布爾操作的結果都是 True。兩個魔術方法總是會先計算__bool__()
數字類型也可做真值判斷：數字有__bool__() 魔術方法，但沒有__len__() 魔術方法，除了表示 0 的數字為 False，其它數字都為 True

如果你覺得本文分析得不錯，那你應該會喜歡這些文章：

1、Python為什麼使用縮進來劃分代碼塊？

2、Python 的縮進是不是反人類的設計？

3、Python 為什麼不用分号作語句終止符？

4、Python 為什麼沒有 main 函數？為什麼我不推薦寫 main 函數？

5、Python 為什麼推薦蛇形命名法？

6、Python 為什麼不支援 i++ 自增文法，不提供 ++ 操作符？

7、Python 為什麼隻需一條語句“a,b=b,a”，就能直接交換兩個變量？

8、Python 為什麼用 # 号作注釋符？

9、Python 為什麼要有 pass 語句？

10、Python 為什麼會有個奇怪的“...”對象？

本文屬于“Python為什麼”系列（Python貓出品），該系列主要關注 Python 的文法、設計和發展等話題，以一個個“為什麼”式的問題為切入點，試着展現 Python 的迷人魅力。所有文章将會歸檔在 Github 上，項目位址：https://github.com/chinesehuazhou/python-whydo