天天看點

Python 3.9 性能優化:更快的 list()、dict() 和 range() 等内置類型

Python 的 3.9.0 版本正在開發中,計劃在 2020-10-05 釋出 final 版本。

官方在 changelog 中披露了很多細節,其中有一項“vectorcall”特性是最容易被接受的,本文打算帶大家先來一探究竟。

事實上,早在 Python 3.8 版本中就已部分地實作了 vectorcall,隻不過它是暫時性的,被隐藏起來了,按計劃是在 3.9 版本中實作完全體。下圖是 3.8 版本中的簡介:

那麼,什麼是 vectorcall 呢?它會帶來哪些變化呢?

“a fast calling protocol for CPython”,即它是 CPython 的一種快速調用協定,可以加速 CPython 解釋器在調用類對象時的速度。

(PS:需要注意的是,這裡說的“協定”是一種廣義的稱呼,它跟我們熟知的網絡協定或通信協定不同,可了解為對代碼作調用時的一種約定、一種實作方式)

這種協定是在 PEP-590 中被提出的(時間是 2019-03-29),對應的 bpo 是 issue37207,曆時近一年的開發,目前它的實作已合入了代碼倉。

用一句話概括它的核心要點是:它将提升 list()、tuple()、dict() 等主要類型的調用速度,同時它還可以被用在自定義的類上。

結合 PEP 與 bpo 資訊,我提煉了以下的詳細要點:

  • vectorcall 是對 fastcall 的正式化。在之前的 CPython 中存在一些零散的優化點(即 fastcall),如今官方把它們系統化了,給出了一個正式的“vectorcall”稱呼
  • vectorcall 适用于多數内置類型。據目前的披露資訊,它适用于 list、tuple、dict、set、frozenset 與 range 這 6 種主要的内置類型(部分測量資料顯示,速度提升率達 10%~30%)
  • vectorcall 是對性能與靈活性的調和。之前的解釋器具有很高的靈活性,但是在對象調用過程中,存在不必要的中間對象以及間接的調用開銷,如今是設法消除了這部分開銷,得以提升了性能

PEP-590 中還詳細介紹了 CPython 的實作細節,并羅列了 C API 的變化點,這部分内容就不展開了,感興趣的同學請自行查閱文檔。

--------貓哥碎碎念分割線--------

主要的内容就算介紹完了,它很簡單,并不難了解,不會帶來學習的負擔,也不會造成什麼意見分歧。

但是說句老實話,這個性能提升可能顯得有點“費力不讨好”:内置類型的調用速度并不會造成什麼性能問題(并不慢),而提升空間也僅是納秒/微秒級别,非常有限。多名核心開發者花費大半年時間和精力,到底值不值得?

我們恐怕都沒有對此作出價值評判的資格。仁者見仁,智者見智。

但是,也許我們可以往樂觀的方面想:對于這種微不足道的性能提升,核心開發者們都能認真對待、精益求精、持續投入、考慮全面,那在其它方面上也絕不會遜色。是以,我們有理由對 Python 的未來保持樂觀的希望!

相關連結:

https://docs.python.org/3.9/whatsnew/changelog.html

https://www.python.org/dev/peps/pep-0590

https://bugs.python.org/issue37207