醒醒！Python已經支援中文變量名啦！

最近，我在翻閱兩本比較新的 Python 書籍時，發現它們都犯了一個嚴重的低級錯誤！

這兩本書分别是《Python程式設計：從入門到實踐》和《父與子的程式設計之旅》，它們都是暢銷書，都在 2020 年 10 月出了新版本，都使用 Python3.7+ 版本的文法。

然而，在關于變量的命名規則部分，它們犯下了一樣的錯誤，即還在使用 Python2 時代的那套說辭，誤以為命名僅僅支援“字母、數字和下劃線”的組合。

事實上，Python3.x 已經支援全面 Unicode 編碼，比如支援使用中文作為變量名。

由于我手頭上沒有其它樣本，是以，我不确定有多少新版的書籍還在使用老的規則。但是，翻譯類的書籍大機率都會有這樣的問題，另外，有些不嚴謹的國内書籍，也可能因為借鑒了過時的材料而犯錯。

如此一來，恐怕有些新接觸 Python 的同學，就會形成錯誤的認識。雖然這可能不會造成嚴重的問題，但是它終歸是一個應該避免而且很容易就能避免的問題。

是以，我覺得這個話題值得聊一聊。

在程式設計語言中有一個很常見的概念，即辨別符（identifier），通常又會稱之為名字（name），用于辨別出變量、常量、函數、類、符号等實體的名字。

在定義辨別符時，有一些必須要考慮的基本規則：

它可以由哪些字元組成？

它是否區分大小寫？（即大小寫敏感）

它是否允許出現某些特殊的單詞？（即關鍵字/保留字）

對于第一個問題，大多數的程式設計語言在早期版本都遵循這條規則：辨別符由字母、數字和下劃線組成，并且不能以數字為開頭。少數的程式設計語言有例外，還支援使用$、@、%等特殊符号（例如PHP、Ruby、Perl等等）。

Python 的早期版本，确切地說是 3.0 之前的版本，就遵循以上的命名規則。下面是官方文檔中的描述：

出處：https://docs.python.org/2.7/reference/lexical_analysis.html#identifiers

但是，這條規則從 3.0 版本起，就被打破了。最新的官方文檔已經變成了這樣：

出處：https://docs.python.org/3/reference/lexical_analysis.html#identifiers

随着網際網路的普及，各國語言進入了國際化的語境中，程式設計語言也與時俱進地增長了對國際化的訴求。

Unicode（譯作統一碼、萬國碼）編碼标準在 1994 年釋出，随後逐漸被主流的程式設計語言所接納。到目前為止，至少有 73 種程式設計語言支援 Unicode 變量名（資料依據：https://rosettacode.org/wiki/Unicode_variable_names）。

2007 年，當 Python 正在設計劃時代的 3.0 版本時，官方也考慮了對 Unicode 編碼的支援，于是，誕生了重要的《PEP 3131 -- Supporting Non-ASCII Identifiers》。

出處：https://www.python.org/dev/peps/pep-3131

事實上，除了我們最關心的中文，Unicode 字元集還包含非常非常多的内容。

在對變量命名時，下面這些用法都是可行的（謹慎使用，如若被打，本貓概不負責……）：

綜上所述，某些 Python 書籍中關于變量命名規則的内容已經過時了，不應該被其所誤導！

Python 3 作為一門面向現代化/國際化的語言，對于 Unicode 編碼有很好的支援。至于該不該在項目中使用中文給辨別符命名，那就是另外的問題啦……