天天看點

6個Python性能優化技巧

原文:6 Python Performance Tips

譯文:6個Python性能優化技巧

譯者:dwqs

Python是一門非常酷的語言,因為很少的Python代碼可以在短時間内做很多事情,并且,Python很容易就能支援多任務和多重處理。

Python的批評者聲稱Python性能低效、執行緩慢,但實際上并非如此:嘗試以下6個小技巧,可以加快Pytho應用程式。

6個Python性能優化技巧

  1、關鍵代碼可以依賴于擴充包

Python使許多程式設計任務變得簡單,但是對于很關鍵的任務并不總是提供最好的性能。使用C、C++或者機器語言擴充包來執行關鍵任務能極大改善性能。這些包是依賴于平台的,也就是說,你必須使用特定的、與你使用的平台相關的包。簡而言之,該解決方案提供了一些應用程式的可移植性,以換取性能,您可以獲得隻有通過直接向底層主機程式設計。下面這些擴充包你可以考慮添加到你的個人擴充庫中:

  • Cython
  • PyInlne
  • PyPy
  • Pyrex

這些包有不同的作用和執行方式。例如,Pyrex 讓Python處理一些記憶體任務變得簡單高效;PyInline可以直接讓你在Python應用程式中使用C代碼,雖然内聯代碼被單獨編譯,但是如果你能高效的利用C代碼,它可以在同一個地方處理每一件事情。

  2、使用關鍵字排序

有很多古老的Python代碼在執行時将花費額外的時間去建立一個自定義的排序函數。最好的排序方式是使用關鍵字和預設的sort()方法,看看下面的示例:

import operator
somelist = [(1, 5, 8), (6, 2, 4), (9, 7, 5)]
somelist.sort(key=operator.itemgetter(0))
somelist
#Output = [(1, 5, 8), (6, 2, 4), (9, 7, 5)]
somelist.sort(key=operator.itemgetter(1))
somelist
#Output = [(6, 2, 4), (1, 5, 8), (9, 7, 5)]
somelist.sort(key=operator.itemgetter(2))
somelist
#Output = [(6, 2, 4), (9, 7, 5), (1, 5, 8)],      

每一個案例的清單是根據你選擇作為關鍵字參數的索引排序的,這種方式對字元串和數字排序同樣适用。

  3、優化循環

每一種程式設計語言都強調循環語句的優化,Python也是一樣的。盡管你可以依賴于豐富的技術讓循環運作的更快,然而,開發者經常忽略的一個方法是避免在循環内部使用點拼接字元串。對于下面的示例:

lowerlist = ['this', 'is', 'lowercase']
upper = str.upper
upperlist = []
append = upperlist.append
for word in lowerlist:
    append(upper(word))
    print(upperlist)
    #Output = ['THIS', 'IS', 'LOWERCASE']      

每一次調用str.upper,Python都會去求這個方法的值。但是如果你把求值的結果放入一個變量中,就能提高程式的性能。這個關鍵是減少Python内執行的循環次數,因為Python解析這些執行個體是比較慢的。

  4、使用新版本

任何一個線上上搜尋Python資料的人都會發現無數關于Python版本遷移的資訊。通常,Python每一個版本都針對之前的一個版本做了優化和改進,以讓Python運作的更快。限制因素是你喜歡的函數庫是否也針對Python的新版本做了改進。

當你使用了新的函數庫,獲得了Python的新版本,你需要保證代碼依然能夠運作,檢查應用,修正差異。

然後,如果你僅僅是保證應用能夠在新版本上運作,你可能錯過新功能的更新。一旦你做了改進,在新版本下配置應用程式,檢查問題區域并優先使用新功能更新,對于之前的更新,使用者将看到更大性能的提升。

  5、嘗試多種程式設計方法

每一次你建立應用的時候,都使用同一種程式設計方法,在某些情況下降導緻程式運作會比預期的慢。在分析的過程中做一些小試驗。例如,當管理字典中的資料項時,可以采用安全的方法确定資料項是否已經存在并需要更新它,或者你可以直接添加條目,然後處理項目根本不存在的情況。

n = 16
myDict = {}
for i in range(0, n):
    char = 'abcd'[i%4]
    if char not in myDict:
        myDict[char] = 0
        myDict[char] += 1
        print(myDict)      

當myDict是空時,上述的代碼通常會運作的更快。但當myDict已經有資料填充時,就有更好的方法可以選擇:

n = 16
myDict = {}
for i in range(0, n):
    char = 'abcd'[i%4]
    try:
        myDict[char] += 1
    except KeyError:
        myDict[char] = 1
    print(myDict)      

兩種情況下都輸出

{'d': 4, 'c': 4, 'b': 4, 'a': 4}

,唯一的差異是輸出是怎麼獲得的。站在盒子外考慮和建立新的程式設計技巧都能讓你的程式獲得更快的運作速度。

  6、交叉編譯程式

        開發者有時會忘記計算機不能識别任何一種現在應用程式語言,它隻識别機器代碼。為了運作程式,需要一個應用将人類可讀的代碼轉換成計算機能識别的代碼。當用一種語言寫程式時,例如Python,然後用另外一種語言來運作它,例如C++,從性能角度看是有道理的。這個取決于你想要用這個應用做什麼和主機系統能夠提供什麼資源。

        一個有趣的交叉編譯器,Nuitka, 能将Python轉換成C++代碼,結果是你可以再本機模式下執行應用,而不是依賴于解釋器。根據平台和任務中,你可以看到顯著的性能提高。

譯文原文:http://www.ido321.com/1433.html