天天看點

Python 通過operator子產品 itemgetter 函數 依據關鍵字排序一個字典清單 通過某個關鍵字排序一個字典清單

 通過某個關鍵字排序一個字典清單

問題

你有一個字典清單,你想根據某個或某幾個字典字段來排序這個清單。

解決方案

通過使用 

operator

 子產品的 

itemgetter

 函數,可以非常容易的排序這樣的資料結構。 假設你從資料庫中檢索出來網站會員資訊清單,并且以下列的資料結構傳回:

rows = [
    {'fname': 'Brian', 'lname': 'Jones', 'uid': 1003},
    {'fname': 'David', 'lname': 'Beazley', 'uid': 1002},
    {'fname': 'John', 'lname': 'Cleese', 'uid': 1001},
    {'fname': 'Big', 'lname': 'Jones', 'uid': 1004}
]
      

根據任意的字典字段來排序輸入結果行是很容易實作的,代碼示例:

from operator import itemgetter
rows_by_fname = sorted(rows, key=itemgetter('fname'))
rows_by_uid = sorted(rows, key=itemgetter('uid'))
print(rows_by_fname)
print(rows_by_uid)
      

代碼的輸出如下:

[{'fname': 'Big', 'uid': 1004, 'lname': 'Jones'},
{'fname': 'Brian', 'uid': 1003, 'lname': 'Jones'},
{'fname': 'David', 'uid': 1002, 'lname': 'Beazley'},
{'fname': 'John', 'uid': 1001, 'lname': 'Cleese'}]
[{'fname': 'John', 'uid': 1001, 'lname': 'Cleese'},
{'fname': 'David', 'uid': 1002, 'lname': 'Beazley'},
{'fname': 'Brian', 'uid': 1003, 'lname': 'Jones'},
{'fname': 'Big', 'uid': 1004, 'lname': 'Jones'}]
      

itemgetter()

 函數也支援多個 keys,比如下面的代碼

rows_by_lfname = sorted(rows, key=itemgetter('lname','fname'))
print(rows_by_lfname)
      

會産生如下的輸出:

[{'fname': 'David', 'uid': 1002, 'lname': 'Beazley'},
{'fname': 'John', 'uid': 1001, 'lname': 'Cleese'},
{'fname': 'Big', 'uid': 1004, 'lname': 'Jones'},
{'fname': 'Brian', 'uid': 1003, 'lname': 'Jones'}]
      

讨論

在上面例子中, 

rows

 被傳遞給接受一個關鍵字參數的 

sorted()

 内置函數。 這個參數是 

callable

類型,并且從 

rows

 中接受一個單一進制素,然後傳回被用來排序的值。 

itemgetter()

 函數就是負責建立這個 

callable

 對象的。

operator.itemgetter()

 函數有一個被 

rows

 中的記錄用來查找值的索引參數。可以是一個字典鍵名稱, 一個整形值或者任何能夠傳入一個對象的 

__getitem__()

 方法的值。 如果你傳入多個索引參數給 

itemgetter()

 ,它生成的 

callable

 對象會傳回一個包含所有元素值的元組, 并且 

sorted()

 函數會根據這個元組中元素順序去排序。 但你想要同時在幾個字段上面進行排序(比如通過姓和名來排序,也就是例子中的那樣)的時候這種方法是很有用的。

itemgetter()

 有時候也可以用 

lambda

 表達式代替,比如:

rows_by_fname = sorted(rows, key=lambda r: r['fname'])
rows_by_lfname = sorted(rows, key=lambda r: (r['lname'],r['fname']))
      

這種方案也不錯。但是,使用 

itemgetter()

 方式會運作的稍微快點。是以,如果你對性能要求比較高的話就使用 

itemgetter()

 方式。

最後,不要忘了這節中展示的技術也同樣适用于 

min()

 和 

max()

 等函數。比如:

>>> min(rows, key=itemgetter('uid'))
{'fname': 'John', 'lname': 'Cleese', 'uid': 1001}
>>> max(rows, key=itemgetter('uid'))
{'fname': 'Big', 'lname': 'Jones', 'uid': 1004}
>>>