天天看點

Python 3 中 PyMongo 的用法MongoDB存儲

在這裡我們來看一下Python3下MongoDB的存儲操作,在本節開始之前請確定你已經安裝好了MongoDB并啟動了其服務,另外安裝好了Python的PyMongo庫。

連接配接MongoDB我們需要使用PyMongo庫裡面的MongoClient,一般來說傳入MongoDB的IP及端口即可,第一個參數為位址host,第二個參數為端口port,端口如果不傳預設是27017。

這樣我們就可以建立一個MongoDB的連接配接對象了。

另外MongoClient的第一個參數host還可以直接傳MongoDB的連接配接字元串,以mongodb開頭,例如:

可以達到同樣的連接配接效果。

MongoDB中還分為一個個資料庫,我們接下來的一步就是指定要操作哪個資料庫,在這裡我以test資料庫為例進行說明,是以下一步我們需要在程式中指定要使用的資料庫。

調用client的test屬性即可傳回test資料庫,當然也可以這樣來指定:

兩種方式是等價的。

MongoDB的每個資料庫又包含了許多集合Collection,也就類似與關系型資料庫中的表,下一步我們需要指定要操作的集合,在這裡我們指定一個集合名稱為students,學生集合。還是和指定資料庫類似,指定集合也有兩種方式。

接下來我們便可以進行資料插入了,對于students這個Collection,我們建立一條學生資料,以字典的形式表示:

在這裡我們指定了學生的學号、姓名、年齡和性别,然後接下來直接調用collection的insert()方法即可插入資料。

在MongoDB中,每條資料其實都有一個_id屬性來唯一辨別,如果沒有顯式指明_id,MongoDB會自動産生一個ObjectId類型的_id屬性。insert()方法會在執行後傳回的_id值。

運作結果:

當然我們也可以同時插入多條資料,隻需要以清單形式傳遞即可,示例如下:

傳回的結果是對應的_id的集合,運作結果:

實際上在PyMongo 3.X版本中,insert()方法官方已經不推薦使用了,當然繼續使用也沒有什麼問題,官方推薦使用insert_one()和insert_many()方法将插入單條和多條記錄分開。

傳回結果和insert()方法不同,這次傳回的是InsertOneResult對象,我們可以調用其inserted_id屬性擷取_id。

對于insert_many()方法,我們可以将資料以清單形式傳遞即可,示例如下:

insert_many()方法傳回的類型是InsertManyResult,調用inserted_ids屬性可以擷取插入資料的_id清單,運作結果:

插入資料後我們可以利用find_one()或find()方法進行查詢,find_one()查詢得到是單個結果,find()則傳回多個結果。

在這裡我們查詢name為Mike的資料,它的傳回結果是字典類型,運作結果:

可以發現它多了一個_id屬性,這就是MongoDB在插入的過程中自動添加的。

我們也可以直接根據ObjectId來查詢,這裡需要使用bson庫裡面的ObjectId。

其查詢結果依然是字典類型,運作結果:

當然如果查詢結果不存在則會傳回None。

對于多條資料的查詢,我們可以使用find()方法,例如在這裡查找年齡為20的資料,示例如下:

傳回結果是Cursor類型,相當于一個生成器,我們需要周遊取到所有的結果,每一個結果都是字典類型。

如果要查詢年齡大于20的資料,則寫法如下:

在這裡查詢的條件鍵值已經不是單純的數字了,而是一個字典,其鍵名為比較符号$gt,意思是大于,鍵值為20,這樣便可以查詢出所有年齡大于20的資料。

在這裡将比較符号歸納如下表:

| 符号 | 含義 | 示例 |

| --- | ---- | --- |

| <code>$lt</code> | 小于 | <code>{'age': {'$lt': 20}}</code> |

| <code>$gt</code> | 大于 | <code>{'age': {'$gt': 20}}</code> |

| <code>$lte</code> | 小于等于 | <code>{'age': {'$lte': 20}}</code> |

| <code>$gte</code> | 大于等于 | <code>{'age': {'$gte': 20}}</code> |

| <code>$ne</code> | 不等于 | <code>{'age': {'$ne': 20}}</code> |

| <code>$in</code> | 在範圍内 | <code>{'age': {'$in': [20, 23]}}</code> |

| <code>$nin</code> | 不在範圍内 | <code>{'age': {'$nin': [20, 23]}}</code> |

另外還可以進行正則比對查詢,例如查詢名字以M開頭的學生資料,示例如下:

在這裡使用了$regex來指定正則比對,<code>^M.*</code>代表以M開頭的正規表達式,這樣就可以查詢所有符合該正則的結果。

在這裡将一些功能符号再歸類如下:

| 符号 | 含義 | 示例 | 示例含義 |

| --- | ---- | --- | --- |

| <code>$regex</code> | 比對正則 | <code>{'name': {'$regex': '^M.*'}}</code> | name以M開頭 |

| <code>$exists</code> | 屬性是否存在 | <code>{'name': {'$exists': True}}</code> | name屬性存在 |

| <code>$type</code> | 類型判斷 | <code>{'age': {'$type': 'int'}}</code> | age的類型為int |

| <code>$mod</code> | 數字模操作 | <code>{'age': {'$mod': [5, 0]}}</code> | 年齡模5餘0 |

| <code>$text</code> | 文本查詢 | <code>{'$text': {'$search': 'Mike'}}</code> | text類型的屬性中包含Mike字元串 |

| <code>$where</code> | 進階條件查詢 | <code>{'$where': 'obj.fans_count == obj.follows_count'}</code> | 自身粉絲數等于關注數 |

這些操作的更詳細用法在可以在MongoDB官方文檔找到:

https://docs.mongodb.com/manual/reference/operator/query/

要統計查詢結果有多少條資料,可以調用count()方法,如統計所有資料條數:

或者統計符合某個條件的資料:

可以調用sort方法,傳入排序的字段及升降序标志即可,示例如下:

在某些情況下我們可能想隻取某幾個元素,在這裡可以利用skip()方法偏移幾個位置,比如偏移2,就忽略前2個元素,得到第三個及以後的元素。

另外還可以用limit()方法指定要取的結果個數,示例如下:

如果不加limit()原本會傳回三個結果,加了限制之後,會截取2個結果傳回。

值得注意的是,在資料庫數量非常龐大的時候,如千萬、億級别,最好不要使用大的偏移量來查詢資料,很可能會導緻記憶體溢出,可以使用類似<code>find({'_id': {'$gt': ObjectId('593278c815c2602678bb2b8d')}})</code> 這樣的方法來查詢,記錄好上次查詢的_id。

對于資料更新可以使用update()方法,指定更新的條件和更新後的資料即可,例如:

在這裡我們将name為Kevin的資料的年齡進行更新,首先指定查詢條件,然後将資料查詢出來,修改年齡,之後調用update方法将原條件和修改後的資料傳入,即可完成資料的更新。

傳回結果是字典形式,ok即代表執行成功,nModified代表影響的資料條數。

另外update()方法其實也是官方不推薦使用的方法,在這裡也分了update_one()方法和update_many()方法,用法更加嚴格,第二個參數需要使用$類型操作符作為字典的鍵名,我們用示例感受一下。

在這裡調用了update_one方法,第二個參數不能再直接傳入修改後的字典,而是需要使用<code>{'$set': student}</code>這樣的形式,其傳回結果是UpdateResult類型,然後調用matched_count和modified_count屬性分别可以獲得比對的資料條數和影響的資料條數。

我們再看一個例子:

在這裡我們指定查詢條件為年齡大于20,然後更新條件為<code>{'$inc': {'age': 1}}</code>,也就是年齡加1,執行之後會講第一條符合條件的資料年齡加1。

可以看到比對條數為1條,影響條數也為1條。

如果調用update_many()方法,則會将所有符合條件的資料都更新,示例如下:

這時候比對條數就不再為1條了,運作結果如下:

可以看到這時所有比對到的資料都會被更新。

删除操作比較簡單,直接調用remove()方法指定删除的條件即可,符合條件的所有資料均會被删除,示例如下:

另外依然存在兩個新的推薦方法,delete_one()和delete_many()方法,示例如下:

delete_one()即删除第一條符合條件的資料,delete_many()即删除所有符合條件的資料,傳回結果是DeleteResult類型,可以調用deleted_count屬性擷取删除的資料條數。

另外PyMongo還提供了一些組合方法,如find_one_and_delete()、find_one_and_replace()、find_one_and_update(),就是查找後删除、替換、更新操作,用法與上述方法基本一緻。

另外還可以對索引進行操作,如create_index()、create_indexes()、drop_index()等。

詳細用法可以參見官方文檔:http://api.mongodb.com/python/current/api/pymongo/collection.html

另外還有對資料庫、集合本身以及其他的一些操作,在這不再一一講解,可以參見官方文檔:http://api.mongodb.com/python/current/api/pymongo/