MongoDB基礎知識
MongoDB 是由C++語言編寫的,是一個基于分布式檔案存儲的開源資料庫系統。
在高負載的情況下,添加更多的節點,可以保證伺服器性能。
MongoDB 旨在為WEB應用提供可擴充的高性能資料存儲解決方案。
MongoDB 将資料存儲為一個文檔,資料結構由鍵值(key=>value)對組成。MongoDB 文檔類似于 JSON 對象。字段值可以包含其他文檔,數組及文檔數組。
MongoDB 是一個面向文檔存儲的資料庫,操作起來比較簡單和容易。
你可以在MongoDB記錄中設定任何屬性的索引 (如:FirstName="Sameer",Address="8 Gandhi Road")來實作更快的排序。
你可以通過本地或者網絡建立資料鏡像,這使得MongoDB有更強的擴充性。
如果負載的增加(需要更多的存儲空間和更強的處理能力) ,它可以分布在計算機網絡中的其他節點上這就是所謂的分片。
Mongo支援豐富的查詢表達式。查詢指令使用JSON形式的标記,可輕易查詢文檔中内嵌的對象及數組。
MongoDb 使用update()指令可以實作替換完成的文檔(資料)或者一些指定的資料字段 。
Mongodb中的Map/reduce主要是用來對資料進行批量處理和聚合操作。
Map和Reduce。Map函數調用emit(key,value)周遊集合中所有的記錄,将key與value傳給Reduce函數進行處理。
Map函數和Reduce函數是使用Javascript編寫的,并可以通過db.runCommand或mapreduce指令來執行MapReduce操作。
GridFS是MongoDB中的一個内置功能,可以用于存放大量小檔案。
MongoDB允許在服務端執行腳本,可以用Javascript編寫某個函數,直接在服務端執行,也可以把函數的定義存儲在服務端,下次直接調用即可。
MongoDB支援各種程式設計語言:RUBY,PYTHON,JAVA,C++,PHP,C#等多種語言。
MongoDB安裝簡單。
https://www.mongodb.com/download-center#community
MongoDB 概念解析

通過下圖執行個體,我們也可以更直覺的了解Mongo中的一些概念:
一個mongodb中可以建立多個資料庫。
MongoDB的預設資料庫為"db",該資料庫存儲在data目錄中。
MongoDB的單個執行個體可以容納多個獨立的資料庫,每一個都有自己的集合和權限,不同的資料庫也放置在不同的檔案中。
"show dbs" 指令可以顯示所有資料的清單。
執行 "db" 指令可以顯示目前資料庫對象或集合。
運作"use"指令,可以連接配接到一個指定的資料庫。
以上執行個體指令中,"local" 是你要連結的資料庫。
在下一個章節我們将詳細講解MongoDB中指令的使用。
資料庫也通過名字來辨別。資料庫名可以是滿足以下條件的任意UTF-8字元串。
不能是空字元串("")。
不得含有' '(空格)、.、$、/、\和\0 (空字元)。
應全部小寫。
最多64位元組。
有一些資料庫名是保留的,可以直接通路這些有特殊作用的資料庫。
admin: 從權限的角度來看,這是"root"資料庫。要是将一個使用者添加到這個資料庫,這個使用者自動繼承所有資料庫的權限。一些特定的伺服器端指令也隻能從這個資料庫運作,比如列出所有的資料庫或者關閉伺服器。
local: 這個資料永遠不會被複制,可以用來存儲限于本地單台伺服器的任意集合
config: 當Mongo用于分片設定時,config資料庫在内部使用,用于儲存分片的相關資訊。
文檔是一組鍵值(key-value)對(即BSON)。MongoDB 的文檔不需要設定相同的字段,并且相同的字段不需要相同的資料類型,這與關系型資料庫有很大的差別,也是 MongoDB 非常突出的特點。
一個簡單的文檔例子如下:
下表列出了 RDBMS 與 MongoDB 對應的術語:
需要注意的是:
文檔中的鍵/值對是有序的。
文檔中的值不僅可以是在雙引号裡面的字元串,還可以是其他幾種資料類型(甚至可以是整個嵌入的文檔)。
MongoDB區分類型和大小寫。
MongoDB的文檔不能有重複的鍵。
文檔的鍵是字元串。除了少數例外情況,鍵可以使用任意UTF-8字元。
文檔鍵命名規範:
鍵不能含有\0 (空字元)。這個字元用來表示鍵的結尾。
.和$有特别的意義,隻有在特定環境下才能使用。
以下劃線"_"開頭的鍵是保留的(不是嚴格要求的)。
集合就是 MongoDB 文檔組,類似于 RDBMS (關系資料庫管理系統:Relational Database Management System)中的表格。
集合存在于資料庫中,集合沒有固定的結構,這意味着你在對集合可以插入不同格式和類型的資料,但通常情況下我們插入集合的資料都會有一定的關聯性。
比如,我們可以将以下不同資料結構的文檔插入到集合中:
當第一個文檔插入時,集合就會被建立。
集合名不能是空字元串""。
集合名不能含有\0字元(空字元),這個字元表示集合名的結尾。
集合名不能以"system."開頭,這是為系統集合保留的字首。
使用者建立的集合名字不能含有保留字元。有些驅動程式的确支援在集合名裡面包含,這是因為某些系統生成的集合中包含該字元。除非你要通路這種系統建立的集合,否則千萬不要在名字裡出現$。
如下執行個體:
Capped collections 就是固定大小的collection。
它有很高的性能以及隊列過期的特性(過期按照插入的順序). 有點和 "RRD" 概念類似。
Capped collections是高性能自動的維護對象的插入順序。它非常适合類似記錄日志的功能 和标準的collection不同,你必須要顯式的建立一個capped collection, 指定一個collection的大小,機關是位元組。collection的資料存儲空間值提前配置設定的。
要注意的是指定的存儲大小包含了資料庫的頭資訊。
在capped collection中,你能添加新的對象。
能進行更新,然而,對象不會增加存儲空間。如果增加,更新就會失敗 。
資料庫不允許進行删除。使用drop()方法删除collection所有的行。
注意: 删除之後,你必須顯式的重新建立這個collection。
在32bit機器中,capped collection最大存儲為1e9( 1X109)個位元組。
資料庫的資訊是存儲在集合中。它們使用了系統的命名空間:
在MongoDB資料庫中名字空間 <dbname>.system.* 是包含多種系統資訊的特殊集合(Collection),如下:
集合命名空間
描述
dbname.system.namespaces
列出所有名字空間。
dbname.system.indexes
列出所有索引。
dbname.system.profile
包含資料庫概要(profile)資訊。
dbname.system.users
列出所有可通路資料庫的使用者。
dbname.local.sources
包含複制對端(slave)的伺服器資訊和狀态。
對于修改系統集合中的對象有如下限制。
在{{system.indexes}}插入資料,可以建立索引。但除此之外該表資訊是不可變的(特殊的drop index指令将自動更新相關資訊)。
{{system.users}}是可修改的。 {{system.profile}}是可删除的。
下表為MongoDB中常用的幾種資料類型。
資料類型
String
字元串。存儲資料常用的資料類型。在 MongoDB 中,UTF-8 編碼的字元串才是合法的。
Integer
整型數值。用于存儲數值。根據你所采用的伺服器,可分為 32 位或 64 位。
Boolean
布爾值。用于存儲布爾值(真/假)。
Double
雙精度浮點值。用于存儲浮點值。
Min/Max keys
将一個值與 BSON(二進制的 JSON)元素的最低值和最高值相對比。
Array
用于将數組或清單或多個值存儲為一個鍵。
Timestamp
時間戳。記錄文檔修改或添加的具體時間。
Object
用于内嵌文檔。
Null
用于建立空值。
Symbol
符号。該資料類型基本上等同于字元串類型,但不同的是,它一般用于采用特殊符号類型的語言。
Date
日期時間。用 UNIX 時間格式來存儲目前日期或時間。你可以指定自己的日期時間:建立 Date 對象,傳入年月日資訊。
Object ID
對象 ID。用于建立文檔的 ID。
Binary Data
二進制資料。用于存儲二進制資料。
Code
代碼類型。用于在文檔中存儲 JavaScript 代碼。
Regular expression
正規表達式類型。用于存儲正規表達式。