天天看點

【MongoDB】01、MongoDB基礎

一、mongodb概述

1、mogodb簡介

mongodb 是由c++語言編寫的,是一個基于分布式檔案存儲的開源資料庫系統。

在高負載的情況下,添加更多的節點,可以保證伺服器性能。

mongodb 旨在為web應用提供可擴充的高性能資料存儲解決方案。

mongodb 将資料存儲為一個文檔,資料結構由鍵值(key=>value)對組成。mongodb 文檔類似于 json 對象。字段值可以包含其他文檔,數組及文檔數組。

【MongoDB】01、MongoDB基礎

  一個文檔相當于mysql資料庫中的一行資料

        2007年10月,mongodb由10gen團隊所發展。2009年2月首度推出。

2012年05月23日,mongodb2.1 開發分支釋出了! 該版本采用全新架構,包含諸多增強。

最新穩定版:3.4.2

2、mongodb特點

mongodb的提供了一個面向文檔存儲,操作起來比較簡單和容易。

你可以在mongodb記錄中設定任何屬性的索引 (如:firstname="sameer",address="8 gandhi road")來實作更快的排序。

你可以通過本地或者網絡建立資料鏡像,這使得mongodb有更強的擴充性。

如果負載的增加(需要更多的存儲空間和更強的處理能力) ,它可以分布在計算機網絡中的其他節點上這就是所謂的分片。(自動分片)

mongo支援豐富的查詢表達式。查詢指令使用json形式的标記,可輕易查詢文檔中内嵌的對象及數組。

mongodb 使用update()指令可以實作替換完成的文檔(資料)或者一些指定的資料字段 。

mongodb中的map/reduce主要是用來對資料進行批量處理和聚合操作。

map和reduce。map函數調用emit(key,value)周遊集合中所有的記錄,将key與value傳給reduce函數進行處理。

map函數和reduce函數是使用javascript編寫的,并可以通過db.runcommand或mapreduce指令來執行mapreduce操作。

gridfs是mongodb中的一個内置功能,可以用于存放大量小檔案。内置分布式檔案系統

mongodb允許在服務端執行腳本,可以用javascript編寫某個函數,直接在服務端執行,也可以把函數的定義存儲在服務端,下次直接調用即可。

mongodb支援各種程式設計語言:ruby,python,java,c++,php,c#等多種語言。

mongodb安裝簡單。

二、概念解析

         不管我們學習什麼資料庫都應該學習其中的基礎概念,在mongodb中基本的概念是文檔、集合、資料庫,下面我們挨個介紹。下表将幫助您更容易了解mongo中的一些概念:

sql術語/概念

mongodb術語/概念

解釋/說明

database

資料庫

table

collection

資料庫表/集合

row

document

資料記錄行/文檔

column

field

資料字段/域

index

索引

table joins

表連接配接,mongodb不支援

primary key

主鍵,mongodb自動将_id字段設定為主鍵

通過下圖執行個體,我們也可以更直覺的的了解mongo中的一些概念:

【MongoDB】01、MongoDB基礎

        文檔是一個鍵值(key-value)對(即bson)。mongodb 的文檔不需要設定相同的字段,并且相同的字段不需要相同的資料類型,這與關系型資料庫有很大的差別,也是 mongodb 非常突出的特點。

一個簡單的文檔例子如下:

需要注意的是:

文檔中的鍵/值對是有序的。

文檔中的值不僅可以是在雙引号裡面的字元串,還可以是其他幾種資料類型(甚至可以是整個嵌入的文檔)。

mongodb區分類型和大小寫。

mongodb的文檔不能有重複的鍵。

文檔的鍵是字元串。除了少數例外情況,鍵可以使用任意utf-8字元。

文檔鍵命名規範:

鍵不能含有\0 (空字元)。這個字元用來表示鍵的結尾。

.和$有特别的意義,隻有在特定環境下才能使用。

以下劃線"_"開頭的鍵是保留的(不是嚴格要求的)。

每個文檔都有隐藏的_id鍵也就是字段,相當于mysql中的主鍵

       集合就是 mongodb 文檔組,類似于 rdbms (關系資料庫管理系統:relational database management system)中的表格。集合存在于資料庫中,集合沒有固定的結構,這意味着你在對集合可以插入不同格式和類型的資料,但通常情況下我們插入集合的資料都會有一定的關聯性。

比如,我們可以将以下不同資料結構的文檔插入到集合中:

當第一個文檔插入時,集合就會被建立。

集合名不能是空字元串""。

集合名不能含有\0字元(空字元),這個字元表示集合名的結尾。

集合名不能以"system."開頭,這是為系統集合保留的字首。

使用者建立的集合名字不能含有保留字元。有些驅動程式的确支援在集合名裡面包含,這是因為某些系統生成的集合中包含該字元。除非你要通路這種系統建立的集合,否則千萬不要在名字裡出現$。 

如下執行個體:

capped collections 就是固定大小的collection。

它有很高的性能以及隊列過期的特性(過期按照插入的順序). 有點和 "rrd" 概念類似。

capped collections是高性能自動的維護對象的插入順序。它非常适合類似記錄日志的功能 和标準的collection不同,你必須要顯式的建立一個capped collection, 指定一個collection的大小,機關是位元組。collection的資料存儲空間值提前配置設定的。

要注意的是指定的存儲大小包含了資料庫的頭資訊。

在capped collection中,你能添加新的對象。

能進行更新,然而,對象不會增加存儲空間。如果增加,更新就會失敗 。

資料庫不允許進行删除。使用drop()方法删除collection所有的行。

注意: 删除之後,你必須顯式的重新建立這個collection。

在32bit機器中,capped collection最大存儲為1e9( 1x109)個位元組。

一個mongodb中可以建立多個資料庫。

mongodb的單個執行個體可以容納多個獨立的資料庫,每一個都有自己的集合和權限,不同的資料庫也放置在不同的檔案中。

"show dbs" 指令可以顯示所有資料的清單。

執行 "db" 指令可以顯示目前資料庫對象或集合。

運作"use db_name"指令,可以使用一個指定的資料庫。

資料庫也通過名字來辨別。資料庫名可以是滿足以下條件的任意utf-8字元串。

不能是空字元串("")。

不得含有' '(空格)、.、$、/、\和\0 (空宇符)。

應全部小寫。

最多64位元組。

資料庫的資訊是存儲在集合中。它們使用了系統的命名空間:

在mongodb資料庫中名字空間 <dbname>.system.* 是包含多種系統資訊的特殊集合(collection),如下:

集合命名空間

描述

dbname.system.namespaces

列出所有名字空間。

dbname.system.indexes

列出所有索引。

dbname.system.profile

包含資料庫概要(profile)資訊。

dbname.system.users

列出所有可通路資料庫的使用者。

dbname.local.sources

包含複制對端(slave)的伺服器資訊和狀态。

對于修改系統集合中的對象有如下限制。

在`system`.`indexes`插入資料,可以建立索引。但除此之外該表資訊是不可變的(特殊的drop index指令将自動更新相關資訊)。

`system`.`users`是可修改的。 `system`.`profile`是可删除的。

下表為mongodb中常用的幾種資料類型。

資料類型

string

字元串。存儲資料常用的資料類型。在 mongodb 中,utf-8 編碼的字元串才是合法的。

integer

整型數值。用于存儲數值。根據你所采用的伺服器,可分為 32 位或 64 位。

boolean

布爾值。用于存儲布爾值(真/假)。

double

雙精度浮點值。用于存儲浮點值。

min/max keys

将一個值與 bson(二進制的 json)元素的最低值和最高值相對比。

arrays

用于将數組或清單或多個值存儲為一個鍵。

timestamp

時間戳。記錄文檔修改或添加的具體時間。

object

用于内嵌文檔。

null

用于建立空值。

symbol

符号。該資料類型基本上等同于字元串類型,但不同的是,它一般用于采用特殊符号類型的語言。

date

日期時間。用 unix 時間格式來存儲目前日期或時間。你可以指定自己的日期時間:建立 date 對象,傳入年月日資訊。

object id

對象 id。用于建立文檔的 id。

binary data

二進制資料。用于存儲二進制資料。

code

代碼類型。用于在文檔中存儲 javascript 代碼。

regular expression

正規表達式類型。用于存儲正規表達式。

二、mongodb安裝

  mongodb官網上提供了各種版本的mongodb安裝包有rpm包,通用二進制包,源碼包

1、yum安裝

   epel源中有2.4.14版本的mongodb,就直接yum安裝了

2、啟動mongod

mongodb預設不啟用認證功能:

3、用戶端mongo的使用

mongo的用法:

執行個體:

常用指令:

  help

  db.help()

  db.mycoll.help()

  db.stats():資料庫狀态

  db.serverstatus():mongodb資料庫伺服器狀态

  show dbs、show collections

  db.getcollectionnames():顯示目前資料所有集合的名稱清單

三、crud快速入門

   crud是指在做計算處理時的增加(create)、讀取查詢(retrieve)、更新(update)和删除(delete)幾個單詞的首字母簡寫。主要被用在描述軟體系統中資料庫或者持久層的基本操作功能。

   mongo支援豐富的查詢表達式。查詢指令使用json形式的标記,可輕易查詢文檔中内嵌的對象及數組。

json:javascript object notation

   輕量級的xml,

    json有兩種結構:

       名稱/值對象的集合,

       值的有序清單

1、插入文檔

        文檔的資料結構和json基本一樣,所有存儲在集合中的資料都是bson格式,bson是一種類json的一種二進制形式的存儲格式,簡稱binary json。

mongodb 使用 insert() ,文法如下:

  不需要先建立資料庫和集合:資料庫會自動延遲建立,集合不需要定義,是以可以直接插入資料

2、查詢文檔

mongodb 查詢資料的文法格式如下:

  db.collection_name.find()

檢視db.collection_name.find()的幫助資訊:

find()簡單的使用:

除了 find() 方法之外,還有一個 findone() 方法,它隻傳回一個文檔:

find()的進階用法

 比較操作:$gt,$gte,$lt,$lte,$ne

操作

格式

範例

rdbms中的類似語句

等于

<code>{&lt;key&gt;:&lt;value&gt;</code>}

<code>db.col.find({"by":"菜鳥教程"})</code>

<code>where by = '菜鳥教程'</code>

小于

<code>{&lt;key&gt;:{$lt:&lt;value&gt;}}</code>

<code>db.col.find({"likes":{$lt:50}})</code>

<code>where likes &lt; 50</code>

小于或等于

<code>{&lt;key&gt;:{$lte:&lt;value&gt;}}</code>

<code>db.col.find({"likes":{$lte:50}})</code>

<code>where likes &lt;= 50</code>

大于

<code>{&lt;key&gt;:{$gt:&lt;value&gt;}}</code>

<code>db.col.find({"likes":{$gt:50}})</code>

<code>where likes &gt; 50</code>

大于或等于

<code>{&lt;key&gt;:{$gte:&lt;value&gt;}}</code>

<code>db.col.find({"likes":{$gte:50}})</code>

<code>where likes &gt;= 50</code>

不等于

<code>{&lt;key&gt;:{$ne:&lt;value&gt;}}</code>

<code>db.col.find({"likes":{$ne:50}})</code>

<code>where likes != 50</code>

 $in   查找在指定清單中列出的資料

 $nin

文法格式:

   {filed:{$in:[&lt;value&gt;]}}

 組合條件:邏輯運算

   $or:或運算

    $and:與運算

    $nor:反運算,傳回不符合指定條件的所有文檔

   {$or:[{&lt;expression1&gt;},...]}

       最少條件2個子句

$not:非運算 

  隻有$not格式和上面的不一樣

          執行邏輯not運算,選擇出不能比對表達式的文檔 ,包括沒有指定鍵的文檔。$not操作符不能獨立使用,必須跟其他操作一起使用(除$regex)。

  {field:{$not: &lt;operator-expression&gt; }}}

元素查詢

  根據文檔中是否存在指定的字段進行的查詢

$exists:

   {filed:{$exists:&lt;boolean&gt;}}

鍵值為null查詢操作

  如何檢索出age鍵值為null的文檔,"$in"判斷鍵值是否為null,"$exists"判定集合中文檔是否包含該鍵。

以下的用的不多:

  $mod:将指定元素做取模運算,并傳回指定餘數的文檔

  $type:傳回指定字段的值的類型為指定類型的文檔

   {filed:{$type:&lt;bson type&gt;}}

    type:用數字辨別

        1:doble

        2:string

        3:object

          array,binary data,undefined,boolean,date

3、更新文檔

   mongodb 使用 update()方法來更新集合中的文檔。

db.mycoll.update() 方法用于更新已存在的文檔。

$set:修改過字段的值為新指定的值,文法格式:

      {filed: value},{$set:{filed: new_value}}

$unset:删除指定字段,文法格式

      {filed:value},{$unset:{filed1,filed2,...}}

$inc:增加

4、删除操作

删除文檔

   db.mycoll.remove()函數是用來移除集合中的資料。 

文法格式:   

參數說明:

query   :(可選)删除的文檔的條件。

justone  : (可選)如果設為 true 或 1

writeconcern :(可選)抛出異常的級别。

  如果什麼參數都不帶,則預設删除所有的文檔

删除collection

 db.mycoll.droup()

删除資料庫

 db.dropdatabase()   # 删除目前資料庫