一、mongodb概述
1、mogodb简介
mongodb 是由c++语言编写的,是一个基于分布式文件存储的开源数据库系统。
在高负载的情况下,添加更多的节点,可以保证服务器性能。
mongodb 旨在为web应用提供可扩展的高性能数据存储解决方案。
mongodb 将数据存储为一个文档,数据结构由键值(key=>value)对组成。mongodb 文档类似于 json 对象。字段值可以包含其他文档,数组及文档数组。

一个文档相当于mysql数据库中的一行数据
2007年10月,mongodb由10gen团队所发展。2009年2月首度推出。
2012年05月23日,mongodb2.1 开发分支发布了! 该版本采用全新架构,包含诸多增强。
最新稳定版:3.4.2
2、mongodb特点
mongodb的提供了一个面向文档存储,操作起来比较简单和容易。
你可以在mongodb记录中设置任何属性的索引 (如:firstname="sameer",address="8 gandhi road")来实现更快的排序。
你可以通过本地或者网络创建数据镜像,这使得mongodb有更强的扩展性。
如果负载的增加(需要更多的存储空间和更强的处理能力) ,它可以分布在计算机网络中的其他节点上这就是所谓的分片。(自动分片)
mongo支持丰富的查询表达式。查询指令使用json形式的标记,可轻易查询文档中内嵌的对象及数组。
mongodb 使用update()命令可以实现替换完成的文档(数据)或者一些指定的数据字段 。
mongodb中的map/reduce主要是用来对数据进行批量处理和聚合操作。
map和reduce。map函数调用emit(key,value)遍历集合中所有的记录,将key与value传给reduce函数进行处理。
map函数和reduce函数是使用javascript编写的,并可以通过db.runcommand或mapreduce命令来执行mapreduce操作。
gridfs是mongodb中的一个内置功能,可以用于存放大量小文件。内置分布式文件系统
mongodb允许在服务端执行脚本,可以用javascript编写某个函数,直接在服务端执行,也可以把函数的定义存储在服务端,下次直接调用即可。
mongodb支持各种编程语言:ruby,python,java,c++,php,c#等多种语言。
mongodb安装简单。
二、概念解析
不管我们学习什么数据库都应该学习其中的基础概念,在mongodb中基本的概念是文档、集合、数据库,下面我们挨个介绍。下表将帮助您更容易理解mongo中的一些概念:
sql术语/概念
mongodb术语/概念
解释/说明
database
数据库
table
collection
数据库表/集合
row
document
数据记录行/文档
column
field
数据字段/域
index
索引
table joins
表连接,mongodb不支持
primary key
主键,mongodb自动将_id字段设置为主键
通过下图实例,我们也可以更直观的的了解mongo中的一些概念:
文档是一个键值(key-value)对(即bson)。mongodb 的文档不需要设置相同的字段,并且相同的字段不需要相同的数据类型,这与关系型数据库有很大的区别,也是 mongodb 非常突出的特点。
一个简单的文档例子如下:
需要注意的是:
文档中的键/值对是有序的。
文档中的值不仅可以是在双引号里面的字符串,还可以是其他几种数据类型(甚至可以是整个嵌入的文档)。
mongodb区分类型和大小写。
mongodb的文档不能有重复的键。
文档的键是字符串。除了少数例外情况,键可以使用任意utf-8字符。
文档键命名规范:
键不能含有\0 (空字符)。这个字符用来表示键的结尾。
.和$有特别的意义,只有在特定环境下才能使用。
以下划线"_"开头的键是保留的(不是严格要求的)。
每个文档都有隐藏的_id键也就是字段,相当于mysql中的主键
集合就是 mongodb 文档组,类似于 rdbms (关系数据库管理系统:relational database management system)中的表格。集合存在于数据库中,集合没有固定的结构,这意味着你在对集合可以插入不同格式和类型的数据,但通常情况下我们插入集合的数据都会有一定的关联性。
比如,我们可以将以下不同数据结构的文档插入到集合中:
当第一个文档插入时,集合就会被创建。
集合名不能是空字符串""。
集合名不能含有\0字符(空字符),这个字符表示集合名的结尾。
集合名不能以"system."开头,这是为系统集合保留的前缀。
用户创建的集合名字不能含有保留字符。有些驱动程序的确支持在集合名里面包含,这是因为某些系统生成的集合中包含该字符。除非你要访问这种系统创建的集合,否则千万不要在名字里出现$。
如下实例:
capped collections 就是固定大小的collection。
它有很高的性能以及队列过期的特性(过期按照插入的顺序). 有点和 "rrd" 概念类似。
capped collections是高性能自动的维护对象的插入顺序。它非常适合类似记录日志的功能 和标准的collection不同,你必须要显式的创建一个capped collection, 指定一个collection的大小,单位是字节。collection的数据存储空间值提前分配的。
要注意的是指定的存储大小包含了数据库的头信息。
在capped collection中,你能添加新的对象。
能进行更新,然而,对象不会增加存储空间。如果增加,更新就会失败 。
数据库不允许进行删除。使用drop()方法删除collection所有的行。
注意: 删除之后,你必须显式的重新创建这个collection。
在32bit机器中,capped collection最大存储为1e9( 1x109)个字节。
一个mongodb中可以建立多个数据库。
mongodb的单个实例可以容纳多个独立的数据库,每一个都有自己的集合和权限,不同的数据库也放置在不同的文件中。
"show dbs" 命令可以显示所有数据的列表。
执行 "db" 命令可以显示当前数据库对象或集合。
运行"use db_name"命令,可以使用一个指定的数据库。
数据库也通过名字来标识。数据库名可以是满足以下条件的任意utf-8字符串。
不能是空字符串("")。
不得含有' '(空格)、.、$、/、\和\0 (空宇符)。
应全部小写。
最多64字节。
数据库的信息是存储在集合中。它们使用了系统的命名空间:
在mongodb数据库中名字空间 <dbname>.system.* 是包含多种系统信息的特殊集合(collection),如下:
集合命名空间
描述
dbname.system.namespaces
列出所有名字空间。
dbname.system.indexes
列出所有索引。
dbname.system.profile
包含数据库概要(profile)信息。
dbname.system.users
列出所有可访问数据库的用户。
dbname.local.sources
包含复制对端(slave)的服务器信息和状态。
对于修改系统集合中的对象有如下限制。
在`system`.`indexes`插入数据,可以创建索引。但除此之外该表信息是不可变的(特殊的drop index命令将自动更新相关信息)。
`system`.`users`是可修改的。 `system`.`profile`是可删除的。
下表为mongodb中常用的几种数据类型。
数据类型
string
字符串。存储数据常用的数据类型。在 mongodb 中,utf-8 编码的字符串才是合法的。
integer
整型数值。用于存储数值。根据你所采用的服务器,可分为 32 位或 64 位。
boolean
布尔值。用于存储布尔值(真/假)。
double
双精度浮点值。用于存储浮点值。
min/max keys
将一个值与 bson(二进制的 json)元素的最低值和最高值相对比。
arrays
用于将数组或列表或多个值存储为一个键。
timestamp
时间戳。记录文档修改或添加的具体时间。
object
用于内嵌文档。
null
用于创建空值。
symbol
符号。该数据类型基本上等同于字符串类型,但不同的是,它一般用于采用特殊符号类型的语言。
date
日期时间。用 unix 时间格式来存储当前日期或时间。你可以指定自己的日期时间:创建 date 对象,传入年月日信息。
object id
对象 id。用于创建文档的 id。
binary data
二进制数据。用于存储二进制数据。
code
代码类型。用于在文档中存储 javascript 代码。
regular expression
正则表达式类型。用于存储正则表达式。
二、mongodb安装
mongodb官网上提供了各种版本的mongodb安装包有rpm包,通用二进制包,源码包
1、yum安装
epel源中有2.4.14版本的mongodb,就直接yum安装了
2、启动mongod
mongodb默认不启用认证功能:
3、客户端mongo的使用
mongo的用法:
实例:
常用命令:
help
db.help()
db.mycoll.help()
db.stats():数据库状态
db.serverstatus():mongodb数据库服务器状态
show dbs、show collections
db.getcollectionnames():显示当前数据所有集合的名称列表
三、crud快速入门
crud是指在做计算处理时的增加(create)、读取查询(retrieve)、更新(update)和删除(delete)几个单词的首字母简写。主要被用在描述软件系统中数据库或者持久层的基本操作功能。
mongo支持丰富的查询表达式。查询指令使用json形式的标记,可轻易查询文档中内嵌的对象及数组。
json:javascript object notation
轻量级的xml,
json有两种结构:
名称/值对象的集合,
值的有序列表
1、插入文档
文档的数据结构和json基本一样,所有存储在集合中的数据都是bson格式,bson是一种类json的一种二进制形式的存储格式,简称binary json。
mongodb 使用 insert() ,语法如下:
不需要先创建数据库和集合:数据库会自动延迟创建,集合不需要定义,所以可以直接插入数据
2、查询文档
mongodb 查询数据的语法格式如下:
db.collection_name.find()
查看db.collection_name.find()的帮助信息:
find()简单的使用:
除了 find() 方法之外,还有一个 findone() 方法,它只返回一个文档:
find()的高级用法
比较操作:$gt,$gte,$lt,$lte,$ne
操作
格式
范例
rdbms中的类似语句
等于
<code>{<key>:<value></code>}
<code>db.col.find({"by":"菜鸟教程"})</code>
<code>where by = '菜鸟教程'</code>
小于
<code>{<key>:{$lt:<value>}}</code>
<code>db.col.find({"likes":{$lt:50}})</code>
<code>where likes < 50</code>
小于或等于
<code>{<key>:{$lte:<value>}}</code>
<code>db.col.find({"likes":{$lte:50}})</code>
<code>where likes <= 50</code>
大于
<code>{<key>:{$gt:<value>}}</code>
<code>db.col.find({"likes":{$gt:50}})</code>
<code>where likes > 50</code>
大于或等于
<code>{<key>:{$gte:<value>}}</code>
<code>db.col.find({"likes":{$gte:50}})</code>
<code>where likes >= 50</code>
不等于
<code>{<key>:{$ne:<value>}}</code>
<code>db.col.find({"likes":{$ne:50}})</code>
<code>where likes != 50</code>
$in 查找在指定列表中列出的数据
$nin
语法格式:
{filed:{$in:[<value>]}}
组合条件:逻辑运算
$or:或运算
$and:与运算
$nor:反运算,返回不符合指定条件的所有文档
{$or:[{<expression1>},...]}
最少条件2个子句
$not:非运算
只有$not格式和上面的不一样
执行逻辑not运算,选择出不能匹配表达式的文档 ,包括没有指定键的文档。$not操作符不能独立使用,必须跟其他操作一起使用(除$regex)。
{field:{$not: <operator-expression> }}}
元素查询
根据文档中是否存在指定的字段进行的查询
$exists:
{filed:{$exists:<boolean>}}
键值为null查询操作
如何检索出age键值为null的文档,"$in"判断键值是否为null,"$exists"判定集合中文档是否包含该键。
以下的用的不多:
$mod:将指定元素做取模运算,并返回指定余数的文档
$type:返回指定字段的值的类型为指定类型的文档
{filed:{$type:<bson type>}}
type:用数字标识
1:doble
2:string
3:object
array,binary data,undefined,boolean,date
3、更新文档
mongodb 使用 update()方法来更新集合中的文档。
db.mycoll.update() 方法用于更新已存在的文档。
$set:修改过字段的值为新指定的值,语法格式:
{filed: value},{$set:{filed: new_value}}
$unset:删除指定字段,语法格式
{filed:value},{$unset:{filed1,filed2,...}}
$inc:增加
4、删除操作
删除文档
db.mycoll.remove()函数是用来移除集合中的数据。
语法格式:
参数说明:
query :(可选)删除的文档的条件。
justone : (可选)如果设为 true 或 1
writeconcern :(可选)抛出异常的级别。
如果什么参数都不带,则默认删除所有的文档
删除collection
db.mycoll.droup()
删除数据库
db.dropdatabase() # 删除当前数据库