天天看点

【MongoDB】01、MongoDB基础

一、mongodb概述

1、mogodb简介

mongodb 是由c++语言编写的,是一个基于分布式文件存储的开源数据库系统。

在高负载的情况下,添加更多的节点,可以保证服务器性能。

mongodb 旨在为web应用提供可扩展的高性能数据存储解决方案。

mongodb 将数据存储为一个文档,数据结构由键值(key=>value)对组成。mongodb 文档类似于 json 对象。字段值可以包含其他文档,数组及文档数组。

【MongoDB】01、MongoDB基础

  一个文档相当于mysql数据库中的一行数据

        2007年10月,mongodb由10gen团队所发展。2009年2月首度推出。

2012年05月23日,mongodb2.1 开发分支发布了! 该版本采用全新架构,包含诸多增强。

最新稳定版:3.4.2

2、mongodb特点

mongodb的提供了一个面向文档存储,操作起来比较简单和容易。

你可以在mongodb记录中设置任何属性的索引 (如:firstname="sameer",address="8 gandhi road")来实现更快的排序。

你可以通过本地或者网络创建数据镜像,这使得mongodb有更强的扩展性。

如果负载的增加(需要更多的存储空间和更强的处理能力) ,它可以分布在计算机网络中的其他节点上这就是所谓的分片。(自动分片)

mongo支持丰富的查询表达式。查询指令使用json形式的标记,可轻易查询文档中内嵌的对象及数组。

mongodb 使用update()命令可以实现替换完成的文档(数据)或者一些指定的数据字段 。

mongodb中的map/reduce主要是用来对数据进行批量处理和聚合操作。

map和reduce。map函数调用emit(key,value)遍历集合中所有的记录,将key与value传给reduce函数进行处理。

map函数和reduce函数是使用javascript编写的,并可以通过db.runcommand或mapreduce命令来执行mapreduce操作。

gridfs是mongodb中的一个内置功能,可以用于存放大量小文件。内置分布式文件系统

mongodb允许在服务端执行脚本,可以用javascript编写某个函数,直接在服务端执行,也可以把函数的定义存储在服务端,下次直接调用即可。

mongodb支持各种编程语言:ruby,python,java,c++,php,c#等多种语言。

mongodb安装简单。

二、概念解析

         不管我们学习什么数据库都应该学习其中的基础概念,在mongodb中基本的概念是文档、集合、数据库,下面我们挨个介绍。下表将帮助您更容易理解mongo中的一些概念:

sql术语/概念

mongodb术语/概念

解释/说明

database

数据库

table

collection

数据库表/集合

row

document

数据记录行/文档

column

field

数据字段/域

index

索引

table joins

表连接,mongodb不支持

primary key

主键,mongodb自动将_id字段设置为主键

通过下图实例,我们也可以更直观的的了解mongo中的一些概念:

【MongoDB】01、MongoDB基础

        文档是一个键值(key-value)对(即bson)。mongodb 的文档不需要设置相同的字段,并且相同的字段不需要相同的数据类型,这与关系型数据库有很大的区别,也是 mongodb 非常突出的特点。

一个简单的文档例子如下:

需要注意的是:

文档中的键/值对是有序的。

文档中的值不仅可以是在双引号里面的字符串,还可以是其他几种数据类型(甚至可以是整个嵌入的文档)。

mongodb区分类型和大小写。

mongodb的文档不能有重复的键。

文档的键是字符串。除了少数例外情况,键可以使用任意utf-8字符。

文档键命名规范:

键不能含有\0 (空字符)。这个字符用来表示键的结尾。

.和$有特别的意义,只有在特定环境下才能使用。

以下划线"_"开头的键是保留的(不是严格要求的)。

每个文档都有隐藏的_id键也就是字段,相当于mysql中的主键

       集合就是 mongodb 文档组,类似于 rdbms (关系数据库管理系统:relational database management system)中的表格。集合存在于数据库中,集合没有固定的结构,这意味着你在对集合可以插入不同格式和类型的数据,但通常情况下我们插入集合的数据都会有一定的关联性。

比如,我们可以将以下不同数据结构的文档插入到集合中:

当第一个文档插入时,集合就会被创建。

集合名不能是空字符串""。

集合名不能含有\0字符(空字符),这个字符表示集合名的结尾。

集合名不能以"system."开头,这是为系统集合保留的前缀。

用户创建的集合名字不能含有保留字符。有些驱动程序的确支持在集合名里面包含,这是因为某些系统生成的集合中包含该字符。除非你要访问这种系统创建的集合,否则千万不要在名字里出现$。 

如下实例:

capped collections 就是固定大小的collection。

它有很高的性能以及队列过期的特性(过期按照插入的顺序). 有点和 "rrd" 概念类似。

capped collections是高性能自动的维护对象的插入顺序。它非常适合类似记录日志的功能 和标准的collection不同,你必须要显式的创建一个capped collection, 指定一个collection的大小,单位是字节。collection的数据存储空间值提前分配的。

要注意的是指定的存储大小包含了数据库的头信息。

在capped collection中,你能添加新的对象。

能进行更新,然而,对象不会增加存储空间。如果增加,更新就会失败 。

数据库不允许进行删除。使用drop()方法删除collection所有的行。

注意: 删除之后,你必须显式的重新创建这个collection。

在32bit机器中,capped collection最大存储为1e9( 1x109)个字节。

一个mongodb中可以建立多个数据库。

mongodb的单个实例可以容纳多个独立的数据库,每一个都有自己的集合和权限,不同的数据库也放置在不同的文件中。

"show dbs" 命令可以显示所有数据的列表。

执行 "db" 命令可以显示当前数据库对象或集合。

运行"use db_name"命令,可以使用一个指定的数据库。

数据库也通过名字来标识。数据库名可以是满足以下条件的任意utf-8字符串。

不能是空字符串("")。

不得含有' '(空格)、.、$、/、\和\0 (空宇符)。

应全部小写。

最多64字节。

数据库的信息是存储在集合中。它们使用了系统的命名空间:

在mongodb数据库中名字空间 <dbname>.system.* 是包含多种系统信息的特殊集合(collection),如下:

集合命名空间

描述

dbname.system.namespaces

列出所有名字空间。

dbname.system.indexes

列出所有索引。

dbname.system.profile

包含数据库概要(profile)信息。

dbname.system.users

列出所有可访问数据库的用户。

dbname.local.sources

包含复制对端(slave)的服务器信息和状态。

对于修改系统集合中的对象有如下限制。

在`system`.`indexes`插入数据,可以创建索引。但除此之外该表信息是不可变的(特殊的drop index命令将自动更新相关信息)。

`system`.`users`是可修改的。 `system`.`profile`是可删除的。

下表为mongodb中常用的几种数据类型。

数据类型

string

字符串。存储数据常用的数据类型。在 mongodb 中,utf-8 编码的字符串才是合法的。

integer

整型数值。用于存储数值。根据你所采用的服务器,可分为 32 位或 64 位。

boolean

布尔值。用于存储布尔值(真/假)。

double

双精度浮点值。用于存储浮点值。

min/max keys

将一个值与 bson(二进制的 json)元素的最低值和最高值相对比。

arrays

用于将数组或列表或多个值存储为一个键。

timestamp

时间戳。记录文档修改或添加的具体时间。

object

用于内嵌文档。

null

用于创建空值。

symbol

符号。该数据类型基本上等同于字符串类型,但不同的是,它一般用于采用特殊符号类型的语言。

date

日期时间。用 unix 时间格式来存储当前日期或时间。你可以指定自己的日期时间:创建 date 对象,传入年月日信息。

object id

对象 id。用于创建文档的 id。

binary data

二进制数据。用于存储二进制数据。

code

代码类型。用于在文档中存储 javascript 代码。

regular expression

正则表达式类型。用于存储正则表达式。

二、mongodb安装

  mongodb官网上提供了各种版本的mongodb安装包有rpm包,通用二进制包,源码包

1、yum安装

   epel源中有2.4.14版本的mongodb,就直接yum安装了

2、启动mongod

mongodb默认不启用认证功能:

3、客户端mongo的使用

mongo的用法:

实例:

常用命令:

  help

  db.help()

  db.mycoll.help()

  db.stats():数据库状态

  db.serverstatus():mongodb数据库服务器状态

  show dbs、show collections

  db.getcollectionnames():显示当前数据所有集合的名称列表

三、crud快速入门

   crud是指在做计算处理时的增加(create)、读取查询(retrieve)、更新(update)和删除(delete)几个单词的首字母简写。主要被用在描述软件系统中数据库或者持久层的基本操作功能。

   mongo支持丰富的查询表达式。查询指令使用json形式的标记,可轻易查询文档中内嵌的对象及数组。

json:javascript object notation

   轻量级的xml,

    json有两种结构:

       名称/值对象的集合,

       值的有序列表

1、插入文档

        文档的数据结构和json基本一样,所有存储在集合中的数据都是bson格式,bson是一种类json的一种二进制形式的存储格式,简称binary json。

mongodb 使用 insert() ,语法如下:

  不需要先创建数据库和集合:数据库会自动延迟创建,集合不需要定义,所以可以直接插入数据

2、查询文档

mongodb 查询数据的语法格式如下:

  db.collection_name.find()

查看db.collection_name.find()的帮助信息:

find()简单的使用:

除了 find() 方法之外,还有一个 findone() 方法,它只返回一个文档:

find()的高级用法

 比较操作:$gt,$gte,$lt,$lte,$ne

操作

格式

范例

rdbms中的类似语句

等于

<code>{&lt;key&gt;:&lt;value&gt;</code>}

<code>db.col.find({"by":"菜鸟教程"})</code>

<code>where by = '菜鸟教程'</code>

小于

<code>{&lt;key&gt;:{$lt:&lt;value&gt;}}</code>

<code>db.col.find({"likes":{$lt:50}})</code>

<code>where likes &lt; 50</code>

小于或等于

<code>{&lt;key&gt;:{$lte:&lt;value&gt;}}</code>

<code>db.col.find({"likes":{$lte:50}})</code>

<code>where likes &lt;= 50</code>

大于

<code>{&lt;key&gt;:{$gt:&lt;value&gt;}}</code>

<code>db.col.find({"likes":{$gt:50}})</code>

<code>where likes &gt; 50</code>

大于或等于

<code>{&lt;key&gt;:{$gte:&lt;value&gt;}}</code>

<code>db.col.find({"likes":{$gte:50}})</code>

<code>where likes &gt;= 50</code>

不等于

<code>{&lt;key&gt;:{$ne:&lt;value&gt;}}</code>

<code>db.col.find({"likes":{$ne:50}})</code>

<code>where likes != 50</code>

 $in   查找在指定列表中列出的数据

 $nin

语法格式:

   {filed:{$in:[&lt;value&gt;]}}

 组合条件:逻辑运算

   $or:或运算

    $and:与运算

    $nor:反运算,返回不符合指定条件的所有文档

   {$or:[{&lt;expression1&gt;},...]}

       最少条件2个子句

$not:非运算 

  只有$not格式和上面的不一样

          执行逻辑not运算,选择出不能匹配表达式的文档 ,包括没有指定键的文档。$not操作符不能独立使用,必须跟其他操作一起使用(除$regex)。

  {field:{$not: &lt;operator-expression&gt; }}}

元素查询

  根据文档中是否存在指定的字段进行的查询

$exists:

   {filed:{$exists:&lt;boolean&gt;}}

键值为null查询操作

  如何检索出age键值为null的文档,"$in"判断键值是否为null,"$exists"判定集合中文档是否包含该键。

以下的用的不多:

  $mod:将指定元素做取模运算,并返回指定余数的文档

  $type:返回指定字段的值的类型为指定类型的文档

   {filed:{$type:&lt;bson type&gt;}}

    type:用数字标识

        1:doble

        2:string

        3:object

          array,binary data,undefined,boolean,date

3、更新文档

   mongodb 使用 update()方法来更新集合中的文档。

db.mycoll.update() 方法用于更新已存在的文档。

$set:修改过字段的值为新指定的值,语法格式:

      {filed: value},{$set:{filed: new_value}}

$unset:删除指定字段,语法格式

      {filed:value},{$unset:{filed1,filed2,...}}

$inc:增加

4、删除操作

删除文档

   db.mycoll.remove()函数是用来移除集合中的数据。 

语法格式:   

参数说明:

query   :(可选)删除的文档的条件。

justone  : (可选)如果设为 true 或 1

writeconcern :(可选)抛出异常的级别。

  如果什么参数都不带,则默认删除所有的文档

删除collection

 db.mycoll.droup()

删除数据库

 db.dropdatabase()   # 删除当前数据库