mongodb基础应用

一些概念

一个mongod服务可以有建立多个数据库，每个数据库可以有多张表，这里的表名叫collection，每个collection可以存放多个文档（document），每个文档都以BSON（binary json）的形式存放于硬盘中，因此可以存储比较复杂的数据类型。它是以单文档为单位存储的，你可以任意给一个或一批文档新增或删除字段，而不会对其它文档造成影响，这就是所谓的schema-free，这也是文档型数据库最主要的优点。跟一般的key-value数据库不一样的是，它的value中存储了结构信息，所以你又可以像关系型数据库那样对某些域进行读写、统计等操作。Mongo最大的特点是他支持的查询语言非常强大，其语法有点类似于面向对象的查询语言，几乎可以实现类似关系数据库单表查询的绝大部分功能，而且还支持对数据建立索引。Mongo还可以解决海量数据的查询效率，根据官方文档，当数据量达到50GB以上数据时，Mongo数据库访问速度是MySQL10 倍以上。

BSON

BSON是BinaryJSON 的简称，是一个JSON文档对象的二进制编码格式。BSON同JSON一样支持往其它文档对象和数组中再插入文档对象和数组，同时扩展了JSON的数据类型。如：BSON有Date类型和BinDate类型。

BSON被比作二进制的交换格式，如同Protocol Buffers，但BSON比它更“schema-less”，非常好的灵活性但空间占用稍微大一点。

BSON有以下三个特点：

1．轻量级

2．跨平台

3．效率高

命名空间

MongoDB存储BSON对象到collections,这一系列的数据库名和collection名被称为一个命名空间。如同：java.util.List;用来管理数据库中的数据。

索引

mongodb可以对某个字段建立索引，可以建立组合索引、唯一索引，也可以删除索引，建立索引就意味着增加空间开销。默认情况下每个表都会有一个唯一索引：_id，如果插入数据时没有指定_id，服务会自动生成一个_id，为了充分利用已有索引，减少空间开销，最好是自己指定一个unique的key为_id，通常用对象的ID比较合适，比如商品的ID。

成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。

输入help可以看到基本操作命令：

show dbs:显示数据库列表

show collections：显示当前数据库中的集合（类似关系数据库中的表）

show users：显示用户

use <db name>：切换当前数据库，这和MS-SQL里面的意思一样

db.help()：显示数据库操作命令，里面有很多的命令

db.foo.help()：显示集合操作命令，同样有很多的命令，foo指的是当前数据库下，一个叫foo的集合，并非真正意义上的命令

db.foo.find()：对于当前数据库中的foo集合进行数据查找（由于没有条件，会列出所有数据）

db.foo.find( { a : 1 } )：对于当前数据库中的foo集合进行查找，条件是数据中有一个属性叫a，且a的值为1

MongoDB没有创建数据库的命令，但有类似的命令。

如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。

数据库常用命令

1、Help查看命令提示

help

db.help();

db.yourColl.help();

db.youColl.find().help();

rs.help();

2、切换/创建数据库

use yourDB; 当创建一个集合(table)的时候会自动创建当前数据库

3、查询所有数据库

show dbs;

4、删除当前使用数据库

db.dropDatabase();

5、从指定主机上克隆数据库

db.cloneDatabase(“127.0.0.1”); 将指定机器上的数据库的数据克隆到当前数据库

6、从指定的机器上复制指定数据库数据到某个数据库

db.copyDatabase("mydb", "temp", "127.0.0.1");将本机的mydb的数据复制到temp数据库中

7、修复当前数据库

db.repairDatabase();

8、查看当前使用的数据库

db.getName();

db; db和getName方法是一样的效果，都可以查询当前使用的数据库

9、显示当前db状态

db.stats();

10、当前db版本

db.version();

11、查看当前db的链接机器地址

db.getMongo();

Collection聚集集合

1、创建一个聚集集合（table）

db.createCollection(“collName”, {size: 20, capped: 5, max: 100});

2、得到指定名称的聚集集合（table）

db.getCollection("account");

3、得到当前db的所有聚集集合

db.getCollectionNames();

4、显示当前db所有聚集索引的状态

db.printCollectionStats();

用户相关

1、添加一个用户

db.addUser("name");

db.addUser("userName", "pwd123", true); 添加用户、设置密码、是否只读

2、数据库认证、安全模式

db.auth("userName", "123123");

3、显示当前所有用户

show users;

4、删除用户

db.removeUser("userName");

其他

1、查询之前的错误信息

db.getPrevError();

2、清除错误记录

db.resetError();

查看聚集集合基本信息

聚集集合查询

修改、添加、删除集合数据

update或 remove其中一个是必须的参数; 其他参数可选。

参数

详解

默认值

query

查询过滤条件

{}

sort

如果多个文档符合查询过滤条件，将以该参数指定的排列方式选择出排在首位的对象，该对象将被操作

remove

若为true，被选中对象将在返回前被删除

N/A

update

一个修改器对象

new

若为true，将返回修改后的对象而不是原始对象。在删除操作中，该参数被忽略。

false

fields

参见Retrieving a Subset of Fields (1.5.0+)

All fields

upsert

创建新对象若查询结果为空。示例 (1.5.4+)

语句块操作

shell操作数据库：

1. 超级用户相关：

1. #进入数据库admin

use admin

2. #增加或修改用户密码

db.addUser('name','pwd')

3. #查看用户列表

db.system.users.find()

4. #用户认证

db.auth('name','pwd')

5. #删除用户

db.removeUser('name')

6. #查看所有用户

show users

7. #查看所有数据库

show dbs

8. #查看所有的collection

show collections

9. #查看各collection的状态

db.printCollectionStats()

10. #查看主从复制状态

db.printReplicationInfo()

11. #修复数据库

db.repairDatabase()

12. #设置记录profiling，0=off 1=slow 2=all

db.setProfilingLevel(1)

13. #查看profiling

show profile

14. #拷贝数据库

db.copyDatabase('mail_addr','mail_addr_tmp')

15. #删除collection

db.mail_addr.drop()

16. #删除当前的数据库

db.dropDatabase()

2. 增删改

1. #存储嵌套的对象

db.foo.save({'name':'ysz','address':{'city':'beijing','post':100096},'phone':[138,139]})

2. #存储数组对象

db.user_addr.save({'Uid':'[email protected]','Al':['[email protected]','[email protected]']})

3. #根据query条件修改，如果不存在则插入，允许修改多条记录

db.foo.update({'yy':5},{'$set':{'xx':2}},upsert=true,multi=true)

4. #删除yy=5的记录

db.foo.remove({'yy':5})

5. #删除所有的记录

db.foo.remove()

3. 索引

1. #增加索引：1(ascending),-1(descending)

2. db.foo.ensureIndex({firstname:1, lastname: 1}, {unique: true});

3. #索引子对象

4.db.user_addr.ensureIndex({'Al.Em': 1})

5. #查看索引信息

6. db.foo.getIndexes()

7. db.foo.getIndexKeys()

8. #根据索引名删除索引

9.db.user_addr.dropIndex('Al.Em_1')

4. 查询

1. #查找所有

2. db.foo.find()

3. #查找一条记录

4. db.foo.findOne()

5. #根据条件检索10条记录

6.db.foo.find({'msg':'Hello 1'}).limit(10)

7. #sort排序

8.db.deliver_status.find({'From':'[email protected]'}).sort({'Dt',-1})

9.db.deliver_status.find().sort({'Ct':-1}).limit(1)

10. #count操作

11. db.user_addr.count()

12. #distinct操作,查询指定列，去重复

13. db.foo.distinct('msg')

14. #”>=”操作

15.db.foo.find({"timestamp": {"$gte" : 2}})

16. #子对象的查找

17.db.foo.find({'address.city':'beijing'})

5. 管理

1. #查看collection数据的大小

2.db.deliver_status.dataSize()

3. #查看colleciont状态

4.db.deliver_status.stats()

5. #查询所有索引的大小

6.db.deliver_status.totalIndexSize()

5. advanced queries:高级查询

条件操作符

$gt : >

$lt : <

$gte: >=

$lte: <=

$ne : !=、<>

$in : in

$nin: not in

$all: all

$not: 反匹配(1.3.3及以上版本)

查询 name <> "bruce" and age >= 18 的数据

db.users.find({name: {$ne: "bruce"}, age: {$gte: 18}});

查询 creation_date > '2010-01-01' and creation_date<= '2010-12-31' 的数据

db.users.find({creation_date:{$gt:new Date(2010,0,1), $lte:newDate(2010,11,31)});

查询 age in (20,22,24,26) 的数据

db.users.find({age: {$in: [20,22,24,26]}});

查询 age取模10等于0 的数据

db.users.find('this.age % 10 == 0');

或者

db.users.find({age : {$mod : [10, 0]}});

匹配所有

db.users.find({favorite_number : {$all : [6, 8]}});

可以查询出{name: 'David', age: 26, favorite_number: [ 6, 8,9 ] }

可以不查询出{name: 'David', age: 26, favorite_number: [ 6, 7,9 ] }

查询不匹配name=B*带头的记录

db.users.find({name: {$not: /^B.*/}});

查询 age取模10不等于0 的数据

db.users.find({age : {$not: {$mod : [10, 0]}}});

#返回部分字段

选择返回age和_id字段(_id字段总是会被返回)

db.users.find({}, {age:1});

db.users.find({}, {age:3});

db.users.find({}, {age:true});

db.users.find({ name : "bruce" }, {age:1});

0为false, 非0为true

选择返回age、address和_id字段

db.users.find({ name : "bruce" }, {age:1, address:1});

排除返回age、address和_id字段

db.users.find({}, {age:0, address:false});

db.users.find({ name : "bruce" }, {age:0, address:false});

数组元素个数判断

对于{name: 'David', age: 26, favorite_number: [ 6, 7, 9 ]}记录

匹配db.users.find({favorite_number: {$size: 3}});

不匹配db.users.find({favorite_number: {$size: 2}});

$exists判断字段是否存在

查询所有存在name字段的记录

db.users.find({name: {$exists: true}});

查询所有不存在phone字段的记录

db.users.find({phone: {$exists: false}});

$type判断字段类型

查询所有name字段是字符类型的

db.users.find({name: {$type: 2}});

查询所有age字段是整型的

db.users.find({age: {$type: 16}});

对于字符字段，可以使用正则表达式

查询以字母b或者B带头的所有记录

db.users.find({name: /^b.*/i});

$elemMatch(1.3.1及以上版本)

为数组的字段中匹配其中某个元素

Javascript查询和$where查询

查询 age > 18 的记录，以下查询都一样

db.users.find({age: {$gt: 18}});

db.users.find({$where: "this.age > 18"});

db.users.find("this.age > 18");

f = function() {return this.age > 18} db.users.find(f);

排序sort()

以年龄升序asc

db.users.find().sort({age: 1});

以年龄降序desc

db.users.find().sort({age: -1});

限制返回记录数量limit()

返回5条记录

db.users.find().limit(5);

返回3条记录并打印信息

db.users.find().limit(3).forEach(function(user) {print('my age is ' +user.age)});

结果

my age is 18

my age is 19

my age is 20

限制返回记录的开始点skip()

从第3条记录开始，返回5条记录(limit 3, 5)

db.users.find().skip(3).limit(5);

查询记录条数count()

db.users.find().count();

db.users.find({age:18}).count();

以下返回的不是5，而是user表中所有的记录数量

db.users.find().skip(10).limit(5).count();

如果要返回限制之后的记录数量，要使用count(true)或者count(非0)

db.users.find().skip(10).limit(5).count(true);

分组group()

假设test表只有以下一条数据

{ domain: "www.mongodb.org"

, invoked_at: {d:"2009-11-03", t:"17:14:05"}

, response_time: 0.05

, http_action: "GET /display/DOCS/Aggregation"

}

使用group统计test表11月份的数据count:count(*)、total_time:sum(response_time)、avg_time:total_time/count;

db.test.group(

{ cond: {"invoked_at.d": {$gt: "2009-11", $lt:"2009-12"}}

, key: {http_action: true}

, initial: {count: 0, total_time:0}

, reduce: function(doc, out){ out.count++; out.total_time+=doc.response_time }

, finalize: function(out){ out.avg_time = out.total_time / out.count }

} );

[

{

"http_action" : "GET /display/DOCS/Aggregation",

"count" : 1,

"total_time" : 0.05,

"avg_time" : 0.05

]