本文所涉及的内容(Contents)
背景(Contexts)
实现过程(Realization)
补充说明(Addon)
参考文献(References)
在SQL Server 2008版本之前,对表数据库的变更监控,我们通常使用DML触发器进行监控,把DML操作中的INSERT/UPDATE/DELETE数据记录下来,但是触发器的维护比较困难;
当SQL Server 2008新功能:变更数据捕获(Change Data Capture,即CDC)出来之后,我发现这正是我想要的,因为我之前使用DML触发器实现的时候也是把UPDATE操作按照两条记录进行记录的,共同的缺点都是在用户修改了表结构后,CDC不会自动同步到记录中,不过CDC也有DDL的监控可以补充这个缺陷;CDC的优点就是以异步进程读取事务日志进行捕获数据变更的。
(一) 创建一个测试数据库;


(二) 在开启数据库的CDC之前先查询一下状态,is_cdc_enabled值为0表示没有开启,1表示开启,当为数据库[CDC_DB]启用了CDC之后,在CDC_DB系统表中会出现下图Figure2所示的6个表;


(Figure1:数据库CDC状态)
(Figure2:启用数据库CDC创建的系统表)
(Figure3:数据库CDC状态)
(Figure4:添加新用户和架构)
开启数据库的CDC之后,分别在用户和架构上创建新的用户cdc,新的架构cdc;
(三) 创建一个测试表,对表行变更启用捕获,为表[Department]启用CDC,首先会在系统表中创建[cdc].[dbo_Department_CT],会在Agent中创建两个作业,cdc.CDC_DB_capture和cdc.CDC_DB_cleanup,启用表变更捕获需要开启SQL Server Agent服务,不然会报错。每对一个表启用捕获就会生成一个向对应的记录表。


(Figure5:提示信息)
(Figure6:新增加的系统表)
(Figure7:生成的捕获和清理作业)
(Figure8:表的CDC状态)
(Figure9:多了个数据库角色)
(Figure10:sys.sp_cdc_enable_table配置选项)
上图深色部分的字段值是在执行sys.sp_cdc_enable_table的时候设置的。
(四) 测试插入数据、更新数据、删除数据,执行完这些DML,我们来观察下cdc.dbo_Department_CT帮我们记录些什么?


(Figure11:变更记录表)
对于insert/delete操作,会有对应的一行记录,而对于update,会有两行记录。__$operation列:1 = 删除、2= 插入、3= 更新(旧值)、4= 更新(新值);
(五) 启用CDC之后,你怎么从中获取到数据呢?通过数据我们可以对数据进行恢复;


(Figure15:通过时间获取LSN更新)
(六) CDC的维护


(Figure12:监控表字段信息)
由于sys.sp_cdc_enable_table 的参数:@captured_column_list = NULL,所以dbo.Department表的所有字段都进行监控了,如果你只关心某些字段,强烈建议在创建捕获的时候设置这个属性;


(Figure13:数据库作业信息)
SQL Server记录数据变更有四种方法:触发器、Output子句、变更数据捕获(Change Data Capture 即CDC)功能、同步更改跟踪。其中后两个为SQL Server 2008所新增。
CDC功能主要捕获SQLServer指定表的增删改操作;
CDC除了捕获数据变更之外,还能捕获DDL操作的变化;
无法对系统数据库和分发数据库启用该功能。且执行者需要用sysadmin角色权限;
cdc.<capture_instance>_CT 可以看到,这样命名的表,是用于记录源表更改的表。对于insert/delete操作,会有对应的一行记录,而对于update,会有两行记录;
对于__$start_lsn列:由于更改是来源与数据库的事务日志,所以这里会保存其事务日志的开始序列号(LSN);
对于__$end_lsn列:
对于__$seqval列:
对于__$operation列:1 = 删除、2= 插入、3= 更新(旧值)、4= 更新(新值);
对于__$update_mask列:
恢复模式为简单模式一样可以进行CDC;
虽然能捕获到数据变更,但是没有办法找到是谁更新的?
能使用这个做回滚嘛?备份的另外一种路径?对表更新不频繁的情况下?
如果是添加或者删除了某些字段DDL,那么创建的CDC表并没有做更改,那新字段的数据怎么捕获呢?修改字段长度等这些操作同样会一起修改CDC对应的表字段;
sys.sp_cdc_enable_table 的@role_name参数,是指角色-数据库角色,这个有什么用呢?应用程序角色又有什么用呢?
cdc.Person_Contact_CT这名字中CT代表什么意思呢?Capture Table?(用户.架构_表_CT)
SQL Server 自启动了两个job,一个捕获,一个清除,注意清除是默认凌晨2点,清除72小时以上的数据。如果同一数据库的表中CDC已经启用,不会重建job。
all
返回指定 LSN 范围内的所有更改。 对于由更新操作导致的更改,此选项只返回在应用更新之后包含新值的行。
all update old
返回指定 LSN 范围内的所有更改。 对于由更新操作导致的更改,此选项将返回在更新之前包含列值的行和更新之后包含列值的行。
文章出处:http://www.cnblogs.com/gaizai/p/3479731.html