上一篇文章中,我们介绍了如何快速的把本地自建的数据库迁移入云,那是不是把数据库迁移到rds后,用户就什么都不需要做了?比如rds帮你的数据库做到了高可用,在主库出现down机后能够快速切换到备库,立刻恢复应用;每天会定时的备份数据和日志,如果出现误操作能够帮你恢复到任意时间点;如果担心黑客攻击或者sql注入漏洞,rds能够帮助你进行sql注入的拦截;当数据库使用中出现bug时,后端有专业的源码和dba团队帮助用户实例打上patch,让用户无后顾之忧;当实例的性能出现瓶颈的时候,可以进行快速的弹性升级,保证服务的正常运行等等。
可以看到rds已经具备相当丰富的自动化数据库运维的功能,用户不用太关心后端数据库的运维,以前这些非常专业的dba工作完完全全可以交由rds系统来完成,那么还需要用户做什么,是不是不需要用户干预了?答案是需要的,在日常的工单问题发现:
一. 经常会发现由于自己的开发人员误操作导致用户数据被误删除,虽然rds支持恢复到任意时间点,但毕竟需要时间去恢复,会造成对用户的影响;所以线上的操作务必谨慎,必须在测试环境中完全验证后才能到线上执行,同时需要必要的数据备份;
二.开发人员发布了一个新功能,但是新功能中的一条sql语句没有添加索引,导致了全表扫描,rds的cpu,io达到100%,影响了整个应用的响应时间;所以新发布的任何sql都必须进过严格的审核,添加上必要的索引;
三. 开发人员在业务高峰期对表进行一个表添加索引或者添加字段的操作(删除数据),导致该表的其他访问堵塞,影响前端应用;所以任何的线上操作都需要在业务的低峰期进行,生产变更必须严格控制在可允许的变更窗口内;
四.rds实例由于时间到期后没有及时进行处理,导致实例被锁定或者释放,虽然最终数据可以恢复回来,但这种故障的发生往往令人心惊胆寒;
所以需要用户制定出合理的流程规范来使用rds,比如设计开发过程中的数据库流程规范,线下测试环境与线上生产环境数据的导入导出流程规范,线上数据订正的流程规范,线上数据库操作(添加字段,添加索引)的流程规范,数据库上线下线的流程规范。
在阿里巴巴数据库技术团队,即使有了非常自动化的运维平台,上述的这些流程制定也是开发,测试,dba都必须遵守的,就是因为有了上述的这些流程才避免了很多不必要的故障发生,大大提高了整个平台的稳定性,除此之外还制定了运维红线:
一.禁止在非变更窗口执行变更:
.所有的变更必须提前4小时提交申请,进过审批后才能执行操作;
.全网变更必须经过线下测试,线上小规模验证后,才能全网推送;
.重大变更(数据库停机,扩容,迁移)必须团队review;
.数据订正和数据提取必须经过团队leader审核通过后才能进行操作;
二.安全保密:
.禁止未经正式审批进行查阅,变更,传播,移动线上数据;
.禁止对无关人员提供系统登录和发布权限;
数据库开发规范:赶集网(国内互联网公司)的dba 吴诗展把自己多年的数据库mysql运维开发检验总结了—mysql数据库开发的三十六条军,对于很多的rds用户来说同样是很受用的,包括了:基本军规,字段军规,索引军规,sql类军规,约定类军规,在此也很感谢他能够把多年来的经验总结分享给众多的数据库用户,在这里也在着重强调一些比较重要的规范:
一.表主键的设置:自增主键是你的最佳选择
.在设计表的时候默认都添加一列无业务意义的自增id的主键:id bigint not null auto_increment;
.自增型主键以利于插入性能的提高
.自增型主键设计(int,bigint)可以降低二级索引的空间,提升二级索引的内存命中率;
.自增型的主键可以减小page的碎片,提升空间和内存的使用;
.无主键的表删除,更新在row模式的主从架构,会导致备库hang住;
可参考:mysql主键的缺少导致备库hang
二.引擎选择:innodb 引擎是你的最佳选择
使用innodb存储引擎还是myisam存储引擎?
.rds的内存配置innodb的innodb_buffer_pool_size,myisam的key_cache配置32k;
.主机断电,crash后myisam表容易出现索引坏叶,需要手工repair修复索引;
.myisam存储引擎的表备份时候会被全局锁住,导致无法写入数据;
案例一:下面的这幅图片就是myisam引擎的表由于一个大查询堵塞了该表的其他更新:

案例二:.federated 存储引擎使用存在bug,会导致备份失败
三.索引设计误区:
误区案例一:对查询条件的每个字段建立单列索引
sql查询:
select count(*) from order o where is_send=0 and
o.order_status in (0,1) and o.shipping_status = 0 and
o.is_separate > 0 and o.is_yushou=0 and o.sd_id=23
and o.add_time>= ‘1370246433’ and o.add_time<= ‘1370332842’
and o.jhd_id=0 group by o.order_id;
key:该表有近30个索引
索引设计误区二:对查询的所有字段建立组合索引
希望这篇blog能够对你使用rds有所帮助.