<b>1.2 postgresql数据库与其他数据库的对比</b>
<b>1.2.1postgresql与mysql数据库的对比</b>
可能有人会问,既然已经有一个人气很高的开源数据库mysql了,为什么还要使用postgresql?这主要是因为在一些应用场景中,使用mysql有以下几个缺点:
功能不够强大:mysql的多表连接查询方式只支持“nest loop”,不支持“hash join”和“sort merge join”。不仅如此,还有很多sql语法它也不支持,子查询性能比较低。由于它不支持sequence,有公司还为此专门开发了统一序号分发中心的软件。
性能优化工具和度量信息不足:mysql在运行过程中如果出现问题,只产生很少的性能数据,很难让维护人员准确定位问题产生的原因。mysql的复制是异步的,无法通过master/slave做到数据零丢失。一些第三方公司也有改造mysql源代码实现同步复制,但这些方案要么是没有开源,要么已开源却又不是很稳定,所以,对于普通大众来说,如何实现同步复制成了一个令人头疼的问题。
在线操作功能较弱:如果在mysql表中加列,基本上是新建一个表,而且建索引时也会锁定整张表,即在建索引的过程中,表不能做任何操作。一些大的互联网公司或者是修改mysql源码来实现在线ddl的功能,或者是通过上层架构来解决这个问题,如先在slave数据库上把ddl做完,然后把应用从master库切换到slave,再把原先的master上把ddl做完。第一种方法,需要公司有很强的mysql研发能力,第二种方法需要公司有较强的开发能力,能设计出较强的应用架构。这对于一些中小型公司来说不太容易实现。
相对这些mysql的弱点,postgresql有以下几个优点:
postgresql功能强大:支持所有主流的多表连接查询的方式(如:“nest loop”、“ hash join”“sort merge join”等);支持绝大多数的sql语法(如:with子句)。postgresql是笔者见过的对正则表达式支持最强、内置函数也是最丰富的数据库。字段类型还支持数组类型。除了可以使用pl/pgsql写存储过程外,还可以使用各种主流开发语言的语法(如:python语言的pl/python、perl语言的pl/perl来写存储过程)。这些强大的功能可以大大地节约开发资源。很多开发人员在postgresql上做开发时,会发现数据库已帮自己实现了很多功能,甚至有一些业务功能都可直接使用数据库的功能解决,不再需要写代码来实现了。
性能优化工具与度量信息丰富:postgresql数据库中有大量的性能视图,可方便地定位问题(比如:可看到正在执行的sql,可通过锁视图看到谁在等待、哪条记录被锁定等)。postgresql中设计了专门的架构和进程用于收集性能数据,既有物理i/o方面的统计,也有表扫描及索引扫描方面的性能数据。
在线操作功能好:postgresql增加空值的列时,本质上只是在系统表上把列定义上,无须对物理结构做更新,这就让postgresql在加列时可以做到瞬间完成。postgresql还支持在线建索引的功能,建索引的过程可以不锁更新操作。
从postgresql9.1开始,支持同步复制功能(synchronous replication),通过master和slave之间的复制可以实现零数据丢失的高可用方案。
另外,由于mysql对sql语法支持的功能较弱,基本上不适合做数据仓库。虽然也有些厂商开发了基于mysql的数据仓库存储引擎(如infobright),但这个方案只是解决了部分数据仓库的问题,sql功能弱的问题仍无法完全解决。另外,infobright的社区版本功能上还有很多的限制,如不支持数据更新,不支持太多的并发执行(最多支持十几个)等。而postgresql不仅支持复杂的sql,还支持大量的分析函数,非常适合做数据仓库。
postgresql数据库中还有一些支持移动互联网时代的新功能,如空间索引。postgis是最著名的一个开源gis系统,它是postgresql中的一个插件,通过它可以很方便地解决lbs中的一些位置计算问题。
综上所述,postgresql数据库是一个功能强大,又带有移动互联网特征的开源数据库。如果你仅仅是想把数据库作为一个简单的存储功能使用(如一些大的互联网公司),一些较复杂的功能都想放在应用中来实现,那么选择mysql或一些nosql产品都是合适的;如果你应用的数据访问很简单(如大多数的blog系统),那么后端使用mysql也是很合适的。但如果你的应用不像blog系统那么简单,而你又不想消耗太多的开发资源,那么postgresql是一个明智的选择。最有说服力的例子就是图片分享公司instagram,在使用python+postgresql架构后,只是十几个人就支持起了整个公司的业务。在数据库中使用postgresql的感觉,就像在开发语言中使用python,会让你的工作变得简洁和高效。
<b>1.2.2 postgresql与oracle数据库的对比</b>
从功能上说,postgresql要比oracle数据库稍弱,如不支持索引组织表等。毕竟oracle数据库是目前功能最强大的商业数据库,但postgresql算是功能最强大的开源数据库。
postgresql与oracle有很多相似之处:都是使用共享内存的进程结构,客户端与数据库服务器建立一个连接后,数据库服务器就启动一个进程为这个连接服务,这与mysql的线程模型不一样。此外,postgresql的wal日志与oracle的redo日志都是记录物理块数据变化的,这与mysql的binlog也不同。
postgresql与oracle的不同之处在于:postgresql有更多的支持互联网特征的功能。如postgresql数据类型支持网络地址类型、xml类型、json类型、uuid类型,以及数组类型,有强大的正则表达式函数,where条件中可以使用正则表达式匹配,可以使用python、perl等语言写存储过程等。
另外,postgresql更小巧。oracle安装包动则几个gb以上,postgresql安装包只有几十mb大小。在任何一个环境都可以容易地安装postgresql。