天天看点

双机热备_双机热备方案

双机热备针对的是服务器临时故障所做的一种备份技术,通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。

1、集群技术

在了解双机热备之前,我们先了解什么是集群技术。

集群技术是指一组相互独立的计算机,利用公司通信网络组成一个计算机系统,每个群集节点(即集群中的每台计算机)都是运行期自己进程的一个独立服务器。这些进程可以彼此通信,对网络客户机来说就像形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据,并以单一系统的模式加以管理。一个客户端与集群相互作用是,集群像是一个独立的服务器。计算机集群技术的出发点是为了提供更高的可用性、可管理性、可伸缩性的计算机系统。一个集群包含多台拥有共享数据存储弓箭的服务器,各服务器通过内部局域网相互通信。当一个节点发生故障时,它所运行的应用程序将由其他节点自动接管。

其中,只有连个节点的高可用集群又称为双机热备,即使用两台服务器互相备份。当一台服务器出现故障时,可由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续对外提供服务。可见,双机热备是集群技术中最简单的一种。

2、双机热备适用对象

一般邮件服务器是要长年累月工作的,且为了工作上需要,其邮件备份工作就绝对少不了。有些企业为了避免服务器故障产生数据丢失等现象,都会采用RAID技术和数据备份技术。但是数据备份只能解决系统出现问题后的恢复;而RAID技术,又只能解决硬盘的问题。我们知道,无论是硬件还是软件问题,都会造成邮件服务的中断,而RAID机数据备份恰恰就不能解决避免服务器中断的问题。

要恢复服务器,再轻微的问题或者强悍的技术支持,服务器都要中断一段时间,对于一些需要随时在线的用户而言,丢失邮件就等于丢失金钱,损失可大可小,这类用户是很难忍受服务中断的。因此,就需要通过双机热备,来避免产时间的服务中断,保证系统长期,可靠的服务。

3、实现方案

双机热备有两种实现模式,一种是基于共享的存储设备的方式,另一种是没用共享的存储设备的方式,一般称为纯软件方式。

1>基于共享技术的存储设备的方式

双机热备_双机热备方案

基于存储共享的双机热备是双机热备的最标准方案。对于这种方式,采用两台服务器(邮件系统同时运行在两台服务器上),使用共享的存储设备磁盘阵列(邮件系统的数据都存放在该磁盘阵列中)。两台服务器可以采用互备、主从、并行等不同的方式。在工作过程中,两台服务器将以一个虚拟的IP地址对外提供服务,依工作方式的不同,将服务请求发送给其中一台服务器承担。同时,服务器通过心跳线(目前往往采用建立私有网络的方式)侦测另一台服务器的工作状况。当一台服务器出现故障时,另一台服务器根据心跳侦测的情况做出判断,并进行切换,接管服务。对用户而言,这一过程是全自动的,在很短时间内完成,从而对业务不会造成影响。由于使用共享的存储设备,两台服务器使用的实际上是一样的数据,由双机或集群软件对其进行管理。

优点:对于共享方式,数据库吃饭在共享的存储设备上。当一台服务器提供服务时,直接在存储设备进行读写。而当系统切换后,另一台服务器也同样读取该存储设备上的数据。它可以在无人值守的情况下提供快速的切换,保证不会有数据丢失的现象。

缺点:增加了昂贵的存储设备投资,对于有实力的企业,可优先考虑该方式。

2>纯软件方式

双机热备_双机热备方案

纯软件的方式,通过镜像软件,将数据可以实时复制到另一台服务器上,这样同样是的数据就在两台服务器上各存一份,如果一台服务器出现故障,可以及时切换到另一台服务器。

优点:

A、避免了磁盘阵列的单点故障:对于双机热备,本身即时防范由于单点设备的故障导致服务中断,但磁盘阵列恰恰又形成一个新的单点。(比如,服务器可靠系数是99.9%,磁盘阵列的可靠系数是99.95%,则纯软双机的可靠系数是1-99.9%X99.9%=99.99%,而基于磁盘阵列的双机热备系统的可靠系数则会是略低于99.95%);

B、节约投资:不需要购买昂贵的磁盘阵列;

C、不受距离的限制:两台服务器不需受SCSI电缆的长度限制(光纤通道的磁盘阵列也不受距离限制,但投资会大得多)。这样,可以灵活的部署服务器,包括通过位置的距离类提高安全性。

缺点:

A、可靠性相对较差,两台服务器间的数据实时复制是一个比较脆弱的环节。

B、一旦某一台服务器出现中断,恢复后还要进行比较复杂的数据同步恢复。并且,这个时段系统处于无保护状态。

C、没有事务机制,由于其复制是在文件和磁盘层进行的,复制是否成功不会影响数据库事务操作,因此有出现数据不完整变化的情况,这个存在相当的风险。

4、配置

硬件:两台相同配置的服务器,根据需要配置;

磁盘阵列,适用于采用共享的方式搭建双机热备系统。

集群软件:

搭建双机热备当然少不了集群软件。推荐集群软件heartbeat,这个软件包括心跳监测部分和资源接管部分,心跳监测可以通过网络链路和串口进行,而且支持冗余链路,他们之间互相发送报文来告诉对方自己当前的状态,如果在指定的时间内未收到对方的报文,那么就认为对方失效,这时需要启动资源接管模块来接管运行在对方主机上的资源或服务。

来自网络。

双机热备_双机热备方案

继续阅读