天天看点

10g RAC TAF介绍

Oracle 10g RAC TAF介绍

  

  Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点

的故障都不会影响用户的使用,连接到故障节点的用户会被自动转移到健康节点,从用户感受而言, 是感觉不到这种切换。

Oracle 10g RAC 的Failover 可以分为3种:

1. Client-Side Connect time Failover

2. Client-Side TAF

3. Service-Side TAF

注意事项: 不能在listener.ora 文件中设置GLOBAL_NAME, 因为这个参数会禁用Connect-time Failover 和 Transparent Application Failover.

一.Client-Side Connect Time Failover

Client-Side Connect Time Failover的含义:如果用户端tnsname 中配置了多个地址,用户发起连接请求时,会先尝试连接地址表中的第一

个地址,如果这个连接尝试失败,则继续尝试使用第二个地址,直至连接成功或者遍历了所有的地址。

这种Failover的特点:只在建立连接那一时刻起作用,也就是说,这种Failover方式只在发起连接时才会去感知节点故障,如果节点没有

反应,则自动尝试地址列表中的下一个地址。一旦连接建立之后,节点出现故障都不会做处理,从客户端的表现就是会话断开了,用户

程序必须重新建立连接。

启用这种Failover的方法就是在客户端的tnsnames.ora中添加FAILOVER=ON 条目,这个参数默认就是ON,所以即使不添加这个条目,

客户端也会获得这种Failover能力。

示例:

VICTOR =

  (DESCRIPTION =

    (ADDRESS = (PROTOCOL = TCP)(HOST = node01-vip)(PORT = 1521))

    (ADDRESS = (PROTOCOL = TCP)(HOST = node02-vip)(PORT = 1521))

    (LOAD_BALANCE = yes)

    (CONNECT_DATA =

      (SERVER = DEDICATED)

      (SERVICE_NAME = vic)

    )

  )

注:node01-vip,node02-vip要添加到hosts 文件中,不然可能解析不了。

二. Client-Side TAF(Transparent Application Failover)

现在的大部分流行的应用系统(如:weblogic, Jboss),都是启动时就建立若干到数据库的长连接,在应用程序整个生命周期内重用这些

连接。 而Client-Side Connet Time Failover的工作方式使它对应用程序的可用性没有太大帮助。

所以从Oracle 8.1.5 版本只有引入了新的Failover 机制—TAF。 所谓TAF,就是连接建立以后,应用系统运行过程中,如果某个实例发

生故障,连接到这个实例上的用户会被自动迁移到其他的健康实例上。对于应用程序而言,这个迁移过程是透明的,不需要用户的介

入,当然,这种透明要是有引导的,因为用户的未提交事务会回滚。 相对与Client-Side Connect Time Failover的用户程序中断(抛出

连接错误,用户必须重启应用程序),TAF这种方式在提高HA上有了很大的进步。

TAF 的配置也很简单,只需要在客户端的tnsnames.ora中添加FAILOVER_MODE配置项。这个条目有4个子项目需要定义。

1. METHOD: 用户定义何时创建到其实例的连接,有BASIC 和 PRECONNECT 两种可选值。

BASIC: 是指在感知到节点故障时才创建到其他实例的连接。

PRECONNECT:是在最初建立连接时就同时建立到所有实例的连接,当发生故障时,立刻就可以切换到其他链路上。

注意:server-side TAF的failover方式无法设置为PRECONNECT,只能设置为BASIC,10g,11g都是如此。所以,如果failover方式要设定

为PRECONNECT,就只能使用client-side TAF。

两种方法比较: BASIC方式在Failover时会有时间延迟,PRECONNECT方式虽然没有时间延迟,但是建立多个冗余连接会消耗更多资源,

两者就是是用时间换资源和用资源换时间的区别。

2. TYPE: 用于定义发生故障时对完成的SQL 语句如何处理,其中有2种类型:session 和select.

这2种方式对于未提交的事务都会自动回滚,区别在于对select 语句的处理,对于select,用户正在执行的select语句会被转移到新的实例

上,在新的节点上继续返回后续结果集,而已经返回的记录集则抛弃。

假设用户正在节点1上执行查询,整个结果集共有10000条记录,现在已从节点1上返回9000条记录,这时节点1宕机,用户连接被转移到节

点2上,如果是session模式,则需要重新执行查询语句;如果是select方式,会从节点2上继续返回剩下的1000条记录,而已经从节点1返

回的9000条记录不会重复返回给用户,对于用户而言,感受不到这种切换。

显然为了实现select 方式,Oracle 必须为每个session保存更多的内容,包括游标,用户上下文等,需要更多的资源也是用资源换时间

的方案。

3. DELAY 和 RETRIES: 这2个参数分别代表重试间隔时间和重试次数。

示例:

DCSRV =

  (DESCRIPTION =

    (ADDRESS = (PROTOCOL = TCP)(HOST = node01-vip)(PORT = 1521))

    (ADDRESS = (PROTOCOL = TCP)(HOST = node02-vip)(PORT = 1521))

    (LOAD_BALANCE = yes)

    (CONNECT_DATA =

      (SERVER = DEDICATED)

      (SERVICE_NAME = dcsrv)

      (FAILOVER_MODE =

        (TYPE = SELECT)

        (METHOD = BASIC)

        (RETRIES = 180)

        (DELAY = 5)

      )

    )

  )

三. Service-Side TAF

Service-SideTAF 可以看作是TAF的一种变种,首先Service-SideTAF也是TAF,所有TAF的特点它都有,其次这种TAF是在服务器上配

置的,而不像TAF是在客户端配置的。

Client-Side TAF 是在客户端修改tnsnames.ora 文件来配置的,如果有很多客户端使用这个数据库,那么每次微小调整都需要把所有的

计算机更改一遍,既低效又容易出错。而Service-Side TAF 通过结合Service,在数据库里保存FAIL_MODE的配置,把所有的TAF配置

保存在数据字典中,从而省去了客户端的配置工作,现在客户端的TNS文件就不需要任何TAF的配置选项了。

从配置参数而言,Service-Side TAF和TAF 相比多了一个Instance Role(实例角色)的概念。 所谓的实例角色,就是当有多个Instance 参

与一个Service时,可以配置优先使用哪一个Instance为用户提供服务。用户共有两种可选角色。

PREFERRED:首选实例,会优先选择拥有这个角色的实例提供服务。

AVAILABLE: 后备实例,用户连接会优先连接PREFFERRED的Instance,当PREFERRED的Instance不可用时,才会被转到AVAILBALE

的Instance上。

要使用Server-Side TAF,第一步,必须配置Service。 Service 可以在创建数据库时创建,也可以在创建数据库之后修改,既可以使用

dbca 配置向导,也可以用命令行的 方式配置。第二步,必须通过dbms_service包来配置TAF策略选项。

注意:server-side的TAF策略会覆盖掉client-side的TAF策略,所以如果使用client-side TAF连接数据库而不想使用server-side的策略,

就只能使用另外一个service。

RAC