但凡是MySQL DBA肯定都听说过MHA个高可用方案,而且很多公司都是通过对MHA做二次开发来实现MySQL高可用的。如果MHA不结合VIP的话,每次主库切换都需要程序修改连数据库的配置,这样比较麻烦。而采用MHA+VIP的方式时可以在主库切换的过程中让VIP漂移到新主库,省去了改数据库配置这一过程。
公司以前是每一组主从复制集群都配置一个manager结点,然后将vip和网络接口等信息都写死在master_ip_failover和master_ip_online_change脚本中。当主从集群数量太多的情况下要维护的manager结点很多,管理起来很麻烦。
如何实现用一个Manager结点管理多个支持VIP的mysql主从集群呢?有两种实现方式:
1,每一组主从复制集群维护两个切换脚本,将VIP和网络接口信息写死在脚本里。
2,修改MHA的相关模块,使其能识别我们自定义的参数,我们只需要在每一组主从复制集群的配置文件中给参数传值。
很明显,第1种方式太low了,需要维护大量的切换脚本。那我们需要修改哪些模块呢?
看一下masterha_check_repl这段脚本,可以看到检测主从复制状态的时候会调用MasterMonitor模块。
<code>$exit_code = MHA::MasterMonitor::main( </code><code>"--interactive=0"</code><code>, </code><code>"--check_only"</code><code>,</code>
<code> </code><code>"--check_repl_health"</code><code>, @ARGV );</code>
<code>if</code> <code>( $exit_code == 0 ) {</code>
<code> </code><code>print </code><code>"\nMySQL Replication Health is OK.\n"</code><code>;</code>
<code>}</code>
<code>else</code> <code>{</code>
<code> </code><code>print </code><code>"\nMySQL Replication Health is NOT OK!\n"</code><code>;</code>
通过masterha_master_switch这段脚本可以看到在线切换是调用的MasterRotate模块,故障切换是调用的MasterFailover模块。
<code>if</code> <code>( $master_state </code><code>eq</code> <code>"dead"</code> <code>) {</code>
<code> </code><code>$exit_code = MHA::MasterFailover::main(@ARGV);</code>
<code>elsif ( $master_state </code><code>eq</code> <code>"alive"</code> <code>) {</code>
<code> </code><code>$exit_code = MHA::MasterRotate::main(@ARGV);</code>
<code> </code><code>pod2usage(1);</code>
MasterMonitor.pm,MasterRotate.pm,MasterFailover.pm这三个模块都是调用Config.pm模块来读取参数配置,所以我们只需要修改这几个模块即可。
为了不平的网络环境,我在配置文件加了这三个配置项:
app_vip :主库的VIP
netmask : VIP的网络位
interface :VIP要绑定的网上
对应调整的代码如下:
Config.pm:
申明变量:
<code>my @PARAM_ARRAY =</code>
<code> </code><code>qw/ </code><code>hostname</code> <code>ip port ssh_host ssh_ip ssh_port ssh_connection_timeout ssh_options node_label candidate_master no_master ignore_fail skip_init_ssh_check skip_reset_slave user password repl_user repl_password disable_log_bin master_pid_file handle_raw_binlog ssh_user remote_workdir master_binlog_dir log_level manager_workdir manager_log check_repl_delay check_repl_filter latest_priority multi_tier_slave ping_interval ping_type secondary_check_script master_ip_failover_script master_ip_online_change_script shutdown_script report_script init_conf_load_script client_bindir client_libdir use_gtid_auto_pos app_vip netmask interface/;</code>
给变量赋值:
<code> </code><code>$value{app_vip} = $param_arg->{app_vip};</code>
<code> </code><code>if</code> <code>( !defined( $value{app_vip} ) ) {</code>
<code> </code><code>$value{app_vip} = $default->{app_vip};</code>
<code> </code><code>}</code>
<code> </code><code>$value{netmask} = $param_arg->{netmask};</code>
<code> </code><code>if</code> <code>( !defined( $value{netmask} ) ) {</code>
<code> </code><code>$value{netmask} = $default->{netmask};</code>
<code> </code><code>$value{interface} = $param_arg->{interface};</code>
<code> </code><code>if</code> <code>( !defined( $value{interface} ) ) {</code>
<code> </code><code>$value{interface} = $default->{interface};</code>
MasterMonitor.pm :
修改复制检测时的命令:
<code>"$current_master->{master_ip_failover_script} --command=status --ssh_user=$current_master->{ssh_user} --orig_master_host=$current_master->{hostname} --orig_master_ip=$current_master->{ip} --orig_master_port=$current_master->{port} --app_vip=$current_master->{app_vip} --netmask=$current_master->{netmask} --interface=$current_master->{interface}"</code><code>;</code>
MasterMonitor.pm :
修改停原主库写入的命令:
<code>"$orig_master->{master_ip_online_change_script} --command=stop --orig_master_host=$orig_master->{hostname} --orig_master_ip=$orig_master->{ip} --orig_master_port=$orig_master->{port} --orig_master_user=$orig_master->{escaped_user} --orig_master_password=$orig_master->{escaped_password} --new_master_host=$new_master->{hostname} --new_master_ip=$new_master->{ip} --new_master_port=$new_master->{port} --new_master_user=$new_master->{escaped_user} --new_master_password=$new_master->{escaped_password} --app_vip=$orig_master->{app_vip} --netmask=$orig_master->{netmask} --interface=$orig_master->{interface}"</code><code>;</code>
修改允许在新主库写入的命令:
<code>"$new_master->{master_ip_online_change_script} --command=start --orig_master_host=$orig_master->{hostname} --orig_master_ip=$orig_master->{ip} --orig_master_port=$orig_master->{port} --orig_master_user=$orig_master->{escaped_user} --orig_master_password=$orig_master->{escaped_password} --new_master_host=$new_master->{hostname} --new_master_ip=$new_master->{ip} --new_master_port=$new_master->{port} --new_master_user=$new_master->{escaped_user} --new_master_password=$new_master->{escaped_password} --app_vip=$orig_master->{app_vip} --netmask=$orig_master->{netmask} --interface=$orig_master->{interface}"</code><code>;</code>
MasterFailover.pm:
修改禁用原从库的vip命令:
<code> </code><code>"$dead_master->{master_ip_failover_script} --orig_master_host=$dead_master->{hostname} --orig_master_ip=$dead_master->{ip} --orig_master_port=$dead_master->{port} --app_vip=$dead_master->{app_vip} --netmask=$dead_master ->{netmask} --interface=$dead_master->{interface}"</code><code>;</code>
修改启用原从库vip的命令:
<code> </code><code>"$new_master->{master_ip_failover_script} --command=start --ssh_user=$new_master->{ssh_user} --orig_master_host=$dead_master->{hostname} --orig_master_ip=$dead_master->{ip} --orig_master_port=$dead_master->{port} --new_m aster_host=$new_master->{hostname} --new_master_ip=$new_master->{ip} --new_master_port=$new_master->{port} --new_master_user=$new_master->{escaped_user} --new_master_password=$new_master->{escaped_password} --app_vip=$de ad_master->{app_vip} --netmask=$dead_master->{netmask} --interface=$dead_master->{interface}"</code><code>;</code>
版权声明:原创作品,如需转载,请注明出处。否则将追究法律责任
本文转自 emma_cql 51CTO博客,原文链接:http://blog.51cto.com/chenql/1939105