赞
踩
技术原理
通过在冗余网关间共享虚拟MAC和IP地址,保证数据转发时并不是转给某一个具体网关的IP,而是把数据转发给虚拟网关的IP,因此,不论哪一个路由器成为主路由,都不会影响数据通信。通过组播协议对数据端口进行监控,一旦检测数据转发的端口坏掉,主路由器会停发HELLO包,备路由器提升为主路由,实现数据的稳定高效转发。
在VRRP协议中,有两组重要的概念:VRRP路由器和虚拟路由器,主控路由器和备份路由器。VRRP路由器是指运行VRRP的路由器,是物理实体;虚拟路由器是指VRRP协议创建的,是逻辑概念。一组VRRP路由器协同工作,共同构成一台虚拟路由器。该虚拟路由器对外表现为一个具有唯一固定的IP地址和MAC地址的逻辑路由器。处于同一个VRRP组中的路由器具有两种互斥的角色:主控路由器和备份路由器,一个VRRP组中有且只有一台处于主控角色的路由器,可以有一个或者多个处于备份角色的路由器VRRP协议从路由器组中选出一台作为主控路由器,负责ARP解析和转发IP数据包,组中的其他路由器作为备份的角色并处于待命状态,当由于某种原因主控路由器发生故障时,其中的一台备份路由器能在瞬间的时延后升级为主控路由器,由于此切换非常迅速而且不用改变IP地址和MAC地址,故对终端使用者系统是透明的。
VRRP相关术语
功能
用户空间核心组件:
WatchDog:监控进程(整个架构是否有问题)
控制组件:提供keepalived.conf 的解析器,完成Keepalived配置。
IO复用器:针对网络目的而优化的自己的线程抽象。
内存管理组件:为某些通用的内存管理功能(例如分配,重新分配,发布等)提供访问权限。
主配置文件:/etc/keepalived/keepalived.conf
GLOBAL CONFIGURATION
Global definitions(全局配置):定义邮件配置,route_id ,vrrp配置,组播地址 等
VRRP CONFIGURATION
VRRP instance(s):定义vrrp协议中的每个vrrp虚拟路由器的规则,基本信息
LVS CONFIGURATION(lvs调度服务器的规则设置)
Virtual server group(s)
Virtual server(s):LVS集群的VS和RS
global_defs { notification_email { root@localhost #keepalived 发生故障切换时邮件发送的目标邮箱,可以按行区分写多个 root@localhost 2769741114@qq.com } notification_email_from keepalived@localhost #发邮件的地址 smtp_server 127.0.0.1 #邮件服务器地址 smtp_connect_timeout 30 #邮件服务器连接timeout router_id LVS01 #每个keepalived主机唯一标识,建议使用当前主机名,但多节点重名不影响 vrrp_skip_check_adv_addr #对所有通告报文都检查,会比较消耗性能,启用此配置后,如果收到的通告报文和上一个报文是同一个路由器,则跳过检查,默认值为全检查 vrrp_strict #严格遵守VRRP协议,启用此项后以下状况将无法启动服务:1.无VIP地址 2.配置了单播邻居 3.在VRRP版本2中有IPv6地址,开启动此项并且没有配置vrrp_iptables时会自动开启iptables防火墙规则,默认导致VIP无法访问,建议不加此项配置。 vrrp_garp_interval 0 #gratuitous ARP messages 免费ARP报文发送延迟,0表示不延迟 vrrp_gna_interval 0 #unsolicited NA messages (不请自来)消息发送延迟 vrrp_mcast_group4 225.0.0.18 #指定组播IP地址范围:224.0.0.0到239.255.255.255,默认值:224.0.0.18 vrrp_iptables #此项和vrrp_strict同时开启时,则不会添加防火墙规则,如果无配置vrrp_strict项,则无需启用此项配置 }
注意:
默认keepalived主机之间利用多播相互通告消息,可能会造成网络拥塞,可以替换成单播,来减少网络流量。
启用vrrp_strict 时,不能启用单播。
vrrp_instance <STRING> { #<String>为vrrp的实例名,一般为业务名称 配置参数 ...... } #配置参数: state MASTER|BACKUP #当前节点在此虚拟路由器上的初始状态,状态为MASTER或者BACKUP interface IFACE_NAME #绑定为当前虚拟路由器使用的物理接口,如:eth0,bond0,br0,可以和VIP不在一个网卡 virtual_router_id VRID #每个虚拟路由器惟一标识,范围:0-255,每个虚拟路由器此值必须唯一,否则服务无法启动,同属一个虚拟路由器的多个keepalived节点必须相同,务必要确认在同一网络中此值必须唯一 priority 100 #当前物理节点在此虚拟路由器的优先级,范围:1-254,值越大优先级越高,每个keepalived主机节点此值不同 advert_int 1 #vrrp通告的时间间隔,默认1s authentication { #认证机制 auth_type AH|PASS #AH为IPSEC认证(不推荐),PASS为简单密码(建议使用) auth_pass <PASSWORD> #预共享密钥,仅前8位有效,同一个虚拟路由器的多个keepalived节点必须一样 } include /etc/keealived/conf.d/*.conf virtual_ipaddress { #虚拟IP,生产环境可能指定上百个IP地址 <IPADDR>/<MASK> brd <IPADDR> dev <STRING> scope <SCOPE> label <LABEL> 192.168.200.100 #指定VIP,不指定网卡,默认为,注意:不指定/prefix,默认为/32 192.168.200.101/24 dev eth1 #指定VIP的网卡,建议和interface指令指定的网卡不在一个网卡 192.168.200.102/24 dev eth2 label eth2:1 #指定VIP的网卡label ifconfig eth2:1 192.168.200.102/24 } track_interface { #配置监控网络接口,一旦出现故障,则转为FAULT状态实现地址转移 eth0 eth1 … }
整体架构
主keepalived:192.168.232.10
备keepalived:192.168.232.20
web1:192.168.232.30
web2:192.168.232.40
vip:192.168.232.188
客户机:192.168.232.50
1.准备环境
systemctl stop firewalld.service
setenforce 0
yum install epel-release.noarch -y
yum install ipvsadm keepalived -y
#lvs需要安装额外源
2.配置web,选用httpd
配置成功。
3.配置主keepalived
启动lvs
ipvsadm-save > /etc/sysconfig/ipvsadm
systemctl start ipvsadm.service
修改keepalived配置文件:
cd /etc/keepalived/
cp keepalived.conf keepalived.conf.bak
备份
主服务器配置
! Configuration File for keepalived global_defs { notification_email { acassen@firewall.loc failover@firewall.loc sysadmin@firewall.loc } notification_email_from Alexandre.Cassen@firewall.loc smtp_server 127.0.0.1 修改邮箱指向自己 smtp_connect_timeout 30 router_id LVS_01 本路由器的服务器的名称 指定服务器名称主备需要不一样 vrrp_skip_check_adv_addr #vrrp_strict vrrp_garp_interval 0 vrrp_gna_interval 0 } vrrp_instance VI_1 { 定义VRRP热备实例 state MASTER 指定服务器类型MASTER为主 BACKUP为备 interface ens33 修改网卡名称,表示承载VIP地址的物理接口 virtual_router_id 51 指定虚拟路由器的ID号主备需要一致 priority 100 设定优先级数字越大优先级越高。 advert_int 1 通告间隔即心跳线 authentication { auth_type PASS 认证类型 auth_pass 1111 修改认证密码,主备需要一样 } virtual_ipaddress { 192.168.232.188 指定群集vip地址,可以是多个 } } virtual_server 192.168.232.188 80 { delay_loop 6 健康间隔时间6秒 lb_algo rr 调度算法轮询 lb_kind DR LVS模式为DR persistence_timeout 0 连接保持时间,通常不会为0,这里是因为体现实验效果,改为0。 protocol TCP 采用TCP协议 real_server 192.168.232.30 80 { 修改为真实的主机地址以及端口号 weight 1 权重为1 TCP_CHECK { connect_prot 80 检查目标端口 connect_timeout 3 连接超时 nb_get_retry 3 重试次数 delay_before_retry 3 重试间隔时间 } } real_server 192.168.232.40 80 { weight 1 TCP_CHECK { connect_prot 80 connect_timeout 3 nb_get_retry 3 delay_before_retry 3 }
从服务器配置
将主服务器配置远程拷贝至从服务器上。
scp keepalived.conf 192.168.232.20:/etc/keepalived/
12 router_id LVS_02
20 state BACKUP
23 priority 80
至此主从服务器配置完成,还需要将ipv4路由转发设置一下。
vim /etc/sysctl.conf
net.ipv4.conf.all.send_redirects = 0
net.ipv4.conf.default.send_redirects = 0
net.ipv4.conf.ens33.send_redirects = 0
sysctl -p
主从都需要。
http服务器配置
设置虚拟ip
ifconfig lo:0 192.168.232.188 netmask 255.255.255.255
内核设置
vim /etc/sysctl.conf
net.ipv4.conf.all.arp_ignore = 1
net.ipv4.conf.all.arp_announce = 2
net.ipv4.conf.default.arp_ignore = 1
net.ipv4.conf.default.arp_announce = 2
net.ipv4.conf.lo.arp_ignore = 1
net.ipv4.conf.lo.arp_announce = 2
sysctl -p
设置路由
route add -host 192.168.232.188 dev lo:0
主服务器上效果
备服务器上效果,并没有192.168.232.188这个IP地址
实验效果:
测试负载均衡:
测试keeplived:
在主服务器上停止keepalive。
地址实现漂移。
keepalive有三种抢占模式,分别是抢占模式,非抢占模式,延迟抢占模式。
默认是抢占模式,当主节点恢复之后会立即抢占回来,会造成两次网络动荡。这种模式有一定弊端。
非抢占模式配置
必须将keepalived服务器state配置为BACKUP
vrrp_instance VI_1 {
state BACKUP #都为BACKUP
interface ens33
virtual_router_id 66
priority 100 #优先级高
advert_int 1
nopreempt #添加此行,都为nopreempt
开启抓包后,关闭主机1,再开启主机1,发现并没有切换至主服务器上,非抢占模式配置成功。
tcpdump -i ens33 -nn host 224.0.0.18
延迟抢占,可以避免主节点频繁切换。
preempt_delay 指定抢占延迟时间为#s,默认延迟300s
注意: 需要各keepalived服务器state为BACKUP,并且不要启用 vrrp_strict
state BACKUP
interface ens33
virtual_router_id 51
priority 100
advert_int 1
preempt_delay 3
单播模式下,Keepalived 节点之间通过单独的 IP 地址进行通信。
优点:
缺点:
组播模式下,Keepalived 节点使用一个预定义的组播地址进行通信。
优点:
缺点:
单播配置
vrrp_instance VI_1 {
interface eth0
state MASTER
priority 100
virtual_ipaddress {
192.168.1.100/24
}
unicast_peer {
192.168.1.101
192.168.1.102
}
}
在这个配置中:
主从两边都需要修改。
组播配置
vrrp_instance VI_1 {
interface eth0
state MASTER
priority 100
virtual_ipaddress {
192.168.1.100/24
}
multicast_group 224.0.0.19
}
必须确保在所有节点上使用相同的组播地址,也要确保是组播地址。
模拟环境:当主从节点发生变化之后,肯定需要人员去维护,但是如何知道呢?这边展示了利用邮件通知运维人员。
通知脚本
当前节点成为主节点时触发的脚本
notify_master <STRING>|<QUOTED-STRING>
当前节点转为备节点时触发的脚本
notify_backup <STRING>|<QUOTED-STRING>
当前节点转为“失败”状态时触发的脚本
notify_fault <STRING>|<QUOTED-STRING>
通用格式的通知触发机制,一个脚本可完成以上三种状态的转换时的通知
notify <STRING>|<QUOTED-STRING>
当停止VRRP时触发的脚本
notify_stop <STRING>|<QUOTED-STRING>
邮箱配置
vim /etc/mail.rc
set from=QQ号@qq.com
set smtp=smtp.qq.com
set smtp-auth-user=QQ号@qq.com
set smtp-auth-password=
配置脚本
#!/bin/bash # contact='2769741114@qq.com' notify() { mailsubject="$(hostname) to be $1, vip floating" mailbody="$(date +'%F %T'): vrrp transition, $(hostname) changed to be $1" echo "$mailbody" | mail -s "$mailsubject" $contact: } case $1 in master) notify master ;; backup) notify backup ;; fault) notify fault ;; *) echo "Usage: $(basename $0) {master|backup|fault}" exit 1 ;; esac
keepalived配置文件
vrrp_instance VI_1 { state BACKUP interface ens33 virtual_router_id 51 priority 100 preempt_delay 30 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 192.168.91.16 } notify_master "/opt/keepalive.sh master" notify_backup "/opt/keepalive.sh backup" notify_fault "/opt/keepalive.sh fault" 需要调用脚本 }
这是keepalive的启动文件
vim /lib/systemd/system/keepalived.service
[Unit]
Description=LVS and VRRP High Availability Monitor
After=syslog.target network-online.target
[Service]
Type=forking
PIDFile=/var/run/keepalived.pid
KillMode=process
EnvironmentFile=-/etc/sysconfig/keepalived
ExecStart=/usr/sbin/keepalived $KEEPALIVED_OPTIONS
ExecReload=/bin/kill -HUP $MAINPID
[Install]
WantedBy=multi-user.target
打开环境变量的文件
vim /etc/sysconfig/keepalived
KEEPALIVED_OPTIONS="-D -S 6"
vim /etc/rsyslog.conf
ocal6.* /var/log/keepalived.log
然后重启两个服务即可
systemctl restart rsyslog.service
systemctl restart keepalived.service
什么是脑裂?
在高可用(HA)系统中,当联系2个节点的“心跳线”断开时,本来为一整体、动作协调的HA系统,就分裂成为2个独立的个体。
由于相互失去了联系,都以为是对方出了故障。两个节点上的HA软件像“裂脑人”一样,争抢“共享资源”、争起“应用服务”,就会发生严重后果。共享资源被瓜分、两边“服务”都起不来了;或者两边“服务”都起来了,但同时读写“共享存储”,导致数据损坏。
哪些原因导致脑裂?
总之,心跳线的问题。
如何解决keepalived脑裂问题?
在实际生产环境中,我们从以下方面防止脑裂:
1.同时使用串行电缆和以太网电缆连接、同时使用两条心跳线路,这样一条线路断了,另外一条还是好的,依然能传送心跳消息。
2.当检查脑裂时强行关闭一个心跳节点(这个功能需要特殊设备支持,如stonith、fence)相当于备节点接收不到心跳消息,通过单独的线路发送关机命令关闭主节点的电源。
keepalived利用 VRRP Script 技术,可以调用外部的辅助脚本进行资源监控,并根据监控的结果实现优先动态调整,从而实现其它应用的高可用性功能。可以和任何软件组合形成,高可用的架构。
分两步实现:
定义脚本
vrrp_script:自定义资源监控脚本,vrrp实例根据脚本返回值,公共定义,可被多个实例调用,定义在vrrp实例之外的独立配置块,一般放在global_defs设置块之后。通常此脚本用于监控指定应用的状态。一旦发现应用的状态异常,则触发对MASTER节点的权重减至低于SLAVE节点,从而实现 VIP 切换到 SLAVE 节点。
vrrp_script <SCRIPT_NAME> { #定义一个检测脚本,在global_defs 之外配置
script <STRING>|<QUOTED-STRING> #shell命令或脚本路径(注意执行权限) 0 不会执行以下操作, 1 就会执行以下操作
interval <INTEGER> #间隔时间,单位为秒,默认1秒
timeout <INTEGER> #超时时间
weight <INTEGER:-254..254> #默认为0,如果设置此值为负数,当上面脚本返回值为非0时,会将此值与本节点权重相加可以降低本节点权重,即表示fall. 如果是正数,当脚本返回值为0,会将此值与本节点权重相加可以提高本节点权重,即表示 rise.通常使用负值
fall <INTEGER> #执行脚本连续几次都失败,则转换为失败,建议设为2以上
rise <INTEGER> #执行脚本连续几次都成功,把服务器从失败标记为成功
user USERNAME [GROUPNAME] #执行监测脚本的用户或组
init_fail #设置默认标记为失败状态,监测成功之后再转换为成功状态
}
vrrp_script check_down {
script "/etc/keepalived/ng.sh" #指明脚本的位置
interval 1 #每隔1s 执行一次检测
weight -30 #如果 脚本执行失败自动减少优先级30
fall 3 # 3次不成功才标注为失败
rise 2 #nginx 重新起来后检测两次成功 才真的成功
timeout 2 #超时时间 2s
}
注意:这边的优先级-30要根据实际情况加减。
调用脚本
track_script:调用vrrp_script定义的脚本去监控资源,定义在VRRP实例之内,调用事先定义的vrrp_script
SCRIPT_NAME_1
主keepalived和nginx:192.168.232.10
备keepalived和nginx:192.168.232.20
web1:192.168.232.30
web2:192.168.232.40
vip:192.168.232.188
客户机:192.168.232.50
配置后端真实服务器
systemctl stop firewalld
setenforce 0
yum install httpd -y
vim /etc/httpd/conf/httpd.conf
keepalive off
echo 7-3 > /var/www/html/index.html
systemctl start httpd
配置代理服务器
vim /etc/nginx/nginx.conf
upstream web {
server 192.168.232.30;
server 192.168.232.40;
}
location / {
proxy_pass http://web;
}
两台机子的配置是一样的,远程拷贝即可。在主配置中也需要将nginx的长连接关闭。
主服务器的keepalive配置
! Configuration File for keepalived global_defs { notification_email { acassen@firewall.loc failover@firewall.loc sysadmin@firewall.loc } notification_email_from Alexandre.Cassen@firewall.loc smtp_server 127.0.0.1 修改邮箱地址 smtp_connect_timeout 30 router_id LVS_01 修改名称 vrrp_skip_check_adv_addr #vrrp_strict 关闭严格模式 vrrp_garp_interval 0 vrrp_gna_interval 0 } vrrp_script check_down { script "/etc/keepalived/ng.sh" 指明脚本位置 interval 1 每隔1s执行一次检测 weight -30 如果脚本执行失败自动减少优先级30 fall 3 3次不成功标注为失败 rise 2 nginx重新起来后检测两次成功后才真的成功。 timeout 2 超时时间2s } vrrp_instance VI_1 { state MASTER interface ens33 virtual_router_id 51 priority 100 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 192.168.232.188 } track_script { check_down } } vim /etc/keepalived/ng.sh killall -0 nginx chmod +x /etc/keepalived/ng.sh scp /etc/keepalived/keepalived.conf 192.168.232.20://etc/keepalived/
测试负载均衡是否成功
关闭7-1的keepalive,切换至7-2的服务。
重启开始7-1,关闭7-1的nginx
效果配置成功。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。