百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Pacemaker实现双机热备

moboyou 2025-03-08 13:28 24 浏览

在互联网高速发展的今天,尤其在电子商务的发展,要求服务器能够提供不间断服务。在电子商务中,如果服务器宕机,造成的损失是不可估量的。要保证服务器不间断服务,就需要对服务器实现冗余。在众多的实现服务器冗余的解决方案中,Pacemaker为我们提供了廉价的、可伸缩的高可用解决方案。

  双机热备测试环境如下:

1

2

3

4

5

主节点:10.0.0.20


副节点:10.0.0.21


虚拟IP:10.0.0.100

一、关闭selinux和防火墙-两台机均执行

  1、 关闭selinux

1

2

$ sudo sed -i “s/SELINUX=enforcing/SELINUX=disabled/g” /etc/selinux/config

$ sudo reboot

  2、 闭防火墙

1

2

$ sudo systemctl stop firewalld

$ sudo systemctl disable firewalld

二、两台机安装Pacamaker

  1、 利用yum安装Pacemaker

1

$ sudo yum install -y fence-agents-all corosync pacemaker pcs

  2、 修改两台机的hostname

1

2

3

4

5

#主节点改为node1

$ sudo hostnamectl set-hostname node1


#副节点

$ sudo hostnamectl -set-hostname node2

  3、 修改两台机的hosts

1

2

3

4

$ sudo vim /etc/hosts


10.0.0.20 node1

10.0.0.21 node2

三、node1与node2实现无密钥访问

1

2

3

4

5

6

7

#在两台机均运行以下命令


$ sudo -i


# ssh-keygen

# ssh-copy-id -p 22 root@10.0.0.20

# ssh-copy-id -p 22 root@10.0.0.21

四、配置两台机的集群用户hacluster,此帐户在安装Pacemaker时已经自动创建。

1

2

3

#设置hacluster用户的密码


$ sudo passwd hacluster

五、配置集群节点之间的认证

  1、 启动并设置开机启动pcsd服务,两台机上均执行以下命令

1

2

3

$ sudo systemctl start pcsd


$ sudo systemctl enable pcsd

  2、 配置节点间的认证,以下命令只在node1节点上执行

1

2

3

#以下操作需要输入用户名hacluster和密码


$ sudo pcs cluster auth node1 node2

  到此为止,节点认证配置完成!

六、Pacemaker可以为多种服务提供支持,例如Apache、MySQL、Xen等,可使用的类型有IP地址、文件系统、服务、fence设备等。以下以Apache为例。

  1、 两台机均安装httpd

1

$ sudo yum install -y httpd

  2、 设置httpd.conf-两台主机均配置

1

2

3

4

5

6

7

8

9

10

$ sudo vim /etc/httpd/conf/httpd.conf


Listen 0.0.0.0:80

ServerName www.node1.com      //另外一台为www.node2.coom


#设置服务器状态页面以便集群检测

SetHandler server-status

Require all granted

  3、Pacemaker可以控制httpd服务的启动和关闭,所以node1和node2配置完httpd后需关闭httpd服务。

1

$ sudo systemctl stop httpd

七、 新建并启动集群,以下操作均在node1上执行

  1、 新建一个名为mycluster的集群

1

$ sudo pcs cluster setup --name mycluster node1 node2

  2、 启动集群

1

$ sudo pcs cluster start --all

  3、 设置自启动集群

1

2

3

4

$ sudo pcs cluster enable –all


# 查看集群状态

$ sudo pcs status

通过以上在node1的设置后,所有的设置都会同步在node2上。

八、为集群添加资源

1

2

3

4

5

6

7

8

9

#添加一个名为VIP的IP地址资源

#使用heartbeat作为心跳检测

#集群每隔30s检查该资源一次


$ sudo pcs resource create VIP ocf:heartbeat:IPaddr2 ip=10.0.0.100 cidr_netmask=24 op monitor interval=30s


$ sudo pcs resource create Web ocf:heartbeat:apache configfile=/etc/httpd/conf/httpd.conf statusurl="http://127.0.0.1/server-status" op monitor interval=30s


$ sudo pcs status

九、调整资源,让VIP和Web两个资源“捆绑”在一起。

1

2

3

4

5

6

7

8

9

# 方式一:将VIP和Web添加到myweb组中

$ sudo pcs resource group add myweb VIP

$ sudo pcs resource group add myweb Web


# 方式二:使用托管约束

$ sudo pcs constraint colocation add Web VIP INFINITY


# 设置先启动VIP,再启动Web

$ sudo pcs constraint order start VIP then start Web

十、优先级:如果node1与node2的硬件配置不同,那么应该调整节点的优先级,让资源运行于硬件配置更好的服务器上,待其失效后再转移至较低配置的服务器上。这就需要配置优先级(Pacemaker中称为Location)。

  1、调整Location

1

2

3

# 数值越大表示优先级越高

$ sudo pcs constraint location Web prefers node1=10

$ sudo pcs constraint location Web prefers node2=5

  2、查看设置结果

1

$ sudo crm_simulate -sL

  3、验证VIP是否启用-需显示IP10.0.0.100

1

$ ip addr show

  4、验证httpd是否启动 

1

$ ps -aux|grep httpd

  5、报错:WARNING: no stonith devices and stonith-enabled is not false,请执行以下命令:

1

$ sudo pcs property set stonith-enabled=false

十一、 启动后正常情况下VIP设置在主节点10.0.0.20上。如主节点故障,则节点node2自动接管服务,方法是直接重启节点node1,然后观察备用节点是否接管了主机的资源,测试过程如下:

  1、 在节点node1上执行重启操作

1

2

#执行重启

$ sudo reboot

  2、node1重启前截图

3、node1重启后状态如下图

4、当节点node1故障时,地点node2收不到心跳请求,超过设置的时间节点后node2启用资源接管程序,上述命令输出中说明VIP和Web已经被节点node2成功接管。如果节点node1恢复且设置了优先级,VIP和Web又会重新被节点node1接管。下图为node1重启后的截图:

另附oracle主、从自动切换方案

各个部分功能说明:

1、keepalived只用作vip功能;

2、check_oracle.sh脚本用于检测master服务,并执行vip、oracle切换;

通过“select status from v$instance;”获取master上oracle的数据状态,由返回值进行判断。

check_oracle.sh

#!/bin/sh

monitor_ip=192.168.3.186

ssh_port=22

logfile=/etc/keepalived/check_oracle.log

#check ssh port status

function check_ssh_port()

{

/usr/bin/nc -z -w 5 -n $monitor_ip $ssh_port 1 > /dev/nul

if [ $? = 0 ]; then

ssh_status=0

else

ssh_status=1

fi

return $ssh_status

}

#oracle_check_status

function check_oracle_helth()

{

source /home/oracle/.bash_profile

source /home/oracle/.bashrc

oracle_check_status=$(su - oracle -c "sqlplus sys/oracle@${monitor_ip}:1521/mydb as sysdba | grep -A 2 STATUS | sed -n '3p'" <<EOF

select status from v\$instance;

EOF

)

if [ "$oracle_check_status" == OPEN ];then

oracle_status=0

else

oracle_status=1

fi

#echo $oracle_check_status

return $oracle_status

}

#update oracle slave to master

function change_oracle_status()

{

source /home/oracle/.bash_profile

source /home/oracle/.bashrc

su - oracle -c 'sqlplus / as sysdba' <<EOF

alter database recover managed standby database finish force;

alter database commit to switchover to primary with session shutdown;

alter database open;

EOF

}

check_time=5

#!=0

while [ $check_time -ne 0 ];do

let "check_time -= 1"

check_ssh_port

echo $ssh_status

if [ $ssh_status = 0 ];then

echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH ok, success_code:[$ssh_status]

echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - start check oracle status......

check_oracle_helth

if [ $oracle_status = 0 ];then

echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - ORACLE ok, success_code:[$oracle_status]

else

echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - ORACLE Down, fail_code:[$oracle_status]

echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - Keepalived stop......

ssh root@$monitor_ip '/etc/init.d/keepalived stop'

wait

echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - Keepalived Already stop

echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - Start update oracle slave stauts......

change_oracle_status

wait

echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - Oracle slave update to master Success

sed 's/.*check_oracle.sh$//g' /var/spool/cron/root

/etc/init.d/crond restart

fi

else

echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH error 1, fail_code:[$ssh_status]

sleep 3

check_ssh_port

if [ $ssh_status = 0 ];then

echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH ok, success_code:[$ssh_status]

else

echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH error 2, fail_code:[$ssh_status]

sleep 3

check_ssh_port

if [ $ssh_status = 0 ];then

echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH ok, success_code:[$ssh_status]

else

echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH error 3, fail_code:[$ssh_status]

sleep 3

check_ssh_port

if [ $ssh_status = 0 ];then

echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH ok, success_code:[$ssh_status]

else

echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH error 4, fail_code:[$ssh_status]

sleep 3

check_ssh_port

if [ $ssh_status = 0 ];then

echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH ok, success_code:[$ssh_status]

else

echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH error 5, fail_code:[$ssh_status]

echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - Start update oracle slave stauts......

change_oracle_status

wait

echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - Oracle slave update to master Success

sed 's/.*check_oracle.sh$//g' /var/spool/cron/root

/etc/init.d/crond restart

fi

fi

fi

fi

fi

sleep 5

done

检测流程图:

脚本由crond执行,每1分钟执行一次,每执行一次,脚本内循环检测5次,首先判断服务器ssh端口是否正常,正常情况下,再去检查oracle状态,根据返回的状态决定是否进行切换,如果ssh端口异常,则进行5次检查判断,5次以内返回正常的话,则重新进行检测,如果第5次仍异常,则进行切换。

相关推荐

声学EI要完稿?十步速写法

【推荐会议】国际声学与振动会议(ICAV)会议号:CFP23112A截稿时间:2025年4月20日召开时间/地点:2025年8月15-17日·新加坡论文集上线:会后3个月提交EiComp...

结构力学!EI会议图表规范秘籍

推荐会议:国际结构与材料工程进展大会(ISME2026)会议编号:EI#73521截稿时间:2026年3月10日召开时间/地点:2026年8月15-17日·德国柏林论文集上线:会后4...

傅里叶级数物理意义的直观理解:利用傅里叶级数逼近方波信号

上篇文章将向大家介绍频谱的概念,对傅里叶级数、傅里叶积分、傅里叶变换进行了数学的推导,并解释了它们各自的物理意义。推导过程见我的上一篇文章:频谱分析——频谱概念(傅里叶变换、级数、积分及物理意义)如下...

通过对航空发动机整机振动进行分析,有何控制方法?

前言针对航空发动机整机振动问题的复杂性和多样性,以整机振动的振源分析为出发点,总结国内外关于转子系统故障、气流激振、轴承故障、齿轮故障和结构局部共振等引起的整机振动的研究情况。结合航空发动机整机结构动...

MATLIB中使用PCA

主成分分析PCA(PrincipalComponentsAnalysis),奇异值分解SVD(Singularvaluedecomposition)是两种常用的降维方法降维致力于解决三类问题:降维...

数据处理|软件:让科研更简单2

书接上回,继续介绍免费的数据处理软件。eGPS一款热图绘制专用软件,热图就是用颜色代表数字,让数据呈现更直观,对比更明显。优点:小巧方便,基本功能齐全,包括数据转换、聚类分析、颜色调整等等缺点:常见的...

电力系统常用的通讯协议及其在Speedgoat系统中的实现

在电力系统中,IEC61850协议、DNP3协议、ModbusTCP广泛应用于远程终端设备(RTU)、智能电子设备(IED)交互以及监控和数据采集(SCADA)系统。一、IEC61850协议IE...

电子工程师的常用仿真软件

不知道从事电子行业的工程师,有没有使用模拟仿真工具,仿真软件网上又有很多,初学者,可能只知道Multisim和Proteus。一般Multisim适合在学习模拟电路和电路分析原理课程时使用,便于理解电...

技术论文|异结构混沌系统的组合同步控制及电路实现

欢迎引用[1]李贤丽,马赛,樊争先,王壮,马文峥,于婷婷.异结构混沌系统的组合同步控制及电路实现[J].自动化与仪器仪表,2022,No.276(10):80-84.DOI:10.14016/j.cn...

现场︱某110KV主变事故过程仿真分析

三峡电力职业学院、河南省电力公司洛阳供电公司的研究人员李莉、任幼逢、徐金雄、王磊,在2016年第6期《电气技术》杂志上撰文,针对某110KV变电站主变差动保护跳闸事故,结合事故相关检测数据,通过MAT...

光伏发电系统篇:单级式并网系统实时仿真

在全球积极推动清洁能源转型的大背景下,光伏发电作为重要的可再生能源利用方式,得到了广泛关注和迅猛发展。目前常用的光伏并网及光伏电站主要拓扑结构有单级式和双级式。相较于传统的多级式系统,单级式光伏发电并...

光伏发电系统篇:三电平并网逆变器实时仿真

一、三电平并网逆变器在能源转型加速的当下,分布式能源接入电网需求大增。三电平并网逆变器凭借低谐波、高功率密度等优势,有效提升电能转换效率,于新能源并网发电中担当关键角色。常见的三电平电路拓扑结构包括二...

自制3.5KW大功率逆变器,很简单,看过这个电路原理就懂了

前言拿下8000元奖金的项目,是什么水平?本项目经过联合湖南科技大学光伏逆变以及电力电子研究生团队共同探讨方案。项目成本:1200元,获得奖金:8000元!参加赛事:立创开源硬件平台_星火计划·外包赛...

圈内分享:电容式加速度计接口电路非线性建模与仿真设计

摘要:非线性是Sigma-Delta(ΣΔ)加速度计系统的关键指标之一。基于一个五阶ΣΔ加速度计结构,分析了其主要的非线性模块,在MATLAB中建立了整体结构的行为级模型,并利用根轨迹法进行了稳...

基于Matlab/Simulink建立一种Thevenin/RC电池模块仿真模型

本文以锂电池数学模型为基础,在Matlab/Simulink的仿真系统中,建立了一种Thevenin/RC电池模块仿真模型,通过实际工况试验,测试精度在允许误差范围内,为电池SOC/SOH研究提供了极...