如何同步集群配置并验证节点中的故障转移设置 - 第 4 部分
大家好。首先,我对本集群系列最后一部分的延迟表示歉意。让我们继续工作吧,不要再耽搁了。
由于我们中的许多人已经完成了前面的所有三个部分,因此我将向您简要介绍我们迄今为止已完成的工作。现在我们已经有了足够的知识来为两个节点安装和配置集群包,并在集群环境中启用防护和故障转移。
如果你不记得了,可以参考我之前的部分,因为发布最后一部分花了一点时间。
Linux 集群简介以及集群的优点/缺点 – 第 1 部分
如何在 Linux 中安装和配置具有两个节点的集群 – 第 2 部分
隔离并向集群添加故障转移 – 第 3 部分
我们将从向集群添加资源开始。在这种情况下,我们可以根据您的需要添加文件系统或 Web 服务。现在我已将 /dev/sda3 分区安装到 /x01,我希望将其添加为文件系统资源。
1. 我使用以下命令将文件系统添加为资源:
ccs -h 172.16.1.250 --addresource fs name=my_fs device=/dev/mapper/tecminttest_lv_vol01 mountpoint=/x01 fstype=ext3
此外,如果您还想添加服务,可以使用以下方法。发出以下命令。
ccs -h 172.16.1.250 --addservice my_web domain=testdomain recovery=relocate autostart=1
您可以通过查看 cluster.conf
文件来验证它,就像我们在前面的课程中所做的那样。
2. 现在在 cluster.conf 文件中输入以下条目,以向服务添加引用标记。
<fs ref="my_fs"/>
3. 一切就绪。不,我们将看到如何在我们拥有的 2 个节点之间同步我们对集群所做的配置。以下命令将完成所需的操作。
ccs -h 172.16.1.250 --sync --activate
注意:输入我们在安装软件包初期为ricci设置的密码。
您可以使用以下命令验证您的配置。
ccs -h 172.16.1.250 --checkconf
4.现在是时候开始了。您可以根据需要使用以下命令之一。
要仅启动一个节点,请使用具有相关 IP 的命令。
ccs -h 172.16.1.222 start
或者,如果您想启动所有节点,请使用 --startall
选项,如下所示。
ccs -h 172.16.1.250 –startall
如果需要停止集群,可以使用 stop 或 --stopall
。
如果您想在不启用资源的情况下启动集群(集群启动时资源将自动启用),例如您故意禁用特定节点中的资源以禁用防护循环,您可以不想在集群启动时启用这些资源。
为此,您可以使用以下命令启动集群但不启用资源。
ccs -h 172.16.1.250 --startall --noenable
5.集群启动后,您可以通过发出clustat命令查看统计信息。
clustat
上面的输出表明集群中有两个节点,并且目前都已启动并正在运行。
6.您还记得我们在之前的课程中添加了故障转移机制。想检查一下它是否有效?这就是你的做法。强制关闭一个节点,并使用clustat命令查找集群统计信息以获取故障转移的结果。
我已使用 shutdown -h now 命令关闭了 node02server(172.16.1.223)。然后从我的 cluster_server(172.16.1.250) 执行 clustat 命令。
上面的输出向您表明,节点 1 处于在线状态,而节点 2 已离线,因为我们将其关闭。然而,我们共享的服务和文件系统仍然在线,您可以在在线的 node01 上查看它。
df -h /x01
请参阅 cluster.conf
文件,其中包含与我们用于 howtoing 的设置相关的整个配置集。
<?xml version="1.0"?>
<cluster config_version="15" name="tecmint_cluster">
<fence_daemon post_join_delay="10"/>
<clusternodes>
<clusternode name="172.16.1.222" nodeid="1">
<fence>
<method name="Method01">
<device name="tecmintfence"/>
</method>
</fence>
</clusternode>
<clusternode name="172.16.1.223" nodeid="2">
<fence>
<method name="Method01">
<device name="tecmintfence"/>
</method>
</fence>
</clusternode>
</clusternodes>
<cman/>
<fencedevices>
<fencedevice agent="fence_virt" name="tecmintfence"/>
</fencedevices>
<rm>
<failoverdomains>
<failoverdomain name="tecmintfod" nofailback="0" ordered="1" restricted="0">
<failoverdomainnode name="172.16.1.222" priority="1"/>
<failoverdomainnode name="172.16.1.223" priority="2"/>
</failoverdomain>
</failoverdomains>
<resources>
<fs device="/dev/mapper/tecminttest_lv_vol01" fstype="ext3" mountpoint="/x01" name="my_fs"/>
</resources>
<service autostart="1" domain="testdomain" name="my_web" recovery="relocate"/>
<fs ref="my_fs"/>
</rm>
</cluster>
希望您会喜欢整个系列的聚类课程。每天与 howmint 保持联系以获得更多方便的指南,并随时评论您的想法和疑问。