网站搜索

如何同步集群配置并验证节点中的故障转移设置 - 第 4 部分


大家好。首先,我对本集群系列最后一部分的延迟表示歉意。让我们继续工作吧,不要再耽搁了。

由于我们中的许多人已经完成了前面的所有三个部分,因此我将向您简要介绍我们迄今为止已完成的工作。现在我们已经有了足够的知识来为两个节点安装和配置集群包,并在集群环境中启用防护和故障转移。

如果你不记得了,可以参考我之前的部分,因为发布最后一部分花了一点时间。

Linux 集群简介以及集群的优点/缺点 – 第 1 部分

如何在 Linux 中安装和配置具有两个节点的集群 – 第 2 部分

隔离并向集群添加故障转移 – 第 3 部分

我们将从向集群添加资源开始。在这种情况下,我们可以根据您的需要添加文件系统或 Web 服务。现在我已将 /dev/sda3 分区安装到 /x01,我希望将其添加为文件系统资源。

1. 我使用以下命令将文件系统添加为资源:

ccs -h 172.16.1.250 --addresource fs name=my_fs device=/dev/mapper/tecminttest_lv_vol01 mountpoint=/x01 fstype=ext3

此外,如果您还想添加服务,可以使用以下方法。发出以下命令。

ccs -h 172.16.1.250 --addservice my_web domain=testdomain recovery=relocate autostart=1

您可以通过查看 cluster.conf 文件来验证它,就像我们在前面的课程中所做的那样。

2. 现在在 cluster.conf 文件中输入以下条目,以向服务添加引用标记。

<fs ref="my_fs"/>

3. 一切就绪。不,我们将看到如何在我们拥有的 2 个节点之间同步我们对集群所做的配置。以下命令将完成所需的操作。

ccs -h 172.16.1.250 --sync --activate

注意:输入我们在安装软件包初期为ricci设置的密码。

您可以使用以下命令验证您的配置。

ccs -h 172.16.1.250 --checkconf

4.现在是时候开始了。您可以根据需要使用以下命令之一。

要仅启动一个节点,请使用具有相关 IP 的命令。

ccs -h 172.16.1.222 start

或者,如果您想启动所有节点,请使用 --startall 选项,如下所示。

ccs -h 172.16.1.250 –startall

如果需要停止集群,可以使用 stop 或 --stopall

如果您想在不启用资源的情况下启动集群(集群启动时资源将自动启用),例如您故意禁用特定节点中的资源以禁用防护循环,您可以不想在集群启动时启用这些资源。

为此,您可以使用以下命令启动集群但不启用资源。

ccs -h 172.16.1.250 --startall --noenable 

5.集群启动后,您可以通过发出clustat命令查看统计信息。

clustat

上面的输出表明集群中有两个节点,并且目前都已启动并正在运行。

6.您还记得我们在之前的课程中添加了故障转移机制。想检查一下它是否有效?这就是你的做法。强制关闭一个节点,并使用clustat命令查找集群统计信息以获取故障转移的结果。

我已使用 shutdown -h now 命令关闭了 node02server(172.16.1.223)。然后从我的 cluster_server(172.16.1.250) 执行 clustat 命令。

上面的输出向您表明,节点 1 处于在线状态,而节点 2 已离线,因为我们将其关闭。然而,我们共享的服务和文件系统仍然在线,您可以在在线的 node01 上查看它。

df -h /x01

请参阅 cluster.conf 文件,其中包含与我们用于 howtoing 的设置相关的整个配置集。

<?xml version="1.0"?>
<cluster config_version="15" name="tecmint_cluster">
        <fence_daemon post_join_delay="10"/>
        <clusternodes>
                <clusternode name="172.16.1.222" nodeid="1">
                        <fence>
                                <method name="Method01">
                                        <device name="tecmintfence"/>
                                </method>
                        </fence>
                </clusternode>
                <clusternode name="172.16.1.223" nodeid="2">
                        <fence>
                                <method name="Method01">
                                        <device name="tecmintfence"/>
                                </method>
                        </fence>
                </clusternode>
        </clusternodes>
        <cman/>
        <fencedevices>
                <fencedevice agent="fence_virt" name="tecmintfence"/>
        </fencedevices>
        <rm>
                <failoverdomains>
                        <failoverdomain name="tecmintfod" nofailback="0" ordered="1" restricted="0">
                                <failoverdomainnode name="172.16.1.222" priority="1"/>
                                <failoverdomainnode name="172.16.1.223" priority="2"/>
                        </failoverdomain>
                </failoverdomains>
                <resources>
                        <fs device="/dev/mapper/tecminttest_lv_vol01" fstype="ext3" mountpoint="/x01" name="my_fs"/>
                </resources>
                <service autostart="1" domain="testdomain" name="my_web" recovery="relocate"/>
                <fs ref="my_fs"/>
       </rm>
</cluster>

希望您会喜欢整个系列的聚类课程。每天与 howmint 保持联系以获得更多方便的指南,并随时评论您的想法和疑问。