虽然 High Availability Extension 可以检测节点故障,但也能够检测节点上的各个资源何时发生故障。如果希望确保资源运行,则必须为该资源配置资源监视。资源监视包括指定超时和/或启动延迟值以及间隔。间隔告诉 CRM 检查资源状态的频率。
按部分 4.1, Linux HA Management Client中所述,启动 Linux HA Management Client 并登录到群集。
在 Linux HA Management Client 主窗口,单击左窗格中的
(资源)以查看群集已配置的资源。在右窗格中,选择要修改的资源并单击
(编辑)。下一个窗口将显示为该资源定义的基本资源参数、元属性、实例属性和操作。要添加新的监视操作,请选择各自选项卡并单击
(添加)。要修改现有操作,请选择各自条目并单击
(编辑)。为监视操作输入唯一的
。修改现有监视操作时,ID 已经定义并显示在配置对话框中。在 monitor、start 或 。
(名称)中,选择要执行的操作,例如在
(间隔)字段中,输入以秒表示的值。在 failed。PE 会决定如何做或执行您在监视操作的 (失败时)字段中指定的操作。
(超时)字段中,输入以秒表示的值。在指定的超时期间后,操作会被视为如果需要,请设置可选参数,如
(失败时)(此操作失败时如何做?)。或 (要求)(发生此操作前需要满足哪些条件?)。如果所有参数都按您的需要进行了设置,请单击
(确定)完成该资源的配置。配置对话框关闭,主窗口显示修改后的资源。如果不配置资源监视,则不会告知成功启动的资源故障,且群集始终显示资源状况正常。
如果资源监视检测到故障,会发生以下操作:
根据在 /etc/ais/openais.conf 的 logging 部分指定的配置,生成日志文件消息(默认情况下,写入系统日志,通常为 /var/log/messages)。
在 Linux HA Management Client 的 crm_mon 工具和 CIB 状态部分中反映故障。要在 Linux HA Management Client 中查看故障,请单击左窗格中的 (管理),然后在右窗格中,选择要查看其细节的资源。
群集启动有意义的恢复操作,包括停止资源修复故障状态和从本地或其他节点重启动资源。资源也可能根本不会重启动,具体取决于配置和群集状态。