调试HA 群集
如果您的群集中的某部分不工作,可首先尝试以下操作。它显示了资源操作历史记录(选项 -o)和不活动的资源 (-r):
crm_mon -o -r
此显示每 10 秒钟刷新一次(您可以使用 Ctrl+C 取消它)。示例显示如下:
示例 15-1 已停止的资源
Refresh in 10s... ============ Last updated: Mon Jan 19 08:56:14 2009 Current DC: d42 (d42) 3 Nodes configured. 3 Resources configured. ============ Online: [ d230 d42 ] OFFLINE: [ clusternode-1 ] Full list of resources: Clone Set: o2cb-clone Stopped: [ o2cb:0 o2cb:1o2cb:2 ] Clone Set: dlm-clone Stopped [ dlm:0 dlm:1 dlm:2 ] mySecondIP (ocf::heartbeat:IPaddr): Stopped Operations: * Node d230: aa: migration-threshold=1000000 + (5) probe: rc=0 (ok) + (37) stop: rc=0 (ok) + (38) start: rc=0 (ok) + (39) monitor: interval=15000ms rc=0 (ok) * Node d42: aa: migration-threshold=1000000 + (3) probe: rc=0 (ok) + (12) stop: rc=0 (ok)
首先使您的节点联机(参见常见问题解答)。然后,检查您的资源和操作。
http://clusterlabs.org/wiki/Documentation 中的 Configuration Explained PDF 的群集如何解释 OCF 返回代码?一节中介绍了三种不同的恢复类型。