15.2 HA 叢集除錯

若某些項對於您的叢集不起作用,請先嘗試以下動作。它會顯示資源作業歷程 (選項 -o) 和非使用中資源 (-r):

crm_mon -o -r

顯示內容每 10 秒重新整理一次 (您可以透過按 Ctrl+C 取消該操作)。範例顯示如下:

範例 15-1 停止的資源

Refresh in 10s...

============
Last updated: Mon Jan 19 08:56:14 2009
Current DC: d42 (d42)
3 Nodes configured.
3 Resources configured.
============

Online: [ d230 d42 ]
OFFLINE: [ clusternode-1 ]

Full list of resources:

Clone Set: o2cb-clone
         Stopped: [  o2cb:0 o2cb:1o2cb:2 ]
Clone Set: dlm-clone
         Stopped [ dlm:0 dlm:1 dlm:2 ]
mySecondIP      (ocf::heartbeat:IPaddr):        Stopped

Operations:
* Node d230:
   aa: migration-threshold=1000000
    + (5) probe: rc=0 (ok)
    + (37) stop: rc=0 (ok)
    + (38) start: rc=0 (ok)
    + (39) monitor: interval=15000ms rc=0 (ok)
* Node d42:
   aa: migration-threshold=1000000
    + (3) probe: rc=0 (ok)
    + (12) stop: rc=0 (ok)

首先連線節點 (請參閱常見問題集)。然後檢查資源與作業。

http://clusterlabs.org/wiki/Documentation 下的 Configuration Explained PDF 會在 How Does the Cluster Interpret the OCF Return Codes? (叢集如何解譯 OCF 傳回代碼?)一節中說明三種不同的復原類型: