デバッグ
クラスタで何かがうまく機能しない場合、まず次のことを試してください。リソース操作の履歴(オプション-o)と非アクティブなリソース(-r)が表示されます。
crm_mon -o -r
表示は10秒ごとに更新されます(Ctrl+Cでキャンセルできます)。次に例を示します。
Example 15-1 停止されたリソース
Refresh in 10s...
============
Last updated: Mon Jan 19 08:56:14 2009
Current DC: d42 (d42)
3 Nodes configured.
3 Resources configured.
============
Online: [ d230 d42 ]
OFFLINE: [ clusternode-1 ]
Full list of resources:
Clone Set: o2cb-clone
Stopped: [ o2cb:0 o2cb:1o2cb:2 ]
Clone Set: dlm-clone
Stopped [ dlm:0 dlm:1 dlm:2 ]
mySecondIP (ocf::heartbeat:IPaddr): Stopped
Operations:
* Node d230:
aa: migration-threshold=1000000
+ (5) probe: rc=0 (ok)
+ (37) stop: rc=0 (ok)
+ (38) start: rc=0 (ok)
+ (39) monitor: interval=15000ms rc=0 (ok)
* Node d42:
aa: migration-threshold=1000000
+ (3) probe: rc=0 (ok)
+ (12) stop: rc=0 (ok)
まず、ノードをオンラインにします(FAQを参照)。その後、リソースと操作を確認します。
http://clusterlabs.org/wiki/DocumentationにあるConfiguration Explained PDFの「How Does the Cluster Interpret the OCF Return Codes?(クラスタがOCF戻りコードを解釈する方法)」のセクションでは、3種類の回復を説明しています。