[Linux]LifeKeeper が/var/log/messages に出力するメッセージについて

LifeKeeper 出力メッセージについて

LifeKeeperに出力されるメッセージはsyslogにより記録される/var/log/messagesファイルとLifeKeeper本体に記録されるログの2種類があります。このドキュメントにはLifeKeeper Coreモジュールが/var/log/messagesファイルに出力メッセージを以下のパターンについてご紹介しております。

  1. LifeKeeper 開始時または停止時
  2. フェイルオーバの発生時
  3. コミュニケーションパスのフェイルまたは回復時
  4. 特定のエラー発生時

なお、LifeKeeperは管理者への通知機能としてはSNMPTRAPとEメール通知が用意されています。合わせて以下のURLをご参照ください。

[Linux]SNMPTRAPの設定方法は?
http://lk.sios.com/?p=1665

1 LifeKeeper 開始時または停止時

lkstart の実行時、または前回アクティブであったサーバの起動時に出力されるメッセージです。
・/opt/LifeKeeper/bin/lkstart

Table 1.1: 出力メッセージ
 

メッセージ 内容 対処
package steeleye-lk is not installed ``rpm - q -- qf '% {NAME} \n % {VERSION} \n % {COPYRIGHT}''' の結果出力です。 単に情報の出力であり、 対処の必要はありませ ん。

・/opt/LifeKeeper/bin/lcd

Table 1.2: 出力メッセージ
 

メッセージ 内容 対処
WARNING: This version of the LifeKeeper core package is restricted to be used within the territories of Japan 起動時に環境変数LANG、LC_ALLをチェックし、日本語版環境と検知された場合に/opt/LifeKeeper/config/localizationの内容を出力する。 単に情報の出力であり、 対処の必要はありませ ん。

Table 1.3: 出力メッセージ
 

メッセージ 内容 対処
LifeKeeper initialize at %s\n LCD is starting to LCD デーモンの開始時に出力されるメッセージで す。 単に情報の出力であり、 対処の必要はありませ ん。

2. フェイルオーバの発生時

障害が検知され、フェイルオーバが発生したときに出力されるメッセージです。
・/opt/LifeKeeper/bin/lcd

Table 2.1: 出力メッセージ
 

メッセージ 内容 対処
%s FAILOVER RECOVERY OF MACHINE %s STARTED \n %s FAILOVER RECOVERY OF MACHINE %s FINISHED \n フェイルオーバ開始時に出力されるメッセージで す。 フェイルオーバ完了時に出力されるメッセージで す。 単に情報の出力であり、 対処の必要はありませ ん。

・/opt/LifeKeeper/bin/lcdmachfail

Table 2.2: 出力メッセージ
 

メッセージ 内容 対処
RECOVERY class=%s event=%s name=%s STARTING AT: %s\n LCD デーモンが不正な状態を検知したときに出力 されるメッセージです。 このメッセージはリカバ リスクリプト(クラス名 class=XXX(このクラス名 は lcdstatus コマンドの出力で type=XXX と出力さ れるもの)、リソースタグ名 name=XXX、イベント 名 event=XXX ) が開始したことを示します。 単に情報の出力であり、 対処の必要はありませ ん。
RECOVERY class=%s event=%s name=%s ENDING AT: %s\n LCD デーモンが不正な状態を検知したときに出力 されるメッセージです。 このメッセージはリカバ リスクリプト(クラス名 class=XXX(このクラス名 は lcdstatus コマンドの出力で type=XXX と出力さ れるもの)、リソースタグ名 name=XXX、イベント 名 event=XXX ) が完了したことを示します。 単に情報の出力であり、 対処の必要はありませ ん。

Table 2.3: 出力メッセージ
 

メッセージ 内容 対処
%s WARNING: LifeKeeper shutdown in progress. Unable to perform failover recovery processing for %s\n LifeKeeper が 停 止 中 ま た は 状 態 が 不 明 の た め、 バックアップサーバがリカバリを実行できない場 合に出力されるメッセージです。 バックアップサーバの状 態を確認してください。 バックアップサーバが停 止、またはシャットダウ ン中でなく、OSU の状態 であることを確認してく ださい。
%s WARNING: LifeKeeper resource initialization in progress. Unable to perform failover recovery processing for %s \n LifeKeeper が開始中または LCD デーモンがまだ起 動していないため、バックアップサーバがリカバ リを実行できない場合に出力されるメッセージで す。 バックアップサーバの状 態を確認してください。 バックアップサーバが停 止、 ま た は 開 始 中 で な く、OSU の状態であるこ とを確認してください。

3. コミュニケーションパスのフェイルまたは回復時

コミュニケーションエラーが検知されたときに出力されるメッセージです。
・/opt/LifeKeeper/lib/libLKlcd.so.1

Table 3.1: 出力メッセージ
 

メッセージ 内容 対処
LifeKeeper: communication to % s by % s RESTORED at: %s\n クラスタを構成する他のサーバとのコミュニケー ションパスが回復したときに出力されるメッセー ジです。 lcdstatus コマンドを実行 し、コミュニケーション パスが回復していること を確認してください。
LifeKeeper: communication to %s by %s FAILED at: %s\n クラスタを構成する他のサーバとのコミュニケー ションパスがフェイルしたときに出力されるメッ セージです。 コミュニケーションパス のネットワーク接続を確 認してください。コミュ ニケーションパスが有効 で あ る か ど う か ネッ ト ワークツール(ifconfig や lcdstatus 、 ping な ど…) で確認し、障害を修復し てください。

4. 特定のエラー発生時

特定のエラーが発生したときに出力されるメッセージです。
・/opt/LifeKeeper/lib/libLKlcm.so.1

Table 4.1: 出力メッセージ
 

メッセージ 内容 対処
\n\nSIGHANDLER FAILURE: pid %d, signal %d not in mask\n\n プロセスに対して必要なシグナルセットが取得で きなかった場合に出力されるメッセージです。 こ れ は 内 部 エ ラー の た め、サポートに連絡して ください。

Table 4.2: 出力メッセージ
 

メッセージ 内容 対処
LifeKeeper: can't get service %s, protocol %s\n lcm_server エ ン ト リ が /etc/services に存在しないときに出力されるメッ セージです。 lcm_server エ ン ト リ が /etc/services か ら 何 ら か の 理 由 で 削 除 さ れ て い ま す。 lcm_server エ ン ト リ を /etc/services 次のよう な内容で追加してくださ い:

lcm_server 7365/tcp # LifeKeeper communications manager

<補足>
LifeKeeperは2種類の監視を行っています。1つはハートビート全断によるノード障害です。もう1つはquickCheckでエラー検知によるリソース(サービス)障害です。ノード障害と、リソース障害では記録されるメッセージが異なります。

ノード障害の場合は “Table 2.1: 出力メッセージ” のメッセージが待機系に記録されます。リソース障害の場合は、”Table 2.2: 出力メッセージ” のメッセージが稼動系に記録されます。”Table 2.2: 出力メッセージ”のメッセージだけではRECOVERYに成功し、通常監視に戻ったかあるいはRECOVERYに失敗し、フェイルオーバが行われたかは判断はできません。”Table 2.2: 出力メッセージ”が記録された場合はlcdstatusコマンドもしくはGUIの画面よりクラスタノードのリソース状態の確認を行ってください。

LifeKeeper製品がsyslogに出力するメッセージは上記で網羅しております。LifeKeeperのログはsyslogの他には、LifeKeeper本体に記録されるメッセージがあります。LifeKeeper本体に出力されるメッセージに関しては一覧や詳しい情報は提供しておりません。ログに出力される文字列をもとに監視をされる場合は、お客様によるログ監視の十分な設計が必要となります。ご了承ください。


<改定履歴>
[2010年9月16日 改定] 補足を追加しました。

[2010年10月21日 改定] 補足を追加しました。

[2010年11月29日 改定] 補足を変更しました。

return top