[Linux] DataKeeper for Linux / LifeKeeper for Linux v8.2.0~8.3.0においてクラスタ機能不全を引き起こす不具合発生時の対処方法

こちらの内容は、”【重要】DataKeeper for Linux / LifeKeeper for Linux v8.2.0~8.3.0においてクラスタ機能不全を引き起こす不具合に対する
修正適用のお願い”というタイトルでご案内差し上げている情報に対する事象発生時の対応方法についてのご案内となります。
詳しくはこちらをご確認下さい。

■事象発生時の対応方法
本手順はv8系を前提としています。v8系に該当しない場合は製品サポートまでご連絡ください。

  • 両ノードのLifeKeeperを再起動します。
      ※LifeKeeperの再起動が正常に終了しない場合がありますので、作業を実施する前に必ず後述の”留意事項”をご参照ください。

    1. 全てのノードでnofailoverフラグを作成しノードフェイルオーバを抑止する
        ・host2にて実行
      # flg_create -f '!nofailover!host1'
        ・host1にて実行
      # flg_create -f '!nofailover!host2'
    2. 待機系、稼動系の順番にLifeKeeperを再起動する

        ・待機系にて実行

        # service lifekeeper restart
          • 上記コマンド終了直後はまだLKの起動は終わっていないので、30秒程度間隔を開けてください。
          • service lifekeeper restartはリソースの停止は伴いません。

        ・稼動系にて実行

        # service lifekeeper restart
          • 上記コマンド終了直後はまだLKの起動は終わっていないので、30秒程度間隔を開けてください
          • service lifekeeper restartはリソースの停止は伴いません。
    3. 手順1で作成したnofailoverフラグを削除する
        ・host2にて実行
      # flg_remove -f '!nofailover!host1'
        ・host1にて実行
      # flg_remove -f '!nofailover!host2'
  • ■留意事項

    • 当該事象でLCM通信が正常にできないことにより、上記手順において、LifeKeeperの再起動処理が途中で止まってしまう場合があります。
      その場合は、次の処理を行ってください。

      1. snd_msgプロセスの有無を確認
      2. snd_msgプロセスの存在が確認できたらkillコマンドでプロセスを停止
      3. 途中で止まっていたLifeKeeperの再起動処理が再開されることを確認
    • また、事象発生時の対処手順の途中の段階では、コミュニケーションパスのステータスがDEADのままになる場合がありますが、最後の手順で両ノードのLifeKeeperの再起動が完了した後に、ステータスがALIVEになっていれば問題ありません。
    • 尚、当該事象が発生しているシステムにおいてlksupportを実行すると、途中で止まってしまう可能性があります。この場合は、Ctrl + Cを実行し、lksupportの実行を中断してください。

 


改定履歴

[公開日:2014年9月3日]
[更新日:2016年2月19日]

return top