[Linux] SAP Recovery Kit 処理概要

SAP Recovery Kit が提供する監視機能と起動処理、停止処理についてご説明します。

対象製品
SAP Recovery Kit (LifeKeeper for Linux)

本処理概要は LifeKeeper for Linux v9.0.0 に付属するリカバリキットをもとに作成しており、SAP Rocovery Kit が提供する動作の概要について記載しております。

監視処理
LKCHECKINTERVAL(デフォルト120秒)の間隔で以下の確認を行います。

1)保護(リカバリ)レベルを確認します。
 
 <リカバリレベル>

      Full ローカルリカバリとフェイルオーバを実施。
      LocalOnly ローカルリカバリのみ実施。
      RemoteOnly フェイルオーバのみ実施。
      Off ローカルリカバリ、フェイルオーバのどちらも実施しない。

2)SAPリソースの状態(ISP か ISU か、それ以外か)を確認します。

3)インスタンスの起動状態
 1.共有されたNFSへのアクセスが可能かを確認します。
 

      # /opt/LifeKeeper/lkadm/bin/pingnfs -s サーバアドレス -t 5

  ※-t はタイムアウトで、5秒固定です。
 
 2.SAP の必要なサービスに起動をかけます。
  起動しているプロセスを確認して、起動していなければ起動します。

 3.VIP(仮想ホスト名)を取得します。

 4.プロセスリストを取得します。
  以下のコマンドを利用してプロセスリストを取得します。
  

      # sapcontrol -host <VIP> -nr <インスタンスの番号>  -function GetProcessList

  取得したプロセスリストを利用して SAP が動作しているかを確認します。

 5.プロセスが停止しているか動作しているかを確認します。

 6.プロセスリストから情報を取得し、SAP インスタンスが稼働しているかを確認します。

 7.UI (色)の状態の確認を行います。
  緑  :動作している
  赤、黄:動作していない or 動作している
  グレー:動作していない

 8.確認した結果から動作状態をリターンコードとして返します。
  インスタンスが停止している場合:0
  インスタンスが動作している場合:1

4)3)の確認でインスタンスが起動していたら、quickCheck は正常終了します。
 インスタンスが起動していない場合はリソース異常となります。

起動処理
SAPリソース起動は以下のコマンドで SAP を起動させます。

      # sapcontrol -format script -prot NI_HTTP -host $viphost -nr $InstanceNum -function Start

 $viphost:仮想ホスト名
 $InstanceNum:インスタンスの番号

起動コマンド発行後、SAPインスタンスの状態を確認し、問題があるようであればエラーを表示させます。

SAPリソース起動のタイムアウトは SAP_START_WAIT で調整します。
デフォルト値は 1108秒です。

停止処理
SAPリソース停止は以下のコマンドで SAP を停止させます。
 

      # sapcontrol -format script -prot NI_HTTP -host $viphost -nr $InstanceNum -function Stop

 $viphost:仮想ホスト名
 $InstanceNum:インスタンスの番号

停止コマンド発行後、SAPインスタンスの状態を確認し、問題があるようであればエラーを表示させます。

SAPリソース停止のタイムアウトは SAP_REMOVE_TIMEOUT で調整します。
デフォルト値は 600秒です。

回復処理
SAPリソースのリカバリのタイムアウトは SAP_RECOVER_TIMEOUT で調整します。
デフォルト値は:1708秒です。

1)リカバリのレベルを決定し、このリソースが sendevent および recover を使用してリカバリできるかどうかを判断します。

 <リカバリレベル>

      Full ローカルリカバリとフェイルオーバを実施。
      LocalOnly ローカルリカバリのみ実施。
      RemoteOnly フェイルオーバのみ実施。
      Off ローカルリカバリ、フェイルオーバのどちらも実施しない。

2)SAPリソースの状態(ISP か ISU か、それ以外か)を確認します。

3)1)のリカバリレベルがローカルリカバリを実施するレベルの場合に、ローカルリカバリを
 実施可能か確認します。

4)”停止処理”と同様に SAP の停止を行います。

5)”起動処理”と同様に SAP の開始を行います。

6)リカバリ処理がエラーとなった場合はリカバリレベル応じてフェイルオーバします。

関連パラメータ
=================================================
SAP Recovery Kit のパラメータ名とその意味を説明しています。

※デフォルトではすべての設定項目が未記載となります。
※設定を変更したい項目を /etc/default/LifeKeeper へ設定してください。

SAP_CONFIG_REFRESH
 Configuration Propertiesページの更新頻度を秒単位で指定します。

 デフォルト値:60
 ※ 5より低い設定値はデフォルト値となります。

SAP_CREATE_NAS
 NAS マウントされたファイルシステムの NAS リソースを自動的に生成するかどうかを指定します。

 自動生成しない:0
 自動生成する :1

 デフォルト値:1

SAP_QUICKCHECK_TIMEOUT
 quickCheck のタイムアウト時間を秒単位で指定します。

 デフォルト値:60

SAP_RESTORE_TIMEOUT
 restore のタイムアウト時間を秒単位で指定します。

 デフォルト値:SAP_START_WAIT(1048) + SAP_QUICKCHECK_TIMEOUT(60)

SAP_REMOVE_TIMEOUT
 remove のタイムアウト時間を秒単位で指定します。

 デフォルト値:SAP_STOP_WAIT(540) + SAP_QUICKCHECK_TIMEOUT(60)

SAP_RECOVER_TIMEOUT
 recover のタイムアウト時間を秒単位で指定します。

 デフォルト値:SAP_REMOVE_TIMEOUT(600) + SAP_RESTORE_TIMEOUT(1108)

 ※デフォルト値より小さい数値はデフォルト値として利用されます。
=================================================



改訂履歴
[公開日:2017年9月27日]

return top