OpenVMS
OpenVMS Cluster システム


前へ 次へ 目次 索引


10.11.3 例

以下の表は,OpenVMS Cluster システムの VAX コンピュータと Alpha コンピュータで一般的に使用される SYSUAF.DAT シナリオとその結果を示しています。

表 10-5 共通の SYSUAF.DAT シナリオと予測される結果
値を設定するレベル プロセスが起動される場所 結果
Alpha レベル Alpha ノード 適切であると思われる値で実行される。
  VAX ノード LOGINOUT は,Alpha 形式の SYSUAF.DAT から各クォータに対して大きい方の値を検出するため,VAX システムで定義されているシステム固有の PQL_M quota の値を使用しない。このため,OpenVMS Cluster 内の VAX プロセスは不適切に高いリソースを使用することがある。
VAX レベル VAX ノード 適切であると思われる値で実行される。
  Alpha ノード LOGINOUT は,SYSUAF に定義されている小さい方の VAX レベルの値を無視し,Alpha システムの各クォータの現在の PQL_M quota の値を使用する。この方法を選択した場合は, PQL_M quota システム・パラメータの現在の値を監視する。Alpha システムで,MODPARAMS.DAT の適切な PQL_M quota の値を必要に応じて大きくする。

OpenVMS Cluster 環境で共通の SYSUAF.DAT に対して使用する値を判断する場合,OpenVMS Alpha システムの SYSUAF.DAT に通常割り当てる,高いプロセス・クォータ値を試しに使用してみることができます。VAX システムに大きな空きメモリ・リソースがある場合,OpenVMS Cluster のホスト VAX ノードで生成されるプロセスに対して, Alpha レベルの高いプロセス・クォータを使用しても問題ありません。

VAX システムと Alpha システムのプロセスにとって適切な値を判断するには,試行錯誤を繰り返します。各プロセスにとって適切な上限値とクォータ値を判断する場合,以下の要素を考慮する必要があります。

10.12 クラスタ・クォーラムの復元

OpenVMS Cluster システムを使用している間,コンピュータがクラスタに追加されたり,削除されることがあります。たとえば,クラスタの処理能力を拡張するためにコンピュータをクラスタに追加しなければならないことがあり,ハードウェア・エラーや致命的なソフトウェア・エラーが発生したためにコンピュータをシャットダウンしなければならないこともあります。接続管理ソフトウェアは,これらのクラスタの状態の変化を調整し,クラスタの動作を制御します。

あるコンピュータがシャットダウンされると,接続マネージャの支援のもとに,残りのコンピュータは,シャットダウンされるコンピュータを削除して,クラスタを再構成します。コンピュータで障害が発生しても,クラスタのボーツ (投票) の総数がクラスタのクォーラム値より大きい限り,操作を続行できます。クラスタのボーツの総数がクラスタ・クォーラム値より小さくなると,クラスタはすべてのプロセスの実行を中止します。

10.12.1 ボーツの復元

プロセスの実行を再開するには,クラスタのボーツの総数がクラスタ・クォーラム値に等しいか,それ以上の値になるように復元しなければなりません。多くの場合,コンピュータがクラスタに追加されたり,いったん削除されたコンピュータが再び追加されると,必要なボーツが追加されます。しかし,コンピュータがクラスタに追加されるのを待ち,ボーツの値を大きくするという方法は,必ずしも簡単または便利な解決方法ではありません。たとえば,別の解決方法として,すべてのコンピュータをいったんシャットダウンして,クォーラム値を小さくしてすべてのコンピュータをリブートする方法があります。

コンピュータで障害が発生した後,Show Cluster ユーティリティを実行して,VOTES, EXPECTED_VOTES,CL_VOTES, CL_QUORUM フィールドの値を確認しなければならないことがあります (これらのフィールドの詳細については,『OpenVMS システム管理ユーティリティ・リファレンス・マニュアル』を参照してください)。 VOTES フィールドと EXPECTED_VOTES フィールドには,各クラスタ・メンバの設定が表示されます。CL_VOTES フィールドと CL_QUORUM フィールドには,クラスタのボーツの総数と現在のクラスタ・クォーラム値が表示されます。

これらの値を確認するには,以下のコマンドを入力します。


$ SHOW CLUSTER/CONTINUOUS
COMMAND> ADD CLUSTER

注意: SHOW CLUSTER コマンドを会話方式で入力する場合は, SHOW CLUSTER コマンドの一部として /CONTINUOUS 修飾子を指定しなければなりません。この修飾子を指定しないと, SHOW CLUSTER コマンドは DCL コマンド SHOW CLUSTER から返されるクラスタ状態情報を表示し,DCL コマンド・レベルに戻ります。

Show Cluster ユーティリティからの表示で,CL_VOTES の値が CL_QUORUM の値に等しい場合は,残りのボーツ・メンバで障害が発生したとき,クラスタは操作を続行できません。これらのコンピュータのいずれかがシャットダウンされると,クラスタ内のすべてのプロセスの動作が停止します。

10.12.2 クラスタ・クォーラム値の削減

クラスタのプロセスの動作が中断されないようにするには, 表 10-6 の説明に従ってクラスタ・クォーラム値を小さくします。

表 10-6 クラスタ・クォーラムの値の削減
手法 説明
DCL コマンド SET CLUSTER/EXPECTED_VOTES を使用して,クラスタ・クォーラムを指定した値に調整する。 値を指定しなかった場合は,オペレーティング・システムが適切な値を計算する。コマンドを 1 台のコンピュータで入力すると,新しい値はクラスタ全体に伝達される。コマンドを入力すると,オペレーティング・システムが新しい値を報告する。

推奨: 通常,SET CLUSTER/EXPECTED_VOTES コマンドは,コンピュータがかなり長い時間クラスタから削除される場合にだけ使用する (このコマンドの詳細については,『OpenVMS DCL ディクショナリ』を参照)。

例: たとえば,クラスタ・クォーラムが 2 に設定されるように,期待されるボーツを変更する場合は,以下のコマンドを入力する。

$ SET CLUSTER/EXPECTED_VOTES=3

この結果,計算されるクォーラム値は,(3 + 2)/2 = 2 になる。

注意: SET CLUSTER/EXPECTED_VOTES コマンドにどのような値を指定しても,現在のボーツ数より大きい値にクォーラムを増やすことはできず,現在のボーツ数の半分以下の値にクォーラムを減少させることもできない。

以前,クラスタ・メンバであったコンピュータをクラスタに再び追加できる状態になったら,すべてのコンピュータの MODPARAMS.DAT で EXPECTED_VOTES システム・パラメータを元の値にリセットし, 第 8.6 節 の説明に従ってクラスタを再構成しなければならない。 SET CLUSTER/EXPECTED_VOTES コマンドを使用してクラスタ・クォーラムを大きくする必要はない。コンピュータがクラスタに再び追加される場合は,クォーラム値が自動的に増大されるからである。

IPC Q コマンドを使用して,クォーラムを再計算する。 Q コマンドの詳細については,『OpenVMS システム管理者マニュアル』を参照。
クラスタ関連のシャットダウン・オプションのいずれかを選択する。 シャットダウン・オプションの詳細については, 第 10.7 節 を参照。

10.13 クラスタのパフォーマンス

場合によっては,アプリケーションとシステム全体の監視およびチューニングが,パフォーマンスの問題に関係することがあります。チューニングでは,パフォーマンスを向上するために,システムおよびネットワーク・プロセスに関する情報が収集され,報告されます。アクティブ・システムとそのアプリケーションに関する情報を収集するのに役立つように,多くのツールが提供されています。

10.13.1 SHOW コマンドの使用

以下の表は,OpenVMS オペレーティング・システムで利用できる SHOW コマンドについて簡単に説明しています。この表に示す SHOW DEVICE コマンドと修飾子を使用してください。

コマンド 目的
SHOW DEVICE/FULL 以下の情報も含めて,デバイスの完全な状態を表示する。

  • クラスタからディスクを使用できるかどうか。

  • ディスクが MSCP でサービスされるのか,デュアル・ポートなのか。

  • プライマリ・ホストとセカンダリ・ホストの名前と種類 (VAX または HSC)。

  • コマンドを入力したシステムでディスクがマウントされてるいるかどうか。

  • ディスクがマウントされているクラスタ内のシステム。

SHOW DEVICE/FILES ボリュームでオープンされているすべてのファイルの名前と,そのファイルに関連するプロセス名およびプロセス識別子 (PID) の一覧を表示する。このコマンドは以下の操作を実行する。

  • このノードでのみオープンされたファイルのリストを表示する。

  • ディスクでオープンされているすべてのファイルを検索する。ディスクがマウントされている各ノードで SHOW DEVICE/FILES コマンドまたは SYSMAN コマンドを使用できる。

SHOW DEVICE/SERVED コマンドを入力したノードで,MSCP サーバによってサービスされているディスクに関する情報を表示する。以下の修飾子を使用して,表示される情報を細かく指定できる。

  • /HOST 修飾子は,ローカル MSCP サーバを通じてデバイスがオンラインに設定されているプロセッサの名前と,デバイスの数を表示する。

  • /RESOURCE 修飾子は,MSCP サーバから使用できるリソース, I/O バッファとして使用できる非ページング動的メモリの総容量, I/O 要求パケットの数を表示する。

  • /COUNT 修飾子は,MSCP サーバが起動されてからこれまで実行した I/O 操作の各サイズと各種類の数を表示する。

  • /ALL 修飾子は,SHOW DEVICE/SERVED コマンドに対してリストされるすべての情報を表示する。

SHOW CLUSTER コマンドは,OpenVMS Cluster システムに関してさまざまな情報を表示します。出力される表示では,クラスタ全体として見たビューではなく,1 つのノードから見たときのクラスタのビューが提供されます。

関連項目: 『OpenVMS システム管理ユーティリティ・リファレンス・マニュアル』には,すべての SHOW コマンドと Show Cluster ユーティリティに関する詳細な説明が記載されています。

10.13.2 Monitor ユーティリティの使用

以下の表は,OpenVMS Monitor ユーティリティを使用して,ディスク I/O のボトルネックを突き止める方法を示しています。 I/O ボトルネックが発生すると,OpenVMS Cluster システムはハングしたように見えます。

ステップ 操作
1 どのクラスタ単位ディスクで問題が発生しているかを判断するには,以下の操作を実行する。

  1. MONITOR/NODE コマンドを使用して,ディスク I/O に関してノード単位の要約を作成する。

  2. 以下の説明を参照して,MSCP によってサービスされるディスクの "row sum" カラムを調整する。

    • サービスする側のノードの I/O レートには,ローカル要求と他のノードからのすべての要求が含まれる。

    • 他のノードの I/O レートには,そのノードからの要求が含まれる。

    • リモート・ノードからの要求は,row sum カラムで 2 回数えられる。

  3. row sum の値が 1 秒間に 8 I/O より大きいディスクを書きとめる。

  4. クラスタで問題があるディスクの一覧から以下のディスクを削除する。

    • 共用されていないディスク

    • アプリケーション専用のディスク

    • バックアップ中のディスク

2 各ノードで,問題のある可能性のあるディスクの影響を判断する。

  • 特定のノードからの要求によってディスクの I/O の量が不適切になっている場合は,そのノードに問題がある可能性が最も高い。

  • ディスク I/O がクラスタ全体に均一に拡散している場合は,問題はクラスタの過負荷状態にあると考えられる。

  • 特定のノードでディスクの平均キュー長が 0.2 未満の場合は,そのディスクがノードに与える影響はほとんどない。

3 問題がある各ディスクで,以下のことを判断する。

  • いずれかのノードのページ・ファイルとスワップ・ファイルがディスクに格納されていないかどうか。

  • 共通に使用されるプログラムやデータ・ファイルがディスクに格納されていないかどうか (SHOW DEVICE/FILES コマンドを使用する)。

  • ディスクにデフォルト・ディレクトリを格納しているユーザが問題の原因になっていないかどうか。

10.13.3 Compaq Availability Manager および DECamds の使用

Compaq Availability Manager および DECamds は,リアルタイム監視/診断/修正ツールであり,システム管理者がシステムの可用性とスループットを向上するために使用します。 Availability Manager は OpenVMS Alpha または Windows ノード上で稼働します。 DECamds は OpenVMS VAX および OpenVMS Alpha 上で稼働し, DECwindows インタフェースを使用します。

オペレーティング・システムに標準添付されている 2つの製品は,システム管理者が CPU の利用状況,メモリの不足,ロックの競合,ハングしたプロセスや制御がきかなくなったプロセス,I/O,ディスク,ページ・ファイル,スワップ・ファイルなどに関して,システム・リソースの利用状況の問題を修正するのに役立ちます。

Availability Manager は,OpenVMS Alpha または Windows のいずれかのノードから,拡張 LAN にある 1 つ以上の OpenVMS を監視することができます。 Availability Manager は,複数の OpenVMS ノードから同時に,システム・データおよびプロセス・データを収集します。そしてデータを分析し,ネイティブ Java GUI を使って出力を表示します。

DECamds は複数のノード (VAX と Alpha) から同時にデータを収集し,分析し,すべての出力を集中化された DECwindows ディスプレイに送信します。DECamds を使用すると,以下に示すように,可用性に関する問題を監視し,対応するのに役立ちます。

関連項目: Availability Manager の詳細については,『Availability Manager User's Guide』および Availability Manager ウェブ・サイトを参照してください。このサイトは次の Compaq OpenVMS サイトからアクセスできます。

http://www.openvms.compaq.com/

DECamds の詳細については,『DECamds User's Guide』を参照してください。

10.13.4 LAN の実行状態の監視

LAN の実行状態は定期的に監視することが重要です。 SCA (Systems Communications Architecture) Control Program (SCACP) を使用して,デフォルト・ポートの設定および表示, LAN デバイスの起動と終了,チャネルへの優先値の割り当ての他, LAN の実行状態も監視できます。

関連項目: SCACP の詳細については,『OpenVMS システム管理ユーティリティ・リファレンス・マニュアル (上巻 ) 』を参照してください。

以下のような NCP コマンドを使用すると,12 時間ごとに実行状態を報告する便利な監視プロシージャを設定できます。イベント 0.2 (自動ライン・カウンタ) に対して DECnet イベント・ログを有効にしておかなければなりません。

関連項目: DECnet for OpenVMS のイベント・ログの詳細については,『DECnet for OpenVMS Network Management Utilities』を参照してください。

以下のコマンドの例で,BNA-0 は Ethernet ラインのライン ID です。


NCP> DEFINE LINE BNA-0 COUNTER TIMER 43200
NCP> SET LINE BNA-0 COUNTER TIMER 43200

各タイマ間隔 (この場合は 12 時間) で,DECnet はカウンタ・データを DECnet イベント・ログに送信するイベントを作成します。クラスタのパフォーマンスが低下した場合は,イベント・ログを調べ,クラスタの標準値を超えているカウンタ値がないかどうか確認してください。すべてのコンピュータでカウンタ値が同じように増加している場合は, Ethernet 構成全般に問題があると考えられます。一方,あるコンピュータだけのカウンタ値が増加している場合は,おそらくそのコンピュータに問題があるか, Ethernet インタフェース・デバイスに問題があります。

RBMS,DECelms,DECmcc,LAN Traffic Monitor (LTM) などのレイヤード製品を弊社の LAN ブリッジのいずれかと組み合わせて使用すると,LAN トラフィック・レベルを監視できます。


前へ 次へ 目次 索引