OpenVMS
OpenVMS Cluster システム


前へ 次へ 目次 索引


D.4 ネットワーク障害の分析

LAVC$FAILURE_ANALYSIS.MAR は SYS$EXAMPLES に格納されているサンプル・プログラムであり,このプログラムを編集して利用すれば,障害のあるネットワーク・コンポーネントを検出し,切り分けるのに役立ちます。このプログラムを実行すると,障害分析を実行するルーチンに対して,クラスタ通信ネットワークの物理的な説明情報が提供されます。

D.4.1 障害分析

ネットワーク障害分析プログラムを使用すると,障害のあるネットワーク・コンポーネントの検出と切り分けに必要な時間を短縮でき,その結果,クラスタの可用性を大幅に向上できます。

D.4.2 LAVC$FAILURE_ANALYSIS プログラムの動作方法

以下の表は,LAVC$FAILURE_ANALYSIS プログラムの動作方法を示しています。

ステップ プログラムの動作
1 プログラムは障害が発生したチャネルをグループにまとめ,それをクラスタ・ネットワークの物理的な記述情報と比較する。
2 プログラムは次に,障害が発生したチャネルに関連する,正常に動作していないネットワーク・コンポーネントのリストを作成し, OPCOM メッセージを使用して,コンポーネントの名前と, 1 つ以上のチャネル障害の原因の可能性を表示する。

ネットワーク障害分析でパスの一部 (複数のコンポーネントを含む) が動作していることを確認できない場合,プログラムは以下の操作を行う。

  1. パスの最初のコンポーネントを最も疑いのあるコンポーネント (%LAVC-W-PSUSPECT) として指定する。

  2. 他のコンポーネントを次候補 (%LAVC-I-ASUSPECT) としてリストする。

3 コンポーネントが再び動作するようになったら,OPCOM は %LAVC-S-WORKING というメッセージを表示する。

D.5 Network Failure Analysis Program の使用

表 D-1 では,Network Failure Analysis Program を編集および使用するための手順について説明しています。

表 D-1 LAVC$FAILURE_ANALYSIS.MAR プログラムの使用手順
ステップ 操作 関連項目
1 クラスタ通信ネットワーク固有の情報を収集し,記録する。 付録 D.5.1 項
2 収集した情報を含むように,LAVC$FAILURE_ANALYSIS.MAR のコピーを編集する。 付録 D.5.2 項
3 プログラムのアセンブル,リンク,デバッグを行う。 付録 D.5.3 項
4 データを提供したノードでのみプログラムが実行されるように,スタートアップ・ファイルを変更する。 付録 D.5.4 項
5 ネットワーク障害分析を実行する予定の 1 つ以上のノードでプログラムを実行する。 付録 D.5.5 項
6 MODPARAMS.DAT を変更して,非ページング・プール・パラメータの値を大きくする。 付録 D.5.6 項
7 Local Area OpenVMS Cluster Network Failure Analysis Program をテストする。 付録 D.5.7 項

D.5.1 ネットワーク・ダイアグラムの作成

ネットワーク構成の物理的な記述を作成し,その記述を電子的な形式で LAVC$FAILURE_ANALYSIS.MAR プログラムに含むには, 表 D-2 に示した手順を実行します。

表 D-2 ネットワークの物理的な記述の作成
ステップ 操作 説明
1 OpenVMS Cluster 通信ネットワークのダイアグラムを作成する。 LAVC$FAILURE_ANALYSIS.MAR を変更するときに,この図を (電子的な形式で) プログラムに挿入する。この図は,クラスタの物理的なレイアウトを示すものであり,以下のコンポーネントを含んでいる。

  • LAN セグメントまたはリング

  • LAN ブリッジ

  • ワイヤリング・コンセントレータ,DELNI インターコネクト, DEMPR リピータ

  • LAN アダプタ

  • VAX および Alpha システム

大規模なクラスタの場合,ケーブルをトレースすることで,構成を確認しなければならないことがある。

2 図の中の各コンポーネントに固有のラベルを付ける。 OpenVMS Cluster に多くのノードが含まれている場合,各ノード名を短縮形に置き換えなければならないことがある。短縮したノード名を利用すると,図を電子的な形式で LAVC$FAILURE_ANALYSIS.MAR に挿入するときに,領域を節約するのに役立つ。たとえば,ノード名 ASTRA の代わりに A を使用し,ASTRA ノードの 2 台の LAN アダプタを A1 および A2 として参照することができる。
3 各コンポーネントに対して以下の情報を指定する。

  • 固有のラベル

  • 種類 [SYSTEM,LAN_ADP,DELNI]

  • 場所 (コンポーネントの物理的な場所)

  • LAN アドレス (適用可能な場合)

DELNI インターコネクト,DEMPR リピータ,ケーブルなどのデバイスには,LAN アドレスは割り当てられない。
4 各コンポーネントを以下のカテゴリのいずれかに分類する。

  • Node: OpenVMS Cluster 構成内の VAX システムまたは Alpha システム。

  • Adapter: 通常,OpenVMS Cluster 通信のために使用される LAN アダプタ。

  • Component: ネットワーク内の汎用コンポーネント。このカテゴリのコンポーネントを通るパスが少なくとも 1 つ動作している場合,通常,これらのコンポーネントは動作しているものとして示される。ワイヤリング・コンセントレータ,DELNI インターコネクト, DEMPR リピータ,LAN ブリッジ,LAN セグメントおよびリングは通常,このカテゴリに分類される。

  • Cloud: ネットワーク内の汎用コンポーネント。このカテゴリのコンポーネントは, 1 つ以上のパスが動作しているものとして示される場合でも,動作しているものとして示すことができない。

クラウド・コンポーネントは,LAN セグメント間の冗長ブリッジなどのように,ネットワーク内の 2 つの地点間に複数のパスが存在する場合にだけ必要である。上位レベルでは複数のパスが存在できるが,実際の操作では,このブリッジ構成では,一度に 1 つのパスだけしか存在できない。一般に,このブリッジの例はおそらく,アクティブ・ブリッジをコンポーネントとして表現し,スタンバイ・ブリッジを無視する方法の方がよりよく処理できる (アクティブ・ブリッジは,RBMS や DECelms などのネットワーク・モニタリング・ソフトウェアによって識別することができる)。デフォルト・ブリッジ・パラメータを使用すると,アクティブ・ブリッジの障害を指摘できる。
5 ステップ 3 で指定したコンポーネント・ラベルを使用して, OpenVMS Cluster 通信ネットワーク内の各接続を記述する。  
6 Network Failure Analysis Program を実行するノードまたはノード・グループを選択する。 このプログラムは,LAVC$FAILURE_ANALYSIS.MAR を編集したときに物理記述に含まれていたノードだけで実行するようにしなければならない。あるノード上の Network Failure Analysis Program は,OpenVMS Cluster 内の他のシステムから独立して動作する。したがって, Network Failure Analysis Program を実行するには,通常はシャットダウンされないシステムを選択しなければならない。プログラムを実行するコンピュータとして,以下の属性を備えたシステムを選択すると適切である。

  • スピードの速い CPU を搭載したシステム

  • メモリ容量の大きいシステム

  • 接続されている LAN アダプタの数の多いシステム (NISCA プロトコルを実行)

注意: 物理記述は,非ページング・プールにロードされ,すべての処理は IPL 8 で実行される。ネットワーク・パス内のネットワーク・コンポーネントの平均数が増加すると, CPU の利用率が増大する。また,ネットワーク・パスの総数が増加すると,CPU の利用率が増大する。

D.5.2 ソース・ファイルの編集

LAVC$FAILURE_ANALYSIS.MAR を編集するには,以下の操作を行います。

ステップ 操作
1 以下のファイルを SYS$EXAMPLES からローカル・ディレクトリにコピーする。

  • LAVC$FAILURE_ANALYSIS.MAR

  • LAVC$BUILD.COM

2 OpenVMS Cluster ネットワーク・マップおよび他の情報を使用して,LAVC$FAILURE_ANALYSIS.MAR のコピーを編集する。

例 D-1 は, LAVC$FAILURE_ANALYSIS.MAR で編集する部分を示しています。

例 D-1 LAVC$FAILURE_ANALYSIS.MAR で編集する部分

;       *** Start edits here *** 
 
;       Edit 1. 
; 
;               Define the hardware components needed to describe 
;               the physical configuration. 
; 
 
        NEW_COMPONENT   SYSTEM          NODE 
        NEW_COMPONENT   LAN_ADP         ADAPTER 
        NEW_COMPONENT   DEMPR           COMPONENT 
        NEW_COMPONENT   DELNI           COMPONENT 
        NEW_COMPONENT   SEGMENT         COMPONENT 
        NEW_COMPONENT   NET_CLOUD       CLOUD 
 
 
;       Edit 2. 
; 
;                       Diagram of a multi-adapter local area OpenVMS Cluster 
; 
; 
;        Sa   -------+---------------+---------------+---------------+-------  
;                    |               |               |               | 
;                    |             MPR_A             |               | 
;                    |          .----+----.          |               | 
;                    |         1|        1|         1|               | 
;                   BrA       ALPHA     BETA       DELTA            BrB 
;                    |         2|        2|         2|               | 
;                    |          `----+----'          |               | 
;                    |             LNI_A             |               | 
;                    |               |               |               | 
;        Sb   -------+---------------+---------------+---------------+-------  
; 
; 
;       Edit 3. 
; 
; Label    Node                       Description            
; -----   ------  -----------------------------------------------    
 
  SYSTEM  A,      ALPHA,  < - MicroVAX II; In the Computer room>...
  LAN_ADP A1,     ,       <XQA; ALPHA - MicroVAX II; Computer room>,...
  LAN_ADP A2,     ,       <XQB; ALPHA - MicroVAX II; Computer room>,...
 
  SYSTEM  B,      BETA,   < - MicroVAX 3500; In the Computer room>...
  LAN_ADP B1,     ,       <XQA; BETA - MicroVAX 3500; Computer room>,...
  LAN_ADP B2,     ,       <XQB; BETA - MicroVAX 3500; Computer room>,...
  
  SYSTEM  D,      DELTA, < - VAXstation II; In Dan's office>...
  LAN_ADP D1,     ,       <XQA; DELTA - VAXstation II; Dan's office>,...
  LAN_ADP D2,     ,       <XQB; DELTA - VAXstation II; Dan's office>,...
 
;       Edit 4. 
; 
;               Label each of the other network components. 
; 
 
        DEMPR   MPR_A, , <Connected to segment A; In the Computer room> 
        DELNI   LNI_A, , <Connected to segment B; In the Computer room> 
 
        SEGMENT Sa,  , <Ethernet segment A> 
        SEGMENT Sb,  , <Ethernet segment B> 
 
        NET_CLOUD       BRIDGES, , <Bridging between ethernet segments A and B> 
 
;       Edit 5. 
; 
;               Describe the network connections. 
; 
        CONNECTION      Sa,     MPR_A 
        CONNECTION              MPR_A,  A1 
        CONNECTION                      A1,     A 
        CONNECTION              MPR_A,  B1 
        CONNECTION                      B1,     B 
 
        CONNECTION      Sa,     D1 
        CONNECTION              D1,     D 
 
        CONNECTION      Sa,     BRIDGES 
        CONNECTION      Sb,     BRIDGES 
 
        CONNECTION      Sb,     LNI_A 
        CONNECTION              LNI_A,  A2 
        CONNECTION                      A2,     A 
        CONNECTION              LNI_A,  B2 
        CONNECTION                      B2,     B 
 
        CONNECTION      Sb,     D2 
        CONNECTION              D2,     D 
 
        .PAGE 
 
;       *** End of edits *** 

このプログラムで,Edit number は,ネットワークに関する情報を取り込むためにプログラムを編集する箇所を示しています。プログラムを以下のように編集します。

変更場所 操作
Edit 1 構成に含まれる各コンポーネントのカテゴリを定義する。 付録 D.5.1 項 のステップ 5 の情報を利用する。以下の形式を使用する。
NEW_COMPONENT component_type category

例: 以下の例では,DEMPR リピータをコンポーネント・カテゴリの一部として定義する方法を示している。

NEW_COMPONENT DEMPR COMPONENT

Edit 2 付録 D.5.1 項 のステップ 1 で描いたネットワーク・マップを挿入する。LAVC$FAILURE_ANALYSIS.MAR のこの部分にマップを挿入すると,マップの電子的なレコードが作成され,紙に書いた図の場合より簡単に検索と更新ができるようになる。
Edit 3 OpenVMS Cluster の各ノードと LAN アダプタを指定する。各ノードに対して 1 行ずつ使用する。各行には以下の情報を指定しなければならない。各情報項目をカンマで区切って,情報の表を作成する。

  • コンポーネント・タイプとカンマ。

  • ネットワーク・マップに指定されているラベルとカンマ。

  • ノード名 (SYSTEM コンポーネントのみ)。ノード名がない場合は,カンマだけを入力する。

  • このコンポーネントで障害を検出したときに, Network Failure Analysis Program が表示する説明文。このテキストは山括弧 (< >) で囲む。このテキストにはコンポーネントの物理的な場所を指定しなければならない。

  • LAN ハードウェア・アドレス (LAN アダプタの場合)。

  • DECnet が使用する LAN アダプタの DECnet LAN アドレス。

Edit 4 他の各ネットワーク・コンポーネントを指定する。各コンポーネントに対して 1 行を使用する。各行には以下の情報を指定しなければならない。

  • NEW_COMPONENT で定義したコンポーネント名とカテゴリ。

  • ネットワーク・マップに指定されているラベル。

  • Network Failure Analysis Program がこのコンポーネントで障害を検出したときに表示する説明文。コンポーネントの物理的な場所に関する情報を含む。

  • LAN ハードウェア・アドレス (省略可能)。

  • 代替 LAN アドレス (省略可能)。

Edit 5 ネットワーク・コンポーネント間の接続を定義する。 CONNECTION マクロと,接続される 2 つのコンポーネントのラベルを使用する。以下の情報を指定する。

  • CONNECTION マクロ名

  • 最初のコンポーネント・ラベル

  • 2 番目のコンポーネント・ラベル

関連項目: この操作手順の詳細については,ソース・モジュール SYS$EXAMPLES:LAVC$FAILURE_ANALYSIS.MAR を参照。

D.5.3 プログラムのアセンブルとリンク

プログラムをアセンブルおよびリンクするには,以下のコマンド・プロシージャを使用します。


$ @LAVC$BUILD.COM LAVC$FAILURE_ANALYSIS.MAR

パス記述でコンポーネント・ラベルをタイプミスすることによって発生するエラーなど,アセンブリ・エラーやリンク・エラーを修正するために必要な編集を行います。その後,プログラムをもう一度アセンブルします。

D.5.4 スタートアップ・ファイルの変更

LAVC$FAILURE_ANALYSIS.EXE プロシージャを実行する前に,データを提供したノードでのみプロシージャが実行されるように,スタートアップ・ファイルを変更します。

例: OMEGA ノードでプログラムを実行するには,以下の条件文を含むように,SYS$COMMON:[SYSMGR] のスタートアップ・ファイルを変更します。


$ If F$GETSYI ("nodename").EQS."OMEGA" 
$ THEN 
$   RUN SYS$MANAGER:LAVC$FAILURE_ANALYSIS.EXE 
$ ENDIF 

D.5.5 プログラムの実行

LAVC$FAILURE_ANALYSIS.EXE プログラムを実行するには,以下の操作を行います。

ステップ 操作
1 PHY_IO 特権が与えられているアカウントを使用する。
2 ネットワーク障害分析を実行する各ノードでプログラムを実行する。
$ RUN SYS$MANAGER:LAVC$FAILURE_ANALYSIS.EXE

プログラムを実行した後,ネットワーク記述に必要な非ページング・プールの適切な量が表示される。この表示の形式は以下のとおりである。


Non-paged Pool Usage:  ~ 10004 bytes 

D.5.6 MODPARAMS.DAT の変更

ネットワーク障害分析を実行する各システムで, SYS$SPECIFIC:[SYSEXE]MODPARAMS.DAT ファイルに以下の行を追加します。ただし,value の代わりに,使用される非ページング・プールの値として表示された値を指定します。


ADD_NPAGEDYN = value
ADD_NPAGEVIR = value

MODPARAMS.DAT を変更した各システムで AUTOGEN を実行します。


前へ 次へ 目次 索引