Compaq OpenVMS
OpenVMS Cluster システム


前へ 次へ 目次 索引


C.12 OPA0 エラー・メッセージのログとブロードキャスト

ポート・ドライバは特定のエラー条件を検出すると,それをログに記録しようとします。ポート・ドライバは,以下の状況で, OPA0 エラー・ブロードキャストと標準的なエラー・ログの両方を実行しようとします。

この説明では,システム・デバイスとエラー・ログ・デバイスが 1 つで,同一であるものと仮定しています。

以下の表は,エラー・ログの方法とその信頼性を示しています。

方法 信頼性 説明
エラー・ログ・デバイスへの標準的なエラー・ロギング 状況によっては,エラー・ログ・デバイスにエラーを記録する操作が失敗することがある。これらの失敗は,エラー状況をログに記録しようとしたときに,エラー・ログ・デバイスにアクセスできないために発生することがある。 ポート・ドライバはクラスタで中心的な役割を果たすため,このような場合,エラー・ログ情報が紛失すると,問題を診断して修正するのが困難になる。
エラー状態に関する特定のメッセージを OPA0 にブロードキャストする (この操作は,ポート・ドライバがエラー状態をエラー・ログ・デバイスに記録することに加えて実行される)。 一部のエラー状態は,OPA0 エラー・ブロードキャストが実行される方法では報告されない可能性があるため,このエラー・レポート方法は完全に信頼性があるものではない。たとえば,ポート・ドライバが最初のエラー状態を OPA0 にブロードキャストできるようになる前に, 2 番目のエラー状態が検出されると,この状況が発生する。このような場合,最初のエラー状態がより重要なエラーであると考えられるため,そのエラーだけが OPA0 に報告される。 この第 2 の重複するエラー・ログ方式は,この方式を使用しなければ失われる可能性があるポート・デバイス・エラー状態に関する一部の情報を少なくとも収集することができる。

注意: 特定のエラー状態は,エラー・ログ・デバイスにアクセス可能であるかどうかとは無関係に,必ず OPA0 にブロードキャストされます。一般に,ポートが永久的または一時的にシャットダウンされるようなエラーは,この場合に該当します。

C.12.1 OPA0 エラー・メッセージ

各エラー状態に対して 1 つの OPA0 エラー・メッセージが常にログに記録されます。各エラー・メッセージのテキストは, Error Log ユーティリティを使用して,対応する標準のエラー・ログ・エントリを書式化することによって表示される要約テキストに類似しています (Error Log ユーティリティの要約メッセージとその説明については, 付録 C.11.7 項 を参照してください)。

表 C-8 は OPA0 エラー・メッセージを示しています。この表は,エラーの種類に応じて分類されています。多くの OPA0 エラー・メッセージには,リモート・ポート番号, CI パケット情報 (フラグ,ポート・オペレーション・コード,応答状態,ポート番号フィールドなど),特定の CI ポート・レジスタなど,オプション情報が一部含まれています。コードは,メッセージが OPA0 に常に記録されるのか,システム・デバイスにアクセスできない場合にだけ記録されるのかを指定します。

表 C-8 OPA0 メッセージ
エラー・メッセージ 常に記録またはアクセス不能時のみ
初期化時のソフトウェア・エラー
%Pxxn, Insufficient Non-Paged Pool for Initialization 常に記録
%Pxxn, Failed to Locate Port Micro-code Image 常に記録
%Pxxn, SCSSYSTEMID has NOT been set to a Non-Zero Value 常に記録
ハードウェア・エラー
%Pxxn, BIIC failure---BICSR/BER/CNF xxxxxx/xxxxxx/xxxxxx 常に記録
%Pxxn, Micro-code Verification Error 常に記録
%Pxxn, Port Transition Failure---CNF/PMC/PSR xxxxxx/xxxxxx/xxxxxx 常に記録
%Pxxn, Port Error Bit(s) Set---CNF/PMC/PSR xxxxxx/xxxxxx/xxxxxx 常に記録
%Pxxn, Port Power Down 常に記録
%Pxxn, Port Power Up 常に記録
%Pxxn, Unexpected Interrupt---CNF/PMC/PSR xxxxxx/xxxxxx/xxxxxx 常に記録
%Pxxn, CI Port Timeout 常に記録
%Pxxn, CI port ucode not at required rev level. ---RAM/PROM rev is xxxx/xxxx 常に記録
%Pxxn, CI port ucode not at current rev level.---RAM/PROM rev is xxxx/xxxx 常に記録
%Pxxn, CPU ucode not at required rev level for CI activity 常に記録
キュー・インターロック障害
%Pxxn, Message Free Queue Remove Failure 常に記録
%Pxxn, Datagram Free Queue Remove Failure 常に記録
%Pxxn, Response Queue Remove Failure 常に記録
%Pxxn, High Priority Command Queue Insert Failure 常に記録
%Pxxn, Low Priority Command Queue Insert Failure 常に記録
%Pxxn, Message Free Queue Insert Failure 常に記録
%Pxxn, Datagram Free Queue Insert Failure 常に記録
CI パケットによって通知されるエラー
%Pxxn, Unrecognized SCA Packet---FLAGS/OPC/STATUS/PORT xx/xx/xx/xx 常に記録
%Pxxn, Port has Closed Virtual Circuit---REMOTE PORT 1 xxx 常に記録
%Pxxn, Software Shutting Down Port 常に記録
%Pxxn, Software is Closing Virtual Circuit---REMOTE PORT 1 xxx 常に記録
%Pxxn, Received Connect Without Path-Block---FLAGS/OPC/STATUS/PORT xx/xx/xx/xx 常に記録
%Pxxn, Inappropriate SCA Control Message---FLAGS/OPC/STATUS/PORT xx/xx/xx/xx 常に記録
%Pxxn, No Path-Block During Virtual Circuit Close---REMOTE PORT 1 xxx 常に記録
%Pxxn, HSC Error Logging Datagram Received Inaccessible---REMOTE PORT 1 xxx アクセス不能時のみ
%Pxxn, Remote System Conflicts with Known System---REMOTE PORT 1 xxx 常に記録
%Pxxn, Virtual Circuit Timeout---REMOTE PORT 1 xxx 常に記録
%Pxxn, Parallel Path is Closing Virtual Circuit--- REMOTE PORT 1 xxx 常に記録
%Pxxn, Insufficient Nonpaged Pool for Virtual Circuits 常に記録
ケーブルの状態変化通知
%Pxxn, Path #0. Has gone from GOOD to BAD---REMOTE PORT 1 xxx アクセス不能時のみ
%Pxxn, Path #1. Has gone from GOOD to BAD---REMOTE PORT 1 xxx アクセス不能時のみ
%Pxxn, Path #0. Has gone from BAD to GOOD---REMOTE PORT 1 xxx アクセス不能時のみ
%Pxxn, Path #1. Has gone from BAD to GOOD---REMOTE PORT 1 xxx アクセス不能時のみ
%Pxxn, Cables have gone from UNCROSSED to CROSSED---REMOTE PORT 1 xxx アクセス不能時のみ
%Pxxn, Cables have gone from CROSSED to UNCROSSED---REMOTE PORT 1 xxx アクセス不能時のみ
%Pxxn, Path #0. Loopback has gone from GOOD to BAD---REMOTE PORT 1 xxx 常に記録
%Pxxn, Path #1. Loopback has gone from GOOD to BAD---REMOTE PORT 1 xxx 常に記録
%Pxxn, Path #0. Loopback has gone from BAD to GOOD---REMOTE PORT 1 xxx 常に記録
%Pxxn, Path #1. Loopback has gone from BAD to GOOD---REMOTE PORT 1 xxx 常に記録
%Pxxn, Path #0. Has become working but CROSSED to Path #1.--- REMOTE PORT 1 xxx アクセス不能時のみ
%Pxxn, Path #1. Has become working but CROSSED to Path #0.--- REMOTE PORT 1 xxx アクセス不能時のみ


1ポート・ドライバが影響を受けるコンピュータのリモート SCS ノード名を識別できる場合,ドライバは "REMOTE PORT xxx" というテキストを "REMOTE SYSTEM X..." に置き換える。ただし, X... はリモート・コンピュータでのシステム・パラメータ SCSNODE の値である。リモート SCS ノード名が提供されない場合は,ポート・ドライバは既存のメッセージ形式を使用する。

CI ポート・レジスタの略称:
CNF --- 構成レジスタ
PMC --- ポート保守/制御レジスタ
PSR --- ポート状態レジスタ

CI ポート・レジスタの詳細については,CI ハードウェアのマニュアルも参照。


C.12.2 CI ポートの回復

CI ポートに関連する他の 2 つのメッセージは,OPA0 に表示されます。


%Pxxn, CI port is reinitializing (xxx retries left.) 
 
%Pxxn, CI port is going off line. 

最初のメッセージは,ポートのシャットダウンを要求している前のエラーが回復可能であり,ポートが再初期化されることを示しています。"xxx retries left" は,ポートを永久的にオフラインにする前に,実行できる再初期化の回数を指定します。ポートの再初期化 (電源障害からの回復以外の理由) のたびに,約 2 KB の非ページング・プールが失われます。

2 番目のメッセージは,前のエラーが回復不可能であり,ポートがオフラインのままになることを示しています。この場合,ポートを回復するには,コンピュータをリブートしなければなりません。


付録 D
LAN 制御のためのサンプル・プログラム

ここでは,LAN アダプタで NISCA プロトコルを起動および停止するサンプル・プログラム,および LAN ネットワーク障害分析を有効にするためのサンプル・プログラムについて説明します。以下のプログラムは SYS$EXAMPLES に格納されています。

プログラム 説明
LAVC$START_BUS.MAR 指定された LAN アダプタで NISCA プロトコルを起動する。
LAVC$STOP_BUS.MAR 指定された LAN アダプタで NISCA プロトコルを停止する。
LAVC$FAILURE_ANALYSIS.MAR LAN ネットワーク障害分析を有効にする。
LAVC$BUILD.COM サンプル・プログラムをアセンブルおよびリンクする。

関連項目: NISCA プロトコルは,イーサネットおよび FDDI LAN を介して,クラスタ内の他のノードにメッセージを伝達するプロトコルです。詳細については 付録 F を参照してください。

D.1 プログラムの目的

ポート・エミュレータ・ドライバ PEDRIVER は,クラスタ内のすべての LAN アダプタで NISCA プロトコルを起動します。

LAVC$START_BUS.MAR と LAVC$STOP_BUS.MAR は,プロトコルの種類に従ってネットワークの負荷を分割すること,つまり,すべての LAN アダプタ上で NISCA プロトコルを実行したくないと考えているクラスタ管理者を対象に提供されます。

関連項目: ネットワーク障害分析プログラムの編集と使用については, 付録 D.5 節 を参照してください。

D.2 NISCA プロトコルの起動

SYS$EXAMPLES に格納されているサンプル・プログラム LAVC$START_BUS.MAR は,指定された LAN アダプタで NISCA プロトコルを起動します。

このプログラムをビルドするには,以下の操作を行います。

ステップ 操作
1 LAVC$START_BUS.MAR ファイルと LAVC$BUILD.COM ファイルを SYS$EXAMPLES からローカル・ディレクトリにコピーする。
2 以下のコマンドを使用して,サンプル・プログラムをアセンブルおよびリンクする。
$ @LAVC$BUILD.COM LAVC$START_BUS.MAR

D.2.1 プロトコルの起動

LAN アダプタでプロトコルを起動するには,以下の操作を行います。

ステップ 操作
1 PHY_IO 特権が割り当てられているアカウントを使用する。 LAVC$START_BUS.EXE を実行するには,このようなアカウントが必要である。
2 フォーリン・コマンド (DCL シンボル) を定義する。
3 フォーリン・コマンド (LAVC$START_BUS.EXE) の後に,プロトコルを起動する LAN アダプタの名前を指定して実行する。

例: 以下の例では,NISCA プロトコルを LAN アダプタ ETA0 で起動する方法を示しています。


$ START_BUS:==$SYS$DISK:[ ]LAVC$START_BUS.EXE
$ START_BUS ETA

D.3 NISCA プロトコルの停止

SYS$EXAMPLES に格納されているサンプル・プログラム LAVC$STOP_BUS.MAR は,指定された LAN アダプタで NISCA プロトコルを停止します。

警告: すべての LAN アダプタで NISCA プロトコルを停止すると,サテライトがハングし,クラスタ・システムは CLUEXIT バグチェックで異常終了することがあります。

プログラムを作成するには,以下の操作を行います。

ステップ 操作
1 LAVC$STOP_BUS.MAR ファイルと LAVC$BUILD.COM ファイルを SYS$EXAMPLES からローカル・ディレクトリにコピーする。
2 以下のコマンドを使用して,サンプル・プログラムをアセンブルおよびリンクする。
$ @LAVC$BUILD.COM LAVC$STOP_BUS.MAR

D.3.1 プロトコルの停止

LAN アダプタで NISCA プロトコルを停止するには,以下の操作を行います。

ステップ 操作
1 PHY_IO 特権が割り当てられているアカウントを使用する。 LAVC$STOP_BUS.EXE を実行するには,このようなアカウントが必要である。
2 フォーリン・コマンド (DCL シンボル) を定義する。
3 フォーリン・コマンド (LAVC$STOP_BUS.EXE) の後に,プロトコルを停止する LAN アダプタの名前を指定して,コマンドを実行する。

例: 以下の例では,LAN アダプタ ETA0 で NISCA プロトコルを停止する方法を示しています。


$ STOP_BUS:==$SYS$DISK[ ]LAVC$STOP_BUS.EXE
$ STOP_BUS ETA

D.3.2 正常実行の確認

LAVC$STOP_BUS モジュールが正常に実行された場合,以下のデバイス・アテンション・エントリがシステム・エラー・ログに書き込まれます。


DEVICE ATTENTION...
 
NI-SCS SUB-SYSTEM...
 
FATAL ERROR DETECTED BY DATALINK...

さらに,以下の 16 進数がエントリの STATUS フィールドに書き込まれます。

最初のロングワード (00000001)
2 番目のロングワード (00001201)

エラー・ログ・エントリは,期待される動作を示すもので,無視してもかまいません。しかし,STATUS フィールドの最初のロングワードに 16 進数の 00000001 以外の値が格納されている場合は,エラーが発生しているため,さらに調査が必要になることがあります。


前へ 次へ 目次 索引