日本語 Compaq TCP/IP Services for OpenVMS
日本語機能の手引き
第 4 章
標準漢字フィルタの仕様
4.1 7ビットJIS漢字フィルタ 1 (JIS)
7 ビットJIS漢字(G0集合1 のみの使用を想定した漢字符号化方法)とDEC 漢字との変換を行います。
7 ビットJIS側のエンコーディングは以下のものをサポートします。
(a) ASCII ESC (B
(b) JIS X0201(LH) ESC (J
(c) JIS X0208('78) ESC $@
(d) JIS X0208('83) ESC $B
(e) JIS X0201(RH) ESC (I
SI, SO
(f) JIS X0212 ESC $(D
|
- ASCII コード・セットの変換
ASCII と JIS X0201(LH)とを区別しません。すなわち(a)と(b)のどちらに対しても, DEC 漢字はエスケープ・シーケンスは使わず単に0xxxxxxxで表示します。送信時はESC (B を用います。
- JIS X0208 コード・セットの変換
JIS X0208('83) と JIS X0208('78) とを区別しません。すなわち(c)と(d)のどちらに対しても,DEC 漢字はエスケープ・シーケンスは使わず単に 1xxxxxxx 1xxxxxxxで表示します(未定義領域も含みます)。送信時は ESC $B を用い,1xxxxxxx 1xxxxxxxから 0xxxxxxx 0xxxxxxxへ変換します (未定義領域も含みます)。
- JIS X0212 コード・セットの変換
JIS7 中に JIS X0212 の指示シーケンスがあると,それ以降ほかの文字セットの指示シーケンスがあるまで 0xxxxxxx 0xxxxxxx から SS3 1xxxxxxx 1xxxxxxx へ変換します。送信時は ESC $(D を用い,SS3 1xxxxxxx 1xxxxxxxから 0xxxxxxx 0xxxxxxxへ変換します (未定義領域も含みます)。
- JIS X0201(RH) (半角カナ)コード・セットの変換
JIS7 中に JIS X0201(RH) の指示シーケンスがあると,それ以降ほかの文字セットの指示シーケンスがあるまで,または SO から SI までの間0xxxxxxx から SS2 1xxxxxxx へ変換します。送信時は SO, SI を用いて,SS2 1xxxxxxxx から 0xxxxxxx へ変換します (未定義領域も含みます)。
- UDC(ユーザ定義文字,DEC 漢字) コード・セットの変換
JIS7 側では,DEC 漢字の UDC(1xxxxxxx 0xxxxxxx)はすべて 0x2222(全角の四角)に変換します。
- C0 コード・セットの変換
JIS7 中の 0x00-1f はその時のステートによらず C0 として扱いそのまま DEC 漢字の C0 とします。 DEC 漢字の C0(0x00-1f) のコードは (a)のシーケンスを付加してJIS 側へ出力します。
- C1 コード・セットの変換
DEC 漢字に含まれる SS2,SS3 以外の C1 コードは,同等のESC コードと7 ビット文字の組み合せに変換します。
- (a)〜(f) 以外のエスケープ・シーケンス
JIS7 側に(a)〜(f)以外のエスケープ・シーケンスが現れた場合,そのエスケープ・シーケンスはそのまま DEC 漢字に送り,ステートはそれ以前のものを維持します。
注意
1 JIS X0202 情報交換用符号の拡張法参照
|
4.2 7 ビット JIS漢字フィルタ 2 (JISM)
7 ビットJIS漢字(前節のJIS7 と同様に,G0集合のみを使用した漢字符号, JIS X0201(RH) の符号化が異なる)と DEC 漢字との変換を行います。
JIS 側のエンコーディングは以下のものをサポートします。
(a) ASCII ESC (B
(b) JIS X0201(LH) ESC (J
(c) JIS X0208('78) ESC $@
(d) JIS X0208('83) ESC $B
(e) JIS X0201(RH) ESC (I
SI, SO
(f) JIS X0212 ESC $(D
|
- ASCII コード・セットの変換
ASCII と JIS X0201(LH) とを区別しません。すなわち (a)と(b)のどちらに対しても, DEC 漢字ではエスケープ・シーケンスは使わず単に 0xxxxxxx で表示します。送信時は ESC (J を用います。
- JIS X0208 コード・セットの変換
JIS X0208('83) と JIS X0208('78) とを区別しません。すなわち(c) と(d)のどちらに対しても,DEC 漢字ではエスケープ・シーケンスは使わず単に 1xxxxxxx 1xxxxxxxで表示します(未定義領域も含みます)。送信時は ESC $B を用いて 1xxxxxxx 1xxxxxxx から 0xxxxxxx 0xxxxxxx へ変換します (未定義領域も含みます)。
- JIS X0212 コード・セットの変換
JIS7 中に JIS X0212 の指示シーケンスがあると,それ以降ほかの文字セットの指示シーケンスがあるまで 0xxxxxxx 0xxxxxxx から SS3 1xxxxxxx 1xxxxxxx へ変換します。送信時は ESC $(D を用い SS3 1xxxxxxx 1xxxxxxx から 0xxxxxxx 0xxxxxxx へ変換します (未定義領域も含みます)。
- JIS X0201(RH) (半角カナ) コード・セットの変換
JIS7 中に JIS X0201(RH) の指示シーケンスがあると,それ以降ほかの文字セットの指示シーケンスがあるまで,または,SO から SI までの間 0xxxxxxx から SS2 1xxxxxxx へ変換します。送信時は ESC (I を用い,1xxxxxxx から 0xxxxxxx へ変換します (未定義領域も含みます)。
- UDC(ユーザ定義文字,DEC 漢字) コード・セットの変換
JIS7 側では DEC 漢字の UDC(1xxxxxxx 0xxxxxxx)はすべて 0x2222(全角の四角)に変換します。
- C0 コード・セットの変換
JIS7 中の 0x00-1f はその時のステートによらず C0 として扱いそのまま DEC 漢字の C0 とします。DEC 漢字の C0(0x00-1f) のコードは(a)のシーケンスを付加して JIS7 側へ出力します。
- C1 コード・セットの変換
DEC 漢字に含まれる SS2,SS3 以外の C1 コードは,同等のESC コードと7 ビット文字の組み合せに変換します。
- (a)〜(f)以外のエスケープ・シーケンスの変換
JIS7 側に(a)〜(f)以外のエスケープ・シーケンスが現れた場合,そのエスケープ・シーケンスはそのまま DEC 漢字に送り,ステートはそれ以前のものを維持します。
4.3 シフト JIS 漢字フィルタ (SJIS)
シフト JIS と DEC 漢字との変換を行います。
シフト JIS 側のコード・セットは以下のものをサポートします。
JIS X0201(LH) 0xxxxxxx
JIS X0208('83) 1xxxxxxx+xxxxxxxx
JIS X0201(RH) 1xxxxxxx
|
- JIS X0201(LH) コード・セットの変換
受信/送信とも変換は行いません。
- JIS X0208 コード・セットの変換
シフト JIS および DEC 漢字の JIS X0208 に対応する部分はそれぞれの JIS X0208 コードに対応するように変換します (未定義部分も含みます)。
- JIS X0212 コード・セットの変換
DEC 漢字の JIS X0212(SS3 1xxxxxxx 1xxxxxxx)は,シフト JISの0x81a0 (全角の四角) に変換します。
- JIS X0201(RH) (半角カナ) コード・セットの変換
シフト JIS の JIS X0201RH (0xa1-df) は DEC 漢字の SS2(0x8e)+0xa1-df に, DEC 漢字の JIS X0201RH (SS2(0x8e)+0xa1-df) はシフト JIS の 0xa1-df に変換します。
- UDC(ユーザ定義文字,DEC 漢字,シフト JIS) コード・セットの変換
シフト JIS の UDC 領域は, DEC 漢字の 0xa2a2 (全角の四角) に変換します。 DEC 漢字の UDC(1xxxxxxx 0xxxxxxx)はシフト JIS の0x81a0 (全角の四角) に変換します。
- C0 コード・セットの変換
受信/送信とも変換は行いません。
- C1 コード・セットの変換
DEC 漢字に含まれる SS2,SS3 以外の C1 コードは,同等のESC コードと7 ビット文字の組み合せに変換します。
- エスケープ・シーケンスの変換
(他の C0 同様に) 受信/送信とも変換は行いません。
4.4 日本語 EUC 漢字フィルタ (UJIS)
日本語 EUC と DEC 漢字との変換を行います。
日本語 EUC 側のコード・セットは以下のものをサポートします。
CS0 ASCII 0xxxxxxx
CS1 JIS X0208('83) 1xxxxxxx+1xxxxxxx
CS2 JIS X0201(RH) SS2+0xxxxxxx
CS3 JIS X0212 SS3+1xxxxxxx+1xxxxxxx
|
- ASCII コード・セットの変換
受信/送信とも変換は行いません。
- JIS X0208 コード・セットの変換
受信/送信とも変換は行いません。
- JIS X0212 コード・セットの変換
受信/送信とも変換は行いません。
- JIS X0201(RH) (半角カナ) コード・セットの変換
受信/送信とも変換は行いません。
- UDC (ユーザ定義文字,DEC 漢字) コード・セットの変換
DEC 漢字の UDC(1xxxxxxx 0xxxxxxx)の領域は0xa2a2(全角の四角)に変換します。
- C0 コード・セットの変換
受信/送信とも変換は行いません。
- C1 コード・セットの変換
受信/送信とも変換は行いません。
- エスケープ・シーケンスの変換
(他の C0 同様に) 受信/送信とも変換は行いません。