日本語 HP TCP/IP Services for OpenVMS
日本語機能の手引き


前へ 目次 索引



第 4 章
標準漢字フィルタの仕様

4.1 7ビットJIS漢字フィルタ 1 (JIS)

7 ビットJIS漢字(G0集合1 のみの使用を想定した漢字符号化方法)とDEC 漢字との変換を行います。

7 ビットJIS側のエンコーディングは以下のものをサポートします。


 (a) ASCII                ESC (B 
 (b) JIS X0201(LH)        ESC (J 
 
 (c) JIS X0208('78)       ESC $@ 
 (d) JIS X0208('83)       ESC $B 
 
 (e) JIS X0201(RH)        ESC (I 
                          SI,  SO 
 (f) JIS X0212            ESC $(D 

  1. ASCII コード・セットの変換
    ASCII と JIS X0201(LH)とを区別しません。すなわち(a)と(b)のどちらに対しても, DEC 漢字はエスケープ・シーケンスは使わず単に0xxxxxxxで表示します。送信時はESC (B を用います。

  2. JIS X0208 コード・セットの変換
    JIS X0208('83) と JIS X0208('78) とを区別しません。すなわち(c)と(d)のどちらに対しても,DEC 漢字はエスケープ・シーケンスは使わず単に 1xxxxxxx 1xxxxxxxで表示します(未定義領域も含みます)。送信時は ESC $B を用い,1xxxxxxx 1xxxxxxxから 0xxxxxxx 0xxxxxxxへ変換します (未定義領域も含みます)。

  3. JIS X0212 コード・セットの変換
    JIS7 中に JIS X0212 の指示シーケンスがあると,それ以降ほかの文字セットの指示シーケンスがあるまで 0xxxxxxx 0xxxxxxx から SS3 1xxxxxxx 1xxxxxxx へ変換します。送信時は ESC $(D を用い,SS3 1xxxxxxx 1xxxxxxxから 0xxxxxxx 0xxxxxxxへ変換します (未定義領域も含みます)。

  4. JIS X0201(RH) (半角カナ)コード・セットの変換
    JIS7 中に JIS X0201(RH) の指示シーケンスがあると,それ以降ほかの文字セットの指示シーケンスがあるまで,または SO から SI までの間0xxxxxxx から SS2 1xxxxxxx へ変換します。送信時は SO, SI を用いて,SS2 1xxxxxxxx から 0xxxxxxx へ変換します (未定義領域も含みます)。

  5. UDC(ユーザ定義文字,DEC 漢字) コード・セットの変換
    JIS7 側では,DEC 漢字の UDC(1xxxxxxx 0xxxxxxx)はすべて 0x2222(全角の四角)に変換します。

  6. C0 コード・セットの変換
    JIS7 中の 0x00-1f はその時のステートによらず C0 として扱いそのまま DEC 漢字の C0 とします。 DEC 漢字の C0(0x00-1f) のコードは (a)のシーケンスを付加してJIS 側へ出力します。

  7. C1 コード・セットの変換
    DEC 漢字に含まれる SS2,SS3 以外の C1 コードは,同等のESC コードと7 ビット文字の組み合せに変換します。

  8. (a)〜(f) 以外のエスケープ・シーケンス
    JIS7 側に(a)〜(f)以外のエスケープ・シーケンスが現れた場合,そのエスケープ・シーケンスはそのまま DEC 漢字に送り,ステートはそれ以前のものを維持します。

注意

1 JIS X0202 情報交換用符号の拡張法参照

4.2 7 ビット JIS漢字フィルタ 2 (JISM)

7 ビットJIS漢字(前節のJIS7 と同様に,G0集合のみを使用した漢字符号, JIS X0201(RH) の符号化が異なる)と DEC 漢字との変換を行います。

JIS 側のエンコーディングは以下のものをサポートします。


 (a) ASCII                ESC (B 
 (b) JIS X0201(LH)        ESC (J 
 
 (c) JIS X0208('78)       ESC $@ 
 (d) JIS X0208('83)       ESC $B 
 
 (e) JIS X0201(RH)        ESC (I 
                          SI,  SO 
 (f) JIS X0212            ESC $(D 

  1. ASCII コード・セットの変換
    ASCII と JIS X0201(LH) とを区別しません。すなわち (a)と(b)のどちらに対しても, DEC 漢字ではエスケープ・シーケンスは使わず単に 0xxxxxxx で表示します。送信時は ESC (J を用います。

  2. JIS X0208 コード・セットの変換
    JIS X0208('83) と JIS X0208('78) とを区別しません。すなわち(c) と(d)のどちらに対しても,DEC 漢字ではエスケープ・シーケンスは使わず単に 1xxxxxxx 1xxxxxxxで表示します(未定義領域も含みます)。送信時は ESC $B を用いて 1xxxxxxx 1xxxxxxx から 0xxxxxxx 0xxxxxxx へ変換します (未定義領域も含みます)。

  3. JIS X0212 コード・セットの変換
    JIS7 中に JIS X0212 の指示シーケンスがあると,それ以降ほかの文字セットの指示シーケンスがあるまで 0xxxxxxx 0xxxxxxx から SS3 1xxxxxxx 1xxxxxxx へ変換します。送信時は ESC $(D を用い SS3 1xxxxxxx 1xxxxxxx から 0xxxxxxx 0xxxxxxx へ変換します (未定義領域も含みます)。

  4. JIS X0201(RH) (半角カナ) コード・セットの変換
    JIS7 中に JIS X0201(RH) の指示シーケンスがあると,それ以降ほかの文字セットの指示シーケンスがあるまで,または,SO から SI までの間 0xxxxxxx から SS2 1xxxxxxx へ変換します。送信時は ESC (I を用い,1xxxxxxx から 0xxxxxxx へ変換します (未定義領域も含みます)。

  5. UDC(ユーザ定義文字,DEC 漢字) コード・セットの変換
    JIS7 側では DEC 漢字の UDC(1xxxxxxx 0xxxxxxx)はすべて 0x2222(全角の四角)に変換します。

  6. C0 コード・セットの変換
    JIS7 中の 0x00-1f はその時のステートによらず C0 として扱いそのまま DEC 漢字の C0 とします。DEC 漢字の C0(0x00-1f) のコードは(a)のシーケンスを付加して JIS7 側へ出力します。

  7. C1 コード・セットの変換
    DEC 漢字に含まれる SS2,SS3 以外の C1 コードは,同等のESC コードと7 ビット文字の組み合せに変換します。

  8. (a)〜(f)以外のエスケープ・シーケンスの変換
    JIS7 側に(a)〜(f)以外のエスケープ・シーケンスが現れた場合,そのエスケープ・シーケンスはそのまま DEC 漢字に送り,ステートはそれ以前のものを維持します。

4.3 シフト JIS 漢字フィルタ (SJIS)

シフト JIS と DEC 漢字との変換を行います。

シフト JIS 側のコード・セットは以下のものをサポートします。


JIS X0201(LH)     0xxxxxxx 
JIS X0208('83)    1xxxxxxx+xxxxxxxx 
JIS X0201(RH)     1xxxxxxx 

  1. JIS X0201(LH) コード・セットの変換
    受信/送信とも変換は行いません。

  2. JIS X0208 コード・セットの変換
    シフト JIS および DEC 漢字の JIS X0208 に対応する部分はそれぞれの JIS X0208 コードに対応するように変換します (未定義部分も含みます)。

  3. JIS X0212 コード・セットの変換
    DEC 漢字の JIS X0212(SS3 1xxxxxxx 1xxxxxxx)は,シフト JISの0x81a0 (全角の四角) に変換します。

  4. JIS X0201(RH) (半角カナ) コード・セットの変換
    シフト JIS の JIS X0201RH (0xa1-df) は DEC 漢字の SS2(0x8e)+0xa1-df に, DEC 漢字の JIS X0201RH (SS2(0x8e)+0xa1-df) はシフト JIS の 0xa1-df に変換します。

  5. UDC(ユーザ定義文字,DEC 漢字,シフト JIS) コード・セットの変換
    シフト JIS の UDC 領域は, DEC 漢字の 0xa2a2 (全角の四角) に変換します。 DEC 漢字の UDC(1xxxxxxx 0xxxxxxx)はシフト JIS の0x81a0 (全角の四角) に変換します。

  6. C0 コード・セットの変換
    受信/送信とも変換は行いません。

  7. C1 コード・セットの変換
    DEC 漢字に含まれる SS2,SS3 以外の C1 コードは,同等のESC コードと7 ビット文字の組み合せに変換します。

  8. エスケープ・シーケンスの変換
    (他の C0 同様に) 受信/送信とも変換は行いません。

4.4 日本語 EUC 漢字フィルタ (UJIS)

日本語 EUC と DEC 漢字との変換を行います。

日本語 EUC 側のコード・セットは以下のものをサポートします。


 CS0 ASCII              0xxxxxxx 
 CS1 JIS X0208('83)      1xxxxxxx+1xxxxxxx 
 CS2 JIS X0201(RH)       SS2+0xxxxxxx 
 CS3 JIS X0212           SS3+1xxxxxxx+1xxxxxxx 

  1. ASCII コード・セットの変換
    受信/送信とも変換は行いません。

  2. JIS X0208 コード・セットの変換
    受信/送信とも変換は行いません。

  3. JIS X0212 コード・セットの変換
    受信/送信とも変換は行いません。

  4. JIS X0201(RH) (半角カナ) コード・セットの変換
    受信/送信とも変換は行いません。

  5. UDC (ユーザ定義文字,DEC 漢字) コード・セットの変換
    DEC 漢字の UDC(1xxxxxxx 0xxxxxxx)の領域は0xa2a2(全角の四角)に変換します。

  6. C0 コード・セットの変換
    受信/送信とも変換は行いません。

  7. C1 コード・セットの変換
    受信/送信とも変換は行いません。

  8. エスケープ・シーケンスの変換
    (他の C0 同様に) 受信/送信とも変換は行いません。


前へ 索引 目次