[ 前のページ ] [ 次のページ ] [ 目次 ] [ 索引 ]


4 標準漢字フィルタの仕様

4.1 7ビットJIS漢字フィルタ1 (JIS)

7ビットJIS漢字(G0集合 [1] のみの使用を想定した漢字符号化方法) とDEC漢字との変換を行います。


[1] JIS X0202情報交換用符号の拡張法参照

7ビットJIS側のエンコーディングは以下のものをサポートします。

      (a) ASCII                ESC (B
      (b) JIS X0201(LH)        ESC (J

      (c) JIS X0208('78)       ESC $@
      (d) JIS X0208('83)       ESC $B

      (e) JIS X0201(RH)        ESC (I
                               SI,  SO
      (f) JIS X0212            ESC $(D

  1. ASCIIコード・セットの変換

    ASCIIとJIS X0201(LH)とを区別しません。すなわち(a)と(b)のどちらに対しても,DEC 漢字はエスケープ・シーケンスは使わず単に0xxxxxxx で表示します。送信時はESC (Bを用います。

  2. JIS X0208コード・セットの変換

    JIS X0208('83)とJIS X0208('78)とを区別しません。すなわち(c)と(d) のどちらに対しても,DEC漢字はエスケープ・シーケンスは使わず単に1xxxxxxx 1xxxxxxx で表示します(未定義領域も含みます)。送信時はESC $B を用い,1xxxxxxx 1xxxxxxxから0xxxxxxx 0xxxxxxxへ変換します( 未定義領域も含みます)。

  3. JIS X0212コード・セットの変換

    JIS7中にJIS X0212の指示シーケンスがあると,それ以降ほかの文字セットの指示シーケンスがあるまで0xxxxxxx 0xxxxxxx からSS3 1xxxxxxx 1xxxxxxxへ変換します。送信時はESC $(Dを用い,SS3 1xxxxxxx 1xxxxxxxから0xxxxxxx 0xxxxxxxへ変換します(未定義領域も含みます) 。

  4. JIS X0201(RH) (半角カナ)コード・セットの変換

    JIS7中にJIS X0201(RH)の指示シーケンスがあると,それ以降ほかの文字セットの指示シーケンスがあるまで, またはSOからSIまでの間0xxxxxxx からSS2 1xxxxxxxへ変換します。送信時はSO,SIを用いて, SS2 1xxxxxxxxから0xxxxxxxへ変換します(未定義領域も含みます)。

  5. UDC(ユーザ定義文字,DEC漢字)コード・セットの変換

    JIS7側では,DEC漢字のUDC(1xxxxxxx 0xxxxxxx)はすべて0x2222(全角の四角)に変換します。

  6. C0コード・セットの変換

    JIS7中の0x00-1fはその時のステートによらずC0として扱いそのままDEC 漢字のC0とします。DEC漢字のC0(0x00-1f)のコードは(a)のシーケンスを付加してJIS 側へ出力します。

  7. C1コード・セットの変換

    DEC漢字に含まれるSS2,SS3以外のC1コードは,同等のESCコードと7ビット文字の組み合せに変換します。

  8. (a)〜(f)以外のエスケープ・シーケンス

    JIS7側に(a)〜(f)以外のエスケープ・シーケンスが現れた場合,そのエスケープ・ シーケンスはそのままDEC漢字に送り,ステートはそれ以前のものを維持します。

4.2 7ビットJIS漢字フィルタ2 (JISM)

7ビットJIS漢字(前節のJIS7と同様に,G0集合のみを使用した漢字符号, JIS X0201(RH)の符号化が異なる)とDEC漢字との変換を行います。

JIS側のエンコーディングは以下のものをサポートします。

      (a) ASCII                ESC (B
      (b) JIS X0201(LH)        ESC (J

      (c) JIS X0208('78)       ESC $@
      (d) JIS X0208('83)       ESC $B

      (e) JIS X0201(RH)        ESC (I
                               SI,  SO
      (f) JIS X0212            ESC $(D

  1. ASCIIコード・セットの変換

    ASCIIとJIS X0201(LH)とを区別しません。すなわち(a)と(b)のどちらに対しても,DEC 漢字ではエスケープ・シーケンスは使わず単に0xxxxxxx で表示します。送信時はESC (Jを用います。

  2. JIS X0208コード・セットの変換

    JIS X0208('83)とJIS X0208('78)とを区別しません。すなわち(c)と(d) のどちらに対しても,DEC漢字ではエスケープ・シーケンスは使わず単に1xxxxxxx 1xxxxxxx で表示します(未定義領域も含みます)。送信時はESC $B を用いて1xxxxxxx 1xxxxxxxから0xxxxxxx 0xxxxxxxへ変換します( 未定義領域も含みます)。

  3. JIS X0212コード・セットの変換

    JIS7中にJIS X0212の指示シーケンスがあると,それ以降ほかの文字セットの指示シーケンスがあるまで0xxxxxxx 0xxxxxxx からSS3 1xxxxxxx 1xxxxxxx へ変換します。送信時はESC $(Dを用いSS3 1xxxxxxx 1xxxxxxxから0xxxxxxx 0xxxxxxxへ変換します(未定義領域も含みます) 。

  4. JIS X0201(RH) (半角カナ)コード・セットの変換

    JIS7中にJIS X0201(RH)の指示シーケンスがあると,それ以降ほかの文字セットの指示シーケンスがあるまで, または,SOからSIまでの間0xxxxxxx からSS2 1xxxxxxxへ変換します。送信時はESC (Iを用い, 1xxxxxxxから0xxxxxxxへ変換します(未定義領域も含みます)。

  5. UDC(ユーザ定義文字,DEC漢字)コード・セットの変換

    JIS7側ではDEC漢字のUDC(1xxxxxxx 0xxxxxxx)はすべて0x2222(全角の四角)に変換します。

  6. C0コード・セットの変換

    JIS7中の0x00-1fはその時のステートによらずC0として扱いそのままDEC 漢字のC0とします。DEC漢字のC0(0x00-1f)のコードは(a)のシーケンスを付加してJIS7 側へ出力します。

  7. C1コード・セットの変換

    DEC漢字に含まれるSS2,SS3以外のC1コードは,同等のESCコードと7ビット文字の組み合せに変換します。

  8. (a)〜(f)以外のエスケープ・シーケンスの変換

    JIS7側に(a)〜(f)以外のエスケープ・シーケンスが現れた場合,そのエスケープ・ シーケンスはそのままDEC漢字に送り,ステートはそれ以前のものを維持します。

4.3 シフトJIS漢字フィルタ(SJIS)

シフトJISとDEC漢字との変換を行います。

シフトJIS側のコード・セットは以下のものをサポートします。

     JIS X0201(LH)     0xxxxxxx
     JIS X0208('83)    1xxxxxxx+xxxxxxxx
     JIS X0201(RH)     1xxxxxxx

  1. JIS X0201(LH)コード・セットの変換

    受信/送信とも変換は行いません。

  2. JIS X0208コード・セットの変換

    シフトJISおよびDEC漢字のJIS X0208に対応する部分はそれぞれのJIS X0208コードに対応するように変換します(未定義部分も含みます)。

  3. JIS X0212コード・セットの変換

    DEC漢字のJIS X0212(SS3 1xxxxxxx 1xxxxxxx)は,シフトJISの0x81a0 (全角の四角)に変換します。

  4. JIS X0201(RH) (半角カナ)コード・セットの変換

    シフトJISのJIS X0201RH (0xa1-df)はDEC漢字のSS2(0x8e)+0xa1- dfに,DEC漢字のJIS X0201RH (SS2(0x8e)+0xa1-df)はシフトJISの0xa1-df に変換します。

  5. UDC(ユーザ定義文字,DEC漢字,シフトJIS)コード・セットの変換

    シフトJISのUDC領域は,DEC漢字の0xa2a2 (全角の四角)に変換します。DEC 漢字のUDC(1xxxxxxx 0xxxxxxx)はシフトJISの0x81a0 (全角の四角) に変換します。

  6. C0コード・セットの変換

    受信/送信とも変換は行いません。

  7. C1コード・セットの変換

    DEC漢字に含まれるSS2,SS3以外のC1コードは,同等のESCコードと7ビット文字の組み合せに変換します。

  8. エスケープ・シーケンスの変換

    (他のC0同様に)受信/送信とも変換は行いません。

4.4 日本語EUC漢字フィルタ(UJIS)

日本語EUCとDEC漢字との変換を行います。

日本語EUC側のコード・セットは以下のものをサポートします。

      CS0 ASCII              0xxxxxxx
      CS1 JIS X0208('83)      1xxxxxxx+1xxxxxxx
      CS2 JIS X0201(RH)       SS2+0xxxxxxx
      CS3 JIS X0212           SS3+1xxxxxxx+1xxxxxxx

  1. ASCIIコード・セットの変換

    受信/送信とも変換は行いません。

  2. JIS X0208コード・セットの変換

    受信/送信とも変換は行いません。

  3. JIS X0212コード・セットの変換

    受信/送信とも変換は行いません。

  4. JIS X0201(RH) (半角カナ)コード・セットの変換

    受信/送信とも変換は行いません。

  5. UDC (ユーザ定義文字,DEC漢字)コード・セットの変換

    DEC漢字のUDC(1xxxxxxx 0xxxxxxx)の領域は0xa2a2(全角の四角)に変換します。

  6. C0コード・セットの変換

    受信/送信とも変換は行いません。

  7. C1コード・セットの変換

    受信/送信とも変換は行いません。

  8. エスケープ・シーケンスの変換

    (他のC0同様に)受信/送信とも変換は行いません。


[ 前のページ ] [ 次のページ ] [ 目次 ] [ 索引 ]