JIS漢字コードについて

メーリングリストを運用していくうちに、
「JISコードってなんだ?」って事になって、
興味が湧いて来たので、しらべてみました。

  1. Q1.JIS で何が定義されているんですか?
    文字コード関係の主な定義は次の通りです。

  2. Q2.じゃぁ「いわゆるJISコード」ってJIS X0208の事なんですか?
    A2.それは違います。
    なぜらならJIS X0208は文字セットの定義だけなのでJIS X0201は同じコードが含まれているので
    共存出来ないのです。
    その両者を区別する為にJIS X0202が必要なのです

  3. Q3.では JIS X0208 JIS X0202 JIS X0208の3つをまとめてJIS漢字なんですね?
    A3.ざんねんならがそれも違います。
    JIS X0202は非常に複雑で、実際にはその一部分(サブセットと呼びます。)を利用 しています。
    このサブセットとしては、「JUNETコード」(いわゆるJIS)、と 「(日本語)EUC」が含まれています。

  4. Q4.ではJUNETコードについて教えて下さい。
    A4.はいわかりました。 JUNETコードは次の文字でコードセットの入れ換えを行ないます。
    注:この表現は正確ではありませんが、便宜上このように表現します。
         文字セット    |切替えコード
    -------------------+-----------
           ASCII       |  ESC ( B
        JISローマ字    |  ESC ( J
        JIS漢字旧版    |  ESC $ @
        JIS漢字新版    |  ESC $ B
    
    JUNETコードはRFC1468として登録されISO-2022-JPという名称がついてます。

  5. Q5.JUNETコードの特徴は何ですか?
    A5.JUNETコードは、その歴史経緯から、7bit環境で転送出来る
    必要がありました。
    また全世界と繋がっているので、国際化拡張できるコードであるべきである と言う信念で作られています。
    このためJUNETコードの歴史経緯、信念を満たす形で「いわゆる半角カナ」を扱う事も可能です。
         文字セット    |切替えコード
    -------------------+------------
        JIS片仮名      |  ESC ( I
    
  6. Q6 いわるゆるJISにも新JISとか旧JISとかがありますがなぜですか?
    A6.これは、「文字の形や割当が変化したための区別」の為に
    別に割り当ててあると思われますが、実際には、片方のフォントしか
    入っていないので機種に依存してしまいます。

  7. Q7 文字セットのASCIIとJISローマ字って違うの?
    A7.はい違います。
    有名な所では、半角の「¥」と「\」が違います。
    ですから実際には ESC ( J と ESC ( B は違う文字であるべきなんですが。
    日本のほとんどの端末は片方しか(一般的にはJIS ローマ字)サポートしてないので、
    便宜上、同じデータとして扱っています。

この文章の問題点、指摘などは遠慮無くこちらまで
Yasuyuki Oouchi<oouchi@beta.or.jp>

Last modified: Mon Mar 23 21:30:05 1998
漢字コードのページに戻る。