[pgsql-jp: 38226] Re: JIS X 0213のサポート

Tatsuo Ishii ishii @ sraoss.co.jp
2007年 3月 26日 (月) 22:54:58 JST


石井です.

ずいぶん古い話で恐縮ですが,1年ほど前に以下のように提案していた JIS X
0213のサポートを開発中のPostgreSQL 8.3にコミットしました.従来
PostgreSQLでサポートしていたEUC_JPやSJISに対応するEUC_JIS_2004と
SHIFT_JIS_2004というエンコーディングが追加されています.

EUC_JIS_2004とSHIFT_JIS_2004はEUC_JPやSJISの文字に更に多くの漢字や記号
を追加していますが,完全に上位互換というわけではないため,新しいエンコー
ディングとして追加しています.JIS X 0213では,従来機種依存文字扱いになっ
ていたさまざまな文字が含まれているので,これらを使いたい人はうれしいか
もしれません.もちろん,JIS X 0213を表示できるフォントとアプリケーショ
ンが必要ではありますが.

JIS X 0213で表示できる文字については以下を参照してください.

http://www.itscj.ipsj.or.jp/ISO-IR/233.pdf
http://www.itscj.ipsj.or.jp/ISO-IR/229.pdf

また,JIS X 0213ではUnicode(ISO 10646)との対応も規定しているため,それ
にしたがってEUC_JIS_2004,SHIFT_JIS_2004<-->UTF_8の変換も可能にしてあ
ります.ただ,一部の文字はUnicodeのBMP,すなわち16bitで表現できる範囲
をこえていたり(たとえばU+2A6B2),2文字を合成して表示するもの(たとえば
U+02E9+02E5)があったりするので,多くの「Unicode対応」のシステムもこの
あたりでつまずいてしまうかもしれません.

個人的には,JIS X 0213対応をうたっているWindows Vistaに8.3を入れて,
JIS X 0213サポートがきちんと動くかどうか,興味があるところではあります.
どなたか試していただけると嬉しいです.

P.S. JIS X 0201の1バイト片仮名はサポートすることにしました.
--
Tatsuo Ishii
SRA OSS, Inc. Japan

> 石井です.
> 
> 今のところPostgreSQLではJIS X 0213をサポートしていません.しかし,
> Windows がJIS X 0213のサポートを表明するなど
> (http://www.microsoft.com/japan/presspass/detail.aspx?newsid=2353),
> JIS X 0213が普及しつつあるので,そろそろPostgreSQLでもサポートしたいと
> 思います.以下,実装案です.ご意見があればお願いします.
> 
> o バックエンドのエンコーディングとしてはEUC-JPと同じ実装が利用できるが,
>   文字集合がJIS X 0208+JIS X 0212とは異なるし,上位互換でもないため,
>   EUC-JPとは別のエンコーディングとして新たに定義すべき.名称は
>   「EUC_JIS_2004」でよいだろう.
> 
> o JIS X 0201を許すかどうかは微妙なところ.JIS X 0213をサポートするとい
>   う,Windows Vistaではどうなんだろう?
> 
> o UTF-8(ユニコード)とのマッピング表は規格で定義済み.オンラインのマッ
>   ピングが「JISX0213 InfoCenter」
>   (http://www.jca.apc.org/~earthian/aozora/0213.html)で入手可能
> 
> o Shift_JIS-2004をクライアントエンコーディングとして追加,EUC_JIS_2004,
>   UTF-8との変換を行う. Shift_JIS-2004とUTF-8との変換表もJISX0213
>   InfoCenterで入手可能
> 
> ちなみに,JIS X 0213のPostgreSQLでの実装に関しての考察ページを作りまし
> た.「JIS X 0213って何?」って言う方も含め,よろしければこちらをどうぞ.
> http://www2b.biglobe.ne.jp/~caco/pgpage/jisx0213.html
> --
> Tatsuo Ishii
> SRA OSS, Inc. Japan




pgsql-jp メーリングリストの案内