[pgsql-jp: 25230] Re: Windows上JDBC でのエンコーディング

Tsunehisa Kazawa kazawa @ sons.co.jp
2002年 3月 11日 (月) 21:00:38 JST


加澤です。もう少しまとめてからメールしたいのですが、出してから
気がつくことも多くて…。

Tsunehisa Kazawa wrote:
> README.mb.jp に、Unicode との変換テーブルとして Shift JIS 系
> は (JIS0208.TXT ではなく) CP932.TXT を使った、と書いてありまし
> た。申し訳ありません。RTFM を肝に銘じます。

RTFM で README.mb.jp を読んだんですが、そこには、
・現在 Unicode-Shift JIS の相互変換は実装されていない。
・Shift JIS は EUC-JP から変換される。
というように読めました (だとすると CP932.TXT はどこで利用されてい
るのかが不思議です)。

もし上記 README.mb.ja の記述が正しいのであれば、Unicode-EUC-JP 間
では JIS0201.TXT、JIS0208.TXT、JIS0212.TXT の変換テーブルが使わ
れているわけで、Java 側も同様のテーブルを用いた EUC-JP コンバータ
が、さらにそこから変換された Shift JIS ストリームに関しても Java
側は同様のテーブルを使っている SJIS エンコーダが正しい、ということ
になります。

どちらが正しいのでしょうか?

***

とはいえ、上記の問題は backend が Unicode で、かつ Shift JIS や
EUC-JP や UTF-8 などいろいろなエンコーディングでデータを出し入れ
する場合に問題になるだけで、

DB backend 内では EUC-JP を利用していて、そこから単純に (JIS〜.TXT、
CP932.TXT といったマップを使っていったん Unicode を経由するのでは
なく) Shift JIS に変換するのであれば、どちらにせよ SJIS の方が正し
いような気がしますね。

#当初の田中さんのご意見からは大分ハズレてしまっていて申し訳ないです。

-- 
加澤恒央
Tsunehisa KAZAWA
kazawa @ sons.co.jp
SONS,. Ltd. Programmer



pgsql-jp メーリングリストの案内