[pgsql-jp: 39305] Re: 'encoding "EUC_JP" has no equivalent in "UTF8"' の理由

2008年 3月 26日 (水) 12:35:53 JST

片岡です。

樋口佳之 さんは書きました:
> １　両方の変換表に手を加えてうまくいった場合
> 
> euc_jp_to_utf8.map:  {0xfce2, 0xe9ab99},  /*はしごたか*/
> utf8_to_euc_jp.map:  {0xe9ab99, 0xfce2}  /*はしごたか*/

　既存のPostgreSQLのEUC_JPの変換表（つまりeucJP-msの変換表）に、上記のよ
にCP51932向けの変換ルールを部分的に加えていくと、結果的にだんだんめちゃ
くちゃな変換表になっていきます（双方に互換性がないので）。

　ですから、どうせやるならCP51932（ポスグレ的にはwin51932かな？）という
エンコーディングを新設して変換表を作って、そちらを使ったらいいのではない
でしょうか？　あるいは、日本語EUCといえばCP51932しか使わない！というので
あれば、PostgreSQLのEUC_JPをCP51932とみなしてしまって、変換表をすっかり
CP51932向けに書き換えてしまったらどうですか？

　ちなみにCP51932にはIBM拡張文字や外字が扱えませんので、そういう意味では
今まで使えてた文字の一部は使えなくなります。その辺の覚悟も必要です。

-- 
Hiroki Kataoka <kataoka ＠ interwiz.jp>