[pgsql-jp: 39308] Re: 'encoding "EUC_JP" has no equivalent in "UTF8"' の理由

Tatsuo Ishii ishii @ sraoss.co.jp
2008年 3月 26日 (水) 13:21:15 JST


石井です.

> Hiroki Kataoka <kataoka @ interwiz.jp> wrote:
> 
> > > 基本的には UTF8 は EUC_JP や SJIS を含む文字セット(スーパーセット)
> > > だと思っていますが、この認識であっているでしょうか?
> > 
> >  その点では合っていますが、
> 
> それならば安心しました。

現場の立場からすると,それでは安心できません.とにかくUTF-8に変換でき
ればOK,って考えている人もいるようですが,実際にはそう簡単ではないです.

たとえば,SJISなりEUCなり,とにかくUTF-8ではない,クライアントエンコー
ディングを使っているアプリがあるとします.何かデータを入力してDBに格納
し,確認のために再びDBから読み出して表示する,といったごくごく基本的な
処理をしようとしたときに,いわゆるround trip conversionが正しくできな
ければ,たちまち破綻します.
# 顧客からのクレーム続出間違いなし:-)

そこまで考えると,結構難しいと言うか,万人が納得できる解がなかなかな
い,っていうことです.ちなみに,私自身も案件によっては,カスタムCREATE
CONVERSIONで対応してますが,これはこれでいろいろ制限事項が出てくるので
(たとえば新たにround trip conversionでなくなる文字が出てくるとか),顧
客に対するきちんとした説明は欠かせません.
--
Tatsuo Ishii
SRA OSS, Inc. Japan



pgsql-jp メーリングリストの案内