[pgsql-jp: 39317] Re: 'encoding "EUC_JP" has no equivalent in "UTF8"' の理由

Nobuyasu Jinnai (Aset ITM) Nobuyasu.Jinnai @ aset.co.jp
2008年 3月 26日 (水) 23:00:33 JST


神内と申します。

>  もしも現状に疑問を感じるなら、ぜひとも万人が納得できる解を探してみてく
> ださい。:-)

汎用機の時代、日立と富士通は IBM を真似た。
NEC は独自で作った。

とか言い出す御老体がいらっしゃって、そんな簡単な問題ではなかろうと。
#いえ、まだそんな事案は結構あるものなんですよ。iconv が変換できないとか。
UTF にするとまとまっているように感じますが、ソートは無理でしょうね。
だいたいが、アジア圏の国情を分かっていない定義になっている。

そこまで DB に求めるのは無理というもので、もちろん要望としては
ありますが、もう UTF で収めたデータならね。

#この道はいつか来た道とか歌いますよ。

おっと、Postgres と脱線してしまいました。

失礼

--神内


From: Hiroki Kataoka <kataoka @ interwiz.jp>
Subject: [pgsql-jp: 39316] Re: 'encoding "EUC_JP" has no equivalent in "UTF8"' の理由
Date: Wed, 26 Mar 2008 22:58:51 +0900

> 片岡です。
> 
> ITAGAKI Takahiro さんは書きました:
> > ならば、CP51932 と eucJP-open の両方のエンコーディングを作成し、
> > 追加インストール可能なモジュールして配布すればよいだけです。
> > (日本語環境専用なので、コアへ取り込むのはさすがに我侭かもしれませんが)
> 
>  コアに入っていてもいいと思いますし、おそらく反対はされないと思います。
> 
> > また、デフォルトの EUC_JP としては、もしかすると CP51932 のほうを採用すべき
> > だったのかもしれません。美学よりもデファクト・スタンダードを優先したいです。
> 
> # そもそもCP51932ってデファクトスタンダードなの?という、素朴な疑問を持
> つわけですが…
> 
>  PostgreSQLのソースに含まれるREADME.mb.jpの中ほど、「■SJISユーザ定義文
> 字への対応」をお読みになると、その辺りを考える上での参考になるかもしれま
> せん。
> 
> > 問題を正しく認識することなど、解決のための第一歩に過ぎません。
> > 実際に手を動かせるような環境・方向性を作ることが重要でしょう。
> 
>  問題を正しく認識してないことがもっと重大です。そのような状況では解への
> 方向性など導き出せるはずもありません。まずは理解でしょう。
> 
> > どうも多国語関連処理には「現状はどうしようもない」「我慢して使え」
> > という風潮が漂っているのが気になります。Locale 問題を含めて。
> 
>  石井さんも仰ってますが、この辺の問題に関しては「万人が納得できる解がな
> かなかない」のが現状です。「よく分からなくても使える」状況にすぐにはなり
> そうもないのです。ですから私は、ことエンコーディング周りに関しては、より
> 良く理解をしてもらうために解説するよう心がけています。
> 
>  もしも現状に疑問を感じるなら、ぜひとも万人が納得できる解を探してみてく
> ださい。:-)
> 
> -- 
> Hiroki Kataoka <kataoka @ interwiz.jp>



pgsql-jp メーリングリストの案内