[pgsql-jp: 39317] Re: 'encoding "EUC_JP" has no equivalent in "UTF8"' の理由
Nobuyasu Jinnai (Aset ITM)
Nobuyasu.Jinnai @ aset.co.jp
2008年 3月 26日 (水) 23:00:33 JST
神内と申します。
> もしも現状に疑問を感じるなら、ぜひとも万人が納得できる解を探してみてく
> ださい。:-)
汎用機の時代、日立と富士通は IBM を真似た。
NEC は独自で作った。
とか言い出す御老体がいらっしゃって、そんな簡単な問題ではなかろうと。
#いえ、まだそんな事案は結構あるものなんですよ。iconv が変換できないとか。
UTF にするとまとまっているように感じますが、ソートは無理でしょうね。
だいたいが、アジア圏の国情を分かっていない定義になっている。
そこまで DB に求めるのは無理というもので、もちろん要望としては
ありますが、もう UTF で収めたデータならね。
#この道はいつか来た道とか歌いますよ。
おっと、Postgres と脱線してしまいました。
失礼
--神内
From: Hiroki Kataoka <kataoka @ interwiz.jp>
Subject: [pgsql-jp: 39316] Re: 'encoding "EUC_JP" has no equivalent in "UTF8"' の理由
Date: Wed, 26 Mar 2008 22:58:51 +0900
> 片岡です。
>
> ITAGAKI Takahiro さんは書きました:
> > ならば、CP51932 と eucJP-open の両方のエンコーディングを作成し、
> > 追加インストール可能なモジュールして配布すればよいだけです。
> > (日本語環境専用なので、コアへ取り込むのはさすがに我侭かもしれませんが)
>
> コアに入っていてもいいと思いますし、おそらく反対はされないと思います。
>
> > また、デフォルトの EUC_JP としては、もしかすると CP51932 のほうを採用すべき
> > だったのかもしれません。美学よりもデファクト・スタンダードを優先したいです。
>
> # そもそもCP51932ってデファクトスタンダードなの?という、素朴な疑問を持
> つわけですが…
>
> PostgreSQLのソースに含まれるREADME.mb.jpの中ほど、「■SJISユーザ定義文
> 字への対応」をお読みになると、その辺りを考える上での参考になるかもしれま
> せん。
>
> > 問題を正しく認識することなど、解決のための第一歩に過ぎません。
> > 実際に手を動かせるような環境・方向性を作ることが重要でしょう。
>
> 問題を正しく認識してないことがもっと重大です。そのような状況では解への
> 方向性など導き出せるはずもありません。まずは理解でしょう。
>
> > どうも多国語関連処理には「現状はどうしようもない」「我慢して使え」
> > という風潮が漂っているのが気になります。Locale 問題を含めて。
>
> 石井さんも仰ってますが、この辺の問題に関しては「万人が納得できる解がな
> かなかない」のが現状です。「よく分からなくても使える」状況にすぐにはなり
> そうもないのです。ですから私は、ことエンコーディング周りに関しては、より
> 良く理解をしてもらうために解説するよう心がけています。
>
> もしも現状に疑問を感じるなら、ぜひとも万人が納得できる解を探してみてく
> ださい。:-)
>
> --
> Hiroki Kataoka <kataoka @ interwiz.jp>
pgsql-jp メーリングリストの案内