[pgsql-jp: 35228] 文字コードのトラブルを解消する方法

tomson tomson_lpcjp @ yahoo.co.jp
2005年 4月 11日 (月) 19:27:46 JST


tomsonと言います。

文字コード、文字化けの話題が非常に多いですが、これを上手く解消する方法を
考えてみました。

原因

1.文字コード、採用している文字変換テーブルの作りが、ベンダーによって、
OSによってばらばらである

2.Unicodeという統一された文字コード体系があるが、じつはこれも真に統一さ
れているとは言えない。

3.UnicodeをOSが使用する標準の文字コードとして採用していない。

4.各ベンダーが、「自社の製品」というエゴをもっているため、なかなか同じに
しようとしない。

そもそも、情報を正しく扱ったり伝えたりするようにするのが、情報システムと
かが出来た理由ではないでしょうか。「自社の製品」「おれの作ったもの」はま
た別の次元の話であり、システムの開発者は、それを使用する人間が使いやすい
ようなシステムを作るべきではないでしょうか。

とはいえ、歴史的な経緯もあり、文字コードが統一されていない、という現実が
あるのは致し方ありません。

世の中が競争原理で回っているかぎり、これは解消しないでしょう。つまり永遠
に(人間がこの世にある限り)解決しないのは、致し方ありません。

だれでも、人に勝ちたいからです。
真に統一された体系などは、幻想にすぎないのかもしれません。


解消方法

1.文字コードの違いを吸収し、各文字コードの差分を分析して統一する新たなク
ラスのようなものを考える。

例えば、このクラスのインスタンスを作るとき、そのマシンで使用している文字
コードと、他のネットワークノードで使用している文字コードを比較し、あたら
しい文字テーブルを生成し、文字コードにはこれをつかう。



pgsql-jp メーリングリストの案内