[pgsql-jp: 35232] Re: 文字コードのトラブルを解消する方法

水野 圭 kiyoshi_mizuno @ mail.toyota.co.jp
2005年 4月 12日 (火) 07:55:34 JST


水野です。

> 2.Unicodeという統一された文字コード体系があるが、じつはこれも真に統一さ
> れているとは言えない。
> 
> 3.UnicodeをOSが使用する標準の文字コードとして採用していない。

ここら辺はUnicodeの規格の複雑さが影響している部分も多々あるでしょうね。
単に「Unicode」といっても文字集合(規格で取り扱うと決めた文字の集まり)が
UCS-2とUCS-4の2種類あったり、エンコーディング
(文字集合とコードとの対応表)もUTF-8、UTF-16、UTF-32などと複数あったり
するので一言「Unicode対応しろ」と言われても実務担当者はとっても大変だと思います。
#私の身に降りかからない事を祈るばかりである

UNICODEの登場時に「16ビットで世界中のすべての文字を表す」という壮大な(笑)
謳い文句がありましたが、あれは文字集合にUCS-2を採用したためで、結局その後
「やっぱ16ビット(正確には65536文字)じゃ足りん」という事でUCS-4(32bit相当)が
定義されました。UCS-4では理論上2^32文字を規定できて確か半分以上はまだ
空き領域なので、全部はともかくかなりの言語を1つの文字集合で定義できるのでは
ないかと期待してます。




pgsql-jp メーリングリストの案内