[pgsql-jp: 39310] Re: 'encoding "EUC_JP" has no equivalent in "UTF8"' の理由
Tatsuo Ishii
ishii @ sraoss.co.jp
2008年 3月 26日 (水) 14:36:18 JST
石井です.
> 私の場合、サーバーのエンコーディングをEUC_JPからUTF8に切り替えたいという
> 1度切りと思われる必要性でこの作業を試しています。
> その後は、UTF8とSJISでの相互の変換がうまくいけばいいのではと考えています。
> 一度UTF8に乗り換えたら、その後は、eucJP-msも、CP51932も必要性がなくなる
> のではと思っているのです。業務にpostgresを取り入れた頃には、サーバのエン
> コーディングは取り敢えずEUC_JPにしておけば一番簡単そうだったということで
> このエンコーディングを選びましたが、今後このエンコーディングを積極的に利
> 用する場面はないのではないかと思います。
> 甘いでしょうか?
一つ思いつくのは,漢字でソートしたいときですね.EUCなりSJISでは,安直
に漢字のコードポイントでソートしても,結構それなりの順に並んでくれます.
UTF-8(というか,Unicodeのコードポイントでは,と言った方が正確ですが)で
は,そのあたりは期待できません.
もちろん,読みをデータとして持って,それでソートするなら問題なしですが.
> それから、大変恐縮ですが、例えば「はしごたか」のような文字が、
> eucJP-ms
> CP51932
> UTF8
> で、それぞれどんなコードになるのかわかるような資料とか、参考になるホーム
> ページとかありましたら教えていただけないでしょうか?
UNICODEなら当然http://www.unicode.org/でしょう.
それ以外のは,原典がどこにあるのかわたしは分かりません.
--
Tatsuo Ishii
SRA OSS, Inc. Japan
pgsql-jp メーリングリストの案内