[pgsql-jp: 27601] Re: 他言語の検索

Eiji Tokuya e-tokuya @ sankyo-unyu.jp
2002年 10月 10日 (木) 14:28:00 JST


徳家です。

> 石井です.
> 
> > 私もUTF-8でPostgreSQL+PHP4を業務に使っておりますが、
> > それで特に困った事態に遭遇しておりません。
> > 他言語ということで、バックエンドでsjisやeucに変換しないの
> > であれば、注意すべき点は漢字のソートがUTF-8のコード順です。
> > ASCII順やJIS順になれていると見た目に違和感があるだけです。
> 
> 徳家さんは先刻ご承知のことと思いますが,一般には余り知られていないので
> ,こういう場合の対処方法をご紹介します.
> 
> o UnicodeデータベースをJIS順でソートする方法
> 
> SELECT * FROM t1 ORDER BY CONVERT(col1,'EUC_JP');
> 
> もちろんcol1には日本語(とASCII)以外は含まれていないのが条件です.
> --
> Tatsuo Ishii
> 


既に多言語DBと化してますので、その上での開発しか頭にないもので、
CONVERT関数を利用したソートは、トンと忘れていました。(..;)

SELECT * FROM t1 ORDER BY CONVERT(col1,'LATIN1'....,'EUC_JP','EUC_CN');

などという記述ができるのであれば、使っていたかもしれません。
# ごめんなさい。余計な事を書いてしまった・・・。(^^;;;;

実際に漢字のデータを見た場合、JIS順よりUTF-8の幾つかのブロックに分かれて
いるものの部首別ソートの方が実用的に見えます。五十音順は実際にはフリガナ
が頼りですからね。


徳家



pgsql-jp メーリングリストの案内