[pgsql-jp: 37877] Re: lc_collat=Cだとto_tsqueryに日本語が使えない

Tatsuo Ishii ishii @ sraoss.co.jp
2006年 12月 28日 (木) 12:58:55 JST


石井です.

> こんにちは、ヨコロッパと申します
> 
> PostgreSQL 8.2 + GIN + tsearch2 + mecab で
> 日本語の全文検索にチャレンジしています。
> 
> はじめは順調にできたのですが、日本語のソートをするために
> --no-locale付きでinitdb しなおしたところ
> to_tsquery() に日本語が使えなくなってしまいました
> 
> なにか心当たりのある方いらっしゃいますでしょうか

tsearch2はCロケールでは日本語が使えません.これはtsearch2がwcstombsな
どのワイド文字関数にずぶずぶに依存した実装になっているからです.なんと
か直そうとは思い,努力しているところです:-)

ワークアラウンドとしては,to_tsqueryを使わず,

  SELECT * FROM foo WHERE bar @@ tsquery_in('検索語');

などとすればよいでしょう.
--
Tatsuo Ishii
SRA OSS, Inc. Japan



pgsql-jp メーリングリストの案内