[pgsql-jp: 37885] Re: lc_collat=Cだとto_tsqueryに日本語が使えない

Toshihiro Kano kanout @ nttdata.co.jp
2006年 12月 29日 (金) 11:43:51 JST


加納です。

宣伝で申し訳ないですが、日本語の全文検索であれば我々で
開発したLudiaもお試し頂ければ幸いです。

http://sourceforge.jp/projects/ludia/

GINインデックス上に作り直された新しい tsearch2 の分析を行っ
てはいないのですが、大まかに比較すると、

Ludia:
 長所:フレーズ検索に対応しており、早い。
 短所:インデックスの実装としては完全ではないため、ログを取得しない
     →リカバリ時は、インデックスの再作成が必要。

tsearch2:
 長所:contribに収められている安心感。ログも取得すると思われます。
 短所:日本語には未対応。MeCab等を組み合わせても、フレーズ検索は出来ない。

フレーズ検索などについては、下記をご参照ください。
http://d.hatena.ne.jp/tasukuchan/20061016/1161016134
qwik.jp/senna/publication.download/senna-sigmod.pdf

一度、Ludiaもお試し頂ければ幸いです。






pgsql-jp メーリングリストの案内