[pgsql-jp: 37885] Re: lc_collat=Cだとto_tsqueryに日本語が使えない
Toshihiro Kano
kanout @ nttdata.co.jp
2006年 12月 29日 (金) 11:43:51 JST
加納です。
宣伝で申し訳ないですが、日本語の全文検索であれば我々で
開発したLudiaもお試し頂ければ幸いです。
http://sourceforge.jp/projects/ludia/
GINインデックス上に作り直された新しい tsearch2 の分析を行っ
てはいないのですが、大まかに比較すると、
Ludia:
長所:フレーズ検索に対応しており、早い。
短所:インデックスの実装としては完全ではないため、ログを取得しない
→リカバリ時は、インデックスの再作成が必要。
tsearch2:
長所:contribに収められている安心感。ログも取得すると思われます。
短所:日本語には未対応。MeCab等を組み合わせても、フレーズ検索は出来ない。
フレーズ検索などについては、下記をご参照ください。
http://d.hatena.ne.jp/tasukuchan/20061016/1161016134
qwik.jp/senna/publication.download/senna-sigmod.pdf
一度、Ludiaもお試し頂ければ幸いです。
pgsql-jp メーリングリストの案内