[pgsql-jp: 39214] Re: 日本語全文検索 textsearch-ja のご紹介

ITAGAKI Takahiro itagaki.takahiro @ oss.ntt.co.jp
2008年 2月 20日 (水) 18:15:14 JST


H.Harada <umi.tanuki @ gmail.com> wrote:

> textsearch-jaでは、Mecabによる分かち書きを利用するとのことですが、
> 8.3の全文検索機能を拡張すれば、N-gramベースの検索も
> 可能なのでしょうか。

現時点でのインフラでは、効率的な N-gram ベースの検索は難しいです。
少なくとも、PostgreSQL 8.3 の素の全文検索や、
この textsearch-ja のみでは実現できません。

プロジェクトのページの末尾にリンクを用意しましたが、既にある拡張モジュール
Ludia (Senna ベース), pgestraier (Hyper Estraier), pgRast (Rast) などでは
N-gram 方式も選択できるようです。N-gram が必須という場合には、
これらの中から選んで使っていくことになるかと思います。

ただ、リカバリや DDL への対応不足などのトレードオフを持つものも
あるようなので、事前に比較はされたほうが良いかもしれません。
性能や機能比較の情報も、ほとんど出回っていないようです。

今のところ、「これさえあれば大丈夫」と言えるまでの
全文検索製品は まだ無いというのが現状です。

------------------------------------------------------------
板垣貴裕 <itagaki.takahiro @ oss.ntt.co.jp>





pgsql-jp メーリングリストの案内