[pgsql-jp: 39213] Re: 日本語全文検索 textsearch-ja のご紹介

H.Harada umi.tanuki @ gmail.com
2008年 2月 20日 (水) 17:47:31 JST


原田と申します。

textsearch-jaでは、Mecabによる分かち書きを利用するとのことですが、
8.3の全文検索機能を拡張すれば、N-gramベースの検索も
可能なのでしょうか。

原田

08/02/20 に ITAGAKI Takahiro<itagaki.takahiro @ oss.ntt.co.jp> さんは書きました:
> 板垣です。
>
> PostgreSQL 8.3 用のデータベース組み込み型日本語全文検索モジュール
> textsearch-ja のご紹介です。
> http://textsearch-ja.projects.postgresql.org/index-ja.html
>
> PostgreSQL 8.3 の新機能の中に、全文検索機能があります。
> 以前のバージョンでは contrib/tsearch2 と呼ばれていましたが、
> 8.3 にて本体に統合され、より洗練されました。
> http://www.postgresql.jp/document/current/html/textsearch.html
>
> 多くの言語に対応しているのですが、残念ながらその中に日本語がありません。
> そこで、日本語文書のためのテキストパーサを拡張モジュールとして作成しました。
> textsearch-ja をインストールすることで、日本語文書も検索できるようになります。
>
> 全文検索拡張のための拡張モジュールは他にも既にありますが、
> textsearch-ja の強みとしては、以下の点があるかと思います。
>
>   ・tsearch2 を利用している欧米言語を対象とした製品を
>     大きく改変することなく、日本語対応できる。
>   ・GIN または GiST インデックスをベースにしているため、
>     全文検索用のインデックスがリカバリ可能。
>
> 詳しい使い方などは、前述のプロジェクトホームページをご覧ください。
>
> ------------------------------------------------------------
> 板垣貴裕 <itagaki.takahiro @ oss.ntt.co.jp>
>
>



pgsql-jp メーリングリストの案内