[pgsql-jp: 39211] 日本語全文検索 textsearch-ja のご紹介

ITAGAKI Takahiro itagaki.takahiro @ oss.ntt.co.jp
2008年 2月 20日 (水) 16:21:18 JST


板垣です。

PostgreSQL 8.3 用のデータベース組み込み型日本語全文検索モジュール
textsearch-ja のご紹介です。
http://textsearch-ja.projects.postgresql.org/index-ja.html

PostgreSQL 8.3 の新機能の中に、全文検索機能があります。
以前のバージョンでは contrib/tsearch2 と呼ばれていましたが、
8.3 にて本体に統合され、より洗練されました。
http://www.postgresql.jp/document/current/html/textsearch.html

多くの言語に対応しているのですが、残念ながらその中に日本語がありません。
そこで、日本語文書のためのテキストパーサを拡張モジュールとして作成しました。
textsearch-ja をインストールすることで、日本語文書も検索できるようになります。

全文検索拡張のための拡張モジュールは他にも既にありますが、
textsearch-ja の強みとしては、以下の点があるかと思います。

  ・tsearch2 を利用している欧米言語を対象とした製品を
    大きく改変することなく、日本語対応できる。
  ・GIN または GiST インデックスをベースにしているため、
    全文検索用のインデックスがリカバリ可能。

詳しい使い方などは、前述のプロジェクトホームページをご覧ください。

------------------------------------------------------------
板垣貴裕 <itagaki.takahiro @ oss.ntt.co.jp>




pgsql-jp メーリングリストの案内