[pgsql-jp: 38005] Re: [tsearch2]日本語のストップワード

SATO Hiroyuki hiroyuki @ navitime.co.jp
2007年 2月 12日 (月) 14:19:26 JST


こんにちは。佐藤です。

> しかし,データベース毎に pg_ts_disct を別々にしなければならない,って
> いうのも面倒ですね.できれば,
> 
> contrib/japanese.stop.エンコーディング
> 
> でファイルを作っておけば,それを見てくれる仕様だと嬉しいような気がする
> のですが,いかがでしょう?


はい、そう思います。しかし以下の調査の結果、私のようなユーザーにはレベ
ルが高いので、データベース毎に dict_initoption を設定すれば良いだろう
と思いました。

以下のページの「TSEARCH2 CONFIGURATION」を読みますと、dict_initoption 
は dict_init に登録されている関数の引数であるようです。

http://www.sai.msu.su/~megera/postgres/gist/tsearch/V2/docs/tsearch-V2-intro.html
---- [start] quotation ----
The dict_init option is used for options passed to the init function
for the stored procedure.
---- [ end ] quotation ----

snb_en_init は contrib/tsearch2/dict_snowball.c で定義されているようで
す。これを修正する必要がありそうです。


追伸:

以下を読みますと、バージョン 8.3 以降は tsearch2 が PostgreSQL の
full-text search 機能として標準実装されるようですね。

http://mira.sai.msu.su/~megera/pgsql/ftsdoc/fts-history.html#FTS-TSEARCHCUR

今回のような設定は、将来は full-text search 用の SQL で行うようです。

http://mira.sai.msu.su/~megera/pgsql/ftsdoc/sql-commands.html




pgsql-jp メーリングリストの案内