[pgsql-jp: 38006] Re: [tsearch2]日本語のストップワード

Tatsuo Ishii ishii @ sraoss.co.jp
2007年 2月 12日 (月) 16:50:00 JST


石井です.

> こんにちは。佐藤です。
> 
> > しかし,データベース毎に pg_ts_disct を別々にしなければならない,って
> > いうのも面倒ですね.できれば,
> > 
> > contrib/japanese.stop.エンコーディング
> > 
> > でファイルを作っておけば,それを見てくれる仕様だと嬉しいような気がする
> > のですが,いかがでしょう?
> 
> 
> はい、そう思います。しかし以下の調査の結果、私のようなユーザーにはレベ
> ルが高いので、データベース毎に dict_initoption を設定すれば良いだろう
> と思いました。
> 
> 以下のページの「TSEARCH2 CONFIGURATION」を読みますと、dict_initoption 
> は dict_init に登録されている関数の引数であるようです。
> 
> http://www.sai.msu.su/~megera/postgres/gist/tsearch/V2/docs/tsearch-V2-intro.html
> ---- [start] quotation ----
> The dict_init option is used for options passed to the init function
> for the stored procedure.
> ---- [ end ] quotation ----
> 
> snb_en_init は contrib/tsearch2/dict_snowball.c で定義されているようで
> す。これを修正する必要がありそうです。

では,こういうふうに修正したい,というプロポーザルを投げてみます.修正
そのものは大したことないと思います.

> 追伸:
> 
> 以下を読みますと、バージョン 8.3 以降は tsearch2 が PostgreSQL の
> full-text search 機能として標準実装されるようですね。
> 
> http://mira.sai.msu.su/~megera/pgsql/ftsdoc/fts-history.html#FTS-TSEARCHCUR
> 
> 今回のような設定は、将来は full-text search 用の SQL で行うようです。
> 
> http://mira.sai.msu.su/~megera/pgsql/ftsdoc/sql-commands.html

はい,そのような方向で議論されているのは承知しています.そのためのパッ
チが査読中ですが,もうちょっと手直しが必要なようで,開発者側で作業中の
ようです.
--
Tatsuo Ishii
SRA OSS, Inc. Japan



pgsql-jp メーリングリストの案内