[pgsql-jp: 41863] [ANN] PGroonga 1.0.6 - 高速日本語全文検索機能を提供する拡張機能
Kouhei Sutou
kou @ clear-code.com
2016年 4月 19日 (火) 12:44:34 JST
須藤です。
PostgreSQLからGroonga(*)を使うための拡張機能、
PGroonga(ぴーじーるんが)1.0.6をリリースしました!
PGroongaを使うと高速な日本語全文検索機能を使うことができます。
http://groonga.org/ja/blog/2016/04/15/pgroonga-1.0.6.html
(*) 国産の全文検索エンジン: http://groonga.org/ja/
1.0.3からの主な変更点は次の通りです。
* 類似文書検索を行う演算子&~?を追加しました。
* 前方一致検索を行う演算子&^を追加しました。
* 前方一致RK検索(*)を行う演算子&^~を追加しました。
(*) ローマ字・ひらがな・カタカナ入力でカタカナデータを前方一
致検索する検索
http://groonga.org/ja/docs/reference/operations/prefix_rk_search.html
類似文書検索を使うとどういうことができるかというと、たとえば、
ブログで、表示中の記事に関連する記事のリストを出すことができ
ます。
使い方: http://pgroonga.github.io/ja/reference/operators/similar-search-v2.html
ヒント:日本語テキストに対して類似文書検索をするときはデフォ
ルトのN-gramベースのトークナイザーよりもMeCabベースのトーク
ナイザーの方が精度がよくなります。
前方一致検索を使うとどういうことができるかというと、たとえば、
タグ名の入力補完を実現できます。
次のタグがあったときに、「pg」と入力したら「PGroonga」と
「pglogical」を返す、といったことができるようになります。
* PostgreSQL
* Groonga
* PGroonga
* pglogical
使い方:
* http://groonga.org/ja/blog/2016/04/15/pgroonga-1.0.6.html
* http://pgroonga.github.io/ja/reference/operators/prefix-search-v2.html
前方一致RK検索を使うとどういうことができるかというと、たとえば、
ローマ字での駅名の入力補完を実現できます。前方一致RK検索は日
本語のヨミガナで検索することができるからです。
次のデータがあったときに、「sin」や「しn」で「品川」と「新宿」
を返す、といったことができるようになります。
* 東京(トウキョウ)
* 品川(シナガワ)
* 新宿(シンジュク)
* 池袋(イケブクロ)
使い方:
* http://groonga.org/ja/blog/2016/04/15/pgroonga-1.0.6.html
* http://pgroonga.github.io/ja/reference/operators/prefix-rk-search-v2.html
前方一致RK検索は日本語に強いPGroongaならではの機能です。
最後におしらせです。
少し先になりますが、6月9日にはMySQLとPostgreSQLと日本語全文
検索2を開催します。PGroongaに関する情報だけでなく、pg_bigmに
関する情報もあるのでぜひご参加ください。
また、VVAULT AUDITというログ管理ソフトウェアでのPGroongaの利
用事例の紹介もある予定なので、PGroongaの利用事例に興味のある
方もぜひご参加ください。
* https://groonga.doorkeeper.jp/events/41770
pgsql-jp メーリングリストの案内