[pgsql-jp: 41863] [ANN] PGroonga 1.0.6 - 高速日本語全文検索機能を提供する拡張機能

Kouhei Sutou kou @ clear-code.com
2016年 4月 19日 (火) 12:44:34 JST


須藤です。

PostgreSQLからGroonga(*)を使うための拡張機能、
PGroonga(ぴーじーるんが)1.0.6をリリースしました!
PGroongaを使うと高速な日本語全文検索機能を使うことができます。

  http://groonga.org/ja/blog/2016/04/15/pgroonga-1.0.6.html

(*) 国産の全文検索エンジン: http://groonga.org/ja/


1.0.3からの主な変更点は次の通りです。

  * 類似文書検索を行う演算子&~?を追加しました。
  * 前方一致検索を行う演算子&^を追加しました。
  * 前方一致RK検索(*)を行う演算子&^~を追加しました。

(*) ローマ字・ひらがな・カタカナ入力でカタカナデータを前方一
    致検索する検索

    http://groonga.org/ja/docs/reference/operations/prefix_rk_search.html


類似文書検索を使うとどういうことができるかというと、たとえば、
ブログで、表示中の記事に関連する記事のリストを出すことができ
ます。

使い方: http://pgroonga.github.io/ja/reference/operators/similar-search-v2.html

ヒント:日本語テキストに対して類似文書検索をするときはデフォ
ルトのN-gramベースのトークナイザーよりもMeCabベースのトーク
ナイザーの方が精度がよくなります。


前方一致検索を使うとどういうことができるかというと、たとえば、
タグ名の入力補完を実現できます。

次のタグがあったときに、「pg」と入力したら「PGroonga」と
「pglogical」を返す、といったことができるようになります。

  * PostgreSQL
  * Groonga
  * PGroonga
  * pglogical

使い方:

  * http://groonga.org/ja/blog/2016/04/15/pgroonga-1.0.6.html
  * http://pgroonga.github.io/ja/reference/operators/prefix-search-v2.html


前方一致RK検索を使うとどういうことができるかというと、たとえば、
ローマ字での駅名の入力補完を実現できます。前方一致RK検索は日
本語のヨミガナで検索することができるからです。

次のデータがあったときに、「sin」や「しn」で「品川」と「新宿」
を返す、といったことができるようになります。

  * 東京(トウキョウ)
  * 品川(シナガワ)
  * 新宿(シンジュク)
  * 池袋(イケブクロ)

使い方:

  * http://groonga.org/ja/blog/2016/04/15/pgroonga-1.0.6.html
  * http://pgroonga.github.io/ja/reference/operators/prefix-rk-search-v2.html

前方一致RK検索は日本語に強いPGroongaならではの機能です。


最後におしらせです。

少し先になりますが、6月9日にはMySQLとPostgreSQLと日本語全文
検索2を開催します。PGroongaに関する情報だけでなく、pg_bigmに
関する情報もあるのでぜひご参加ください。

また、VVAULT AUDITというログ管理ソフトウェアでのPGroongaの利
用事例の紹介もある予定なので、PGroongaの利用事例に興味のある
方もぜひご参加ください。

  * https://groonga.doorkeeper.jp/events/41770



pgsql-jp メーリングリストの案内