[pgsql-jp: 38253] Re: postgresql への CP932 系エンコーディングの追加パッチ

MORIYAMA Masayuki moriyama @ miraclelinux.com
2007年 3月 30日 (金) 21:11:49 JST


森山です。

Tatsuo Ishii wrote:
>>> これは森山さんにお願いしてもよいですか?
>>> それとも私からやりますか?
>> 森山さんがてんぱっているみたいなので、feature freezeに対する
>> プロポーザルを、申し訳ないのですが、石井さんのほうから軽く
>> 投げていただくこと可能でしょうか?
>>
>> そうするととっともうれしいです。
> 
> えーそれは構いませんが,このエンコーディングはどういうもので,
> PostgreSQLに追加するとここが嬉しい,っていうのをどっかに書いたものはあ
> りませんか?日本語でもいいのですが.

WIN51932 の詳細は、マイクロソフト自身からは公開されていないようなので、
次のページを参照していただければと思います。

http://legacy-encoding.sourceforge.jp/wiki/index.php?cp51932
http://msyk.at.webry.info/200511/article_2.html

WIN51932 を追加するメリットとしては次のような事を考えています。

PostgreSQL では、日本語のエンコーディングとしては、SJIS と EUC_JP が使用
でき、SJIS は Windows Codepage 932、EUC_JP は、オープングループ日本ベン
ダ協議会 (TOG/JVC)が策定した eucJP-open が実装されています。

LAPP 構成の Web アプリケーションで、データベースエンコーディング、クライ
アントエンコーディング共に EUC_JP を使った場合には、Web ブラウザで
EUC-JP として多く採用されている Windows Codepage 51932 が、そのままデー
タベースに格納されます。

このような状況において、PostgreSQL で SJIS や UTF-8 に変換を行なうと、
eucJP-open と Windows Codepage 51932 では、一部、文字割り当てが異なる
為、他の文字に変換されてしまうという問題が生じてしまいます。

Windows Codepage 51932 (WIN51932) を PostgreSQL に追加する事で、この問題
を解消可能となります。

LAPP 構成のシステムでは、EUC-JP 符号化方式で Web アプリケーションが開発
される事は広く一般的に行なわれているので PostgreSQL に WIN51932 を追加す
る事はメリットがあると思われます。


関連する話題
「[pgsql-jp: 35190] IBM拡張文字の扱いについて」から始まるスレッド
http://ml.postgresql.jp/pipermail/pgsql-jp/2005-April/018750.html

以上、よろしくお願いいたします。

--
森山 将之 <moriyama @ miraclelinux.com>




pgsql-jp メーリングリストの案内