[pgsql-jp: 38253] Re: postgresql への CP932 系エンコーディングの追加パッチ
MORIYAMA Masayuki
moriyama @ miraclelinux.com
2007年 3月 30日 (金) 21:11:49 JST
森山です。
Tatsuo Ishii wrote:
>>> これは森山さんにお願いしてもよいですか?
>>> それとも私からやりますか?
>> 森山さんがてんぱっているみたいなので、feature freezeに対する
>> プロポーザルを、申し訳ないのですが、石井さんのほうから軽く
>> 投げていただくこと可能でしょうか?
>>
>> そうするととっともうれしいです。
>
> えーそれは構いませんが,このエンコーディングはどういうもので,
> PostgreSQLに追加するとここが嬉しい,っていうのをどっかに書いたものはあ
> りませんか?日本語でもいいのですが.
WIN51932 の詳細は、マイクロソフト自身からは公開されていないようなので、
次のページを参照していただければと思います。
http://legacy-encoding.sourceforge.jp/wiki/index.php?cp51932
http://msyk.at.webry.info/200511/article_2.html
WIN51932 を追加するメリットとしては次のような事を考えています。
PostgreSQL では、日本語のエンコーディングとしては、SJIS と EUC_JP が使用
でき、SJIS は Windows Codepage 932、EUC_JP は、オープングループ日本ベン
ダ協議会 (TOG/JVC)が策定した eucJP-open が実装されています。
LAPP 構成の Web アプリケーションで、データベースエンコーディング、クライ
アントエンコーディング共に EUC_JP を使った場合には、Web ブラウザで
EUC-JP として多く採用されている Windows Codepage 51932 が、そのままデー
タベースに格納されます。
このような状況において、PostgreSQL で SJIS や UTF-8 に変換を行なうと、
eucJP-open と Windows Codepage 51932 では、一部、文字割り当てが異なる
為、他の文字に変換されてしまうという問題が生じてしまいます。
Windows Codepage 51932 (WIN51932) を PostgreSQL に追加する事で、この問題
を解消可能となります。
LAPP 構成のシステムでは、EUC-JP 符号化方式で Web アプリケーションが開発
される事は広く一般的に行なわれているので PostgreSQL に WIN51932 を追加す
る事はメリットがあると思われます。
関連する話題
「[pgsql-jp: 35190] IBM拡張文字の扱いについて」から始まるスレッド
http://ml.postgresql.jp/pipermail/pgsql-jp/2005-April/018750.html
以上、よろしくお願いいたします。
--
森山 将之 <moriyama @ miraclelinux.com>
pgsql-jp メーリングリストの案内