[pgsql-jp: 38241] Re: postgresql への CP932 系エンコーディングの追加パッチ

Tatsuo Ishii ishii @ sraoss.co.jp
2007年 3月 28日 (水) 13:26:49 JST


主に森山さんへ

石井です.

以下の件ですが,以下のパッチをPostgreSQL 8.3に追加することを希望されま
すか?もし希望されるのであれば,feature freezeが今月中なので,今がラス
トチャンスです.

どうしましょう?
--
Tatsuo Ishii
SRA OSS, Inc. Japan

> ミラクルリナックスの森山です。
> 
> IPA 2005年度下期オープンソースソフトウェア活用基盤整備事業のプロジェク
> トとして採択された、「オープンソースソフトウェアにおける統一したレガ
> シーエンコーディングの変換機能の開発」で、作成した、Postgresql 8.1.3
> のキャラクタエンコーディングに WIN51932 (Windows Codepage 51932) を追
> 加するパッチを公開しました。
> 
> パッチファイル:
>   /ostgresql-8.1.3-ja-20060427.patch
> 
> テストフレームワーク:
>   legacy-encoding-0.1.tar.gz
> 
> ダウンロード:
>   以下の場所からダウンロードが可能です。
>   http://sourceforge.jp/projects/legacy-encoding
> 
> このパッチを適用する事により、次の事が実現されます。
> 
> 1) PostgreSQL で Windows Codepage 51932 (Windows の日本語EUC) を直接扱
>    えるようになります。
> 
>    LAPP 環境で、PHP のスクリプトを EUC-JP で記述し、EUC-JP のまま HTTP
>    の入出力を行なう場合、データベースに CP51932 のデータが格納される
> 
>      MySQL の設定
>        データベースのエンコーディング WIN51932
>      PHP の設定
>        mbstring.language = Japanese
>        mbstring.internal_encoding = EUC-JP
>        mbstring.http_output = pass
>        mbstring.http_input = pass
> 
> 2) Windows 上で作成された Unicode とシフトJIS (CP932)、日本語EUC
>    (CP51932、eucJP-ms)、7ビットJIS (ISO-2022-JP-MS) との間で変換可能に
>    なります。
> 
>    具体的には、次の文字の変換が可能になります。
> 
>    文字 SJIS     EUC      Unicode   Unicode での
>          コード値 コード値 コード値  文字の名前
>    ----- -------- -------- ---------  ----------------------
>     ―    0x815C   0xA1BD   U+2015    HORIZONTAL BAR
>     〜    0x8160   0xA1C1   U+FF5E    FULLWIDTH TILDE
>     ‖    0x8161   0xA1C2   U+2225    PARALLELE TO
>     −    0x817C   0xA1DD   U+FF0D    FULLWIDTH HYPHEN-MINUS
>     ¢    0x8191   0xA1F1   U+FFE0    FULLWIDTH CENT SIGN
>     £    0x8192   0xA1F2   U+FFE1    FULLWIDTH POUND SIGN
>     ¬    0x81CA   0xA2CC   U+FFE2    FULLWIDTH NOT SIGN
> 
>     上記の Unicode 値との変換を行なう為には、次のエンコーディングを用
>     いる必要があります。
> 
>       SJIS -> SJIS
>       EUC  -> WIN51932 もしくは EUC_JP
> 
> 追加を行なう各エンコーディングの概要は次の通りです。
> 
> WIN51932 (Windows Codepage 51932)
> --------------------------------
> o Windows で使用されている日本語EUC。
> o EUC-JP の JIS X 0212 およびユーザー定義文字には対応していない。
> o 機種依存文字のコード割り当てが eucJP-ms とは異なる。
> 
> --
> 森山 将之 moriyama @ miraclelinux.com
> ミラクル・リナックス株式会社
> 



pgsql-jp メーリングリストの案内