[pgsql-jp: 40550] Re: UTF8とSJISの変換でSJISの外字はうまく変換されるでしょうか?

Itagaki Takahiro itagaki.takahiro @ gmail.com
2010年 11月 20日 (土) 20:45:17 JST


2010/11/20 Morita Kazuro <morita @ yuki.ad.jp>:
> 以前、漢字コードは UTF8 を使いたかったんですが、
> 当時SJISの外字(絵文字に使われています)をUTF8への変換がうまくいかず、
> 最終的に EUC_JPを使わざるをえませんでした。
> その後postgreSQLはバージョンが上がって 9.0.1 になりましたが、
> この部分の改良はされているのでしょうか?

変換できないのは、外字領域のマッピングは SJIS⇔EUC だけは
サポートされていますが、UTF8 とのマッピングは未だありません。

外付けのモジュールでマッピングを追加する EUDC というものが
ありますので、UTF8 を使う場合はこちらを試してみてください。
http://textsearch-ja.projects.postgresql.org/eudc.html

そういえば、こんど新しく UTF8 にも絵文字が追加されるんでしたっけ?
もし「公式な」マッピングが定義されるならば、本家のエンコーディング
にも絵文字のマッピングを追加するのは可能だとは思います。

-- 
Itagaki Takahiro


pgsql-jp メーリングリストの案内