[pgsql-jp: 26896] Re: UCS-2 文字を利用したい

MORIGUCHI Hirokazu kito @ mutt.freemail.ne.jp
2002年 8月 4日 (日) 15:24:09 JST


はじめまして。森口といいます。

Javaでの"EUC_JP"はIANAで定義されている"EUC_JP"+半角カナなので、
機種依存文字(Windows依存文字)や外字領域は含まれません。
ので、変換できません。
http://www.iana.org/assignments/character-sets


"SEIJI SUGAHARA/NIDEC" <SEIJI_SUGAHARA @ notes.nidec.co.jp> wrote:

> (ユーザ入力文字 EUC_JP) ⇒ (JSPで文字取得 その際、
>EUC_JP⇒Unicodeに変換 *1) ⇒

携帯端末等を考えなければ、ユーザー入力文字もすべてUTF-8等にして
しまえばすべて解決すると思います。(機種依存文字ではなく、
正式なUnicode文字として処理できるため)

※読み込みだけなら、バイトコードのままEUC→Shift-JIS変換した後
Windows-31Jで読み込む、という手も無くは無いですが、
今度は表示するときに困るのでやはりAll-Unicodeが無難です。

> *1 Javaソース
> String(s.getBytes("8859_1"),"EUC_JP") といった感じで。

これは、昔、日本語(というかUS-ASCII以外)に対応していない
アプリケーションが多かった時代の変換コードなので、
現在のメジャーなアプリケーションではこんな妙なコードは必要ありません。
どこかでエンコーディングを指定できるはずです。

では。


---
稀杜(kito) / 森口宏一(MORIGUCHI Hirokazu)
Email: kito @ kun.ne.jp
Web:  http://hp.vector.co.jp/authors/VA017148/




pgsql-jp メーリングリストの案内