[pgsql-jp: 26476] Re: Invalid EUC_JP character エラー対策

Hajime Lucky Okada paraiso @ luckyo.8m.com
2002年 6月 23日 (日) 19:52:25 JST


岡田です。

桜井さん、どうもありがとうございます!

ultraking @ anet.ne.jp wrote:
> 
> おっしゃる通り、EUC以外の文字チェックを行えばいいと思います。
> 
> EUC漢字のコード範囲は
> http://www.hosibune.net/~mak/technical/kanji.shtml
> 
> の2.1 JIS X 0208に
> 第1・第2バイトとも0x21〜0x7E(EUCでは0xA1〜0xFE、以下略)ですが
> と書かれているように
> A1A1からFEFEまでとなります(ただしFFxxなどは存在しないので1BYTEづつ範囲チェ 
> ックを行う必要があります)
> 確か2BYTE系半角カタカナもこの範囲のはずです、viで入力した後,od -x ファイルで 
> 確認してみてください。

このページはすばらしいですね。 ちょっとじっくり読ませて頂きます。

EUC 以外の文字を発見し 例えばそこから後ろを切ってしまう方法、
他の方のお話で「その文字列全体がEUCであるかないか」を判断して
しかるべき処置をするか。。

前者が出来れば理想なんですけどね。

ちょっとパズル的ではあるのですが、うまくいけばまた報告させて頂きます。

岡田はじめ






pgsql-jp メーリングリストの案内