[pgsql-jp: 26476] Re: Invalid EUC_JP character エラー対策
Hajime Lucky Okada
paraiso @ luckyo.8m.com
2002年 6月 23日 (日) 19:52:25 JST
岡田です。
桜井さん、どうもありがとうございます!
ultraking @ anet.ne.jp wrote:
>
> おっしゃる通り、EUC以外の文字チェックを行えばいいと思います。
>
> EUC漢字のコード範囲は
> http://www.hosibune.net/~mak/technical/kanji.shtml
>
> の2.1 JIS X 0208に
> 第1・第2バイトとも0x21〜0x7E(EUCでは0xA1〜0xFE、以下略)ですが
> と書かれているように
> A1A1からFEFEまでとなります(ただしFFxxなどは存在しないので1BYTEづつ範囲チェ
> ックを行う必要があります)
> 確か2BYTE系半角カタカナもこの範囲のはずです、viで入力した後,od -x ファイルで
> 確認してみてください。
このページはすばらしいですね。 ちょっとじっくり読ませて頂きます。
EUC 以外の文字を発見し 例えばそこから後ろを切ってしまう方法、
他の方のお話で「その文字列全体がEUCであるかないか」を判断して
しかるべき処置をするか。。
前者が出来れば理想なんですけどね。
ちょっとパズル的ではあるのですが、うまくいけばまた報告させて頂きます。
岡田はじめ
pgsql-jp メーリングリストの案内