[pgsql-jp: 26475] Re: Invalid EUC_JP character エラー対策

Kazutoshi Kubota yakk @ willbe6.org
2002年 6月 23日 (日) 04:33:23 JST


On Fri, 21 Jun 2002 18:07:34 +0900 (JST),
In Message <20020621.180734.78757442.you @ auxo.dearest.net>
Yu Ooasa <you @ dearest.net> wrote...

> >    うまくこの「EUC文字ではない文字 又は この文字を含む文字列」だけに
> >    マッチする正規表現はないか?

> バタくさいのでよければ…
> EUC-JP 集合はたぶん以下のはずですから(jcode.plより)

> $re_euc_c    = '[\241-\376][\241-\376]';
> $re_euc_kana = '\216[\241-\337]';
> $re_euc_0212 = '\217[\241-\376][\241-\376]';

> 上記以外、とか。

> ruby でも同じですね。gsubで置換とか?

数ヵ月前にちょいと必要になって C で書いたものなら手元にあったのを思い
出しました。たいしたものではないです。

http://www.willbe6.org/files/euc_validator.c に置いてあります。

# 誤解を招くコメントをコード中に書いてあるので補足しておきます  ^^;
# -s (コメントでは strict mode としている)を指定すると、CR/LF/HT を除
# いたコントロールコードも弾くようになります。

-----
Kazutoshi Kubota <yakk @ willbe6.org>,
 and the old one <tu7k-kbt @ asahi-net.or.jp>



pgsql-jp メーリングリストの案内