[pgsql-jp: 26475] Re: Invalid EUC_JP character エラー対策
Kazutoshi Kubota
yakk @ willbe6.org
2002年 6月 23日 (日) 04:33:23 JST
On Fri, 21 Jun 2002 18:07:34 +0900 (JST),
In Message <20020621.180734.78757442.you @ auxo.dearest.net>
Yu Ooasa <you @ dearest.net> wrote...
> > うまくこの「EUC文字ではない文字 又は この文字を含む文字列」だけに
> > マッチする正規表現はないか?
> バタくさいのでよければ…
> EUC-JP 集合はたぶん以下のはずですから(jcode.plより)
> $re_euc_c = '[\241-\376][\241-\376]';
> $re_euc_kana = '\216[\241-\337]';
> $re_euc_0212 = '\217[\241-\376][\241-\376]';
> 上記以外、とか。
> ruby でも同じですね。gsubで置換とか?
数ヵ月前にちょいと必要になって C で書いたものなら手元にあったのを思い
出しました。たいしたものではないです。
http://www.willbe6.org/files/euc_validator.c に置いてあります。
# 誤解を招くコメントをコード中に書いてあるので補足しておきます ^^;
# -s (コメントでは strict mode としている)を指定すると、CR/LF/HT を除
# いたコントロールコードも弾くようになります。
-----
Kazutoshi Kubota <yakk @ willbe6.org>,
and the old one <tu7k-kbt @ asahi-net.or.jp>
pgsql-jp メーリングリストの案内