[pgsql-jp: 26466] Re: Invalid EUC_JP character エラー対策
Yu Ooasa
you @ dearest.net
2002年 6月 21日 (金) 18:07:34 JST
Fri, 21 Jun 2002 15:29:57 +0900
Hajime Lucky Okada <paraiso @ luckyo.8m.com> said:
>
>2.Postgres からは離れるのですが、読み込ませる前に 例えば Perl の
> フィルターをかけ文字化けの部分は削除してしまう、ということを考えた場合、
> うまくこの「EUC文字ではない文字 又は この文字を含む文字列」だけに
> マッチする正規表現はないか?
バタくさいのでよければ…
EUC-JP 集合はたぶん以下のはずですから(jcode.plより)
$re_euc_c = '[\241-\376][\241-\376]';
$re_euc_kana = '\216[\241-\337]';
$re_euc_0212 = '\217[\241-\376][\241-\376]';
上記以外、とか。
ruby でも同じですね。gsubで置換とか?
--
Yu Ooasa E-mail: you @ dearest.net
pgsql-jp メーリングリストの案内