[pgsql-jp: 26466] Re: Invalid EUC_JP character エラー対策

Yu Ooasa you @ dearest.net
2002年 6月 21日 (金) 18:07:34 JST


Fri, 21 Jun 2002 15:29:57 +0900
	Hajime Lucky Okada <paraiso @ luckyo.8m.com> said:
>
>2.Postgres からは離れるのですが、読み込ませる前に 例えば Perl の
>    フィルターをかけ文字化けの部分は削除してしまう、ということを考えた場合、
>    うまくこの「EUC文字ではない文字 又は この文字を含む文字列」だけに
>    マッチする正規表現はないか?

バタくさいのでよければ…
EUC-JP 集合はたぶん以下のはずですから(jcode.plより)

$re_euc_c    = '[\241-\376][\241-\376]';
$re_euc_kana = '\216[\241-\337]';
$re_euc_0212 = '\217[\241-\376][\241-\376]';

上記以外、とか。

ruby でも同じですね。gsubで置換とか?
--
Yu Ooasa  E-mail: you @ dearest.net



pgsql-jp メーリングリストの案内