[pgsql-jp: 26467] Re: Invalid EUC_JP character エラー対策

KAWAI,Takanori GCD00051 @ nifty.ne.jp
2002年 6月 21日 (金) 18:10:40 JST


川合孝典です。

----- Original Message -----
From: "Hajime Lucky Okada" <paraiso @ luckyo.8m.com>
To: <pgsql-jp @ ml.postgresql.jp>
Sent: Friday, June 21, 2002 3:29 PM
Subject: [pgsql-jp: 26464] Invalid EUC_JP character エラー対策


> こんにちは、岡田と申します。
>
> ある元データの CSV ファイルを \copy コマンドで Postgres に
> データを吸い上げようとしているのですが、元ネタの品質が悪く
> ERROR:  copy: line 2226, Invalid EUC_JP character sequence found (0xe16e)
> というエラーが出て失敗します。
(中略)
> 2.Postgres からは離れるのですが、読み込ませる前に 例えば Perl の
>     フィルターをかけ文字化けの部分は削除してしまう、ということを考えた場
合、
>     うまくこの「EUC文字ではない文字 又は この文字を含む文字列」だけに
>     マッチする正規表現はないか?
具体的なコードは思いつきませんが、大崎さんの「Perlメモ」でもご覧に
なってみては?
文字の正規表現や文字が切れているかどうかなど、さまざまな
サンプルがありますから。

Perlメモ
http://www.din.or.jp/~ohzaki/perl.htm#JP

===================================================
川合 孝典 (Hippo2000)
   DBI日本語メーリングリスト管理人、Kansai.pm所属
   kwitknr @ cpan.org GCD00051 @ nifty.ne.jp
   http://member.nifty.ne.jp/hippo2000、http://www.hippo2000.info/
ホームページ開設に関するアンケート実施中
   http://www.hippo2000.info/vote.htm
===================================================




pgsql-jp メーリングリストの案内