[pgsql-jp: 38069] Re: データ移行時の文字コードエラーについて

Hiroki Kataoka kataoka @ interwiz.jp
2007年 2月 21日 (水) 14:34:15 JST


片岡です。

YuGo wrote:
>> 片岡です。
>>
>> YuGo wrote:
>>> バックアップしても、完全にリストアできないということですか。
>>> 2バイト文字の扱いについて、細かいところまでPostgreSQLに頼ってはいけない
>>> のかなと思いました。
>>  PostgreSQLに何を頼ろうというのでしょう。単に、文字列として間違ったデー
> 
> http://www.postgresql.jp/document/pg801doc/html/multibyte.html
> ここに自動文字セット変換できるとかいてあるので、頼りにしてSJISのsqlテキ
> ストをUTF-8のデータベースに投入したことがあります。

 繰り返しますが、今回の問題の原因は、EUC_JPの文字列として不正なデータが
登録されていることです。エンコーディング変換とは関係ありませんので、どう
か誤解されないよう。

 ちなみに、PostgreSQLのエンコーディング変換機能は、頼りにされていいと思
います。ただしUTF-8と他のエンコーディング間の変換ではユーザ定義文字が変
換できません(エラーになり登録できない)ので、そこだけ注意してください。

-- 
Hiroki Kataoka <kataoka @ interwiz.jp>



pgsql-jp メーリングリストの案内