[pgsql-jp: 38057] Re: データ移行時の文字コードエラーについて
YuGo
yu.gotou @ gtec-ni.com
2007年 2月 21日 (水) 11:46:02 JST
中井 どの
> YuGo wrote:
>> バックアップしても、完全にリストアできないということですか。
>> 2バイト文字の扱いについて、細かいところまでPostgreSQLに頼ってはいけない
>> のかなと思いました。
>
> それは間違っています。基本的にeuc-jpとutf-8の間で完全に1対1の
> 対応が仕様上できていないことに問題があります。
何が間違っているのか、さっぱりわかりません。
PostgreSQLサーバでEUC-JPとUTF-8間の変換ができないとしたら、自分で変換し
て投入しなければいけないということでしょう。
> utf-8の間口が一番広いので、データベース自身のエンコーディングは
> utf-8がベストだと思います。既に入っているデータはどうしようも
> ありません。削除するか似ている文字で代用するとか。
> 必要なことは、Webアプリ側でutf-8に変換できない文字をチェックする
> ことだと思います。Webアプリの内部コードはutf-8に統一して、できる
> だけ早いレベルで入力チェック(変換)することが重要だと思います。
ごもっともな話です。わたし自身もPHPとPostgreSQLでともにUTF-8で運用してい
るためか、文字化けなどのトラブルに遭遇したことはありません。
ただ、わざわざコストをかけて変換をしようとしている人は、それなりの事情が
あって統一できないのではないでしょうか。
YuGo
pgsql-jp メーリングリストの案内