[pgsql-jp: 38057] Re: データ移行時の文字コードエラーについて

YuGo yu.gotou @ gtec-ni.com
2007年 2月 21日 (水) 11:46:02 JST


 中井 どの

> YuGo wrote:
>> バックアップしても、完全にリストアできないということですか。
>> 2バイト文字の扱いについて、細かいところまでPostgreSQLに頼ってはいけない
>> のかなと思いました。
> 
> それは間違っています。基本的にeuc-jpとutf-8の間で完全に1対1の
> 対応が仕様上できていないことに問題があります。

何が間違っているのか、さっぱりわかりません。
PostgreSQLサーバでEUC-JPとUTF-8間の変換ができないとしたら、自分で変換し
て投入しなければいけないということでしょう。

> utf-8の間口が一番広いので、データベース自身のエンコーディングは
> utf-8がベストだと思います。既に入っているデータはどうしようも
> ありません。削除するか似ている文字で代用するとか。
> 必要なことは、Webアプリ側でutf-8に変換できない文字をチェックする
> ことだと思います。Webアプリの内部コードはutf-8に統一して、できる
> だけ早いレベルで入力チェック(変換)することが重要だと思います。

ごもっともな話です。わたし自身もPHPとPostgreSQLでともにUTF-8で運用してい
るためか、文字化けなどのトラブルに遭遇したことはありません。
ただ、わざわざコストをかけて変換をしようとしている人は、それなりの事情が
あって統一できないのではないでしょうか。

YuGo





pgsql-jp メーリングリストの案内