[pgsql-jp: 38470] Re: 文字コードの変換で問題

Tatsuo Ishii ishii @ sraoss.co.jp
2007年 6月 7日 (木) 23:45:52 JST


石井です.

> 片岡です。
> 
> Tatsuo Ishii さんは書きました:
> >> PostgreSQL側で何かもっとシンプル対応できないものでしょうか。
> > 
> > PostgreSQLのCREATE CONVERSIONで自前のコード変換をするようにすれば,ど
> > のようにでも対応できますよ.
> 
>  正直なところ、その方法はシンプルな対応とは思えませんが、どうでしょう?

はい,「オプション設定で一発OK」のようなシンプルな方法ではありません.
ただ,これは問題自体が実はそんなにシンプルではないので,解もシンプルに
ならない,ということだと思います.

>  新しい変換を行いたいのなら、まさしくその方法が王道だと思いますが、今回
> はエラー文字(変換できない文字)の扱いに過ぎません。
> 
>  変換できない文字に出会ったときに、下駄文字に変換するようなオプションが
> あったら、もしかしたらうれしい人もいるのかと、いま思いました。

それはどうなんでしょう?

代替文字に置き換えることで対応しても,次は「一律同じ代替文字ではなくA
ならBに置き換えるようなことにできない?」とか,更には「EUC-JP -> UTF-8 
の変換と,UTF-8 -> EUC-JP の変換を非対称にしてくれ」とか顧客の要求は限
りがないものです.
# 最後の例は,「WAVE DASH」や「MINUS SIGN」などをできるだけうまく扱お
# うとすると発生することがあります.

更に気になるのがセキュリティ.代替文字に置き換えることを利用したSQLイ
ンジェクションが成立しそうな気がします.
--
Tatsuo Ishii
SRA OSS, Inc. Japan



pgsql-jp メーリングリストの案内