[pgsql-jp: 38238] Re: JIS X 0213のサポート

Tatsuo Ishii ishii @ sraoss.co.jp
2007年 3月 28日 (水) 12:03:26 JST


石井です.

> 堂前です
> 
> 石井さん wrote:
> 
> > MySQLでは3バイトのUTF-8が処理できないんですか?よかったら情報ポインタを
> > 教えてください.
> 
> 元ソースは不明なのですが
> [mysql 13812] UTF8 問題
> http://www.mysql.gr.jp/mysqlml/mysql/msg/13812
> とかのスレッドになるでしょうか
> #ご存知でしたらすいません

ありがとうございます.

元はこれですかね.

http://www.mysql.gr.jp/mysqlml/mysql/msg/13666

さすがに3バイトのUTF-8はOKで,4バイト以上がダメなようです.

ちょっとおもしろかったのは,その後のスレッドで,

> UTF-16 のサロゲートペアの文字を 3バイト+3バイトで表現する符号化方式は、
> CESU-8 という名前が付けられているようです。
> http://unicode.org/reports/tr26/

# ここで「UTF-16 のサロゲートペアの文字」といっているのは,UTF-8で4バ
# イトになる文字を指します.

「CESU-8」というのを初めて知りました.
--
Tatsuo Ishii
SRA OSS, Inc. Japan



pgsql-jp メーリングリストの案内