[pgsql-jp: 30762] 漢字3とは

Toshio Uchiyama uchiyama @ shonan.homeunix.org
2003年 8月 13日 (水) 00:42:33 JST


お世話になります。内山と申します。

	先日、漢字3 とは何? というメールを見かけて、偶然、漢字3の謎が
解けましたので、メールさせていただきます。

	私の使っているデータは、元は、Windows 2000 professional で入力
されたものです。これを、自宅の FreeBSD 4.8R + PostgreSQL 7.3.3 でデータ
処理しようと思い、入力されたデータをアスキーモードの frp で、FreeBSD 4.8R
に put し、nkf -e して、EUC に変換したところ、若干ですが、うまく変換できない
文字があることに気づきました。nkf は、そこまでの変換を保障しないソフトなので
仕方がないです。そこで、どんな文字が、これに当たるのか考えてみたところ、氏名
で、凝った漢字を使っている場合が圧倒的に多いことが分かりました。たとえば、
ニンベンに春や、ニンベンに京都の京などが、これに当たります。いわゆる、機種依存文字と
言えば分かりやすいと思いますが、windows 上でしか使えない文字と推測されます。
	下名は、Windows XP pro をメールの読み書きに使っていますが、XP pro にはIMEパッド
というかな漢字変換プロセッサがあり、これにある「文字一覧」という項目に、漢字3 という特殊
な項目があることを発見しました。ここには、(株)を全角一文字で表してしまうフォント(記号)
があったり、TEL を全角一文字で表してしまうフォント(記号)があったりします。既出の
ニンベンに春や、ニンベンに京も同じです。これは、Microsoft が独自に用意した漢字で
あり、JIS 漢字にはありません。推測するにEUC にもないでしょう。これぞ、機種依存文字と
言って良いでしょう。これが、漢字3 の正体と考えられます。最後に、Unix や、Mac を使って
いる方には、文字化けすることを承知で、敢て、これらの文字をメールに載せておきます。

ニンベンに春→〓
ニンベンに京→〓
(株)→(株)
TEL→Tel

などです。windows クライアントがこれだけ、浸透してしまった以上、windows 環境で
仕事をしているクライアントは、これらの文字が使えて当然と思うでしょう。しかし、
windows 以外では、使えないと考えられます。
	PostgreSQL の windows 版が、encoding に何を採用するかは、下名は知りませんが、
SQL server は、これらの漢字をサポートしていると推測されるので(Oracle がどうか知りません)、
windows 上で動作し、フリーでないデータベースなので、顧客からは、対応を求められる
可能性が出てくるような気がします。
	下名が知る限り、Unicode は、全世界の文字を統一して扱おうという発想なので、
こんな特殊な文字は扱えないと思います。multibyte 文字がサポートしているかどうか
情報があったら、ご教示願えれば幸いです。
	このメールを書いていて、JPNIC が提供する予定の日本語ドメインは、
encoding に何を使うのかも興味が湧いてきました。

							以上です。

----
内山敏郎
uchiyama @ agent.homeunix.org
http://agent.homeunix.org/




pgsql-jp メーリングリストの案内