[pgsql-jp: 29962] Re: 40万件有るデー

k_matsui matsui @ tono-k.jp
2003年 5月 18日 (日) 22:50:29 JST


レスをつけて頂いた皆様、ありがとうございます。マツイです。
まとめての返信で失礼致します。

まず、重複処理は行わずに集計段階ではじくのか、
または応募時に重複処理を行ってDBにinsertするのかを確認してみます。
(個人的にはやはり集計段階のほうが良いような気もしますが)

で、重複処理を行う場合の方法ですが、みなさまのレスを参考にした結果、
create table t1 (
mail_id int,
mail_add text,
constraint cs1 primary key (mail_id,mail_add)
);

または、mail_addにindexを張って
select mail_add from t1 where mail_add = $oubomail
でプログラム側ではじく。

と、この2通りが良さそうなのですが、メリット、デメリットなど
有りますでしょうか?

>どちらにしろ条件のPostgreSQLが古すぎるので できるだけ最新の
>PostgreSQLを使用したほうが良いでしょう。

そんなに速度的に違いがあるものなのでしょうか。
バージョンアップするように薦めてみます。
しかし、今回の件ではおそらく間に合わないと思います。

> あと実体験からですが、メールアドレスは小文字に変換して
> 格納しておく方が無難かと思われます。

まさにその通りですね。
ご忠告ありがとうございます。






pgsql-jp メーリングリストの案内