[pgsql-jp: 29962] Re: 40万件有るデー
k_matsui
matsui @ tono-k.jp
2003年 5月 18日 (日) 22:50:29 JST
レスをつけて頂いた皆様、ありがとうございます。マツイです。
まとめての返信で失礼致します。
まず、重複処理は行わずに集計段階ではじくのか、
または応募時に重複処理を行ってDBにinsertするのかを確認してみます。
(個人的にはやはり集計段階のほうが良いような気もしますが)
で、重複処理を行う場合の方法ですが、みなさまのレスを参考にした結果、
create table t1 (
mail_id int,
mail_add text,
constraint cs1 primary key (mail_id,mail_add)
);
または、mail_addにindexを張って
select mail_add from t1 where mail_add = $oubomail
でプログラム側ではじく。
と、この2通りが良さそうなのですが、メリット、デメリットなど
有りますでしょうか?
>どちらにしろ条件のPostgreSQLが古すぎるので できるだけ最新の
>PostgreSQLを使用したほうが良いでしょう。
そんなに速度的に違いがあるものなのでしょうか。
バージョンアップするように薦めてみます。
しかし、今回の件ではおそらく間に合わないと思います。
> あと実体験からですが、メールアドレスは小文字に変換して
> 格納しておく方が無難かと思われます。
まさにその通りですね。
ご忠告ありがとうございます。
pgsql-jp メーリングリストの案内