[pgcluster: 219] 障害によるスタンドアローン構成への切替検証

2004年 3月 29日 (月) 21:35:50 JST

いつもお世話になっております。
高橋と申します。

「[pgcluster: 190] 障害テスト方法について」の内容と、
大変よく似た検証を行っておりますが、判らない点があります。

【試験内容】
クラスタサーバ2（スレーブ）で異常が発生した場合、
クラスタサーバ1（マスタ）によるスタンドアローン構成に切り替わることを検
証。

【サーバ構成】
　RS：レプリケーションサーバ
　C1：クラスタサーバ1（マスタ）　　<=read writeモード
　C2：クラスタサーバ2（スレーブ）　<=read writeモード
　AP：APサーバ
合計：4台

【手順】
（１）APサーバより、クラスタサーバ1（マスタ）に対して、
　　　1000件のレコードを、連続してinsertする擬似APを実行。
　　　（1件毎にcommit）
（２）擬似AP処理中に、クラスタサーバ2（スレーブ）のLANケーブルを抜く。
　　　　=>即時的に、クラスタサーバ1（マスタ）のスタンドアローン構成に
　　　　　切り替わることを想定。

【結果】
（１）クラスタサーバ1（マスタ）では、障害発生後のinsert処理も行われてお
り、
　　　スタンドアローン構成に切り替わって正常に動作している。
（２）ただし、障害発生直後のinsert処理は、開始から終了まで約16分（955
秒）かかった。
　　　このinsert処理は、pgreplicate.logを確認したところ、
　　　クラスタサーバ2（スレーブ）のエラーを検知したタイミングとほぼ合致
している。

【質問】
同条件で何回か実施しましたが、いずれも上記と同じ結果でした。

クラスタサーバの異常検知には、このくらいの時間がかかるものなのでしょう
か？
それとも、何か設定が悪いのでしょうか？

どなたか情報をお持ちであれば、よろしくお願いします。

/Takahashi, Hiroo