[pgcluster: 219] 障害によるスタンドアローン構成への切替検証

高橋 hiroo-t @ po.ntts.co.jp
2004年 3月 29日 (月) 21:35:50 JST


いつもお世話になっております。
高橋と申します。

「[pgcluster: 190] 障害テスト方法について」の内容と、
大変よく似た検証を行っておりますが、判らない点があります。

【試験内容】
クラスタサーバ2(スレーブ)で異常が発生した場合、
クラスタサーバ1(マスタ)によるスタンドアローン構成に切り替わることを検
証。

【サーバ構成】
 RS:レプリケーションサーバ
 C1:クラスタサーバ1(マスタ)  <=read writeモード
 C2:クラスタサーバ2(スレーブ) <=read writeモード
 AP:APサーバ
合計:4台

【手順】
(1)APサーバより、クラスタサーバ1(マスタ)に対して、
   1000件のレコードを、連続してinsertする擬似APを実行。
   (1件毎にcommit)
(2)擬似AP処理中に、クラスタサーバ2(スレーブ)のLANケーブルを抜く。
    =>即時的に、クラスタサーバ1(マスタ)のスタンドアローン構成に
     切り替わることを想定。

【結果】
(1)クラスタサーバ1(マスタ)では、障害発生後のinsert処理も行われてお
り、
   スタンドアローン構成に切り替わって正常に動作している。
(2)ただし、障害発生直後のinsert処理は、開始から終了まで約16分(955
秒)かかった。
   このinsert処理は、pgreplicate.logを確認したところ、
   クラスタサーバ2(スレーブ)のエラーを検知したタイミングとほぼ合致
している。

【質問】
同条件で何回か実施しましたが、いずれも上記と同じ結果でした。

クラスタサーバの異常検知には、このくらいの時間がかかるものなのでしょう
か?
それとも、何か設定が悪いのでしょうか?

どなたか情報をお持ちであれば、よろしくお願いします。

/Takahashi, Hiroo




pgcluster メーリングリストの案内