[pgcluster: 801] Re: pglb の仕様が疑問があります

Atsushi Mitani a.mitani @ sra-europe.com
2005年 8月 16日 (火) 19:47:46 JST


三谷@オランダです。

>システムの起動方法は、
>1. レプリケーションサーバの起動
>2. クラスタDBの起動
>3. pglbの起動
>の順で起動するとあります。
1と2の順番はどっちでも良いというか、1.1以降はクラスタDBを先に起動した方が良いです。
というのは、これらのバージョンではレプリケーションサーバをカスケード接続するためのソースが一部入っているためです。

>クラスタDBを全て停止した場合もレプリケーションサーバはすでに起動してお
>り、1までは終わっている状態と同じと考え、2.クラスタDBの起動 から行えば
>よいと思うのですが、何故レプリケーションサーバも再起動する必要があるの
>でしょうか?
レプリケーションサーバにもクラスタDBの状態を保持しており、これもクラスタDBがリカバリーモードで追加されないとこれらの状態が更新されないためです。
クラスタDBを全部止め、全部立ち上げると言う作業は、システムの再起動と同じだと考えています。したがって、その場合はレプリケーションサーバやロードバランサが保持している状態データもクリアにしてやる必要があります。

レプリケーションサーバやロードバランサに対して、「保持状態初期化通知」というものを作ればよいのかも知れませんが、誰がどのタイミングで出すのか、という問題があります。
システムの再起動は手動で行うというのは、システム全体を管理するためのツールが無いためでもあります。

レプリケーションや負荷状況を監視したり、動的にロードバランスの重みづけを変更したり、動的にクラスタDBの追加・削除をコントロールできるような管理ツールが必要だと思っています。

できればインストールや動作チェックを自動的に行うようなツールも欲しいところです。

まだまだ足りないものが沢山あり、周辺ツールの整備等も今後の課題だと思っています。

まずは高負荷時の動作の安定化に注力しており、手が回らない状況なのですが、開発協力を申し出てくれるボランティアもいますので、少しづつ改善されると思っています。




pgcluster メーリングリストの案内