[pgsql-jp: 41471] ストリーミングレプリケーションのチェックサムエラー
長村善行
osa @ osa-p.net
2013年 7月 24日 (水) 22:01:45 JST
こんにちは、長村と申します。
CentOS6.4上で、PostgreSQL9.2.4を2台使い、
ストリーミングレプリケーションの構成にしています。
その途中で、期待の動作をしてくれずに困っております。
運用していると、スレーブDB側で
LOG: 1993/98063720のレコード内のリソースマネージャデータのチェックサムが不正です
FATAL: 管理者コマンドにより WAL 受信プロセスを終了しています
LOG: ログファイル"000000010000199300000098"をアーカイブからリストアしました
LOG: 1993/98063720のレコード内のリソースマネージャデータのチェックサムが不正です
(以下「リストア」と「チェックサム不正」のメッセージが交互に出る)
というログがでて、ストリーミングが止まってしまいます。
この状態になってしまうと、スレーブDBを再起動しても同じ状態で、
また一から(basebackupから)やり直さないと使えない状態になってしまいます。
発生頻度が高く、何度かスレーブDBを作り直しているのですが、
2週間以上の連続運用が出来た試しがありません。
ディスクが故障しているのかと、スレーブDB側や、アーカイブログを保存している
NFSサーバのディスクも交換してみたのですが、効果が無いようです。
マスタDB、スレーブDBは自宅サーバとして運用しており、ギガビットの
イーサネットで接続されています。
何とか安定運用をさせたいのですが、原因となるようなものがありますでしょうか?
チェックサムエラーが出た場合に、マスタDBへ再送を要求するような仕組みは
ないのでしょうか?
よろしくお願いいたします。
--
+-----------------------------------------------------------------------+
NAME :長村善行
EMAIL :osa @ osa-p.net
+-----------------------------------------------------------------------+
pgsql-jp メーリングリストの案内