[pgsql-jp: 41471] ストリーミングレプリケーションのチェックサムエラー

長村善行 osa @ osa-p.net
2013年 7月 24日 (水) 22:01:45 JST


こんにちは、長村と申します。

CentOS6.4上で、PostgreSQL9.2.4を2台使い、
ストリーミングレプリケーションの構成にしています。
その途中で、期待の動作をしてくれずに困っております。

運用していると、スレーブDB側で

LOG:  1993/98063720のレコード内のリソースマネージャデータのチェックサムが不正です
FATAL:  管理者コマンドにより WAL 受信プロセスを終了しています
LOG:  ログファイル"000000010000199300000098"をアーカイブからリストアしました
LOG:  1993/98063720のレコード内のリソースマネージャデータのチェックサムが不正です
(以下「リストア」と「チェックサム不正」のメッセージが交互に出る)

というログがでて、ストリーミングが止まってしまいます。
この状態になってしまうと、スレーブDBを再起動しても同じ状態で、
また一から(basebackupから)やり直さないと使えない状態になってしまいます。
発生頻度が高く、何度かスレーブDBを作り直しているのですが、
2週間以上の連続運用が出来た試しがありません。

ディスクが故障しているのかと、スレーブDB側や、アーカイブログを保存している
NFSサーバのディスクも交換してみたのですが、効果が無いようです。

マスタDB、スレーブDBは自宅サーバとして運用しており、ギガビットの
イーサネットで接続されています。
何とか安定運用をさせたいのですが、原因となるようなものがありますでしょうか?

チェックサムエラーが出た場合に、マスタDBへ再送を要求するような仕組みは
ないのでしょうか?

よろしくお願いいたします。

-- 
+-----------------------------------------------------------------------+
 NAME :長村善行
 EMAIL :osa @ osa-p.net
+-----------------------------------------------------------------------+


pgsql-jp メーリングリストの案内