[pgsql-jp: 41472] Re: ストリーミングレプリケーションのチェックサムエラー

takehiro wada takehiro.wada @ gmail.com
2013年 7月 24日 (水) 23:26:48 JST


初めまして。和田です。

その状態に一度なってしまうとPostgreSQLの機能のみでは再送要求はできないと思います。
一定期間運用ができているとのことなので構成には問題がなさそうですね。
Primary と Seconday でだめなWALファイルに対して cksum や sha1sum を
行っていただきその結果がかわるか試してみてください。

また、async系のオペレーションを極力なくしsync系のみにすればうまくいくかもしれません。

 *経験的なものですが、頻繁にそのような状態になる場合CPUがだめだったりしますので
  BIOSでフルチェックなどの検査を行ってはいかがでしょうか。自宅サーバであるかわかりませんが。。。


2013年7月24日 22:01 長村善行 <osa @ osa-p.net>:
> こんにちは、長村と申します。
>
> CentOS6.4上で、PostgreSQL9.2.4を2台使い、
> ストリーミングレプリケーションの構成にしています。
> その途中で、期待の動作をしてくれずに困っております。
>
> 運用していると、スレーブDB側で
>
> LOG:  1993/98063720のレコード内のリソースマネージャデータのチェックサムが不正です
> FATAL:  管理者コマンドにより WAL 受信プロセスを終了しています
> LOG:  ログファイル"000000010000199300000098"をアーカイブからリストアしました
> LOG:  1993/98063720のレコード内のリソースマネージャデータのチェックサムが不正です
> (以下「リストア」と「チェックサム不正」のメッセージが交互に出る)
>
> というログがでて、ストリーミングが止まってしまいます。
> この状態になってしまうと、スレーブDBを再起動しても同じ状態で、
> また一から(basebackupから)やり直さないと使えない状態になってしまいます。
> 発生頻度が高く、何度かスレーブDBを作り直しているのですが、
> 2週間以上の連続運用が出来た試しがありません。
>
> ディスクが故障しているのかと、スレーブDB側や、アーカイブログを保存している
> NFSサーバのディスクも交換してみたのですが、効果が無いようです。
>
> マスタDB、スレーブDBは自宅サーバとして運用しており、ギガビットの
> イーサネットで接続されています。
> 何とか安定運用をさせたいのですが、原因となるようなものがありますでしょうか?
>
> チェックサムエラーが出た場合に、マスタDBへ再送を要求するような仕組みは
> ないのでしょうか?
>
> よろしくお願いいたします。
>
> --
> +-----------------------------------------------------------------------+
>  NAME :長村善行
>  EMAIL :osa @ osa-p.net
> +-----------------------------------------------------------------------+



-- 
*************************
Name:Takehiro Wada
mail:takehiro.wada @ gmail.com
*************************


pgsql-jp メーリングリストの案内