[pgsql-jp: 36214] Re: pg_clogディレクトリ内のログが参照できずPANIC

Kiyoshi Mizuno kiyoshi_mizuno @ mail.toyota.co.jp
2005年 10月 19日 (水) 19:22:51 JST


水野です。

> -----Original Message-----
> 今回のシステムでは、代替するサーバがない為、memtest86を実施中は、
> サービスを止めなければならないという事情がございます。

という事はマシンやディスクがまったく二重化されていない?
止められないサービスをそのようなハード環境で運用するのは無謀ですよ。
【例:HDDがいきなりオシャカになった場合】
1.HDDを交換する
2.OSをインストールする
3.サービスをセットアップする
4.バックアップしてあったデータをリストアする
5.バックアップ時点からクラッシュ時点までの状態差分を
 手作業などで反映する
この5ステップを行うには半日はかかると思います。
5番に至っては実際のところ実施不可能な事も多いでしょう。
(ある程度ハードが二重化されていないと5番は実施できない)


>  * やはり何かしらのハードウェアトラブルが発生しているのでしょうか。

ハードが壊れている事は「ハードを交換したら起きなくなった」という
検証結果が得られて初めて断定できるようになります。
それまでは可能性でしか話をできません。
なおハードが原因の場合、今は「不安定」ですがそのうち「確実に」
ディスクの読み書きができなくなります。
逆にハードを変えてもPANICしたらソフトの問題である可能性が
非常に高くなります。
(パソコンは大量ロットで生産しますから「交換したハードも同じように
 壊れている」というケースはたまにあります)

>  * この事象が発生したのは、postgresql.confに以下の設定を付与してから、
>   (たまたまかもしれませんが)発生しています。

統計情報の収集が直接PostgreSQLのPANICに関与している
可能性は低いと思います。
というのも統計情報の収集はパフォーマンスチューンのために
みんなよくやっている事ですから、これが原因なら他所でも
いっぱい起きていると思われるからです。
ただ
 収集した統計情報はディスクに保存する
   →ディスクアクセスが増えてI/O負荷がかかる
     →結果的にvacuumの時PANICに至った
という仮説も立てられるので、完全に無関係とは言い切れないです。




pgsql-jp メーリングリストの案内