[Linux-ha-jp] リソースが起動しない場合・リソースを終了させられない場合 について

アーカイブの一覧に戻る

坂井田保彦 yasuh****@gmail*****
2008年 2月 26日 (火) 17:53:26 JST


坂井田と申します。
ご存じの方がいらっしゃいましたら、2つほど教えていただけないでしょうか?

(1)リソース起動用スクリプトが起動しない場合の条件について
heartbeatは管理下のリソースを起動させるために/etc/ha.d/resource.d/、/etc/init.d/の
起動スクリプトを実行させようとすると思いますが、実行しない場合があり困っています。
実行するための条件というものがあるのでしょうか?

具体的にはpostgreSQL 8.2.6のスクリプトが起動しません。
このスクリプトはソースからpostgreSQLを入れたときに

cp /usr/local/src/postgresql-8.2.6/contrib/start-scripts/linux
/etc/rc.d/init.d/postgresql

として、コピーしたものです。

スクリプトはそれ単体で起動することを確認しています。
/etc/init.d/postgresql start と入力した場合には起動します。
また、何かの理由でPIDファイルが残っていてpostgresが起動しない、というわけではありませんでした。


(2)リソースを終了させられない場合の挙動について
文末の2つのログについて教えていただけないでしょうか。
heartbeatの管理リソースとしてpostgreSQLを起動しています。

ログはResourceManagerがpostgreSQLプロセスを終了させられないためにheartbeatが異常終了している、ということだと思いますが
heartbeatがOSをリブートさせる場合と、させない場合があります。どのような違いでこういう動作をするのでしょうか?


この現象は

	1.heartbeatが起動中に手動でpostgresqlサービスをストップ。
	2.heartbeatを手動でストップさせる。
	3.heartbeatは管理リソースであるpostgresqlをストップさせようとさせる。
	4.しかし、すでにpostgresqlはストップしているため終了させられない。

という場合に起こるようです。


■OSリブートする場合
ResourceManager[6477]:	2008/02/24_04:11:10 info: Releasing resource
group: node1 drbddisk Filesystem::/dev/drbd0::/data::ext3
192.168.1.1/24 postgresql
ResourceManager[6477]:	2008/02/24_04:11:10 info: Running
/etc/init.d/postgresql  stop
ResourceManager[6477]:	2008/02/24_04:12:12 ERROR: Return code 1 from
/etc/init.d/postgresql
ResourceManager[6477]:	2008/02/24_04:12:13 info: Retrying failed stop
operation [postgresql]
ResourceManager[6477]:	2008/02/24_04:12:13 info: Running
/etc/init.d/postgresql  stop
ResourceManager[6477]:	2008/02/24_04:13:15 ERROR: Return code 1 from
/etc/init.d/postgresql
ResourceManager[6477]:	2008/02/24_04:13:16 info: Retrying failed stop
operation [postgresql]
ResourceManager[6477]:	2008/02/24_04:13:16 info: Running
/etc/init.d/postgresql  stop
ResourceManager[6477]:	2008/02/24_04:14:17 ERROR: Return code 1 from
/etc/init.d/postgresql
ResourceManager[6477]:	2008/02/24_04:14:18 info: Retrying failed stop
operation [postgresql]
ResourceManager[6477]:	2008/02/24_04:14:18 info: Running
/etc/init.d/postgresql  stop
ResourceManager[6477]:	2008/02/24_04:15:20 ERROR: Return code 1 from
/etc/init.d/postgresql
ResourceManager[6477]:	2008/02/24_04:15:21 info: Retrying failed stop
operation [postgresql]
ResourceManager[6477]:	2008/02/24_04:15:21 info: Running
/etc/init.d/postgresql  stop
ResourceManager[6477]:	2008/02/24_04:16:22 ERROR: Return code 1 from
/etc/init.d/postgresql
ResourceManager[6477]:	2008/02/24_04:16:23 info: Retrying failed stop
operation [postgresql]
ResourceManager[6477]:	2008/02/24_04:16:23 info: Running
/etc/init.d/postgresql  stop
ResourceManager[6477]:	2008/02/24_04:17:25 ERROR: Return code 1 from
/etc/init.d/postgresql
ResourceManager[6477]:	2008/02/24_04:17:26 info: Retrying failed stop
operation [postgresql]
ResourceManager[6477]:	2008/02/24_04:17:26 info: Running
/etc/init.d/postgresql  stop
ResourceManager[6477]:	2008/02/24_04:18:28 ERROR: Return code 1 from
/etc/init.d/postgresql
ResourceManager[6477]:	2008/02/24_04:18:29 info: Retrying failed stop
operation [postgresql]
ResourceManager[6477]:	2008/02/24_04:18:29 info: Running
/etc/init.d/postgresql  stop
ResourceManager[6477]:	2008/02/24_04:19:30 ERROR: Return code 1 from
/etc/init.d/postgresql
ResourceManager[6477]:	2008/02/24_04:19:32 info: Retrying failed stop
operation [postgresql]
ResourceManager[6477]:	2008/02/24_04:19:32 info: Running
/etc/init.d/postgresql  stop
ResourceManager[6477]:	2008/02/24_04:20:33 ERROR: Return code 1 from
/etc/init.d/postgresql
ResourceManager[6477]:	2008/02/24_04:20:35 info: Retrying failed stop
operation [postgresql]
ResourceManager[6477]:	2008/02/24_04:20:35 info: Running
/etc/init.d/postgresql  stop
ResourceManager[6477]:	2008/02/24_04:21:37 ERROR: Return code 1 from
/etc/init.d/postgresql
ResourceManager[6477]:	2008/02/24_04:21:38 info: Retrying failed stop
operation [postgresql]
ResourceManager[6477]:	2008/02/24_04:21:38 info: Running
/etc/init.d/postgresql  stop
ResourceManager[6477]:	2008/02/24_04:22:40 ERROR: Return code 1 from
/etc/init.d/postgresql
ResourceManager[6477]:	2008/02/24_04:22:40 CRIT: Resource STOP
failure. Reboot required!
ResourceManager[6477]:	2008/02/24_04:22:40 CRIT: Killing heartbeat ungracefully!

■OSリブートしない場合
ResourceManager[7265]:  2008/02/23_23:00:22 info: Releasing resource
group: node1 drbddisk Filesystem::/dev/drbd0::/data::ext3
192.168.1.1/24 postgresql
ResourceManager[7265]:  2008/02/23_23:00:23 info: Running
/etc/ha.d/resource.d/postgresql  stop
ResourceManager[7265]:  2008/02/23_23:00:23 ERROR: Return code 1 from
/etc/ha.d/resource.d/postgresql
ResourceManager[7265]:  2008/02/23_23:00:25 info: Retrying failed stop
operation [postgresql]
ResourceManager[7265]:  2008/02/23_23:00:25 info: Running
/etc/ha.d/resource.d/postgresql  stop
ResourceManager[7265]:  2008/02/23_23:00:25 ERROR: Return code 1 from
/etc/ha.d/resource.d/postgresql
ResourceManager[7265]:  2008/02/23_23:00:26 info: Retrying failed stop
operation [postgresql]
ResourceManager[7265]:  2008/02/23_23:00:26 info: Running
/etc/ha.d/resource.d/postgresql  stop
ResourceManager[7265]:  2008/02/23_23:00:27 ERROR: Return code 1 from
/etc/ha.d/resource.d/postgresql
ResourceManager[7265]:  2008/02/23_23:00:28 info: Retrying failed stop
operation [postgresql]
ResourceManager[7265]:  2008/02/23_23:00:28 info: Running
/etc/ha.d/resource.d/postgresql  stop
ResourceManager[7265]:  2008/02/23_23:00:29 ERROR: Return code 1 from
/etc/ha.d/resource.d/postgresql
ResourceManager[7265]:  2008/02/23_23:00:30 info: Retrying failed stop
operation [postgresql]
ResourceManager[7265]:  2008/02/23_23:00:30 info: Running
/etc/ha.d/resource.d/postgresql  stop
ResourceManager[7265]:  2008/02/23_23:00:30 ERROR: Return code 1 from
/etc/ha.d/resource.d/postgresql
ResourceManager[7265]:  2008/02/23_23:00:32 info: Retrying failed stop
operation [postgresql]
ResourceManager[7265]:  2008/02/23_23:00:32 info: Running
/etc/ha.d/resource.d/postgresql  stop
ResourceManager[7265]:  2008/02/23_23:00:32 ERROR: Return code 1 from
/etc/ha.d/resource.d/postgresql
ResourceManager[7265]:  2008/02/23_23:00:33 info: Retrying failed stop
operation [postgresql]
ResourceManager[7265]:  2008/02/23_23:00:33 info: Running
/etc/ha.d/resource.d/postgresql  stop
ResourceManager[7265]:  2008/02/23_23:00:35 ERROR: Return code 1 from
/etc/ha.d/resource.d/postgresql
ResourceManager[7265]:  2008/02/23_23:00:36 info: Retrying failed stop
operation [postgresql]
ResourceManager[7265]:  2008/02/23_23:00:36 info: Running
/etc/ha.d/resource.d/postgresql  stop
ResourceManager[7265]:  2008/02/23_23:00:36 ERROR: Return code 1 from
/etc/ha.d/resource.d/postgresql
ResourceManager[7265]:  2008/02/23_23:00:37 info: Retrying failed stop
operation [postgresql]
ResourceManager[7265]:  2008/02/23_23:00:37 info: Running
/etc/ha.d/resource.d/postgresql  stop
ResourceManager[7265]:  2008/02/23_23:00:38 ERROR: Return code 1 from
/etc/ha.d/resource.d/postgresql
ResourceManager[7265]:  2008/02/23_23:00:39 info: Retrying failed stop
operation [postgresql]
ResourceManager[7265]:  2008/02/23_23:00:39 info: Running
/etc/ha.d/resource.d/postgresql  stop
ResourceManager[7265]:  2008/02/23_23:00:40 ERROR: Return code 1 from
/etc/ha.d/resource.d/postgresql
ResourceManager[7265]:  2008/02/23_23:00:41 info: Retrying failed stop
operation [postgresql]
ResourceManager[7265]:  2008/02/23_23:00:41 info: Running
/etc/ha.d/resource.d/postgresql  stop
ResourceManager[7265]:  2008/02/23_23:00:41 ERROR: Return code 1 from
/etc/ha.d/resource.d/postgresql
ResourceManager[7265]:  2008/02/23_23:00:42 ERROR: Resource script for
postgresql probably not LSB-compliant.
ResourceManager[7265]:  2008/02/23_23:00:42 WARN: it (postgresql) MUST
succeed on a stop when already stopped
ResourceManager[7265]:  2008/02/23_23:00:42 WARN: Machine reboot
narrowly avoided!


以上、宜しくお願い致します。





Linux-ha-japan メーリングリストの案内
アーカイブの一覧に戻る