VM/Server debuggen

07/08/2013 - 19:50 von Bernd Hohmann | Report spam
Ich stehe hier schon seit Jahren vor einem Problem: eine vor 15 Jahren
entstandene Installation mit einem Mail und Webserver (beide selber in
Java geschrieben) irgendwann virtualisiert und verrichtet auch immer
brav seinen Dienst.

Nur manchmal dreht irgendwas dort hohl: ich bekomme vom Zabbix
Monitoring einen Hinweis, dass IO-Wait nach oben geht und ehe ich
reagieren kann, steht die Kiste weitestgehend.

Dh. im Idealfall komme ich noch mit ssh drauf, aber selbst htop làsst
sich nicht mehr starten (bzw. bringt nach 15min kein Ergebnis).

Obwohl die Programmierung das nicht hergibt, vermute ich einen derben
Deadlock im Filesystem weil nach dem Reboot paar Konfigurationsdateien
nur noch 0 bytes haben (was nicht sein kann, aber wohl passiert).

Wie zàhme ich sowas, dass im Ernstfall noch genügend Ressourcen für ein
Debugging via SSH vorhanden sind?

Bernd
 

Lesen sie die antworten

#1 Sven Hartge
08/08/2013 - 09:27 | Warnen spam
Bernd Hohmann wrote:

Ich stehe hier schon seit Jahren vor einem Problem: eine vor 15 Jahren
entstandene Installation mit einem Mail und Webserver (beide selber in
Java geschrieben) irgendwann virtualisiert und verrichtet auch immer
brav seinen Dienst.

Nur manchmal dreht irgendwas dort hohl: ich bekomme vom Zabbix
Monitoring einen Hinweis, dass IO-Wait nach oben geht und ehe ich
reagieren kann, steht die Kiste weitestgehend.

Dh. im Idealfall komme ich noch mit ssh drauf, aber selbst htop làsst
sich nicht mehr starten (bzw. bringt nach 15min kein Ergebnis).

Obwohl die Programmierung das nicht hergibt, vermute ich einen derben
Deadlock im Filesystem weil nach dem Reboot paar Konfigurationsdateien
nur noch 0 bytes haben (was nicht sein kann, aber wohl passiert).

Wie zàhme ich sowas, dass im Ernstfall noch genügend Ressourcen für
ein Debugging via SSH vorhanden sind?



Was für ein System? Linux? *BSD?

Das Thema erscheint mir auch nicht ganz richtig in der Shell-Gruppe zu
sein, es wàre besser in der spezifischen Betriebssystemgruppe
aufgehoben.



Sigmentation fault. Core dumped.

Ähnliche fragen