Fehler nach Absturz eingrenzen

26/09/2007 - 20:54 von Manfred Viala | Report spam
Hallo!

Nach der Umstellung eines Servers erweist sich dieser als instabil indem er
scheinbar ab und zu crashed (Auf das "scheinbar" gehe ich gleich nàher ein)

Die Umstellung betrifft diverse Hardwaretauschs als auch ein Upgrade auf
den neuesten Kernel 2.6.22.8. Kurz: Es wurden zuviele Komponenten getauscht
um auf den ersten Blick sagen zu können warum er vielleicht abstürzt.

Meine Frage ist wie ich nun Schritt für Schritt an diese Problematik
herangehen kann um den Fehler einzugrenzen. Welche Möglichkeiten habe ich
um dem Kernel noch einiges an Infos zu entlocken?

Bei einem Absturz war ich live dabei, der Server wurde plötzlich sehr
langsam und lokal nicht mehr ansprechbar. Per Netzwerk war er noch
erreichbar und SSH funktionierte (Zumindest das Login kam, nach der
Passworteingabe ging nichts mehr, Ein erneuter SSH Zugriff brachte wiederum
ein Login, aber kein Vorankommen nach dem Passwort) - und alles in einer
sehr langsamen Geschwindigkeit.

Die Hardware: Dual Xeon 3Ghz, 2GB Ram, 3x IDE Platten (ohne hdparm Tuning)
Die Software: Debian Basis, der Rest vom Source aufgesetzt, Kernel 2.6.22.8

lg
Manfred
 

Lesen sie die antworten

#1 Thomas Ogrisegg
26/09/2007 - 21:48 | Warnen spam
Manfred Viala wrote on 2007-09-26:
Meine Frage ist wie ich nun Schritt für Schritt an diese Problematik
herangehen kann um den Fehler einzugrenzen. Welche Möglichkeiten habe ich
um dem Kernel noch einiges an Infos zu entlocken?



Indem Fall ist die sysrq-Tastenkombination sicherlich die beste
Moeglichkeit das System zu debuggen. Fuer genauere Informationen siehe
/usr/src/linux/Documentation/sysrq.txt

Ansonsten (fuer dieses Problem vielleicht nicht so hilfreich):
memtest86 um das System auf Speicherfehler zu testen
stress, crashme, cpuburn - Stresstests fuer Hardware/Betriebssystem

Bei einem Absturz war ich live dabei, der Server wurde plötzlich sehr
langsam und lokal nicht mehr ansprechbar. Per Netzwerk war er noch
erreichbar und SSH funktionierte (Zumindest das Login kam, nach der
Passworteingabe ging nichts mehr, Ein erneuter SSH Zugriff brachte wiederum
ein Login, aber kein Vorankommen nach dem Passwort) - und alles in einer
sehr langsamen Geschwindigkeit.



Festplattenaktivitaet? Moeglicherweise Out-of-memory Problem? Swap
aktiviert?

Ähnliche fragen