Nicht nachvollziehbarer Totalabsturz, erst Etch, jetzt Lenny

07/03/2009 - 22:17 von Frank Burmeister | Report spam
Hallo,

ich habe das Problem, dass mein Debian Linux aus mir völlig unbekannten
Gründen komplett einfriert und den Dienst versagt. Ein Hardware Reset
ist das einzige, was dann noch geht.

Unter Debian Etch konnte ich wenigstens manchmal noch durch STRG-ALT F1
die letzten LOG Ausgaben begutachten, die darauf hingewiesen haben,
dass die Festplatten "weg" waren.

Folgende AUssagen konnte ich abfotografieren:

ata8.00: failed to IDENTIFY (I/O error, err_mask=0x40)
ata8.00: limiting speed to UDMA7:PIO5
ata8: hard resetting port
ata8: port is slow to respong, please be patient (Status 0xff)
ata8: COMRESET failed (errno=-16)
ata8: hard resetting port
ata8: SATA link up 1.5 Gbps (SStatus 113 SControl E9)
ata8: EH pending after completion, repeating EH (cnt=3)
ata8: exception Emask 0x10 SAct 0x0 SErr 0x49d0000 action 0x2 frozen
ata8: (irg_stat 0x00400040, connection status changed)
ata8: hard resetting port

und weiteres, àhnliche Ausgaben fallen mit ata7: zu beginnt

Die Festplatten (Samsung 500 GByte, SATA2) sind per Software RAID 1
zusammen verknüpft (/, /boot/, /swap), beide wurden mit den
Analysetools von Samsung geprüft und als fehlerfrei beurteilt.

Das Mainboard ist ein Gigabyte P35.

Nun war ich der Meinung, das ein Software Fehler irgendwie den Raid
Treiber schiesst und das dieser Fehler mit Lenny behoben ist.

Aber leider machte ich heute die Erfahrung, dass Lenny heute auch einen
Stillstand hatte, allerdings keine Logs wie oben (da kam ich auch nicht
mehr ran...)

Jemand Ideen wie ich vorgehen kann, um den Fehler einzugrenzen?

Danke für Hilfe

Gruß
Frank
 

Lesen sie die antworten

#1 Florian Weimer
08/03/2009 - 14:10 | Warnen spam
* Frank Burmeister:

Die Festplatten (Samsung 500 GByte, SATA2) sind per Software RAID 1
zusammen verknüpft (/, /boot/, /swap), beide wurden mit den
Analysetools von Samsung geprüft und als fehlerfrei beurteilt.



Wir hatten neulich etwas àhnliches und tauschten die Platte, womit der
Fehler verschwand.

Ich bin mir nicht sicher, ob unsere Platte wirklich richtig kaputt
ist. Da aber der Pfad zur Fehlerbehebung nicht so richtig gut
funktionieren zu scheint, schien der Tausch angemessen.

Ähnliche fragen