win 2003 clusterknoten findet quorum nicht mehr.

09/12/2008 - 12:08 von Michael Hirczy | Report spam
Hi!

Die Specs: Wir haben einen 2003-sp2-cluster, der 2 Jahre lang ohne
Probleme gelaufen ist. Setup ist Active/Active, auf jedem Knoten eine
Ressourcengruppe mit Fileshares (3 und 4 Disken/Freigaben).

Heute Früh hab' ich das übliche Ritual für die MS-Updates durchgemacht:
Die Ressource von Knoten 2 auf K1 gemoved, und K2 gebootet. Nach dem
Boot Eventlog gecheckt, K2 war im Cluster -> passt. Ressourcen von K2
wieder zurück, Update für K1 war für morgen Früh geplant.
(Nebenbei ist mir aufgefallen, dass auf K2 nicht alles Clusterdisken
sichtbar waren, nur die eigenen)

Nachem 2 Stunden lang alles gelaufen ist, konnte ich plötzlich ab und zu
nicht mehr zu den Shares auf K2 verbinden, nach kurzer Zeit ging gar
nichts mehr.

Im Eventlog waren die Fehler 1055 und 1069 mit Errorcode 64
Ich hab' zwar
http://support.microsoft.com/?scid=...2478&x&y
gefunden, aber das hat nichts gebracht.

Im cluster.log auf K2 war dann:
"[DiskArb] Failed to read (sector 12), error 170"
für die quorumdisk und
"FMGetQuroumResource failed, error 170".

Googlen hat zwar http://support.microsoft.com/kb/249194 gefunden, aber
weder ein reboot von K2 noch ein hàndisches "net stop/start clussvc" hat
war gebracht - K2 findet die QDisk einfach nicht.

Die QD hat noch 1GB von 8GB freien Speicherplatz.
Hat jemand eine Idee, wie man das fixed?

danke und lg
michi
 

Lesen sie die antworten

#1 Bernd Pfann [MS]
09/12/2008 - 16:40 | Warnen spam
"Michael Hirczy" wrote in message
news:493e5199$0$11610$
Hi!

Die Specs: Wir haben einen 2003-sp2-cluster, der 2 Jahre lang ohne
Probleme gelaufen ist. Setup ist Active/Active, auf jedem Knoten eine
Ressourcengruppe mit Fileshares (3 und 4 Disken/Freigaben).

Heute Früh hab' ich das übliche Ritual für die MS-Updates durchgemacht:
Die Ressource von Knoten 2 auf K1 gemoved, und K2 gebootet. Nach dem Boot
Eventlog gecheckt, K2 war im Cluster -> passt. Ressourcen von K2 wieder
zurück, Update für K1 war für morgen Früh geplant.
(Nebenbei ist mir aufgefallen, dass auf K2 nicht alles Clusterdisken
sichtbar waren, nur die eigenen)

Nachem 2 Stunden lang alles gelaufen ist, konnte ich plötzlich ab und zu
nicht mehr zu den Shares auf K2 verbinden, nach kurzer Zeit ging gar
nichts mehr.

Im Eventlog waren die Fehler 1055 und 1069 mit Errorcode 64
Ich hab' zwar
http://support.microsoft.com/?scid=...2478&x&y
gefunden, aber das hat nichts gebracht.

Im cluster.log auf K2 war dann:
"[DiskArb] Failed to read (sector 12), error 170"
für die quorumdisk und
"FMGetQuroumResource failed, error 170".

Googlen hat zwar http://support.microsoft.com/kb/249194 gefunden, aber
weder ein reboot von K2 noch ein hàndisches "net stop/start clussvc" hat
war gebracht - K2 findet die QDisk einfach nicht.

Die QD hat noch 1GB von 8GB freien Speicherplatz.
Hat jemand eine Idee, wie man das fixed?


[...]
Das sind recht wenige Infos. So wie das aussieht ist auf der Quorum ein
Persistent Lock (das deutet die 170 im Cluster.log an). Vorrausgesetzt, dass
der Storage welcher die Quorum hostet OK ist! Sollte das der Fall sein. Node
K1 runter fahren und ausschalten. Auf Node K2 den Clusdisk.sys deaktivieren
und schauen ob die Quorum als normale Disk in den Zugriff kommt.

Wie ist den der Storage an den Cluster angebunden: iSCSI, FC oder SCSI ????

Ansonsten empfehle ich einen Call bei uns um die Logs zu analysieren. Ich
würde auch mal mit dem Hersteller des Storage bzw. der Lösung sprechen, ob
man auf dem Storage was sieht - bzw. sollte es sich herrausstellen das es
wirklich ein Lock ist diesen über ein entsprechendes Tool zu lösen (gibts
von den Storage Herstellern).
Mit freundlichen Grüßen / Kind regards - Bernd Pfann (Microsoft)

This posting is provided "AS IS" with no warranties, and confers no
rights.

Ähnliche fragen