heartbeat: zwei ha-cluster im gleichen netz?

09/06/2008 - 16:33 von Steven Varco | Report spam
Hi NG

Ich bin zur Zeit etwas am verzweifeln zwei (unabhàngige) HA-Cluster im
gleichen Netz zu betreiben, mein Freund google wusste bisher auch keine
Antwort :-(

Situation:
Erst hatten wir 4 Maschinen, nennen wir sie server1,server2,server3 und
server4, die zusammen einen HA-Cluster bildeten; dies hatte aber einige
komplikationen mit sich gebracht, so dass wir entschieden diese zu
splitten und 2 unabhàngie ha-cluster daraus zu machen.
D.h. nun: server1+2 sowie server2+3 haben jeweils eine unabhàngige
ha.ch, haressources und authkeys.

Seither spammen diese aber die logfiles voll, da sie sich noch immer an
den anderen nodes "anmelden" möchten.

Dies sieht dann so aus:

- Hat man verschiedene auhtkeys auf dem server kommen nonstop die
"failed authentication" Meldungen im logile, so z.B. auf server1:
"heartbeat[5203]: 2008/06/09_16:06:08 WARN: string2msg_ll: node
[server3] failed authentication"
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~


- Hat man gleiche keys, motzt heartbeat, dass sich "fremde" maschinen am
cluster anmelden wollen, also solche welche weder in ha.ch noch in
haressources definiert sind, da diese ja gar nicht dazugehören.
Dies sieht dann, wieder auf server1 im logfile so aus:

heartbeat[5203]: 2008/06/09_16:19:48 ERROR: MSG[9] : [auth=1
e17]
heartbeat[5203]: 2008/06/09_16:19:48 ERROR: process_status_message: bad
node [server3] in message
heartbeat[5203]: 2008/06/09_16:19:48 ERROR: MSG: Dumping message with 12
fields
heartbeat[5203]: 2008/06/09_16:19:48 ERROR: MSG[0] : [t=status]
heartbeat[5203]: 2008/06/09_16:19:48 ERROR: MSG[1] : [st=active]
heartbeat[5203]: 2008/06/09_16:19:48 ERROR: MSG[2] : [dtu30]
heartbeat[5203]: 2008/06/09_16:19:48 ERROR: MSG[3] : [protocol=1]
heartbeat[5203]: 2008/06/09_16:19:48 ERROR: MSG[4] : [src=server3]
heartbeat[5203]: 2008/06/09_16:19:48 ERROR: MSG[5] :
[(1)srcuuid=0x1351ca08(36 27)]
heartbeat[5203]: 2008/06/09_16:19:48 ERROR: MSG[6] : [seqsfef]
heartbeat[5203]: 2008/06/09_16:19:48 ERROR: MSG[7] : [hgH219b45]
heartbeat[5203]: 2008/06/09_16:19:48 ERROR: MSG[8] : [tsH4d3c07]
heartbeat[5203]: 2008/06/09_16:19:48 ERROR: MSG[9] : [ld=0.07 0.15 0.11
2/253 26655]
heartbeat[5203]: 2008/06/09_16:19:48 ERROR: MSG[10] : [ttl=4]
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~


Meine configs sehen jeweils so aus:

ha.cf:
autojoin none
use_logd on
keepalive 2
deadtime 30
warntime 10
initdead 120
bcast eth0
auto_failback on
node server1
node server2
ping <ip des routers>


haressources:
server1 <virtual ip server 1+2>


authkeys:
auth 1
1 sha1 e17.



Auch solche Dinge wie das setzen von:
ucast eth0 <IP des 2. nodes>
oder das komplett neue erstellen der uuids hatte bisher ned so viel
gebracht... :-(



Weiss jemand wie ich dieses setup so hinkrige? -Oder sollte es wieder
erwartengrundsàtzlich nicht möglich sein 2 ha-cluster im gleichen netz
am laufen zu haben?

Wir haben noch einen dritten ha-cluster, aber in einem anderen netz und
dieser làuft wunderbar. ;-)


Danke schonmal für eure hilfe,

Steven

There really is someone out there trying to guess your passwords.
www.varco.ch
 

Lesen sie die antworten

#1 Sven Hartge
09/06/2008 - 17:07 | Warnen spam
Steven Varco wrote:

Meine configs sehen jeweils so aus:

ha.cf:
autojoin none
use_logd on
keepalive 2
deadtime 30
warntime 10
initdead 120
bcast eth0
auto_failback on
node server1
node server2
ping <ip des routers>



Arbeite ohne bcast sondern nutze das ucast-Feature mit direkter Abgabe
der Partner.

Auch solche Dinge wie das setzen von:
ucast eth0 <IP des 2. nodes>
oder das komplett neue erstellen der uuids hatte bisher ned so viel
gebracht... :-(



Das sollte es aber eigentlich.



Sven Hartge -- professioneller Unix-Geek
Meine Gedanken im Netz: http://www.svenhartge.de/

Ähnliche fragen