Forums Neueste Beiträge
 

Loadproblem finden

17/12/2009 - 05:05 von Peter Mairhofer | Report spam
Hallo,

Ich habe auf meinem Server (mehrere OpenVZ Container) seit ca. 2 Tagen
Loadprobleme. Auf einer VM laeuft dabei nagios und das aeussert sich
darin dass vor allem viele SNMP Checks verrueckt spielen und "no data
received from host" senden und die Admins mit nagios Meldungen
ueberflutet werden. Weiters ist der "Load average" check seit einiger
Zeit "flatteing" und zeigt derzeit als "Performance data" an:

load1X.700;15.000;30.000;0;
load5.380;10.000;25.000;0;
load15.070;5.000;20.000;0;

und aktuell: CRITICAL - load average: 58.70, 19.38, 13.07

Das groesste Problem ist aber dass ich bei der normalen Arbeit ein
Load-Lag nicht von einem Netzwerkproblem unterscheiden kann da ich sehr
weit weg (am anderen Ende der Erdkugel) sitze. Ich lasse zwar eine SSH
Session mit htop laufen und die haengt hier sehr oft aber dass der CPU
Balken permanent auf 100% sitzt kann ich eigentlich nicht beobachten,
ebensowenig wie eine Anwendung die staendig 100% CPU fressen wuerde.

Natuerlich, Kandidaten wie named, slapd und mysqld reihen sich immer
weit rauf, haben aber nicht viel CPU-% und wenn sie 100% haben dann nur
fuer kurze Zeit.

In den letzten Tagen habe ich 2 Dinge an der Server config geaendert:

* Mit dem LDAP Server experimentiert. Hier allerdings nur Aenderungen in
der Struktur und ACLs. User sind allerdings nur eine Handvoll drinnen,
Backend ist bdb und die Indices habe ich zur Sicherheit auch eben neu
generiert.

* Von Courier auf dovecot umgestellt. Aber auf den Server greifen
derzeit neben mir noch eine andere Person zu also kann ich mir auch
schwer vorstellen dass es daran liegt.

Hat jemand eine Idee wie ich das Problem eingrenzen kann?

LG
Peter
 

Lesen sie die antworten

#1 Peter Mairhofer
17/12/2009 - 06:19 | Warnen spam
Peter Mairhofer wrote:
[...]
Natuerlich, Kandidaten wie named, slapd und mysqld reihen sich immer
weit rauf, haben aber nicht viel CPU-% und wenn sie 100% haben dann nur
fuer kurze Zeit.



Ich bin ein Edi.

Hab htop in einem openVZ container laufen lassen und da ist sogar die
CPU Auslastung brav virtualisiert.

Am Host hat sich offenbart dass ein "vzctl" 100% CPU frisst. Dadurch hat
rsync (Backup) nicht weitergetan und das Uebrige dazu getan.

Ich weiss zwar nicht was das war und wieso aber ich hab es gekillt und
nun lauft das rsync Backup weiter.

Fuers erste also mal hinfaellig. Danke trotzdem!

Peter

Ähnliche fragen