Monitoring AIX mit Open Source Programmen

Ganglia

Eine von vielen Möglichkeiten AIX im Betrieb zu überwachen hat man mit dem Open Source Projekt Ganglia. Es ist skalierbar und für Cluster und Grids mit bis zu 2000 Knoten gut geeignet. Ganglia besteht aus zwei Dämonen, dem RoundRobinDatabaseTool RRD und einem PHP Web Interface auf Apache Webserver. Die durch das monitoring zusätzliche Last sowie das Netzwerkverkehrsaufkommen sind sehr gering. Lediglich RRDTool braucht etwas CPU wenn die Graphiken gezeichnet werden.

Die zur Nutzung unter AIX notwendigen Programme  (Ganglia RPM, Apache2 for AIX 5.1+, Ganglia web interface und RRDTool) sind im Internet von Michael Perzl's website erhältlich. Installation der Programme einschließlich der Systemvoraussetzung sind gut erklärt. Mit ihnen ist die notwendige Systemumgebung in sehr kurzter Zeit aufgebaut. Die RPMs installieren sich so, daß die Dienste aus der /etc/rc.d/init.d beim Start des Servers aktivieren. Etwas umständlicher gestaltet sich die Such danach, wie die Konfiguration sinnvoll vorgenommen werden kann.

gmon: muß auf jeder Maschine sein, die überwacht werden soll. KANN Daten von anderen gmon Daten annehmen. Mindestens ein gmon im überwachten Verbund muss die Daten einsammeln und dann die gesammelten Daten weitergeben an.

gmetad: ist i.d.R. auf einer Maschine vorhanden und füttert die Daten ins RRDTool, aus dessen Datenbanken die Information mit PHP Skripten des Apache für die Nutzung im Webbrowser nutzbar gemacht werden.

gmetad.conf

gmond.conf

Für die Nutzung von ganglia müssen im einfachsten Fall drei Einträge indviduell konfiguriert werden. Es handelt sich dabei um:

Beispiele für gültigen udp_send_channel Einträge

multicast

udp_send_channel {

mcast_join = 239.2.11.71

port = 8049

ttl = 1

}

unicast

udp_send_channel {

host = 192.168.1.100

port = 8049

ttl = 1

}

Beispiele für gültigen udp_recv_channel Einträge

udp_recv_channel {

mcast_join = 239.2.11.71

port = 8049

bind = 239.2.11.71

}

Möglichkeit bei unicast, jedes Protokoll aus IP Familie 4 auf Port

udp_recv_channel {

port = 8049

family = inet4

}

Beispiele für gültigen tcp_accecpt_channel Eintrag

Von dieser Adresse werden die XML Daten vom backend abgegriffen. Kann mit telnet auf diesen Port geprüft werden.

tcp_accept_channel {

port = 8049

}

Nur auf einem Server sind (müssen...) alle drei Einträge konfiguriert (sein). D.h. nur dort, wo die Daten abgegriffen werden. Server, die ihre überwachten Daten nur versenden sollen, brauchen nur einen korrekten udp_send_channel Eintrag. Einen udp_recv_channel braucht nur der/die Server, der die Daten aller Knoten sammeln soll. Mehrere Server kann man mit Blick auf die Ausfallsicherheit definieren.

Wenn verschiedenen Cluster überwacht werden sollen, dann empfiehlt sich außerdem noch einen Clusternamen zu definieren und den einzelnen Clustern z.B. noch individuelle Portnummern für die Arbeit zuzuweisen.

Unicast durch firewall mit SSH Tunnel

Der öffentliche root SSH Schlüssel des Servers wird in die authorized_keys2 des Servers gelegt, der die Daten gesammelt hat und an den gmetad abgeben soll. Anschließend wird der Tunnel gebaut:

# ssh -fN -L 4049:<ZielServer>:8049 <ZielServer>

In der gmetad.conf wird dann die entsprechende data_source Einstellung vorgenommen:

data_source "cluster01" localhost:4049

Im Gegensatz zu den Dämonen selbst muß bei Ausfall des Servers z.B. durch ein Skript sichergestellt werden, daß beim Start die Tunnel wiederhergestellt werden.

Bugs and unsupported features

Im Zshg. mir APV zählt Ganglia (V. 3.0.5) die virtuellen Prozessoren jeweils einzeln als komplette CPU, mit der Folge, daß eine irrwitzige Zahl an CPU in der Übersicht auftauchen.

Links

Ganglia Open Source Projekt bei Sourceforge

IBM Wiki: Ganglia-How-To

++++++++++++++++++++++++++++++++++++++++++++++++++

Copyright © Schulze-EDV-Service 2002-2008

Das direkte Linken meiner Seiten ist nur auf Seiten ohne Werbung gestattet.My pages must not be linked directly to pages and/or frame-sets containing ads. Copyright © 1998-2008 Andreas Schulze. German and European copyright law applicable. Alle Rechte vorbehalten. All rights reserved.

Content of my pages and its presentation is entirely mine. It is illegal to use, reproduce, modify, adapt, publish, translate, create derivative works from, distribute, perform and display Content (in whole or in part) and /or to incorporate it in other works in any form, media, or technology now known or later developed without written consensus of the author. If you do not agree with these terms, you have to delete my pages / its content in whole from you (IT-) systems. In this case you are not allowed to keep any kind of backup of it (neither in whole nor in part).

Alle hier genannten Produkte sind eingetragene Marken oder Marken der jeweiligen Eigentümer. Inhalte verlinkter Seiten machen wir uns nicht zu eigen und befürworten sie auch nicht.