Posts by bern

This forum was archived to /woltlab and is now in read-only mode.

    Wie sehen denn die Ownerships und Permissions des Verzeichnisses aus, aus dem das Log herausrenamed werden soll?

    der Pfad zu den RRD Datenbanken steht im XML File!

    Und wird dort wiederum von den die Performance-Daten wegschreibenden Teilen von PNP4Nagios, also der Installation auf dem Core, eingetragen. Die vom abweichenden Pfad auf dem Frontend nix weiß (und - Pitchfork, widersprich' mir - auch nie eine entsprechende Config haben wird).


    Ergo zwei Möglichkeiten: 1. 'Ran an die Templates auf dem Frontend, sämtliche $RRDFILE[]s 'raus und den korrekten Pfad hartcodieren, das Ganze bei jedem Update mit neuen Templates in templates.dist von vorn; oder 2. den Core-Pfad auf dem Frontend gangbar machen (sei es per anderem Mountpoint oder simpel per Symlink).

    ich versuche gerade ein Skript zu schreiben, welches mir für Services eine Downtime einträgt, wenn ein anderer Host eine Downtime gesetzt bekommt.
    [...]
    Da es sich um sehr viele Abhängigkeiten handelt, kann ich wohl Service-Abhängigkeiten vergessen.

    Dumme Frage: Wenn diese Abhängigkeiten bestehen (ausweislich dessen, daß Du ihnen Downtimes eintragen muß - weil sie ohne den bewußten Host zwingend ausfallen?), tust Du Dir dann wirklich einen Gefallen, sie nicht einzupflegen? Mail-Lawine, sobald der Host 'mal tatsächlich (ungeplant) ausfällt ...

    Ich vervollständige die Liste der Möglichkeiten noch mit einem Hinweis auf den rrdcached (der aber Daten verliert, wenn die Verbindung wegbricht, und nicht mehr sehr oft mit Netzwerkverbindungen eingesetzt wird und entsprechend geringe Priorität hat, wenn's um Features oder Bugfixes spezifisch für einen solchen Einsatz geht).


    Wolfgang, bei NFS schießt mir spontan das Stichwort "file locks" durch den Kopf, ich bin mir ziemlich sicher, daß rrdtool kein dotlocking macht ... ?

    wollte mal in die Runde fragen, ob jemand von euch ein Plugin zur Überwachung von Alcatel-Lucent Switches hat.

    Welche denn? ;)


    Wenn wir von diesen Dingern hier sprechen, deren MIBs muß man sich vom Alcatel-Support geben lassen, aber dafür ist dann auch so ziemlich alles an Daten greifbar - der 5620 SAM packt die Teile auch nur per Ping und SNMP an.


    Tipp: Die Default-OIDs für die Ports ändern sich schonmal zwischen TiMOS-Versionen. Wenn Du nach einem Update nicht -zig OIDs neu bestimmen und nachpflegen willst, schau' genau hin, welche Files Du ins Backup etc. ziehst; Es gibt da einen, in dem die bisherigen OIDs abgelegt sind, so daß sie nach einem Update weiterbenutzt werden.

    Ich habs jetzt mit einzelnen Checks gelöst, aber danke trotzdem ;)

    Es gibt genau zwei Lösungen für den ganz allgemeinen Fall, in dem auch 'mal mehrere Drives gleichzeitig über die Alarmschwellen kommen können: Einzelne Checks oder Template editieren und alles auf nur einen Graphen (mit LINE statt AREA) zusammendampfen.


    Will man sich darauf verlassen, daß immer nur ein Drive alarmiert wird, kann man aber auch die Fähigkeiten von PNP's Template-Mechanismus ausnutzen (also wieder das Template editieren): Statt die Graphen stur nach Reihenfolge (üblicherweise vom Index 0 aufwärts) anzulegen, legt man am Anfang des Templates erstmal einen Graphen 0 mit leeren Strings an, baut dann die bisherigen Graphen von 1 aufwärts, läßt sich bei denjenigen, die "percent free" darstellen, den LAST-/current-Wert geben, merkt sich den Index mit dem niedrigsten Wert, und am Ende des Templates kopiert man diesen Index auf die 0 'rüber. Ergebnis: "currently worst drive" erscheint nochmal extra als der allererste Graph und wird dort vom E-Mail-Skript abgeholt.


    (Notabene: Der Vorschlag nutzt aus, daß das Plugin auf alle Drives dieselben prozentualen Limits anwendet, so daß "niedrigster Prozentwert" auch tatsächlich identisch ist mit "schlimmstes Drive".)

    Im Nagios erstelle ich dann die checks wie die sonst auch eingerichtet werden, nur mit dem $USER1$/check_by_ssh davor?

    Nuja, ein bißchen mehr gehört schon dazu. Zum Beispiel ein Parameter, auf welchen Host's denn grad' gehen soll. 8)


    Auch hier hilt ein Aufruf des Plugins mit "--help" ...

    Nagios doesn't have a notifications queue. Those notifications are either queued somewhere in the e-mail system, or Nagios generates them anew after startup (which means that the hosts/services should still check as non-OK).

    <type> DERIVE </type>


    here is some data
    <!-- 2015-02-10 14:51:00 GMT / 1423579860 --> <row><v> 3.2894043528e+00 </v></row>

    DERIVE means that the RRD file stores the rate, i.e., counter ticks per second. DERIVE or COUNTER are what gets selected automatically when the data is marked as a counter.

    Code
    1. 2015-02-10 14:32:45 35968683
    2. 2015-02-10 14:35:48 35969337

    Counter increased by 654 over 183 seconds --> 3.57 ticks/s on average.


    If you want to see the absolute counter values, a) make the plugin drop the UOM "c" from the performance data or b) manually change the RRD file, once autocreated, from DERIVE to GAUGE. (Technically c) have the PNP template compute the integral of the rate might look usable, too, but I'ld worry about the precision and it'ld have a permanent unknown offset.)

    Der Dienst läuft dann halt nicht. Wenn ich "/etc/init.d/snmpd status" eingebe, kommt da "unused" raus. Also starte ich ihn und dann läuft er wieder.
    Also gehe ich davon aus, das er abstürzt.

    OpenSUSE, sagtest Du? Hatte (oder hat immer noch ...) ein Kunde von uns auch (niedrig priorisierte) Probleme mit, da steckten dann aber auch OpenManage Extensions im snmpd und zusätzlich zum Nagios griff eine entsprechende Management-Station per SNMP zu. Dein Nagios ist alleiniger Nutzer ... ?

    Ja, ich will aber eher an die Konfig ran. Man kann doch bestimmt SNMP irgendwie in Debug Modus versetzen, so das er alles logt.

    In der Manpage steht 'was davon, aber ich kenn's nicht, würd's mir einfacher machen und ein tcpdump o.ä. mitlaufen lassen, um zu sehen, ob der snmpd bei bestimmten Abfragen den Dienst einstellt ...

    Was genau muss ich den tun, damit die Infos die in der OID "iso.3.6.1.2.1.2.1.0" als Text ausgegeben werden ? ^^

    Die Parameter so verändern, daß check_snmp sich bemüßigt fühlt, das MIB Dir einzulesen, daraus den OID Tree zusammenzubauen und daraus die gewünschte Textform zu entnehmen. Möglichkeiten gibt's dazu mehrere, von "-O" Optionen bis dahin, die abzufragenden OIDs nicht rein numerisch anzugeben.


    Das komplette Verzeichnis.
    Bei jedem Aufruf.
    Tausende Male am Tag.


    Du siehst, es hat Konsequenzen, das Plugin die Info zusammenrödeln zu lassen, statt sie einmal manuell zusammenzutragen und sie als Labels oder in einem Comment festzuhalten ...

    Nach ein wenig googlen habe ich gelesen das man in /etc/snmp die snmp.conf datei verändern muss und die erlaubniss eintragen muss um den snmpwalk auszuführen.
    In meiner snmp.conf steht aber nur:

    Code
    1. mibs :

    Bist Du ganz sicher, daß da nicht von der snmpd.conf die Rede ist ... ?

    jetzt meine Frage, gib es eien Möglichkeit den MAC Addressen Hostnamen zuzuordnen?

    Gegenfrage: Darf ich aus dem Begriff "Hostname" ablesen, daß die fraglichen Rechner selbst vom Nagios überwacht werden?


    Wenn ja und sie sind im selben Subnet wie der Nagios, guckt man auf dem in die ARP Table.
    Wenn ja und es geht durch Routing, kann man einen Service dazuwerfen, der auf dem Zielrechner die MACs ausgibt.


    Wenn nein, wo kommen diese Rechner dann her? Wenn der große Unbekannte daherkommt und seinen Rechner ins LAN stöpselt (und am Besten noch eine Netzwerkkarte drin hat, der er die MAC nach Gusto einstellen kann), wieso und wo sollte der überhaupt einen "Hostnamen" (her)haben, geschweige denn einen, den man glauben darf?

    Yes, but how?

    For a sufficiently recent snmpd from the Net-SNMP package, you should find this in the snmpd.conf Manpage:

    alte File:


    Code
    1. ds[1].min = 0.0000000000e+00
    2. ds[1].max = 0.0000000000e+00

    Das ist der funktionierende? :huh:


    Ansonsten würde ich sicherheitshalber nochmal auf Ownerships, Permissions und SELinux Contexte gucken und dann 'mal probieren, was passiert, wenn man einer Kopie des RRD-Files per Kommandozeile und manuellem "rrdupdate " Daten in den Rachen stopfen will.

    Gibt es Pläne das auf TLS 1.1 und TLS 1.2 zu erweitern?

    Die Standard-Plugins benutzen eine zugrundeliegende Bibliothek, oft OpenSSL, für die ganzen Crypto-Geschichten. Wenn dann in der API nur ein Call "TLSv1_client_method(void) " existiert und der kümmert sich dann unter der Haube um die Unterversion des Protokolls, kann der Code des Plugins mit vertretbarem Aufwand da nicht mehr allzu viel festnageln ...

    so the host has the state “up” which actually allows Nagios to do some service checks and send notifications.

    The host being DOWN disables the service notifications, not the execution of the checks themselves.


    Having that said: Add a service that makes a specific check (be it for the target machine's uptime, be it for availability of NSCP), add a service dependency of all NSCP-based services on that one, and if getting alerts for that extra service is still too much noise, use one of the established "delayed alarms" mechanisms on that one.

    Nun habe ich das hier gefunden. Wie kann ich jetzt sicher sein das dies auch funktioniert? Wie kann ich das jetzt überprüfen, ob auch wirklich die Service Check Überwachung ausgeschaltet ist.

    Du meinst, Du willst in dem Event Handler Skript selbst prüfen, ob es sich die konkurrierenden Service Checks erfolgreich vom Hals geschafft bzw. abschließend wieder aktiviert hat?


    Event Handler werden als Nagios-User gestartet und es ist am einfachsten, wenn man die "Fernsteuerung" als dieser User in Nagios einkippt. Insofern sollte auch Lesezugriff auf die status.dat vorhanden sein. Die änderung wird dort allerdings nicht sofort sichtbar.


    Zukunftssicherer wäre wohl eine Abfrage über livestatus, aber wenn Du das aktuell noch nicht installiert hast ...

    ich habe derzeit das Problem, dass E-Mail Benachrichtigungen zu bestimmten E-Mail Adressen nicht zugestellt werden sondern im dead.letter enden.

    Dead letter files werden von einem direkt aufgerufenen MUA (wie mailx) angelegt, wenn sie die Mail nicht loswerden. Wenn das abhängig ist von der Empfängeradresse, dann ist es sehr wahrscheinlich, daß es der MSA (lokal laufend, z.B. postfix) ist, der sich weigert, sie auch nur anzunehmen. Details müßten in dessen Log (/var/log/mail*) zu finden sein.