Wednesday, May 22nd 2013, 6:45pm UTC+2

You are not logged in.

  • Login
  • Register

Dear visitor, welcome to Monitoring-Portal.
Although this is a german monitoring forum, please don't hesitate to post in English. Nearly everybody here understands you and will answer in English as well.
If this is your first visit here, please read the Help. It explains how this page works. You must be registered before you can use all the page's features. Please use the registration form to register here or read more information about the registration process. If you are already registered, please login here.

jmeissner

Beginner

Posts: 31

Number of monitoring servers: 4

Nagios Version: keine

Icinga Version: 1.8.4

Distributed monitoring: Ja

Redundant monitoring: Nein

Number of hosts: 213

Number of services: 6700

OS: openSuSE 12.2

Plugin Version: 1.4.16

NagVis Version: 1.7.5

Other Addons: pnp4nagios 0.6.19, check_mk 1.2.0p4

1

Friday, June 15th 2012, 10:06am

[SOLVED] Weathermap Error

Hallo ihr Nagvisexperten,

Ich visualisiere meine WAN Verbindungen mit Weathermaps. Dazu benutze ich Performancedaten der Netzwerkinterface Traffic-checks (check_iftraffic). Die Daten hole ich mir von mklive.
Leider sind die Verbindungen zu einigen Standorten nicht immer stabil, so dass gelegentlich Checks fehlschlagen und dadurch nicht immer Performancedaten zur Verfügung stehen. In einem solchen Fall erhalte ich von Nagvis immer diese Fehlermeldung: (siehe Anhang)

Das ist insbesonders ärgerlich, da die ganze Map dann "tot" ist und auch die anderen Verbindungen nicht mehr angezeigt. Dann muss ich in der Map-Definition die Anweisung "line_type=13" des betroffen Service auskommentieren. Liefert der Check dann wieder Performancedaten, das ganze retour.
Dadurch sind im Tagesgeschäft Weathermaps leider unbenutzbar, denn "normalen" Supportern ist diese Vorgehen nicht zu erklären.
Wie kann man Nagvis dazu bringen bei fehlenden Performancedaten die betroffene Linie nur rot zu färben und die anderen Services weiterhin normal darzustellen.
Vielen Dank schon mal für eure zahlreichen Antworten.
jmeissner has attached the following image:
  • nagvis_error.jpg

This post has been edited 1 times, last edit by "jmeissner" (Jul 18th 2012, 1:09pm)


jmeissner

Beginner

Posts: 31

Number of monitoring servers: 4

Nagios Version: keine

Icinga Version: 1.8.4

Distributed monitoring: Ja

Redundant monitoring: Nein

Number of hosts: 213

Number of services: 6700

OS: openSuSE 12.2

Plugin Version: 1.4.16

NagVis Version: 1.7.5

Other Addons: pnp4nagios 0.6.19, check_mk 1.2.0p4

2

Wednesday, June 27th 2012, 4:50pm

Keiner eine Idee?

Ich hatte ja gehofft das der Entwickler hier mitliest und was dazu sagen kann. Auch wenn es vielleicht nur "geht nicht anders, musst Du damit leben" ist.

LaMi

Geek

Posts: 3,822

Birthday: Sep 22nd

Gender: male

Location: München

Occupation: Berater / Entwickler

Number of monitoring servers: x

Nagios Version: 3.2.x

Distributed monitoring: Nein

Redundant monitoring: Nein

Number of hosts: x

Number of services: x

OS: SLES,CentOS,Debian

Plugin Version: x

NagVis Version: Git

NDO Version: -

IDO-Version: -

Perfparse Version: -

Other Addons: PNP, Check_MK, Livestatus, Multisite

3

Wednesday, June 27th 2012, 11:38pm

Hallo,

kommen denn in der Situation wirklich gar keine Perfdaten? Oder kommt irgendwas?

Grundsätzlich sollte NagVis schon damit umgehen können.

Gruesse,
Lars

jmeissner

Beginner

Posts: 31

Number of monitoring servers: 4

Nagios Version: keine

Icinga Version: 1.8.4

Distributed monitoring: Ja

Redundant monitoring: Nein

Number of hosts: 213

Number of services: 6700

OS: openSuSE 12.2

Plugin Version: 1.4.16

NagVis Version: 1.7.5

Other Addons: pnp4nagios 0.6.19, check_mk 1.2.0p4

4

Thursday, June 28th 2012, 5:07pm

Nein, da kommen gar keine Performancedaten. Der Servicecheck timed aus, weil die Leitung überlastet ist oder ganz weggebrochen, dann liefert das Plugin nur einen Fehler zurück z.B. sowas
Current Status: CRITICAL (for 0d 0h 0m 21s)
Status Information:Return code of 25 is out of bounds
Performance Data: [check_iftraffic_WAN!EXT:net1!100!100!m]

im Normalfall sieht das so aus
Current Status: OK (for 0d 0h 0m 12s)
Status Information:Average IN: 605.28Kbs (0.59%), Average OUT: 73.68Kbs (0.07%)brTotal RX: 17344.42 Mbits, Total TX: 32313.97 Mbits
Performance Data: inUsage=0.59%;85;98 outUsage=0.07%;85;98 inBandwidth=605.28Kbs outBandwidth=73.68Kbs inAbsolut=2273368242 outAbsolut=4235456658
[check_iftraffic_WAN!EXT:net1!100!100!m]

Gruß Jens

pitchfork

Administrator

Posts: 18,440

Location: Kassel

Occupation: Sysadmin SAP / Linux / AIX

Number of monitoring servers: 2

Hobbies: Motorrad fahren, wenns die Zeit erlaubt :-)

Nagios Version: 3.2.3 ( OMD )

Distributed monitoring: Nein

Redundant monitoring: Nein

Number of hosts: 360

Number of services: 6700

OS: Debian 6.0

Plugin Version: 1.4.x

Other Addons: SNMPTT, NagTrap, check_mk, PNP-0.6.x. Thruk

5

Thursday, June 28th 2012, 5:09pm

Performance Data: [check_iftraffic_WAN!EXT:net1!100!100!m]


Also kommen doch Perfdaten, aber keine vernünftigen

Sieht für mich nach Daten aus einem verteilten Monitoring aus. Richtig?
+++ PNP Developer +++ PNP 0.6.21 ist online ! +++
Hilfreiche Infos gefunden? Dann schnell ein paar Cent flattrn
OMD - Open Monitoring Distribution

jmeissner

Beginner

Posts: 31

Number of monitoring servers: 4

Nagios Version: keine

Icinga Version: 1.8.4

Distributed monitoring: Ja

Redundant monitoring: Nein

Number of hosts: 213

Number of services: 6700

OS: openSuSE 12.2

Plugin Version: 1.4.16

NagVis Version: 1.7.5

Other Addons: pnp4nagios 0.6.19, check_mk 1.2.0p4

6

Monday, July 2nd 2012, 3:53pm

Das ist korrekt. Die Daten kommen via nsca zum zentralen Server auf dem Nagvis läuft.
Ich vergaß das in meinem Eingangspost zu erwähnen. Sorry!

Die Angaben in der eckigen Klammer braucht aber der pnp4nagios damit er mit das richtige Diagramm malen kann. Also muss Nagvis dazu gebracht werden wie icinga die Daten in eckigen Klammer zu ignorieren. Jemand eine Idee dazu?

Gruß Jens

This post has been edited 2 times, last edit by "jmeissner" (Jul 4th 2012, 11:24am)


LaMi

Geek

Posts: 3,822

Birthday: Sep 22nd

Gender: male

Location: München

Occupation: Berater / Entwickler

Number of monitoring servers: x

Nagios Version: 3.2.x

Distributed monitoring: Nein

Redundant monitoring: Nein

Number of hosts: x

Number of services: x

OS: SLES,CentOS,Debian

Plugin Version: x

NagVis Version: Git

NDO Version: -

IDO-Version: -

Perfparse Version: -

Other Addons: PNP, Check_MK, Livestatus, Multisite

7

Saturday, July 7th 2012, 5:27pm

Hallo,

Quoted

[check_iftraffic_WAN!EXT:net1!100!100!m]


interessant. Sind das die Check Parameter? Was haben die in den Perfdaten zu suchen? Wenn es um die Skalierung geht, kann man die benötigten Werte doch vortrefflich im normalen Perfdaten Format übergeben.

Quoted

Also muss Nagvis dazu gebracht werden wie icinga die Daten in eckigen Klammer zu ignorieren. Jemand eine Idee dazu?


Das ist eine totale Sonderlocke. Ich habe Perfdaten in dem Format noch nie gesehen. Das Format entspricht nicht der Nagios Plugin API (http://nagiosplug.sourceforge.net/develo…nes.html#AEN201). Warum "muss" NagVis also damit korrekt umgehen können?

Gruesse
Lars

pitchfork

Administrator

Posts: 18,440

Location: Kassel

Occupation: Sysadmin SAP / Linux / AIX

Number of monitoring servers: 2

Hobbies: Motorrad fahren, wenns die Zeit erlaubt :-)

Nagios Version: 3.2.3 ( OMD )

Distributed monitoring: Nein

Redundant monitoring: Nein

Number of hosts: 360

Number of services: 6700

OS: Debian 6.0

Plugin Version: 1.4.x

Other Addons: SNMPTT, NagTrap, check_mk, PNP-0.6.x. Thruk

8

Saturday, July 7th 2012, 8:43pm

interessant. Sind das die Check Parameter? Was haben die in den Perfdaten zu suchen? Wenn es um die Skalierung geht, kann man die benötigten Werte doch vortrefflich im normalen Perfdaten Format übergeben.


Siehe -> http://docs.pnp4nagios.org/de/pnp-0.6/advanced
+++ PNP Developer +++ PNP 0.6.21 ist online ! +++
Hilfreiche Infos gefunden? Dann schnell ein paar Cent flattrn
OMD - Open Monitoring Distribution

jmeissner

Beginner

Posts: 31

Number of monitoring servers: 4

Nagios Version: keine

Icinga Version: 1.8.4

Distributed monitoring: Ja

Redundant monitoring: Nein

Number of hosts: 213

Number of services: 6700

OS: openSuSE 12.2

Plugin Version: 1.4.16

NagVis Version: 1.7.5

Other Addons: pnp4nagios 0.6.19, check_mk 1.2.0p4

9

Monday, July 9th 2012, 10:15am

Quoted


Nach dieser Anleitung bin ich vorgegangen.
Auf dem zentralen Server auf dem auch Nagvis läuft sind alle Service-Checks passive Checks (check_dummy), diese werden von den verteilten Servern mit den Performancedaten versorgt. Die Daten in den eckigen Klammern sind die check_commands die auf den verteilten Servern ausgeführt werden. Dies verwendet pnp4nagios um das passende Template für den Graph zu finden. Nagvis muß nur die Daten in eckigen Klammern ignorieren und alles ist gut.

Quoted

Warum "muss" NagVis also damit korrekt umgehen können?

Weil ich denke das noch einige Andere Ihre Icinga / Nagios Umgebung genau so konfiguriert haben.

PS: Sorry, "muss" war hier die falsche Formulierung. Es sollte heißen "muss nur dazu gebracht werden" im Sinne von es wäre wünschenwert wenn...

Gruß
Jens

This post has been edited 1 times, last edit by "jmeissner" (Jul 9th 2012, 2:21pm)


jmeissner

Beginner

Posts: 31

Number of monitoring servers: 4

Nagios Version: keine

Icinga Version: 1.8.4

Distributed monitoring: Ja

Redundant monitoring: Nein

Number of hosts: 213

Number of services: 6700

OS: openSuSE 12.2

Plugin Version: 1.4.16

NagVis Version: 1.7.5

Other Addons: pnp4nagios 0.6.19, check_mk 1.2.0p4

10

Monday, July 16th 2012, 2:39pm

Jetzt muß ich den Thread nochmal hoch holen.
Gibt es wirklich keine Lösung? Dann sagt doch geht nicht oder nicht gleich.

Gruß Jens

pitchfork

Administrator

Posts: 18,440

Location: Kassel

Occupation: Sysadmin SAP / Linux / AIX

Number of monitoring servers: 2

Hobbies: Motorrad fahren, wenns die Zeit erlaubt :-)

Nagios Version: 3.2.3 ( OMD )

Distributed monitoring: Nein

Redundant monitoring: Nein

Number of hosts: 360

Number of services: 6700

OS: Debian 6.0

Plugin Version: 1.4.x

Other Addons: SNMPTT, NagTrap, check_mk, PNP-0.6.x. Thruk

11

Monday, July 16th 2012, 2:45pm

naja, wenn du keine perfdaten lieferst, macht es durchaus Sinn auch nicht das command per send_nsca zu übertragen.

Die kannst dein Problem recht leicht im OCSP Command lösen

Just my 2 cent
+++ PNP Developer +++ PNP 0.6.21 ist online ! +++
Hilfreiche Infos gefunden? Dann schnell ein paar Cent flattrn
OMD - Open Monitoring Distribution

jmeissner

Beginner

Posts: 31

Number of monitoring servers: 4

Nagios Version: keine

Icinga Version: 1.8.4

Distributed monitoring: Ja

Redundant monitoring: Nein

Number of hosts: 213

Number of services: 6700

OS: openSuSE 12.2

Plugin Version: 1.4.16

NagVis Version: 1.7.5

Other Addons: pnp4nagios 0.6.19, check_mk 1.2.0p4

12

Monday, July 16th 2012, 4:06pm

Da kann ich doch nur den Befehl definieren der nach dem Check ausgeführt wird.

Source code

1
ocsp_command=submit_check_result


und der lautet

Source code

1
2
3
define command {
        command_name                    submit_check_result
        command_line                    /usr/lib/nagios/plugins/contrib/submit_check_result $HOSTNAME$ '$SERVICEDESC$' $SERVICESTATE$ '$SERVICEOUTPUT$ | $SERVICEPERFDATA$ [$SERVICECHECKCOMMAND$]'

Hiermit wird das Skript "submit_check_result" aufgerufen und unter anderem die Performancedaten und das Checkkommando per Makro in eckigen Klammern angefügt. Das passiert doch bei jedem Aufruf. Wenn keine Performancedaten vorhanden werden auch keine eingefügt, aber das Checkkommando wird immer eingefügt.
An welcher Stelle kann ich denn das Einfügen von [$SERVICECHECKCOMMAND$] verhindern? In der Icinga-doku habe ich nichts dazu gefunden.

Gruß Jens

pitchfork

Administrator

Posts: 18,440

Location: Kassel

Occupation: Sysadmin SAP / Linux / AIX

Number of monitoring servers: 2

Hobbies: Motorrad fahren, wenns die Zeit erlaubt :-)

Nagios Version: 3.2.3 ( OMD )

Distributed monitoring: Nein

Redundant monitoring: Nein

Number of hosts: 360

Number of services: 6700

OS: Debian 6.0

Plugin Version: 1.4.x

Other Addons: SNMPTT, NagTrap, check_mk, PNP-0.6.x. Thruk

13

Monday, July 16th 2012, 5:00pm

Im Script prüfen ob Perfdaten vorhanden sind und entsprechen reagieren.
+++ PNP Developer +++ PNP 0.6.21 ist online ! +++
Hilfreiche Infos gefunden? Dann schnell ein paar Cent flattrn
OMD - Open Monitoring Distribution

jmeissner

Beginner

Posts: 31

Number of monitoring servers: 4

Nagios Version: keine

Icinga Version: 1.8.4

Distributed monitoring: Ja

Redundant monitoring: Nein

Number of hosts: 213

Number of services: 6700

OS: openSuSE 12.2

Plugin Version: 1.4.16

NagVis Version: 1.7.5

Other Addons: pnp4nagios 0.6.19, check_mk 1.2.0p4

14

Monday, July 16th 2012, 5:22pm

Ich will nicht unbescheiden sein, aber hast du vielleicht ein klitzekleines Beispielskript.

Danke Jens

dnsmichi

Super Moderator

Posts: 5,986

Birthday: May 30th 1983 (29)

Gender: male

Location: Nürnberg

Occupation: Consultant / Developer beim besten Arbeitgeber der Welt @netways

Number of monitoring servers: Icinga: 4x dev, 10++ prod, Icinga2: 2x dev

Nagios Version: s/nagios/icinga/

Icinga Version: 1.9.0 / GIT

Distributed monitoring: Ja

Redundant monitoring: Ja

Number of hosts: 1000+

Number of services: 15000+

OS: RHEL, Debian, SUSE

Plugin Version: 1.4.16

IDO-Version: 1.9.0 / GIT MySQL/Postgresql/Oracle

Other Addons: Icinga Web, PNP, check_multi, inGraph, EventDB, LConf

15

Monday, July 16th 2012, 6:05pm

joerg spricht von /usr/lib/nagios/plugins/contrib/submit_check_result wo du einen check einbauen kannst. der parameter, der interessant ist - $4 wie im header beschrieben.
+++ Icinga / LConf Developer +++ Senior Consultant at []NETWAYS> +++
+++ Icinga 1.9 || Icinga 2 +++ Icinga Support || IRC +++

jmeissner

Beginner

Posts: 31

Number of monitoring servers: 4

Nagios Version: keine

Icinga Version: 1.8.4

Distributed monitoring: Ja

Redundant monitoring: Nein

Number of hosts: 213

Number of services: 6700

OS: openSuSE 12.2

Plugin Version: 1.4.16

NagVis Version: 1.7.5

Other Addons: pnp4nagios 0.6.19, check_mk 1.2.0p4

16

Tuesday, July 17th 2012, 4:23pm

Ich habe das jetzt soweit verstanden und sehe ein das Nagvis nicht der Übeltäter ist.
Ausgehend von diesem Thread habe mein ocsp Kommando angepasst.

Source code

1
/usr/lib/nagios/plugins/contrib/submit_check_result  $HOSTNAME$ '$SERVICEDESC$' $SERVICESTATE$ '$SERVICEOUTPUT$' '$SERVICEPERFDATA$' '$SERVICECHECKCOMMAND$'

Im Skript prüfe ich jetzt auf das Vorhandensein von $6, denn wenn keine Performancedaten geliefert werden habe ich nur fünf Argumente und dann werden nur die ersten vier verarbeitet und schon ist das Service Check Kommando weg.

Source code

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
#!/bin/sh
# Arguments:
#  $1 = host_name (Short name of host that the service is
#       associated with)
#  $2 = svc_description (Description of the service)
#  $3 = state_string (A string representing the status of
#       the given service - "OK", "WARNING", "CRITICAL"
#       or "UNKNOWN")
#  $4 = plugin_output (A text string that should be used
#       as the plugin output for the service checks)
#
# Convert the state string to the corresponding return code

#printfcmd="/usr/bin/printf"
printfcmd="/bin/echo"

NscaBin=/usr/bin/send_nsca
NscaCfg="/etc/nagios/send_nsca.cfg"
IcingaHost="172.18.10.253"


 return_code=-1
 case "$3" in
     OK)
         return_code=0
         ;;
     WARNING)
         return_code=1
         ;;
     CRITICAL)
         return_code=2
         ;;
     UNKNOWN)
         return_code=-1
         ;;
 esac

# pipe the service check info into the send_nsca program, which
# in turn transmits the data to the nsca daemon on the central
# monitoring server

if (test  $# -eq 6)
    then    $printfcmd -e "$1\t$2\t$return_code\t$4|$5 [$6]" |  $NscaBin -H  $IcingaHost -c $NscaCfg
    else    $printfcmd -e "$1\t$2\t$return_code\t$4" |  $NscaBin -H  $IcingaHost -c $NscaCfg
fi
# EOF

Auf der Kommdozeile funktioniert alles wie geplant. Innerhalb von Icinga gehen die Performancedaten aber komplett verloren, wie im nsca Debug Log auf dem zentralen Server zu sehen

Source code

1
Jul 17 16:07:26 mu00mgm01 nsca[12084]: SERVICE CHECK -> Host Name: 'mu00sapmon01', Service Description: 'Current Users', Return Code: '0', Output: 'USERS OK - 2 users currently logged in'

Im Icinga Log auf dem abgesetzten Server sieht das so aber aus.

Source code

1
[1342534280.118077] [256.1] [pid=1353] Running command '/usr/lib/nagios/plugins/contrib/submit_check_result  mu00sapmon01 'Current Users' OK 'USERS OK - 2 users currently logged in' 'users=2;20;50;0' 'check_local_users!20!50''...

Wird mir nur die Pipe zum Markieren der Performancedaten im Skript verschluckt, oder bin ich völlig auf dem Holzweg? Ich denke das es einfacher ist mit sechs Argumenten zu hantieren als die riesenlange Variable $4 zu zerlegen.

Gruß Jens

This post has been edited 1 times, last edit by "jmeissner" (Jul 17th 2012, 4:33pm)


dnsmichi

Super Moderator

Posts: 5,986

Birthday: May 30th 1983 (29)

Gender: male

Location: Nürnberg

Occupation: Consultant / Developer beim besten Arbeitgeber der Welt @netways

Number of monitoring servers: Icinga: 4x dev, 10++ prod, Icinga2: 2x dev

Nagios Version: s/nagios/icinga/

Icinga Version: 1.9.0 / GIT

Distributed monitoring: Ja

Redundant monitoring: Ja

Number of hosts: 1000+

Number of services: 15000+

OS: RHEL, Debian, SUSE

Plugin Version: 1.4.16

IDO-Version: 1.9.0 / GIT MySQL/Postgresql/Oracle

Other Addons: Icinga Web, PNP, check_multi, inGraph, EventDB, LConf

17

Tuesday, July 17th 2012, 6:00pm

wenn du's so splittest wuerde ich eher ueberpruefen, ob $5 mit perfdata ueberhaupt gesetzt ist (als integritaetscheck), und wenn nicht, dann eben den kurzen string ausgeben. zusaetzlich zum testen kannst du dir ja innerhalb des scripts noch den nsca string ausgeben lassen, bzw selbst wohin loggen, damit du's siehst.
+++ Icinga / LConf Developer +++ Senior Consultant at []NETWAYS> +++
+++ Icinga 1.9 || Icinga 2 +++ Icinga Support || IRC +++

jmeissner

Beginner

Posts: 31

Number of monitoring servers: 4

Nagios Version: keine

Icinga Version: 1.8.4

Distributed monitoring: Ja

Redundant monitoring: Nein

Number of hosts: 213

Number of services: 6700

OS: openSuSE 12.2

Plugin Version: 1.4.16

NagVis Version: 1.7.5

Other Addons: pnp4nagios 0.6.19, check_mk 1.2.0p4

18

Wednesday, July 18th 2012, 1:11pm

Danke für eure Hilfe, es funktioniert jetzt einwandfrei.
Ich habe es jetzt so gelöst.

Source code

1
2
3
if [$5 -eq '']
    then    $printfcmd -e "$1\t$2\t$return_code\t$4" |  $NscaBin -H  $IcingaHost -c $NscaCfg
    else    $printfcmd -e "$1\t$2\t$return_code\t$4|$5 [$6]" |  $NscaBin -H  $IcingaHost -c $NscaCfg


Gruß Jens