über den Changelog der 3.x Versionen bin ich darauf gekommen, dass Univention etwas am Nagios-Sensor für die NTP-Überwachung verbessert hat.
Wir verwenden 4.0-1 auf Patchstand 03-2015 und damit bekomme ich seit einem der letzten Patches regelmäßig (täglich auch 10x) sowas:
** PROBLEM Service Alert: ucs.somedomain.tld/UNIVENTION_NTP is CRITICAL **
***** Nagios *****
Notification Type: PROBLEM
Service: UNIVENTION_NTP
Host: ucs.somedomain.tld
Address: 192.168.xxx.xxx
State: CRITICAL
Date/Time: Tue Mar 31 17:33:56 CEST 2015
Additional Info:
NTP CRITICAL: Offset unknown
Aufgrund dessen habe ich letztens mehrfach versucht, von unserem internen NTP, welcher sich die Zeit von pool.ntp.org holt und dem internen Netz zu Verfügung stellt, sofort per Abfrage die Zeit zu holen. Dies funktioniert von einem anderen Linux problemlos (natürlich vergehen einige Sekunden, bis ich das nach der Fehlermeldung testen kann).
Nach 10 Minuten gibt es dann immer die Gutmeldung:
** RECOVERY Service Alert: ucs.somedomain.tld/UNIVENTION_NTP is OK **
***** Nagios *****
Notification Type: RECOVERY
Service: UNIVENTION_NTP
Host: ucs.somedomain.tld
Address: 192.168.xxx.xxx
State: OK
Date/Time: Tue Mar 31 17:43:56 CEST 2015
Additional Info:
NTP OK: Offset -1.537799835e-05 secs
Es gibt in der Univention Config-Registry Felder für 3 NTP Server, wahrscheinlich werden diese per Failover nacheinander abgefragt. Wir haben zur Zeit nur einen gesetzt.
Ich wundere mich, warum das erst jetzt Probleme macht, da wir an der restlichen Konfiguration nichts geändert haben, insbesondere am internen NTP, abgesehen von den UCS Updates.
Vielleicht hat jemand ähnliche Probleme bzw. eine Idee?
Im Netz findet man Hinweise auf Probleme von check_ntp_time im Kontext der “Leap Second”. Die ist aber erst am 30.6.
Bemerkenswert ist allerdings, dass bei Ihnen der Fehler am Tag nach der DST-Umstellung auftrat. Wobei ich ihn letztmalig am 8.3. gesehen habe. Da war aber nur Internationaler Frauentag, dürfte also nicht in einem Zusammenhang stehen.
Vielleicht findet jemand anderes noch aktuellere Hinweise. Die Bugs im Kontext sollten in dieser Version von nagios-plugins-basic behoben sein.
Der Fehler trat schon vor der DST-Umstellung auf, nur in unterschiedlicher Häufigkeit. Es könnte natürlich auch mit einem unzuverlässigen NTP-Server im Pool zusammenhängen. Momentan erhalte ich jedenfalls etwas weniger Meldungen diesbezüglich!
Ob der internationale Frauentag für Risse im Raum/Zeitkontinuum verantwortlich sein kann, konnte ich bis jetzt leider auch noch nicht eruieren…