Hallo,
über den Changelog der 3.x Versionen bin ich darauf gekommen, dass Univention etwas am Nagios-Sensor für die NTP-Überwachung verbessert hat.
Wir verwenden 4.0-1 auf Patchstand 03-2015 und damit bekomme ich seit einem der letzten Patches regelmäßig (täglich auch 10x) sowas:
** PROBLEM Service Alert: ucs.somedomain.tld/UNIVENTION_NTP is CRITICAL **
***** Nagios *****
Notification Type: PROBLEM
Service: UNIVENTION_NTP
Host: ucs.somedomain.tld
Address: 192.168.xxx.xxx
State: CRITICAL
Date/Time: Tue Mar 31 17:33:56 CEST 2015
Additional Info:
NTP CRITICAL: Offset unknown
Aufgrund dessen habe ich letztens mehrfach versucht, von unserem internen NTP, welcher sich die Zeit von pool.ntp.org holt und dem internen Netz zu Verfügung stellt, sofort per Abfrage die Zeit zu holen. Dies funktioniert von einem anderen Linux problemlos (natürlich vergehen einige Sekunden, bis ich das nach der Fehlermeldung testen kann).
Nach 10 Minuten gibt es dann immer die Gutmeldung:
** RECOVERY Service Alert: ucs.somedomain.tld/UNIVENTION_NTP is OK **
***** Nagios *****
Notification Type: RECOVERY
Service: UNIVENTION_NTP
Host: ucs.somedomain.tld
Address: 192.168.xxx.xxx
State: OK
Date/Time: Tue Mar 31 17:43:56 CEST 2015
Additional Info:
NTP OK: Offset -1.537799835e-05 secs
Es gibt in der Univention Config-Registry Felder für 3 NTP Server, wahrscheinlich werden diese per Failover nacheinander abgefragt. Wir haben zur Zeit nur einen gesetzt.
Ich wundere mich, warum das erst jetzt Probleme macht, da wir an der restlichen Konfiguration nichts geändert haben, insbesondere am internen NTP, abgesehen von den UCS Updates.
Vielleicht hat jemand ähnliche Probleme bzw. eine Idee?
Beste Grüße,
TP