Hallo Leute,
seit einiger Zeit kam es sporadisch vor das der check-mk-agent mit “failed” bei Systemd drinnen stand. Nun ist es leider bei sämtlichen UCS-Servern ein Dauerzustand geworden. Und das lässt sich im Betrieb auch nicht fixen. Dabei ist der Agent oft 20-30 mal in Systemd als failed zu sehen. Das ganze sieht dann z.B. so aus:
check_mk@243-192.168.44.57:6556-192.168.44.254:59154, ...
Von den Einträgen gibt es zig, und das verteilt auf 100 Maschinen Plus, da sieht man dann in CheckMK genau nichts mehr.
Ein Reboot einer solchen Maschine behebt das Problem manchmal, manchmal auch nicht. Starten oder Restarten kann man die genannten Services leider nur selten. Oft existieren diese gar nicht.
Wir benutzen hier CheckMK in der Version 1.6.0p13 und UCS in der Version 4.4.
Hat da jemand eine Idee / einen Lösungsvorschlag?
Lg. und Danke
SomeWire