Moin,
Sie verwechseln hier Korrelation und Kausalität. Nur, weil Sie meinen, dass zwei Ereignisse (Upgrade ZCP sowie die beobachteten Fehler) im zeitlichen Zusammenhang (Korrelation) stehen, bedeutet das noch lange nicht, dass sie auch in irgend einer Form voneinander abhängen oder das eine Ursache des anderen ist (Kausalität). Wir Menschen sind extrem schlecht darin, intuitiv zu entscheiden, ob solche Ereignisse zusammenhängen. Wir merken uns sehr leicht gewisse Dinge (»ich habe ZCP manuell aktualisiert«), aber viele andere Dinge, die ebenfalls geschehen können sein (z.B. dabei ein Kernelupgrade, oder ein Upgrade der QNAP-Firmware, oder die Tatsache, dass das Problem bereits vor dem Upgrade mal aufgetaucht ist aber dann als einmaliges Ereignis abgetan wurde), entgehen völlig unserer Wahrnehmung.
Konkret: die Meldungen, die ich meine, sind der komplette Block, bei dem die Zeilen mit »kernel:« bezeichnet sind. Bereits die erste Zeile »rcu_sched detected stalls on CPU/tasks…« ist das, was mich aufmerksam gemacht hat. Weiter unten finden Sie »NMI watchdog: BUG: soft lockup - CPU#2 stuck for 1025s!« (wobei das meiner Erfahrung nach nur eine Folgeerscheinung der ersten Meldung ist, sie ist also nicht Ursache sondern ein Symptom). Direkt im Anschluss beendet sich MySQL. Auch hier kann man argumentieren, dass zeitliche Korrelation zwischen den Kernel-Meldungen und dem MySQL-Shutdown nicht zwangsläufig Kausalität bedeutet, also dass die Kernelmeldungen und der Shutdown begründet zusammenhängen, aber ich vermute, dass Sie ähnliche Abfolgen finden würden, wenn Sie ältere syslog-Dateien durchsuchen würden.
Was so eine Meldung bedeutet? Es gibt da leider viele mögliche Ursachen. Eine ist ein Bug im Kernel (eher selten, passiert aber mal), eine andere sind unerwartete Hänger in Codepfaden, in denen es keine Hänger geben sollte, z.B. aufgrund von defekter Hardware — oder aber aufgrund von Inkompatibilitäten mit der Virtualisierung oben drüber. Dort können genau so Bugs enthalten sein.
Was meiner Erfahrung nach aber nie eine Ursache für solche Meldungen ist, sind User-Space-Programme wie Amavis, MySQL oder Zarafa. Die können höchstens das eigentliche Problem triggern.
Daher kann ich wirklich nur mit Nachdruck raten, die Maschine auf eine andere Hardware umzuziehen, um zu testen, ob sich am Verhalten etwas ändert. Wenn das partout nicht möglich ist, dann können Sie noch versuchen, UCS mit einer anderen Kernel-Version laufen zu lassen. Weiterhin sollten Sie prüfen, ob es für die QNAP neuere Firmware gibt und falls ja auch diese testweise ausprobieren.
Gruß,
mosu