Unregelmäßige Systemabstürze

german

#1

Hallo,

folgendes Szenario:
UCS-Master (2.2-3 SP4) + Scalix (11.4.6) läuft als DomU
auf einem Debian Lenny Xen-Host (2.6.26-2-xen-686).

Das System ist nach der Neuinstallation einige Wochen stabil gelaufen. In den letzten Wochen kommt es jedoch immer wieder zur Systemabstürzen. Die Frequenz liegt zwischen ca. 2 Tagen und 3 Wochen (eventuell war die erste stabile Zeit auch nur eine dieser Phasen).

Beim Absturz werden keinerlei Einträge in die Logdateien (syslog, kernel.log) geschrieben, die Aufschluss über die Absturzursache liefern könnten - weder in den Logs der DomU noch der Dom0.

Auch wenn ich alle Logdateien nach dem Absturzzeitpunkt durchsuche (den ich aus Dom0: /var/log/xen/xend.log kenne), finde ich keine
zeitnahen Einträge die Aufschluss geben können.

Das UCS-System stürzt offenbar ohne Vorankündigung einfach ab, unabhängig von der Last, zu beliebiger Tageszeit.

Ein Memtest auf dem Hostrechner liefert keine Fehler. Das RAM dürfte also in Ordnung sein.

Ich hab das DomU Image auf einem anderen XEN-Host laufen lassen. Bei dem ist der Absturz schon nach rund 30 Minuten erfolgt, wieder ohne Einträge in den Logfiles.
Ein Hardware-Fehler ist also unwahrscheinlich.

Auf den Partitionen sind unter 50% des verfügbaren Speichers belegt. Es dürfte ausreichend RAM (1.5GB) verfügbar sein: der Swap wird vom System nicht verwendet.

Kann dieses Problem damit in Zusammenhang stehen?


(es existiert bereits ein Eintrag im Bug-Tracking System)
…eventuell mit der xen-eigenen libc6 Version?

Diese Logeinträge wurden bereits als unkritisch eingestuft:

Was kommt als Ursache noch in Frage?

Hat jemand weitere Lösungsvorschläge?

Gibt es schon Informationen, wann Scalix 11.5 erscheint bzw. unter UCS-2.3 verfügbar sein wird?

Vielen Dank im Voraus,
Jürgen Kurzmann.


#2

Mögliche Ursache gefunden:
bugs.debian.org/cgi-bin/bugreport.cgi?bug=534880

Unter der Kernelversion 2.6.26 dürfte es Probleme mit DomUs geben, denen mehr als 2 virtuelle CPUs zugewiesen sind (vcpu>1 option).

Ich werde berichten, ob die DomU mit aktuellem Kernel stabil laufen.

lg, Jürgen.


#3

Hallo,

sind die Instabilitäten nach dem Zuweisen von weniger CPU’s nocheinmal aufgetreten?

Mit freundlichen Grüssen
Tobias Scherer


#4

leider ja.

Das System ist vorerst stabil gelaufen. Vor etwas über 2 Wochen habe ich die virtuelle Maschine nach einem Security-Update neu gestartet.

Gestern Abend ist jedoch die Dom0 (samt DomU = UCS System) wieder ohne Vorankündigung abgestürzt. Weder da noch dort auffällige Logeinträge. syslog und kern.log zeigen vorm Absturzzeitpunkt keine Fehler.

Das System war zu dem Zeitpunkt (um ca. 20:15 Uhr) auch nicht unter Last. Nachdem ich relativ ratlos bin werde ich es einfach weiterhin genauer im Auge behalten und bin gespannt, ob die Probleme mit einem Update auf UCS 2.3 (sobald Scalix dafür verfügbar ist) behoben sind.

mfg, Jürgen.


#5

Vielleicht mal Kernel 2.6.18 in der DomU verwenden?

Viele Grüße
Stefan Gohmann


#6

Kann man in diesem Forum auch Beiträge verschieben?
Bisher sieht der Thread für mich eher nicht nach einem Scalix-spezifischen Problem aus.


#7

Hier sind noch weitere Tipps: wiki.xensource.com/xenwiki/XenBestPractices

Das Begrenzen des Dom0-Speichers war bei uns in einem anderen Fall erfolgreich.

Viele Grüße
Stefan Gohmann


#8

Vielen Dank für die Tipps.

Das System läuft nun seit 6 Wochen stabil, einzig mit der Änderung auf vcpu=1.
Sollte es doch noch einmal zu einem Absturz kommen werde ich das RAM für die Dom0 fixieren und ballooning deaktivieren.

[code]/boot/grub.lst:
kernel /xen.gz-3.x.x dom0_mem=512M

/etc/xen/xend-config.sxp:
(dom0-min-mem 0)[/code]
Danke nochmals,
Jürgen Kurzmann

PS: Verschieben des Threads (falls möglich) ist eine gute Idee!