Hello Ben, Sönke und alle Anderen,
memtest86: ist nun gelaufen und hat keine Fehler im RAM erkannt.
Außerdem habe ich nun im BIOS des HP Proliant Servers das sog. Online-Speicher gesetzt. Dabei werden von den 60GB Gesamtspeicher 20GB reserviert und im Falle eines Fehlers zugeteilt. Damit kann es meiner Meinung nach im OS zu keinem Speicherfehler mehr kommen.
Die Festplatten einzeln testen tue ich mir nun nicht an. Das kostet mich zuviel Zeit.
Und ja, die Festplatte im RAID kann ich unter dem USC5 vom Stick gebootet sehen.
Und ja, auch ein fsck habe ich über die Partitions /dev/sda1 (Grub und /boot) und /(dev/vg_ucs/root als /) laufen - auch da war alles ok.
Den Cache am RAID-Kontroller kann ich nicht deaktivieren.
Ich tippe nun auf einen korrupten RAID-Kontroller Treiber in der UCS Installation auf den RAID-Platten - meiner Meinung nach kommt nicht mehr viel sonst in Frage.
Ich brauche nun schön langsam wieder meine Daten und habe mich entschlossen, das System enu aufzusetzen.
Dazu habe ich folgende Fragen:
- Kann ich das System, wenn ich die vorhandenen Partitions nicht lösche, über die bestehende Installation auf /dev/vg_ucs/root drüberinstallieren? Wird das funktionieren? Oder soll ich lieber eine komplett neue Installation machen?
- Würde UCS5 beim Drüberinstallieren meine vorherige Installation erkennen und die Programme (Letsencrypt, Nextcloud, usw.) und Settings übernehmen? Aber auch wenn nicht, dann müsste ich das halt alles nachher neu einrichten. Der enstscheidende Vorteile wäre, dass ich direkt wieder auf die Daten zugreifen kann.
Wenn eure Empfehlung eine saubere Neuinstallation ist (also mit einem Löschen der bestehenden Partitions) müsste ich halt mein Backup, dass ich ohnehin habe, wieder einspielen. Das wäre nicht so schlimm - das ganze würde zwar sehr viel Zeit in Anspruch nehmen, aber in die Rettung der vorhandenen Installation habe ich schon 3x mehr Aufwand investiert.
Vielen Dank im Voraus für eure Empfehlung und Einschätzung,
Michael