Sicherung des Master-DC

Moin,

all of the above. Oder anders ausgedrückt: eine Kombination verschiedener Methoden, um gegen verschiedene Problemfälle abzusichern:

  1. Einsatz eines DC Backups, idealerweise auf einer anderen Hardware, in einem anderen Brandabschnitt oder sogar einem anderen Gebäude — sichert gegen einen katastrophalen bzw. dauerhaften Ausfall des DC Masters. Kann in dem Fall zu einem DC Master hochgestuft werden (anschließend einen neuen DC Backup aufsetzen).
  2. Hochverfügbarkeit einzelner Dienste konfigurieren — sichert gegen kurz- und mittelfristige Ausfälle dieser Dienste ab (das ist das, was Sie ja auch schon selber aufgesetzt und verlinkt haben)
  3. Vor Betriebssystemupdates Snapshots erstellen — damit kann man im Fall eines echten Problems mit den Updates auch wieder zum Stand davor zurückkehren[1]
  4. Verwendung von redundantem Storage (RAID) — sichert gegen Ausfall einzelner Festplatten
  5. Klassische Backups: Dumps aller Datenbanken inklusive des LDAP-Verzeichnisses, Sichern aller Dateien, mit welchem Programm auch immer — sichert gegen versehentliches Löschen/Überschreiben/Verändern, erlaubt Wiederherstellung auf anderen Maschinen etc.

Punkte 4 und 5 halte ich in allen Szenarien für absolutes Mindest-Muss. Alles weitere ist dann je nach Szenario und Aufwand sinnvoll.

[1] Verwendung von Snapshots:

Snapshots kann man in UCS sehr wohl verwenden, wenn man sich an ein paar Regeln hält. Snapshots können beim Wiederherstellen problematisch sein, weil es mit Samba eine Komponente gibt, die eben bidirektional zwischen allen beteiligten Servern synchronisiert, und nicht nur unidirektional vom DC Master zu den anderen Servern. Über die Synchronisation zwischen Samba4-LDAP und OpenLDAP landen die Änderungen dann halt auch im OpenLDAP.

Was daher gefährlich ist, ist das Wiederherstellen von Snapshots von unterschiedlichen Zeitpunkten, oder aber auch das Wiederherstellen nur einzelner Maschinen aus Snapshots.

Beide Probleme kann man aber gut umgehen:

  1. Vor den Updates einfach alle UCS-Maschinen sauber herunterfahren und die Snapshots im ausgeschalteten Zustand erstellen. Dadurch wird Konsistenz der Snapshotzeitpunkte sichergestellt.
  2. Muss man Snapshots wiederherstellen, so alle UCS-Maschinen wiederherstellen und nicht nur ein paar wenige.
  3. Zur Not kann man auch den DC Master aus einem Snapshot wiederherstellen und anschließend alle anderen UCS-Server schlicht mit univention-join neu joinen. Dabei gehen keine Verkehrsdaten (Datenbanken, Dateien, Rechte…) flöten, und es werden die beteiligten Dienste wieder auf einen konsistenten Zustand gebracht.

Gruß
mosu

1 Like