Leider ist das server-password-change Skript heute total schief gelaufen :-(!!!
Sicherung startet beim Kunden um 21:00, habe nun das Skript per Hand angestoßen, der udm Befehl zum ändern des Server- Passwortes brauchte 3 Sekunden…
Am Wochenende werden auch noch zusätzlich die virtuellen Maschinen gesichert… Da kann das ändern vielleicht schonmal über 10 Sekunden benötigen…
Wäre es vielleicht möglich, das Timeout auf 30 Sekunden zu erhöhen…?
Und nun zum eigentlichen Problem, das Server Passwort ändern Skript ist heute Abend um 1:00 total schief gelaufen!!! Den halbe Vormittag funktionierte NICHTS mehr!
Grund: server-password-change Skript…
Dieses hat laut Log- Dateien das Passwort im udm zwar geändert, aber nicht in der /etc/machine.secret, somit ist beim Kunden die Produktion für STUNDEN gestanden!
Ich finde das server-password-change bei nährer Betrachtung etwas herzlog programmiert, ihr geht einfach davon aus, dass alle Befehle fehlerfrei funktionieren werden, überprüft aber nicht, ob diese tatsächlich fehlerfrei funktioniert haben!
Man bedenke, dass es sich hierbei um ein Skript handelt, wenn hier ein Fehler auftritt, der komplette Server, somit auch der komplette Betrieb steht!
1.) Ihr schreibt einfach das neue Passwort in die machine.secret, überprüft aber nicht, ob dieses auch tatsächlich geschrieben wurde (Sicherung, zuviele io, könnte kernel fehler produzieren?!..). Hier würde ein einfaches cat reichen, um zu sehen, ob es tatsächlich geschrieben wurde… Oder auch den return status des letzten Befehls überprüfen??!
Man sollte immer davon ausgehen, dass unter bestimmten Situationen jeder Befehl schief gehen kann…!
2.) Nach ändern des Passworts wird kein authentifizieren mit dem neuen Passwort getestet! Man sollte testen, ob ein auth mit dem neuen Passwort möglich ist, falls nicht, eventuell auf ältere Passwörter zurückspringen, bis der auth funktioniert!!!
3.) Habe ich zwar schon gemeldet, aber wenn das Passwort ändern fehlschlägt & nochange ausgeführt wird, wird der bind Dienst NICHT gestartet!!! Warum wurde dieser übersehen?? Eine der wichtigesten Komponenten!!!
Wurde das Skript auf bestimmte Fehlersituationen bei euch getestet?? Warum können dann solche Fehler auftreten?
Habe das Skript zum ändern des Passwortes beim Kunden vorerst deaktiviert…
lG