Nfs Netzwerkprobleme

german

#1

Hallo,
leider werden die Probleme bei unseren UCCs nicht weniger.

Die Ablagen werden per nfs gemountet. Folgende Probleme treten viel zu oft, nicht reproduzierbar auf, mal bei dem einen Nutzer, dann bei dem anderen unabhängig vom Rechner:

  • Programmabstürze bei geöffneten Dokumenten
  • Änderungen sind nicht speicherbar (Rechte Problem), andere Nutzer der selben Rechtegruppe können aber damit arbeiten
  • Dokumente lassen sich nicht öffnen bzw. öffnen mit der falschen Anwendung
  • Zugriff auf Ablagen extrem langsam (wie gesagt, andere Nutzer mit den gleichen Rechten können zur selben Zeit gut arbeiten)
  • Anmeldeprozess bleibt stehen
  • Rechner “hängt”
  • Nutzer können sich nicht abmelden (der Dialog erscheint nicht)

So in etwa … Ein Server-Neustart bringt kurzeitig “Besserung”.
Mir fehlen die Ansatzpunkte in welchen Log-Dateien ich schauen müsste bzw. welche Prozesse ich überwachen sollte.
Vielen Dank im Voraus
Torsten


#2

Hallo,

ich habe mal in das syslog geschaut, ob ich etwas ungewöhnliches sehe.

Dort stehen massenhaft im Millisekundentakt Einrträge:
rpc.gsad[2067]: ERROR: can’t open /var/lib/nfs/rpc_pipenfs/nfsd4_cb/clnt…: No such file or directory

Nach einem Serverneustart sind diese Einträge erstmal nicht mehr im log.


#3

Interessant wären sicherlich Logmeldungen vom Zeitpunkt kurz bevor die von Ihnen gezeigten Meldungen anfangen. Gibt’s da irgendetwas Verdächtiges, z.B. Dateisystemfehler, Fehler von NFS- oder RPC-Dämonen oder in der Ausgabe von dmesg etc.? Wenn das nachträglich nicht gut zu beurteilen ist, dann sollten Sie nach dem ja bereits erfolgten Serverneustart die Logdateien regelmäßig auf diese Fehlermeldung untersuchen und dann weiter analysieren.

Die von Ihnen im ersten Post geschilderten Probleme klingen sehr nach den allgemeinen Problemen auf einem NFS-Client, wenn sein NFS-Server nicht oder nur teilweise antwortet. Die Ursachenforschung sollte sich erst einmal auf den Server konzentrieren, vor allem, da Sie dort ja schon Fehlermeldungen ausgemacht haben.

Zu der konkreten Fehlermeldung ist mir nichts bekannt, auch eine kurze Suche hat leider nichst Erhellendes zu Tage gefördert.


#4

Hallo,

danke für die Antwort.
So richtig konnte ich in den logs nichts “verdächtiges” erkennen.
Darum versuche ich jetzt mal die Probleme nacheinander anzugehen, zu erst das mit den Rechten. Bei den NFS-gemounteten Laufwerken werden die Berechtigungen bei neu angelegten Dateien nicht richtig vererbt (setgid ist gesetzt) Vielleicht ein acl-Problem mit NFS?

Darum versuche ich mal die Freigaben als Samba-Freigaben zu mounten. Das geht leider auch noch nicht.
Ich habe dafür in der Richtlinie Eintragungen vorgenommen.
Die /etc/cron.d/univention-ucr-cronjobs sieht jetzt so aus:

PATH="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/bin/X11:/opt/scalix/bin"
MAILTO=root
@reboot root sleep 5s
MAILTO=root
@reboot root mount //dc01/08-test /media/test8 -t cifs -o username=lehrertest,passwd=EbeneinW8rt,domain=lehrer,rw

Führe ich “mount //dc01/08-test /media/test8 -t cifs -o username=lehrertest,passwd=EbeneinW8rt,domain=lehrer,rw” nach dem Start als root im Terminal aus, dann ist die Freigabe verfügbar, aber eben gleich nach dem Start nicht.
Viele Grüße
Torsten


#5

Moin,

Das set-GID-Bit hat nichts mit dem Vererben von Berechtigungen zu tun. Es sorgt lediglich dafür, dass neu angelegte Dateien und Verzeichnisse derselben Gruppe zugewiesen werden wie das Verzeichnis, in dem sie erstellt werden. Die Berechtigungen werden ganz normal von der umask des Prozesses beeinflusst – und natürlich von den ACLs auf dem Verzeichnis.

Bei den ACLs gilt: diese werden auch nicht »vererbt«. Statt dessen kann es auf einem Verzeichnis »Default-ACLs« geben. Die Default-ACLs (und nur die!) werden bei neu angelegten Dateien und Verzeichnissen gesetzt.

Daher wäre es sinnvoll, mal die Ausgabe von »getfacl /path/to/the/directory« zu sehen, vor allem auf dem Client.

Hier kann es gut sein, dass es zu einer Race-Condition kommt – evtl. ist das Netzwerk in dem Moment noch nicht up, oder der DNS-Server noch nicht erreichbar. Normalerweise werden Netzwerkfreigaben auch nicht über Cron-Jobs eingebunden, sondern über die fstab.


#6

Hallo,

danke für die Antwort.
Ich habe in der “Zwischenzeit” alle Freigaben per smb angebunden, indem ich entsprechende Einträge in der pam_mount.conf.xml gesetzt habe.

Ob die Nutzer jetzt weniger Probleme haben, muss ich abwarten.

Die Freigaben per Cron zu mounten, hatte mir mal ein Univention-Techniker per Mail geraten.