Hallo Gemeinde,
wir haben bei einem Kunden einen Fehler, der uns bei noch keiner anderen Installation untergekommen ist. "Freundlicherweise" tritt er auch nur sporadisch auf. Alle 3-6 Wochen einmal.
Das Symptom ist stets identisch: Wenn man auf den Server schaut, sieht eigentlich alles gut aus. Alle David-Dienste laufen, keine Probleme im System. Startet man allerdings den David-Client, passiert nichts. Keine Fehler, keine Server-Auswahl. Wir haben daher bislang immer den Service Layer neu starten wollen.
Der Service Layer aber bleibt beim Beenden im Status "Wird beendet" hängen. Man muss manuell den Task abschießen, dann den SL neu starten - und plötzlich rennt wieder alles wie gewohnt, ohne Probleme, ohne Fehler.
Bisherige Untersuchungen und Erkenntnisse:
- Keine Fehler im Windows-Eregnisprotokoll
- Keine Fehler im David unter System -> Ereignisse
- Es wurden kürzlich keine Updates eingespielt und der Server auch nicht neu gestartet
- Eine Bereinigung temporärer Dateien gem. Tobit-KB haben wir jedes Mal durchgeführt, dort gab's aber keine "angesammelten" Dateien
- Virenschutz ist unschuldig, es läuft nur der Defender, und David ist komplett ausgeklammert. Funde gab's auch keine.
Bisher machte sich das Problem immer am Morgen bemerkbar, der Kunde konnte also an Tag X normal arbeiten, machte Feierabend, und am nächsten Morgen hing's. Da Updates und Neustart inzwischen ausgeschlossen wurden, bleiben eigentlich nur Datensicherung und Datenbereinigung als Ursache übrig. Das auszuschließen ist problematisch, wenn der Fehler so selten auftritt. Es gibt aber eine gewisse Korrelation zwischen der gestern zuletzt eingetroffenen Mail (23:02 Uhr) und dem Start des Backups der David-Daten-Partition (23:03 Uhr). Wobei das auch nicht 100% akkurat ist, da über Nacht wenig Mail eintrudeln - genau so gut könnte der Aufhänger um 03:30 Uhr aufgetreten sein. Das Backup erfolgt mittels Drive Snapshot (auf Basis der MS-Schattenkopien), das Tool ist uns bisher immer nur als extrem pflegeleicht untergekommen. Fest steht auch, dass die Sicherung um 01:30 fertig war, sich also nicht mit der David-Datenbereinigung (03:00) überschneidet.
Hat jemand von euch eine Idee, wo wir noch suchen könnten? Irgendein anderes LOG, eine andere Überwachungs-Methode? Blöd ist halt, dass wir nicht einmal z. B. den Status des SL per Monitoring überwachen können, denn der Dienst läuft ja (er macht nur nix). Ich würde vermutlich testweise mal die Art des Backups ändern, aber das wäre schon ziemlich unschön, da "Sonderlösung".
Bin wie immer für jeden Tipp dankbar!