Jeden morgen zwischen sieben und acht

Projektangaben

Zeitpunkt

Dauer

Kunde

August 2018

2 Wochen

Baustoffhändler

Eine gelungene Virtualisierung und ein gescheiter physischer Server vor eineinhalb Jahren schienen wie der Schlusspunkt einer kurzen aber heftigen Aufgabe, bei der ich einem befreundeten Kollegen geholfen habe. Zu Hause wäre nun das übliche Vorgehen, alle drei Monate eine kurze Wartung durchzuführen, Updates zu installieren usw. Mehr und öfter über den Server zu sprechen wäre ungewöhnlich.

Hier leider nicht.

Ein Jahr nach der Virtualisierung fing der Server an, jeden Morgen zwischen sieben und acht abzustürzen. Man könne fast seine Uhr danach stellen, so der Kollege. Merkwürdig, merkwürdig, doch fallen mir gleich eine ganze Reihe von Punkten ein, die es erst mal zu klären gilt: Einzelne Rechner als Fehlerursache ausschließen, indem diese reihum tageweise aus dem Netz genommen werden, das Netz derweil für private Geräte sperren, die Logs im Server befragen, was der so zwischen sieben und acht am Morgen treibt, mit dem Support der Fachsoftware für die Rechnungslegung sprechen usw.

All das brachte nicht wirklich eine Lösung, denn es blieb bei der Problematik. Nicht wirklich leichter machte es die Tatsache, dass der Server rund 1.300km von der Homeoffice entfernt steht. Also wurden ziemlich schnell ziemlich schwere Geschütze aufgefahren:
Physischer und virtueller Server wurden mit unserem Connect-Server verbunden. Instanzen für das Monitoring wurden eingerichtet und um alle erdenkbaren Parameter erweitert. Unser Controll-Server zeichnete den leisesten Wind im Netzwerk auf.

Da konnten die ersten Ergebnisse nicht lange auf sich warten lassen:
1. Zwei IP Adressen sind fest in Geräten einprogrammiert und werden trotzdem noch vom DHCP-Server vergeben
2. Der Router wird immer langsamer, wenn eine bestimmte Anzahl von Geräten im Netz sind
3. Der Server stürzt nicht ab, sondern die Serverinstanz des Kassensystems

Die ersten beiden Punkte waren schnell behoben. Der dritte Punkt erforderte allerdings weitere Anstrengungen. Also wurde das Monitoring noch einmal erweitert, um die dem Kassensystem zugrunde liegende Datenbank genauer zu überwachen. Genau dabei zeigte sich schnell, dass nicht die komplette Kassensoftware abstürzt, sondern ein einzelner Prozess der Datenbank.

Bis zu einer solchen Erkenntnis zu gelangen ist outstanding! Zumal der Support der Fachsoftware den Fehler ganz klar der Serverinstallation und nicht seinem Produkt zurechnete. Entsprechend war die Erwartungshaltung hoch, als das Problem im Detail an den Support des Kassensystems gemeldet wurde. Dieser prüfte für zwei Tage und bemerkte, dass Beginn der Probleme und ein eingespieltes Update zeitlich zusammenhängen, um dann zu entscheiden, dass die Entstörung eines einzelnen Prozesses zu anspruchsvoll wäre.

Also wurde der komplette virtuelle Server neu aufgesetzt und die Serverinstallation des Kassensystems darauf übertragen. Zumindest die Basisinstallation ist absolut sauber, nicht zuletzt weil ich diese selbst vorgenommen habe.