Fehlersuche per Operlog: Fehler in der IT-Produktion schneller finden – durch Online- und historische Daten
In z/OS-Umgebungen eines Rechenzentrums entstehen bei großen Unternehmen Tag für Tag Millionen von Meldungen, von Benutzeranmeldungen bis zu Hinweisen auf kritische Fehler. Operlog-Daten als spezielles Logstream-Format spielen hier eine besondere Rolle. Damit werden Kommunikationen über Programme und Systemfunktionen von jedem System in einem Sysplex aufgezeichnet und zusammenführt. IBM empfiehlt JES3-Kunden mit einem Multisystem-Systemkomplex die Verwendung von Operlog-Logstream, gleichzeitig sollten JES3 DLOG und SYSLOG ausgeschaltet werden. Operlog kann auch als reiner DASD-Protokollstrom verwendet werden. Für die Fehlersuche.
von Boris Kemp, Director Product Strategy Beta Systems Software
Administratoren in Großunternehmen wissen, wie zeitaufwändig die Arbeit mit diesem speziellen Format ist und wie viel Know-how dafür erforderlich ist. Operlog-Daten liegen entweder aktuell (online) vor oder sie sind bereits archiviert. Sowohl auf Online- wie auf archivierte Daten muss der Administrator zugreifen, wenn er die Ursachen für bestimmte Fehler oder Probleme im z/OS-Umfeld nachvollziehen will.Zugriff auf Operlog über SAF-Definitionen steuern
Über die Batch-Schnittstelle können Operlog-Daten im Hintergrund ausgewählt sowie im SYSLOG- und/oder MDB-Format (Nachrichtendatenblock) gespeichert werden. Die gespeicherten Daten sind über einen vom Kunden gewählten Zeitraum mit der gleichen Schnittstelle und Ausstattung verfügbar. Diese Management-Funktion löst auch das Problem des Zugriffs auf die Operlog-Daten innerhalb eines großen Systems mit verschiedenen Benutzern/Kunden. Der Zugriff auf Operlog kann über SAF-Definitionen gesteuert und systembezogen festgelegt werden. Ein wichtiges Sicherheitsmerkmal, das zudem hohe Kontrolle und Übersicht über die Daten ermöglicht. Für die Kommunikation mit Sysplex greift der Logstream Manager auf die offene Basic Sysplex (XCF)-Schnittstelle zurück. Als dritte Komponente fungiert daher ein Sysplex Communicator.
Die Credit Suisse Group AG setzt seit einiger Zeit ein Werkzeug ein, das beide Ansätze vereint – die „Operlog Tools“ von Beta Systems. Rund 100 User arbeiten bei dem Finanzdienstleister mit der Lösung. Sie verwaltet sowohl den Online- wie den archivierten Bestand über eine gemeinsame Oberfläche. Der Administrator kann Meldungen einzeln aussortieren, sie selektieren, bisherige Selektionskriterien sichern und wiederverwenden usw. Vergleichbare Tools wurden von der IBM-Community in der Vergangenheit nur schlecht angenommen. Anwender sind vor allem Großunternehmen, die traditionell mit IBM-Infrastrukturen arbeiten: Versicherungen, Banken, Krankenkassen und auch Behörden.
Herkömmliche Fehlersuche blockiert Ressourcen
Bislang mussten die RZ-Administratoren der Credit Suisse Fehler im Produktionsbetrieb stets manuell aufspüren. Dies hatte mühsame und zeitaufwändige Suchen zur Folge, gerade in kritischen Situationen mit hoher Management Attention, in denen Fehler auftraten, die zum Stopp der IT-Produktion führten und innerhalb kürzester Zeit behoben werden mussten. Es führte zudem nicht selten zur Blockade von Ressourcen bei der Fehlersuche, die so nicht für andere Zwecke verwendet werden konnten.
Risiken ungewollter Ausfälle minimiert
Die Credit Suisse Group AG hat dadurch die Fehlersuche in ihrer IT-Produktion stark vereinfacht. Risiken ungewollter Ausfälle wurden minimiert, ebenso die Zeit für die Fehlereingrenzung. Dies funktioniert über flexible Suchmöglichkeiten. In den meisten Fällen sind bei Problemanalysen einzelne verdächtige oder kritische Nachrichten, Nachrichtenteile oder Jobs bekannt. Oft ist es jedoch auch wichtig zu wissen, welche Meldungen unmittelbar vor oder nach einem Ereignis geschrieben wurden. Der Benutzer kann in dem Tool daher einen Zeitraum in Sekunden angeben, für den Meldungen vor oder nach Ereignissen angezeigt werden.
Selektionskriterien
Wichtig sind zudem Selektionskriterien, d.h. der Administrator kann Jobs nach Datum, Zeit, Systemname, Jobname, Job-ID, Nachrichten-ID sowie Text filtern. Das Abspeichern einmal verwendeter Filtereinstellungen und ihre Wiederverwendung bei der nächsten Suche erleichtern die Fehlersuche ebenfalls. So muss man nicht stets von vorn anfangen.
Wert legt Credit Suisse ferner auf Übersichtlichkeit. Das Anzeigen oder Ausblenden ausgewählter Nachrichten, Nachrichtenarten oder Systemnamen, die Einblendung von Befehlen nur bestimmter Konsolen oder die Trennung mehrzeiliger Nachrichten sind Features, welche die Fehlersuche für die Administratoren in ihrer täglichen Praxis deutlich vereinfachen.Boris Kemp, Beta Systems Software
Sie finden diesen Artikel im Internet auf der Website:
https://itfm.link/93157
Schreiben Sie einen Kommentar