STRATEGIE8. Februar 2021

IDV – Intelligente Dokumentenverarbeitung: Einstieg in die Hyperautomatisierung

Dr. Dennis Imer, Global Head of Advanced Analytics & Data Management bei Synpulse Management ConsultingSynpulse

Banken und Ver­si­che­run­gen ver­fol­gen seit ei­ni­gen Jah­ren mehr oder we­ni­ger ziel­stre­big die Di­gi­ta­li­sie­rung und Au­to­ma­ti­sie­rung ih­rer Wert­schöp­fungs­ket­te. In vie­len Fäl­len wur­den In­itia­ti­ven und Pro­jek­te al­ler­dings vor­ran­gig auf die kun­den­sei­ti­gen Schnitt­stel­len und Pro­zes­se an­ge­wen­det (E-Ban­king, Scha­dens­fall­mel­dung). In den letz­ten zwei bis drei Jah­ren je­doch ha­ben ins­be­son­de­re Ban­ken, aber auch Ver­si­che­rer in ei­nem ers­ten Schritt an­ge­fan­gen, im­mer mehr ih­rer re­pe­ti­ti­ven Kern­ge­schäfts­pro­zes­se auf der nicht kun­den­be­zo­ge­nen Sei­te ih­rer Wert­schöp­fungs­ket­te zu au­to­ma­ti­sie­ren.

von Dr. Dennis Imer und Frederike Sturm, Synpulse

Die Gren­ze der ein­fa­chen und schnel­len Au­to­ma­ti­sie­rung re­pe­ti­ti­ver Kern­ge­schäfts­pro­zes­se, z.B. durch Ro­bo­tic Pro­cess Au­to­ma­ti­on (RPA), ist häu­fig dann er­reicht, wenn für ei­ne voll­stän­di­ge Au­to­ma­ti­sie­rung des Pro­zes­ses Kom­po­nen­ten künst­li­cher In­tel­li­genz (KI) von­nö­ten sind. Dies ist häu­fig dann der Fall, wenn un­struk­tu­rier­te Da­ten als In­put für ei­ne au­to­ma­ti­sier­te Wei­ter­ver­ar­bei­tung vor­lie­gen. Hier trägt in­tel­li­gen­te Do­ku­men­ten­ver­ar­bei­tung (IDV) als wich­ti­ges Ele­ment der hy­per­au­to­ma­ti­sier­ten Wert­schöp­fungs­ket­te da­zu bei, das An­wen­dungs­spek­trum für die Au­to­ma­ti­sie­rung zu erweitern.

Frederike Sturm, Associate Partner bei Synpulse Management Consulting Synpulse

Was ist intelligente Dokumentenverarbeitung und wie hilft sie?

Intelligente Dokumentenverarbeitung befähigt Banken und Versicherer, ihre Formulare, Briefe, E-Mails, Verträge und andere schriftliche Korrespondenz kontrolliert und automatisiert zu verarbeiten und somit den manuellen Aufwand in den betroffenen Bereichen zu minimieren.

IDV-Lösungen erkennen definierte und antrainierte Dokumenten- und Formularkategorien und extrahieren relevante Informationen aus diesen unstrukturierten und strukturierten Formaten, um sie für die weitere Verarbeitung im gewünschten Format bereitzustellen.”

Wie arbeitet eine IDV-Lösung?

IDV-Lösungen erledigen ihre Arbeit im Wesentlichen durch vier ansonsten aufwändige Arbeitsschritte.

  1. Schrifterkennung: Im ersten Schritt werden gescannte PDF-Dokumente und Formulare maschinenlesbar gemacht – also in Textdateien umgewandelt, um sie in den darauffolgenden Schritten weiterverarbeiten zu können. Dieser Schritt nennt sich Optical Character Recognition (OCR) und funktioniert – wie der Name suggeriert – über die optische Analyse und Erkennung der Schriftzeichen.
  2. Kategorisierung: Im nächsten Schritt werden die Inhalte der erstellten Textdateien geladen, um diese zu kategorisieren. Je nach IDV-Lösung werden die Dokumente von einer KI „gelesen“ oder via optischer Merkmale kategorisiert. Eine Kombination aus beiden Ansätzen kann das Ergebnis nochmals verbessern.
  3. Datenextraktion: Im dritten Schritt werden die für die Weiterverarbeitung relevanten Informationen aus den kategorisierten Dokumenten extrahiert. Hierfür kommen ebenfalls entweder KI, strukturelle oder eine Kombination beider Komponenten zum Einsatz.
  4. Weiterverarbeitung: Im letzten Schritt werden die extrahierten Informationen für die Weiterverarbeitung in einer Datenbank oder auf einem Netzlaufwerk gespeichert oder direkt über Schnittstellen an ein anderes System (bspw. das Bestandssystem einer Versicherung) übergeben.

Sollten während der intelligenten Dokumentenverarbeitung Fehler auftauchen, muss sichergestellt sein, dass sich diese nicht durch den kompletten Prozess ziehen und am Ende fehlerhafte Daten in ein Zielsystem übertragen werden.

Um dies zu verhindern, sind IDV-Lösungen mit Mechanismen ausgestattet, um Fehler zu erkennen und auszusteuern. Die ausgesteuerten Fälle werden von Menschen überprüft, die Daten ergänzt oder korrigiert und mit wenigen Klicks zurück in die automatisierte Weiterverarbeitung geschickt.”

Aussteuerungsgründe können beispielsweise ein unsicheres Ergebnis in der Schrifterkennung aufgrund schlechter Scanqualität sein, eine Unsicherheit der KI bei der Zuteilung eines Dokuments zu einer bestimmten Kategorie oder eine Unsicherheit über die Zugehörigkeit eines extrahierten Wertes zu einer bestimmten Informationsart (z.B. Versicherungsnummer).

Nachfolgend eine Auflistung verschiedener Anwendungsfälle, bei denen IDV-Lösungen für eine end-to-end Automatisierung sorgen:

  • Posteingangssortierung und Datenextraktion für die manuelle Weiterverarbeitung
  • Extraktion von Ausweisdaten
  • Auslesen von Formularen (z.B. SEPA Lastschriftmandat, Adressänderung)
  • Auslesen von Rechnungen
  • Datenextraktion aus Versicherungsverträgen
  • Auslesen von Inhalten aus Freitext-E-Mails
  • Datenextraktion aus Pfändungs- und Überweisungsbeschlüssen
Die drei Arbeitsschritte einer IDV-Lösung.
Abbildung 1: Die drei Arbeitsschritte einer IDV-Lösung. Synpulse.

 

 

Die Vorteile von Intelligenter Dokumentenverarbeitung

Der Einsatz einer IDV-Lösung hat mehrere direkte und indirekte Vorteile.

Verkürzte Bearbeitungsdauer

Durch IDV können Banken und Versicherer den Einstieg ihrer teils aufwändigen und manuellen Prozesse – wie beispielsweise Posteingangsverarbeitung – automatisieren. So können fortlaufend eintreffende Dokumente, Formulare und Kundenanfragen auf postalischem oder digitalem Weg in Echtzeit entgegengenommen und zur Weiterverarbeitung aufbereitet werden. In einem weiteren Ausbauschritt lassen sich IDV-Lösungen sehr gut mit RPA verbinden.

So müssen Mitarbeitende nur noch in Einzelfällen einschreiten und Ergebnisse verifizieren oder abfangen. Dies wiederum führt dazu, dass die Prozesse schneller und zeitgleich auch weniger fehleranfällig werden.”

Als Nebeneffekt werden interne Kapazitäten frei, die anderweitig gewinnbringend eingesetzt werden können, beispielsweise zur Abarbeitung komplexerer Anwendungsfälle.

Insbesondere während Stoßzeiten ist die IDV-Lösung klar im Vorteil, da sie rund um die Uhr im Betrieb ist. Für den Fall der dauerhaften Erhöhung des zu bearbeitenden Volumens (neue Anwendungsfälle, Wachstum, o.ä.) ist die Skalierung der implementierten Lösung möglich. Dies führt wiederum dazu, dass Mitarbeitende entlastet werden und weniger manuelle Bearbeitungsfehler auftreten.

Künstliche Intelligenz schafft Vorsprung

Je nach Anwendungsfall lassen sich mit dem Einsatz von künstlicher Intelligenz bei der Kategorisierung und Extraktion bessere Ergebnisse erzielen als durch den Einsatz von strukturellen oder regelbasierten Lösungen. So kann eine regelbasierte Lösung bei der Identifikation des Wortes Nachlass das Dokument als Sonderkonditionsdokument kategorisieren, da das Tool einen Rabatt assoziiert. Die KI jedoch kann durch Training identifizieren, dass es sich um die Bearbeitung eines Erbfalls handelt. Die KI erlernt die Kategorisierung und Extraktion von relevanten Daten auf der Basis hauseigener Dokumente und Formulare und ist so ideal auf die individuellen Anforderungen abgestimmt. Dies führt dazu, dass verlässlichere Ergebnisse erzielt werden, welche auch bei Hinzunahme von neuen Formularen oder Dokumententypen durch Anpassung der Trainingsmenge Bestand haben. Somit entfallen aufwändige Anpassungen von Regelwerken und die Dokumentation dieser.

Niedrige Umsetzungshürde

Die Umsetzung von IDV-Lösungen ist in der Regel ein relativ schnelles und kostengünstiges Unterfangen. Die typischen Anwendungsfälle können unter sämtlichen infrastrukturellen Voraussetzungen innerhalb weniger Monate umgesetzt werden. In Verbindung mit den typischen Projekt-, Lizenz- und Betriebskosten kommen sehr schnell rentable Business Cases zustande.

Die Vorteile einer IDV-Lösung.
Abbildung 2: Die Vorteile einer IDV-Lösung. Synpulse.

 

Projektbeispiel: Postrückläufer

Der Synpulse Projektansatz für IDV-Lösungen.
Abbildung 3: Der Synpulse Projektansatz für IDV-Lösungen. Synpulse.

Im Folgenden zeigen wir anhand eines Projektbeispiels auf, wie eine IDV-Tool Einführung funktioniert.

Ausgangssituation:

Bei einer deutschen Retail Bank galt es, Postretouren, also zurückgesendete Bankformulare sowie Standardbriefe, zunächst über einen hausinternen Scanvorgang zu digitalisieren und im Anschluss relevante Informationen für die Weiterverarbeitung aus den Dokumenten zu extrahieren. Da die Weiterverarbeitung automatisiert mithilfe von Robotic Process Automation erfolgt und pro Dokumentenart unterschiedliche Daten für die Weiterverarbeitung extrahiert werden mussten, wurden die Dokumente zunächst in verschiedene Kategorien unterteilt (für eine Übersicht der einzelnen Kategorien siehe Tabelle 1). Das IDV-Tool sollte hierbei möglichst nahtlos in den bestehenden Prozess, vom Scanning bis hin zur Dokumentenarchivierung, integriert werden.

Autor Dr. Dennis Imer, Synpulse
Experte für IDV: Dr. Dennis Imer Dr. Dennis Imer ist bei Synpulse Global Head (Webseite) of Advanced Analytics & Data Management. In dieser Rolle entwickelt er Themen rund um die Intelligente Dokumentenverarbeitung sowie Data Management Strategien und betreut Projekte in diesen Bereichen. Zuvor prägte Dr. Imer bei der Schweizer Privatbank Bank J. Safra Sarasin als Group Data Governance Manager und Group Data Protection Officer die dortige Datenverarbeitung nachhaltig. Während seines Doktorats in Biogeochemie an der ETH Zürich beschäftigte sich Imer mit der Modellierung von Treibhausemissionen.

Phase A und B: Potenzialanalyse und Toolauswahl

IDV-Lösungen können bei nahezu allen Prozessen, in denen schriftliche Korrespondenz kategorisiert und/oder Inhalte aus Dokumenten extrahiert werden müssen, eingesetzt werden. Vor der Entscheidung für eine IDV-Lösung sollte jedoch im ersten Schritt immer eine Potenzialanalyse durchgeführt werden.”

Hier wer­den meh­re­re An­wen­dungs­fäl­le be­trach­tet und auf die Re­le­vanz für ei­ne Au­to­ma­ti­sie­rung un­ter­sucht. Das Pro­zess­vo­lu­men und die ein­ge­spar­te ma­nu­el­le Be­ar­bei­tungs­zeit sind wich­ti­ge Fak­to­ren für ei­ne Ent­schei­dung. An­hand der An­wen­dungs­fäl­le wird eben­falls be­wer­tet, mit wel­cher IDV-Lö­sung das grö­ß­te Spek­trum an vor­han­de­nen Do­ku­men­ten­ty­pen um­ge­setzt wer­den kann. Um ein mög­lichst um­fas­sen­des Bild zu er­lan­gen, wer­den un­ter an­de­rem die fol­gen­den Fra­gen geklärt:

  • Welche Prozesse sollen mit einer IDV-Lösung automatisiert werden?
  • Welche Dokumententypen sind zu bearbeiten (Post, E-Mails, Verträge, Formulare, Rechnungen, Ausweise)?
  • Wie hoch sind zu bearbeitende Volumen pro Prozess (generell gilt: je höher das Volumen, desto schneller lohnt sich der Einsatz einer IDV-Lösung)?
  • In welchem Zeitrahmen müssen die Dokumente prozessiert werden?

Über die Beantwortung dieser Fragen lässt sich generell schnell ermitteln, ob sich eine IDV-Lösung rechnet und falls ja, welche konkrete IDV-Lösung zum Einsatz kommen soll. Während ein Tool beispielsweise Stärken bei der Kategorisierung von Formularen und Ausweisen hat, ist ein anderes Tool besser für Freitextdokumente geeignet.

Da die zu erwartende Menge an Postretouren einen signifikanten Anteil an semi- und unstrukturierten Dokumenten enthält, wurde als IDV-Lösung die AI Plattform der Firma ITyX ausgewählt. Hier sind durch den Einsatz von KI bessere Ergebnisse im Bereich der Kategorisierung und der Datenextraktion zu erzielen als mit einer Lösung, die struktur- oder regelbasiert arbeitet. Darüber hinaus ist eine KI-Lösung bei der Hinzunahme weiterer Anwendungsfälle generell flexibler, weil Trainingsmengen schnell angepasst werden können.

Autor Frederike Sturm, Synpulse
Expertin für IDV: Frederike Sturm Frederike Sturm ist Associate Partner von Synpulse (Webseite). Die gelernte Bankkauffrau berät mit ihrem Team bei Synpulse Deutschland Finanzdienstleister und Versicherungen bei der Einführung von Robotic Process Automation (RPA) und dessen Ausbaustufe Intelligent Automation – von der Auswahl geeigneter Tools, über Schulungen bis hin zur Implementierung automatisierter Prozesse. Darüber hinaus betreut Frau Sturm die Technologiepartner von Synpulse in diesem Themenbereich.

Phase C: Proof of Concept:

Im Pro­of of Con­cept wur­de der Pro­zess er­folg­reich (gu­te Er­ken­nungs- und Ex­trak­ti­ons­quo­te) au­to­ma­ti­siert. Hier­zu wur­de in der IDV-Lö­sung zu­nächst ein Work­flow auf­ge­setzt. Die­ser Work­flow stellt si­cher, dass die ge­scann­ten Do­ku­men­te aus ei­nem In­pu­tord­ner zur Schrift­er­ken­nung ge­schickt, dann ka­te­go­ri­siert, im An­schluss die re­le­van­ten Da­ten ex­tra­hiert und am En­de die ein­ge­le­se­nen PDF- und XML-Da­tei­en mit den ex­tra­hier­ten Da­ten in die ge­wünsch­ten Out­pu­tord­ner ge­schrie­ben wer­den. Von dort aus wer­den die Da­ten dann von Ro­bo­tern für die Wei­ter­ver­ar­bei­tung abgeholt.

Für das Trai­ning der Ka­te­go­ri­sie­rungs- und Ex­trak­ti­ons­mo­del­le wur­den je­weils zwi­schen 100 und 200 Do­ku­men­te ver­wen­det. Bei der Ex­trak­ti­ons­au­to­ma­ti­sie­rung wur­de ei­ne Kom­bi­na­ti­on aus Mo­del­len und re­gu­lä­ren Aus­drü­cken (Re­gEx) – al­so ei­ne Kom­bi­na­ti­on aus KI und be­ste­hen­den Re­gel­wer­ken – ver­wen­det, um die Ex­trak­ti­ons­quo­te aus den an­trai­nier­ten Do­ku­men­ten mit­hil­fe von Re­geln noch zu­sätz­lich anzuheben.

Phase D: Projekt

Nach dem Proof of Concept erfolgt die Umsetzung weiterer Prozesse. Parallel hierzu werden in der Regel interne Mitarbeitende in der Anwendung des Tools geschult. So kann ein möglichst umfassender Wissenstransfer stattfinden.

Einfache Anwendungsfälle können so häufig selbstständig durch interne Mitarbeitende umgesetzt werden. Über die Projektlaufzeit werden Anwender somit befähigt, immer mehr Tätigkeiten innerhalb der IDV-Lösung selbst zu übernehmen.”

Ein weiteres wichtiges Projektziel ist die Einbettung der IDV-Lösung in ein entsprechendes Betriebsmodell, um den Anforderungen externer Prüfer und interner Revision an Dokumentation, IT-Sicherheit und klarer Aufbau- und Ablauforganisation gerecht zu werden.

Kategorie Extrahierte Daten Anzahl Trainingsdokumente STP Rate Möglich:
Dokumente / h
Tatsächlich:
Dokumente / Woche
Bankkarten Datum
Adresse
Kontonummer (aus IBAN)
Kartennummer
Kategorisierung:
200
Extraktion:
100
90% 15 100
Online Banking Datum
Adresse
Online Banking Key
Kategorisierung:
200
Extraktion:
100
95% 20 100
Kredite Datum
Adresse
Kontonummer
Kundennummer
Kategorisierung:
200
Extraktion:
200
90% 15 60
Wertpapiere Datum
Adresse
Kontonummer
Kategorisierung:
200
Extraktion:
100
95% 20 100
Restliche Dokumente Datum
Adresse
Kundennummer
Kontonummer
(Kredit-)Kartennummer
Online Banking Key
Name
Kategorisierung:
200
Extraktion:
100
80% 12 40

Abbildung 4: IVD-Lösungsergebnisse. Quelle: Synpulse.

Ergebnisse und Fazit

Über alle Kategorien hinweg konnten gute bis sehr gut Dunkelverarbeitungsraten (STP: Straight Through Processing) erzielt werden. Während im komplexesten Fall eine Rate von 80% erreicht wurde, konnten in den weniger komplexen Fällen bis zu 95% erreicht werden.

Bei dem aktuellen Aufkommen an zu verarbeitenden Dokumenten pro Woche (circa 400 / Woche) hat die Bank sogar noch Skalierungsmöglichkeiten, da je nach Kategorie zwischen 12 und 20 Dokumente pro Stunde verarbeitet werden können.

Es zeigt sich, dass IDV-Lösungen ein wichtiger Schritt hin zur Digitalisierung und Automatisierung der kunden- und nicht kundenbezogenen Seite der Wertschöpfungskette sind, da sie Effizienzsteigerungen bei geringem Umsetzungsaufwand bieten.”

Dr. Dennis Imer und Frederike Sturm, Synpulse

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert