Banken, Versicherungen oder E-Commerce – bei der Aufdeckung von Betrügerringen entscheiden Geschwindigkeit und die Analyse von Datenbeziehungen.Neo Technology

Betrugsfälle verursachen in der Finanz- und Bankenbranche jährlich einen Schaden in Milliardenhöhe. Konventionelle Methoden reichen längst nicht mehr zur Aufdeckung aus, denn die organisierten Betrügerbanden finden immer neue Wege, sich hinter falschen Identitäten zu verstecken. Anders Graphdatenbanken: Sie erkennen Muster innerhalb der Daten und decken so Betrugsringe in Echtzeit auf. Eine detaillierte Erklärung der Funktionsweise von Graphdatenbanken.

Holger Temme, Area Director CEMEA, Neo Technology

Eine Art des Betrugs ist der sogenannte „First Party Fraud“ – Betrug durch den Antragssteller. Dabei beantragen Personen Kredite, Kreditkarten, Kontokorrentkredite und nicht gesicherte Kreditlinien, ohne die Absicht zu haben, diese je zurückzuzahlen. Laut einer Studie von Experian verlieren US-Banken dadurch jährlich Dutzende von Milliarden Dollar; das entspricht rund 25% der gesamten Abschreibungen für Verbraucherkredite.

First Party Fraud – der erste Schritt zum exponentiellen Anstieg

Diese hohen Verluste resultieren aus zwei Faktoren. Zunächst ist es sehr schwierig First Party Fraud aufzudecken. Betrüger verhalten sich lange Zeit wie legitime Kunden, bis sie plötzlich „ausbrechen“, ihre Konten räumen und untertauchen. Das zweite Problem ist die exponentielle Beziehung: Je mehr Personen in einem Betrügernetzwerk arbeiten, desto schneller steigt die Höhe des gestohlenen Gesamtbetrags. Zehn Betrüger mit zehn gemeinsam genutzten Datenelementen (Name, Geburtsdatum, Telefonnummer, Anschrift, Sozialversicherungsnummer usw.) können beispielsweise 100 falsche Identitäten kreieren. Selbst wenn sie nur drei Finanzinstrumente pro Identität mit einer Kreditlinie von je 5.000 Euro ausnutzen, beträgt der potenzielle Verlust für die Bank insgesamt 1,5 Millionen Euro.

Exponentielle Steigerung: Ein Betrügerring mit vier künstlichen Identitäten und insgesamt 18 Konten erbeutet bei einem durchschnittlichen Kredit von 4.000 Euro pro Konto einen Betrag von 72.000 Euro.Neo Technology

Relationale Datenbanken sind überfordert

Analyse von diskreten Daten und Datenbeziehungen: Mit herkömmlichen Instrumenten lassen sich zwar Einzeltäter bzw. „Ausreißer“ finden (oben), organisierte Betrugsbanden findet aber nur eine Graphdatenbank (unten).Neo Technology

Herkömmliche Methoden führen hier zu geringem Erfolg, da sie nicht darauf ausgerichtet sind, Netzwerke oder Gruppen zu erkennen. Standardinstrumente zur Aufdeckung von Betrug – wie das Abweichen von normalen Einkaufsmustern – erfassen nur diskrete Daten und nicht die Beziehungen zwischen den Daten. So lassen sich zwar Einzeltäter finden, großangelegte Betrüger-Ringe bleiben jedoch unbehelligt. Zudem führen viele dieser Methoden häufig zu falschen Verdächtigungen und können so die Zufriedenheit der Kunden beeinträchtigen sowie den Gewinn schmälern.

Das Aufdecken von Banden mit relationalen Datenbanktechnologien erfordert das Modellieren eines Diagramms als eine Reihe von Tabellen und Spalten sowie das Erstellen komplexer Verknüpfungen und Selbstverknüpfungen. Um Beziehungen zwischen den Tabellen abzufragen, muss die Datenbank sogenannte Joins der Primär- und Fremdschlüssel-Tabelle berechnen. Im Fall einer Betrügerbande müssen mehrere Tabellen miteinander verbunden werden – beispielsweise Name, Kontonummer, Kreditkartennummer, E-Mail. Will man ein Gesamtbild des Netzwerks zeichnen, ist es zudem notwendig, manche Tabellen mehrfach – einmal pro Identität – zu berücksichtigen. Derartige Beziehungsabfragen sind sehr komplex im Aufbau, sehr teuer im Ablauf und bringen das System eher ins Stocken statt Antworten zu liefern.

Muster erkennen mit dem Graph

Ganz anders verläuft die Suche mit Graphdatenbanken wie Neo4j. Sie sind zur Abfrage von Datennetzwerken konzipiert und eignen sich daher ideal zur Identifizierung von Betrugsringen. Ein Graph ist die allgemeine Bezeichnung für eine abstrakte Struktur, die eine Menge von Objekten (Knoten) sowie die bestehenden Verbindungen (Kanten) zwischen diesen Objekten repräsentiert. Sowohl die Knoten als auch die Kanten können Eigenschaften, sogenannte Properties, besitzen. Gerade weil sie nicht nur einzelne Daten, sondern auch die Beziehungen der Daten untereinander abbilden, lassen sich so stark vernetzte und/oder unstrukturierte Informationen anschaulich darzustellen. Die Beziehungen können ganz unterschiedlicher Art sein, zum Beispiel das Belasten der Kreditkarte oder die Eröffnung eines Kontos. Zudem kann diesen Datenbeziehungen eine beliebige Anzahl von qualitativen oder quantitativen Eigenschaften zugewiesen werden, zum Beispiel die Höhe des ausgegebenen Geldbetrags, die Dauer des Kredits oder der Standort bei der Kreditkartennutzung.

„Soziale Netzwerkanalyse“ deckt Beziehungen auf

Fraud Detection im Graph-Modell: Nicht nur einzelne Daten, sondern auch die Beziehungen der Daten untereinander lassen sich anschaulich darstellen, so dass Muster schnell erkannt werden können. Neo Technology

Die Verbindungen zwischen Daten sind nicht mehr nur bloße Metadaten, sondern stehen vielmehr im Zentrum des Modells. Banken und Finanzinstitute können so über eine „soziale Netzwerkanalyse“ Beziehungen zwischen einzelnen Kunden untersuchen. Dadurch lassen sich sehr schnell Muster erkennen, die auf Betrugsfälle hinweisen – beispielsweise die Benutzung gleicher Adressen oder Telefonnummern bei unterschiedlichen Konten. Da eine Gruppe von Personen sowie deren einzelne Aktivitäten in Verbindung gesetzt werden, lassen sich Betrugsfälle bereits bei der Ausführung erkennen. Zuvor unbemerkte Absprachen werden offensichtlich. Auch fest definierte Zeitpunkte wie die Kontoeröffnung, das Erreichen des Kreditrahmens oder das Platzen eines Schecks können mit den Daten in Verbindung gesetzt werden und zu neuen Erkenntnissen führen.

Die Echtzeit-Analyse von Daten ist ein entscheidender Vorteil der Graphdatenbanken im Kampf gegen First Party Fraud. Im Vergleich zu relationalen Datenbanken können Graphdatenbanken (wie z.B. Neo4j – siehe Kasten unten) je nach Szenario bis zu 1.000-mal schneller arbeiten und auch bei vielen, miteinander verknüpften Datensätzen eine hohe Performance erzielen. Die Abfragegeschwindigkeit hängt nicht von der Gesamtmenge der Daten oder Verknüpfungsoperationen ab, sondern nur von der Anzahl der für eine gewünschte Abfrage relevanten, konkreten Beziehungen. Komplexe Analysen benötigen so wesentlich weniger Rechnerleistung und Hardwarekapazitäten und lassen sich innerhalb weniger Sekunden statt in langsamen Batchverfahren über Nacht realisieren. Banken und Finanzinstitute können so blitzschnell auf Betrugsversuche reagieren und beispielsweise Kreditkarten und Konten sperren.

Polyglotte Persistenz

Der Einsatz von Graphdatenbanken in Banken und Finanzinstituten schließt die Verwendung von bestehenden relationalen Datenbanken jedoch nicht aus – beiden Typen ergänzen sich vielmehr. Anwender profitieren von dem Ansatz einer polyglotten Persistenz, in der unterschiedliche Datenbankmodelle für unterschiedliche Aufgaben und im jeweiligen Kontext eingesetzt werden. Die Anbindung an die Kernsysteme eines Unternehmens und an vorhandene Datenbanken ist daher sehr einfach.

Ob First Party Fraud bei Banken oder Versicherungs- oder E-Commerce-Betrug, die Herausforderungen bleiben dieselben. Geschwindigkeit spielt eine entscheidende Rolle, wenn es darum geht, Betrugsversuche so schnell wie möglich zu erkennen und Kriminelle zu stoppen. Stark automatisierte und damit immer schneller ablaufende Geschäftsprozesse erlauben nur ein kleines Zeitfenster für die Aufdeckung. Gefragt sind daher Lösungen, die in Echtzeit gesicherte Ergebnisse liefert. Schon längst haben Kriminelle gelernt, herkömmliche Sicherheitssysteme zu umgehen und deren Schwächen auszunutzen. Relationale Datenbanken bieten in vielen Fällen noch ausreichend Prävention, der Aufdeckung von Betrügerringen oder -netzwerken sind sie jedoch nicht gewachsen. Hier können Graphdatenbanken ihre Vorteile voll und ganz ausspielen. aj

Open Source Graphdatenbank: Neo4j - Neo Technology

Neo4j ist die Graphdatenbank von Neo Technology. Dank des systemeigenen, flexiblen Rahmens für Graph-Traversierungen lassen sich mit dem Neo4j Datenmodell ganz einfach Daten und Datenstruktur ändern sowie neue Daten hinzufügen. Auch das Übertragen von bestehenden Daten in den Graphen sowie deren Synchronisierung geschieht dank integrierter Tools mit Neo4j sehr einfach. Neo4j ist eine Open Source Graphdatenbank, so dass die IT den Code bei Bedarf einsehen und weitere Funktionen hinzufügen kann. Unterstützung finden Anwender zudem bei der engagierten Open-Source-Community von Neo4j.