GRUNDLAGEN: FRAUD DETECTION27. August 2015

„Soziale Netzwerkanalyse“ deckt Beziehungen auf: Mit Graph-Technologie auf der Spur der Betrüger

Banken, Versicherungen oder E-Commerce – bei der Aufdeckung von Betrügerringen entscheiden Geschwindigkeit und die Analyse von Datenbeziehungen.Neo Technology
Banken, Versicherungen oder E-Commerce – bei der Aufdeckung von Betrügerringen entscheiden Geschwindigkeit und die Analyse von Datenbeziehungen.Neo Technology

Betrugsfälle verursachen in der Finanz- und Bankenbranche jährlich einen Schaden in Milliardenhöhe. Konventionelle Methoden reichen längst nicht mehr zur Aufdeckung aus, denn die organisierten Betrügerbanden finden immer neue Wege, sich hinter falschen Identitäten zu verstecken. Anders Graphdatenbanken: Sie erkennen Muster innerhalb der Daten und decken so Betrugsringe in Echtzeit auf. Eine detaillierte Erklärung der Funktionsweise von Graphdatenbanken.

Holger Temme, Area Director CEMEA, Neo Technology

Eine Art des Betrugs ist der sogenannte „First Party Fraud“ – Betrug durch den Antragssteller. Dabei beantragen Personen Kredite, Kreditkarten, Kontokorrentkredite und nicht gesicherte Kreditlinien, ohne die Absicht zu haben, diese je zurückzuzahlen. Laut einer Studie von Experian verlieren US-Banken dadurch jährlich Dutzende von Milliarden Dollar; das entspricht rund 25% der gesamten Abschreibungen für Verbraucherkredite.

First Party Fraud – der erste Schritt zum exponentiellen Anstieg

Diese hohen Verluste resultieren aus zwei Faktoren. Zunächst ist es sehr schwierig First Party Fraud aufzudecken. Betrüger verhalten sich lange Zeit wie legitime Kunden, bis sie plötzlich „ausbrechen“, ihre Konten räumen und untertauchen. Das zweite Problem ist die exponentielle Beziehung: Je mehr Personen in einem Betrügernetzwerk arbeiten, desto schneller steigt die Höhe des gestohlenen Gesamtbetrags. Zehn Betrüger mit zehn gemeinsam genutzten Datenelementen (Name, Geburtsdatum, Telefonnummer, Anschrift, Sozialversicherungsnummer usw.) können beispielsweise 100 falsche Identitäten kreieren. Selbst wenn sie nur drei Finanzinstrumente pro Identität mit einer Kreditlinie von je 5.000 Euro ausnutzen, beträgt der potenzielle Verlust für die Bank insgesamt 1,5 Millionen Euro.

Exponentielle Steigerung: Ein Betrügerring mit vier künstlichen Identitäten und insgesamt 18 Konten erbeutet bei einem durchschnittlichen Kredit von 4.000 Euro pro Konto einen Betrag von 72.000 Euro.Neo Technology
Exponentielle Steigerung: Ein Betrügerring mit vier künstlichen Identitäten und insgesamt 18 Konten erbeutet bei einem durchschnittlichen Kredit von 4.000 Euro pro Konto einen Betrag von 72.000 Euro.Neo Technology

 

Relationale Datenbanken sind überfordert

 Analyse von diskreten Daten und Datenbeziehungen: Mit herkömmlichen Instrumenten lassen sich zwar Einzeltäter bzw. „Ausreißer“ finden (oben), organisierte Betrugsbanden findet aber nur eine Graphdatenbank (unten).Neo Technology
Analyse von diskreten Daten und Datenbeziehungen: Mit herkömmlichen Instrumenten lassen sich zwar Einzeltäter bzw. „Ausreißer“ finden (oben), organisierte Betrugsbanden findet aber nur eine Graphdatenbank (unten).Neo Technology

Herkömmli­che Me­thoden füh­ren hier zu geringem Erfolg, da sie nicht dar­auf aus­gerich­tet sind, Netz­werke oder Gruppen zu erkennen. Stan­dard­in­strumente zur Auf­deckung von Betrug – wie das Abwei­chen von norma­len Ein­kaufsmus­tern – erfas­sen nur diskre­te Da­ten und nicht die Beziehun­gen zwi­schen den Da­ten. So las­sen sich zwar Ein­zeltä­ter fin­den, großange­legte Betrü­ger-Ringe blei­ben jedoch unbehelligt. Zudem füh­ren viele die­ser Me­thoden häufig zu fal­schen Ver­dächtigun­gen und können so die Zufriedenheit der Kun­den beein­trächtigen sowie den Gewinn schmälern.

Das Auf­de­cken von Ban­den mit re­latio­na­len Datenbank­tech­no­logi­en erfordert das Modellie­ren ei­nes Diagramms als ei­ne Reihe von Ta­bel­len und Spal­ten sowie das Er­stel­len komplexer Verknüpfun­gen und Selbstverknüpfun­gen. Um Beziehun­gen zwi­schen den Ta­bel­len abzufra­gen, muss die Datenbank soge­nannte Joins der Primär- und Fremdschlüs­sel-Ta­bel­le be­rech­nen. Im Fall ei­ner Betrüger­ban­de müs­sen meh­re­re Ta­bel­len mit­ein­an­der ver­bun­den wer­den – bei­spielsweise Na­me, Konto­num­mer, Kreditkar­ten­num­mer, E-Mail. Will man ein Ge­samtbild des Netzwerks zeichnen, ist es zudem notwendig, man­che Ta­bel­len mehrfach – einmal pro Iden­ti­tät – zu berücksichtigen. Der­artige Beziehungs­abfra­gen sind sehr komplex im Auf­bau, sehr teuer im Ab­lauf und brin­gen das Sys­tem eher ins Sto­cken ­statt Antwor­ten zu liefern.

Muster erkennen mit dem Graph

Ganz anders verläuft die Suche mit Graphdatenbanken wie Neo4j. Sie sind zur Abfrage von Datennetzwerken konzipiert und eignen sich daher ideal zur Identifizierung von Betrugsringen. Ein Graph ist die allgemeine Bezeichnung für eine abstrakte Struktur, die eine Menge von Objekten (Knoten) sowie die bestehenden Verbindungen (Kanten) zwischen diesen Objekten repräsentiert. Sowohl die Knoten als auch die Kanten können Eigenschaften, sogenannte Properties, besitzen. Gerade weil sie nicht nur einzelne Daten, sondern auch die Beziehungen der Daten untereinander abbilden, lassen sich so stark vernetzte und/oder unstrukturierte Informationen anschaulich darzustellen. Die Beziehungen können ganz unterschiedlicher Art sein, zum Beispiel das Belasten der Kreditkarte oder die Eröffnung eines Kontos. Zudem kann diesen Datenbeziehungen eine beliebige Anzahl von qualitativen oder quantitativen Eigenschaften zugewiesen werden, zum Beispiel die Höhe des ausgegebenen Geldbetrags, die Dauer des Kredits oder der Standort bei der Kreditkartennutzung.

„Soziale Netzwerkanalyse“ deckt Beziehungen auf

Fraud Detection im Graph-Modell: Nicht nur einzelne Daten, sondern auch die Beziehungen der Daten untereinander lassen sich anschaulich darstellen, so dass Muster schnell erkannt werden können. Neo Technology
Fraud Detection im Graph-Modell: Nicht nur einzelne Daten, sondern auch die Beziehungen der Daten untereinander lassen sich anschaulich darstellen, so dass Muster schnell erkannt werden können. Neo Technology

Die Verbindungen zwischen Daten sind nicht mehr nur bloße Metadaten, sondern stehen vielmehr im Zentrum des Modells. Banken und Finanzinstitute können so über eine „soziale Netzwerkanalyse“ Beziehungen zwischen einzelnen Kunden untersuchen. Dadurch lassen sich sehr schnell Muster erkennen, die auf Betrugsfälle hinweisen – beispielsweise die Benutzung gleicher Adressen oder Telefonnummern bei unterschiedlichen Konten. Da eine Gruppe von Personen sowie deren einzelne Aktivitäten in Verbindung gesetzt werden, lassen sich Betrugsfälle bereits bei der Ausführung erkennen. Zuvor unbemerkte Absprachen werden offensichtlich. Auch fest definierte Zeitpunkte wie die Konto­er­öffnung, das Erreichen des Kreditrahmens oder das Platzen eines Schecks können mit den Daten in Verbindung gesetzt werden und zu neuen Erkenntnissen führen.

Die Echtzeit-Analyse von Daten ist ein entscheidender Vorteil der Graphdatenbanken im Kampf gegen First Party Fraud. Im Vergleich zu relationalen Datenbanken können Graphdatenbanken (wie z.B. Neo4j – siehe Kasten unten) je nach Szenario bis zu 1.000-mal schneller arbeiten und auch bei vielen, miteinander verknüpften Datensätzen eine hohe Performance erzielen. Die Abfragegeschwindigkeit hängt nicht von der Gesamtmenge der Daten oder Verknüpfungsoperationen ab, sondern nur von der Anzahl der für eine gewünschte Abfrage relevanten, konkreten Beziehungen. Komplexe Analysen benötigen so wesentlich weniger Rechnerleistung und Hardwarekapazitäten und lassen sich innerhalb weniger Sekunden statt in langsamen Batchverfahren über Nacht realisieren. Banken und Finanzinstitute können so blitzschnell auf Betrugsversuche reagieren und beispielsweise Kreditkarten und Konten sperren.

Polyglotte Persistenz

Der Einsatz von Graphdatenbanken in Banken und Finanzinstituten schließt die Verwendung von bestehenden relationalen Datenbanken jedoch nicht aus – beiden Typen ergänzen sich vielmehr. Anwender profitieren von dem Ansatz einer polyglotten Persistenz, in der unterschiedliche Datenbankmodelle für unterschiedliche Aufgaben und im jeweiligen Kontext eingesetzt werden. Die Anbindung an die Kernsysteme eines Unternehmens und an vorhandene Datenbanken ist daher sehr einfach.

Ob First Party Fraud bei Banken oder Versicherungs- oder E-Commerce-Betrug, die Herausforderungen bleiben dieselben. Geschwindigkeit spielt eine entscheidende Rolle, wenn es darum geht, Betrugsversuche so schnell wie möglich zu erkennen und Kriminelle zu stoppen. Stark automatisierte und damit immer schneller ablaufende Geschäftsprozesse erlauben nur ein kleines Zeitfenster für die Aufdeckung. Gefragt sind daher Lösungen, die in Echtzeit gesicherte Ergebnisse liefert. Schon längst haben Kriminelle gelernt, herkömmliche Sicherheitssysteme zu umgehen und deren Schwächen auszunutzen. Relationale Datenbanken bieten in vielen Fällen noch ausreichend Prävention, der Aufdeckung von Betrügerringen oder -netzwerken sind sie jedoch nicht gewachsen. Hier können Graphdatenbanken ihre Vorteile voll und ganz ausspielen. aj

Open Source Graphdatenbank: Neo4j - Neo Technology
Neo4j ist die Graphdatenbank von Neo Technology. Dank des systemeigenen, flexiblen Rahmens für Graph-Traversierungen lassen sich mit dem Neo4j Datenmodell ganz einfach Daten und Datenstruktur ändern sowie neue Daten hinzufügen. Auch das Übertragen von bestehenden Daten in den Graphen sowie deren Synchronisierung geschieht dank integrierter Tools mit Neo4j sehr einfach. Neo4j ist eine Open Source Graphdatenbank, so dass die IT den Code bei Bedarf einsehen und weitere Funktionen hinzufügen kann. Unterstützung finden Anwender zudem bei der engagierten Open-Source-Community von Neo4j.

Polyglotte Persistenz: Neo4j lässt sich leicht an die Kernsysteme anbinden und mit anderen Datenbanken kombinieren – auch mit relationalen Datenbanken.Neo Technology
Polyglotte Persistenz: Neo4j lässt sich leicht an die Kernsysteme anbinden und mit anderen Datenbanken kombinieren – auch mit relationalen Datenbanken.Neo Technology

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert