Was sind Daten Wert? Drei Ansätze für die Bestimmung
Dr. Henning Stolze, Leiter Data Governance & Data Management, EOS Deutscher Inkasso-Dienst, über die Messung von Datenwerten aus zwei unterschiedlichen Blickwinkeln: Zum einen aus Perspektive der Verbraucher und Verbraucherinnen, praktisch der Angebotsseite der Daten. Zum anderen aus Sicht von Unternehmen, die Daten anfragen, um diese gewinnbringend in ihren Prozessen einzusetzen.
von Dr. Henning Stolze, EOS Deutscher Inkasso-Dienst
Die Frage, was Daten wert sind, lässt sich so einfach nicht beantworten. Denn: für unterschiedliche Parteien kann es auch unterschiedliche Antworten geben. Die aktuelle EOS Studie „Was sind Daten wert?“ beschäftigt sich eingehender mit dieser Thematik und beleuchtet dabei das Datenangebot durch Verbraucher. Demnach würden 78 Prozent der Deutschen einem vertrauenswürdigen Unternehmen ihre Daten verkaufen. Das zeigt: Die Erkenntnis, dass ihre Daten etwas wert sind, ist bei den Verbrauchern angekommen. Über den genauen Wert der Daten besteht allerdings noch große Unsicherheit. Nur die Hälfte der Befragten hat eine konkrete Preisvorstellung – mit breiter Spanne zwischen wenigen Euro bis zu über 500 Euro.Diese unkonkrete und teilweise sehr hohe Preisvorstellung ist unter anderem darin begründet, dass es für die Kunden und Kundinnen schwer einzuschätzen ist, was mit ihren Daten in den Unternehmen genau passiert und welchen Mehrwert sie dem Unternehmen damit bieten. Grundlage für einen Datenaustausch ist zudem immer das Vertrauen, dass die Datenweitergabe ohne Risiko ist. Außerdem glauben Verbraucher häufig, dass stets alle Aspekte ihrer Daten für das Unternehmen wertvoll seien und es um sie persönlich ginge. Das ist aber oft gar nicht der Fall, wenn wir uns die Datennutzung in den Unternehmen anschauen. Hier gilt es die Unterschiede klarer aufzuzeigen und Daten in unterschiedliche Kategorien einzuordnen.
Den Wert von Daten bestimmen: Cost-, Market- oder Value-Approach
Auf der Unternehmensseite durchläuft die Rolle von Daten (und damit auch der Wert) verschiedene Stationen. Dies gilt für die Datenwirtschaft im Allgemeinen, aber auch im Rahmen einer zunehmenden Datenreife für jedes Unternehmen im Einzelnen. Im einfachsten Fall nehmen Daten eine unterstützende Rolle ein, etwa im Reporting als Grundlage für Business-Entscheidungen. Hier kann ihr Wert grob über die Wiederbeschaffungskosten bestimmt werden, indem man sich die Frage stellt, was ein Datenverlust kosten würde – dem sogenannten Cost-Approach.
Nach dieser Stufe übernehmen Daten immer mehr die Rolle eines Enablers für Prozesse und Produkte. Hier befinden sich aktuell die meisten Unternehmen.
Damit stehen wir an der Schwelle, an der Daten selbst zum Produkt werden – sie könnten gemäß Angebot und Nachfrage auf Märkten gehandelt werden (Market-Approach). Solche Märkte sind aber noch in einer sehr frühen Phase und erst im Begriff, zu entstehen.”
Solange dieser echte Markt fehlt, ist eine Nutzenbetrachtung (Value-Approach) ein guter Ansatz, den Wert von Daten zu bestimmen. Es gilt die Frage zu beantworten, welchen zusätzlichen Nutzen die Daten in den Geschäftsprozessen generieren. Eine sinnvolle Lösung ist, den wichtigsten Datenfeldern ein konkretes Preisschild umzuhängen und den jeweiligen Wert klar zu bestimmen. Das ist ein erster wichtiger Schritt, um mit Daten so umzugehen, als seien sie Assets.
Drei Beispiele für einen Added-Value-Ansatz
1.Schwankungen in der Datenqualität mit konkreten Euro-Werten beziffern
Zur Wertbestimmung nach dem Added-Value-Ansatz bietet es sich an, die Performance von Prozessen einmal mit und einmal ohne bestimmte Datenfelder anzuschauen. Dies kann ganz trivial und im Forderungsmanagement beispielsweise mit folgender Frage verknüpft sein: Wie entwickelt sich der durchschnittliche Zahlungseingang, nachdem man eine neue Kontaktmöglichkeit zum säumigen Kunden bekommen hat? Etwa eine aktuelle Adresse oder Telefonnummer. So lässt sich ermitteln, welchen Wert die jeweilige Information im Inkassoprozess tatsächlich hat und welchen (finanziellen) Aufwand man als Unternehmen maximal betreiben sollte, um sie zu erhalten.
2.Datengestützte und konventionelle Prozesse vergleichen
Machine-Learning- und KI-Modelle helfen dabei, den konkreten Verlauf des Forderungsmanagements individuell anzupassen. Mit ihrer Hilfe lässt sich bestimmen, welche Kommunikationskanäle am besten zu den jeweiligen Verbrauchern passen und die geeignetste Ansprache wählen. Der Erfolg dieses datengetriebenen Ansatzes ist messbar: Nach unseren Erfahrungen führt er, verglichen mit der konventionell bearbeiteten Kontrollgruppe, zu einem um zehn Prozent höheren Zahlungseingang. Umgekehrt erlauben die Modelle auf Maßnahmen zu verzichten, die wenig erfolgversprechend sind. So werden effizient Kosten und Ressourcen gespart.
Die verwendeten Daten in solchen Inkasso-Modellen sind vielfältig. Die Basis bilden Informationen zu Kunden (zum Beispiel Alter oder ob ein Arbeitsverhältnis besteht), Forderungen (beispielsweise Ursprung und Höhe der Forderung) und dem bisherigen Bearbeitungsverlauf (Wurde schon einmal gezahlt? Wann war die Person am Telefon erreichbar?). Auch hier ist die Anwendung des Added-Value-Ansatzes relativ einfach möglich: Die Daten werden den Modellen schrittweise entzogen, auf denen sie aufgebaut sind. Über einen Vergleich der Ist-Werte mit den simulierten Ergebnissen mit reduzierten Datensätzen lässt sich eine gute Vorstellung vom Nutzenbeitrag einzelner Datenfelder bekommen.
3.Datenwerte mittels Propensity Score schätzen
Eine dritte Möglichkeit, den Added-Value zu bestimmen, erfordert etwas statistischen Einsatz. Das Gedankenmodell ist jedoch sehr einfach und einleuchtend: Es werden sogenannte statistische Zwillinge gesucht, also z.B. zwei säumige Zahler, die sich möglichst nur in dem zu bewertenden Merkmal unterscheiden. Der eine Zwilling soll das zu untersuchende Datenfeld tragen, bei dem anderen soll es fehlen. Ansonsten gleichen sich die beiden. Mit einem Propensity-Score-Schätzer kann dann der Einfluss dieses einen Datenfeldes auf die Performance abgebildet werden, indem der EBT-Beitrag beider Zwillinge miteinander verglichen wird.
Mit diesen einfachen Ansätzen können schnell erste Schritte gemacht werden, um den Wert von Daten im Unternehmen sichtbar zu machen. Mittlerweile aktualisieren wir die ermittelten Werte regelmäßig und stellen sie unseren Data Ownern im Data Dictionary zur Verfügung. Mittelfristig soll der Wert der Daten in Kern-KPIs und Management-Systemen verankert werden. Neben diesem direkten Feedback sind die Erkenntnisse jedoch auch ein Baustein im Business-Case, der die Infrastruktur zur dispositiven Datenhaltung rechtfertigt.
Daten als Basis für Investitionsentscheidungen und individualisierte Angebote
Die Anforderungen an analytische Infrastrukturen wachsen schnell. Als Grundlage für die Modellentwicklung kann z.B. ein umfangreiches Datawarehouse auf Basis von Exasol dienen. In diesem Fall können Data Scientists gängige Python-Frameworks nutzen, die sich über JSON-Objekte in Echtzeit mit dem Inkassosystem austauschen. Wir setzen in unserem Kernsystem beispielsweise auf Microservices, die über einen Kafka-Bus kommunizieren und haben auf der dispositiven Seite ein Data-Lake von Cloudera im Einsatz, um schnell alle Daten nutzen zu können. Auch hier hilft das konkrete Wissen um den Wert von Daten, um kluge Investitionsentscheidungen zu treffen und die Datenerschließung fokussiert zu betreiben.
Neben der analytischen Erschließung der Daten im Inneren liegt es auf der Hand, zusätzliche Daten extern zu erheben. Die EOS Studie zeigt: Banken sind in Punkto Vertrauen klar im Vorteil. Dieser Vorsprung kann ausgebaut werden, indem die Datennutzung transparenter wird. Dabei sollte diversifiziert werden:
Statt zu fragen, ob Daten grundsätzlich erhoben werden, sollte die Frage lauten, wieviel die Kund*innen jeweils preisgeben möchten und welche Gegenleistung sie dafür erhalten. Banken könnten ihrer Kundschaft je nach Bereitschaft zur Datenfreigabe unterschiedliche Services anbieten.”
Auch bei der Kreditvergabe kann das funktionieren, z.B. indem die Bank für die Preisgabe von Daten Rabatte einräumt. Denn: Je besser sie den Kunden kennt, desto besser kann sie die Ausfallrisiken einschätzen.
PSD2: Chancen fürs Forderungsmanagement – und Verbraucher
Ein weiteres Thema, dass sich aus verschiedenen Perspektiven diskutieren lässt, ist die Nutzung von Kontoinformationen auf Basis von PSD2. Dies wird nur funktionieren, wenn Unternehmen komplett transparent machen, welchen Nutzen die Kunden von einem solch tiefen Einblick in ihre Daten haben. Bezogen aufs Forderungsmanagement könnte beispielsweise ein flexibler und individueller Plan zum Schuldenabbau einen Mehrwert stiften, für den säumige Zahler den Blick ins Konto zuzulassen. Zumal wenn sichergestellt ist, dass Raten nur noch vom Konto abgebucht werden, wenn dieses dadurch nicht in den Dispo rutscht und ein angemessener finanzieller Spielraum übrig bleibt.
Daten sind ein nicht mehr wegzudenkender Baustein vieler Geschäftsmodelle geworden. Um sich als Unternehmen auch für die Zukunft eine gute Datengrundlage zu sichern und die rasch wachsenden Möglichkeiten der analytischen Technologien zu nutzen, muss die Erhebung von Daten partnerschaftlich mit den Kunden erfolgen, so dass der Wert der Daten für beide Seiten spürbar wird.Dr. Henning Stolze, EOS
Sie finden diesen Artikel im Internet auf der Website:
https://itfm.link/114453
Schreiben Sie einen Kommentar