Potenzial von Dark Data

Goldene Fische im dunklen Datenmeer



Marcus Enger leitet den indirekten Vertrieb bei Pitney Bowes Software. Sein beruflicher Werdegang begann mit dem Studium der Wirtschaftsinformatik in Mannheim und Nizza mit dem Abschluss eines deutsch-französischen Doppeldiploms. Über die Stationen Oracle Consulting, das Start-up Sagent Technology und Group 1 Software kam er zu Pitney Bowes und durchlief mehrere internationale Stationen: Leitung der Beratung in Deutschland, Verantwortung des Produktmarketings in EMEA bis zur aktuellen Position.
Unstrukturierte Daten stellen Unternehmen vor große Herausforderungen. Eine akkurate Analyse kann jedoch einige Schätze zu Tage fördern.

Tief in Ihren Geschäftsabläufen versteckt sich eine Bedrohung, die Ihnen vermutlich nicht bewusst ist. Sie bedroht die Sicherheit Ihres Geschäfts und könnte Sie unter den DSGVO-Vorschriften teuer zu stehen kommen. Ihr Name? Dark Data. Auch als unstrukturierte Daten bekannt, sind laut einer aktuellen IBM-Studie, über 80 Prozent aller Daten "dunkle" Daten. Bis 2020, so prognostizieren andere Studien, werden sogar 93 Prozent aller Daten unstrukturiert sein.

Damit Unternehmen nicht im Trüben fischen müssen, sollten sie ihre unstrukturierten Daten genau analysieren.
Damit Unternehmen nicht im Trüben fischen müssen, sollten sie ihre unstrukturierten Daten genau analysieren.
Foto: shutterstock/Palo_ok

Gartner definiert Dark Data als "Informationsressourcen, die Unternehmen während der regulären Geschäftsaktivitäten erfassen, verarbeiten und speichern, aber im Allgemeinen nicht für andere Zwecke verwenden". Diese Daten stammen aus einer Vielzahl unterschiedlicher Quellen wie E-Mails, Dokumenten, Sofortnachrichten oder auch Social-Media-Beiträgen. Vor allem im Hinblick auf neue Datenschutzvorschriften wie die DSGVO, müssen Unternehmen einen klaren Überblick über die von ihnen gespeicherten Daten haben.

Statische Daten aus strukturierten Datenbanken lassen sich dabei relativ unkompliziert erfassen. Unstrukturierte, "dunkle" Daten stellen dagegen eine Herausforderung dar, da sie in großen Mengen und in hunderten von Silos gespeichert werden.

Ein bodenloses Datenmeer

Dark Data ist meistens textbasiert, kann aber auch als Video-, Audio- oder Bilddateien vorliegen. Sie werden durch viele Quellen erzeugt und auf mobilen Endgeräten, sozialen Medien oder Apps gesammelt, um nur einige Beispiele zu nennen. Auch ein Großteil der durch das Industrial Internet of Things (IIoT) generierten Daten ist unstrukturiert und wird somit ebenfalls als Dark Data gewertet.

Am Arbeitsplatz sind häufig die Mitarbeiter dafür verantwortlich, dass sich unerkannt Dark Data ansammelt. So werden beispielsweise im Laufe des Arbeitstages Telefonkonferenzen und Kundengespräche zu Trainingszwecken aufgenommen und als Audiodateien geteilt, Chat-Verläufe protokolliert und Instant-Messaging-Anwendungen auf dem Desktop gespeichert.

Alle Daten, die so gesammelt und auf unterschiedlichen Geräten, Laufwerken, Desktops und SaaS-Plattformen gespeichert werden, fallen unter die Definition "Dark Data". Das meiste davon wird nie wieder verwendet. Mitarbeiter verlassen das Unternehmen, Kunden wechseln den Anbieter, Geschäftsprioritäten ändern sich. Und niemand hat die Aufgabe, die Zeit oder gar die Möglichkeit, die Daten zu löschen, so dass die Informationen schnell veralten und nicht mehr zugänglich sind.

Warum man Daten verstehen muss

Früher war Dark Data ein akzeptabler Bestandteil des alltäglichen Geschäfts und es gab keine Vorschriften zur Mindest- oder Höchstdauer für die Speicherung von Daten. Angesichts der DSGVO muss sich diese "Aus den Augen, aus dem Sinn"-Mentalität jedoch dringend ändern. Unternehmen müssen nun in der Lage sein, den internen Datenfluss zu verstehen und darauf basierend stringente Data-Governance-Konzepte zu entwickeln.

Seit Inkrafttreten der EU-Datenschutzgrundverordnung müssen Unternehmen und Organisationen auf Anfrage von Kunden, Mitarbeitern oder sonstigen Anspruchsberechtigten alle personenbezogenen Daten, die im Unternehmen gehalten werden, zügig bereitstellen können. Auch wenn Kunden eine Dokumentation darüber anfordern, wann und in welchem Kontext sie die Einwilligung zur Erfassung und Speicherung ihrer Daten erteilt haben, müssen Unternehmen ihre Aufzeichnungen zur Verfügung stellen.

Dabei sollten Datenverantwortliche ihre Aufgabe sehr ernst nehmen und von vornherein nur Informationen verarbeiten, die für den ursprünglichen Zweck erforderlich sind. Das ist dann besonders schwierig, wenn Unternehmen ihre Informationen in zahlreichen isolierten Datenquellen speichern.

Warum man Daten verstehen sollte

Es ist daher höchste Zeit, dass Unternehmen ihre "dunklen" Daten ans Licht bringen. Denn durch das Zusammenstellen, Ordnen und Verwalten von Dark Data erreichen Unternehmen einen Mehrwert, der weit über DSGVO-Compliance hinausgeht. Die Analyse dieser unstrukturierten Daten bietet die Möglichkeit, wertvolle Geschäftseinblicke zu gewinnen, die andernfalls vielleicht unerkannt blieben. Daten können so in strategische Intelligenz umgewandelt werden.

Beispiele für solche Daten sind Anmeldungen auf Portalen und ähnlichem, die Hinweise auf das Nutzerverhalten der Besucher geben können, Gesprächsanalysen von Kundenanrufen, die auf die Konsumentenstimmung hinweisen, oder auch mobile Geodaten, die das Bewegungsverhalten der Kunden für die Geschäftsplanung analysierbar machen.

Einzelhändler sind Experten dafür, die Entscheidungsprozesse von Käufern sowie deren Bewegungsmuster im Ladengeschäft zu verstehen und darauf basierend ihre Produkte optimal zu platzieren. Die Erkenntnisse, die Einzelhändler aus der Analyse unstrukturierter Videodaten gewinnen, können durch das Anpassen der Filialgestaltung direkt einen positiven Einfluss auf die Umsätze haben.

Durch eine genaue Analyse unstrukturierter Daten können Unternehmen:

  • eine echte 360-Grad-Single-Customer-View erstellen, um den Dialog und die Interaktion mit den Kunden individuell zu gestalten

  • Veränderungen der Markt- und Verbrauchernachfrage vorhersehen, verstehen und frühzeitig darauf reagieren

  • auf Basis der Analyse von Social-Media-Plattformen und Multichannel-Interaktionen ein verbessertes Verständnis über die Wahrnehmung der Unternehmensmarke erlangen

  • gefährdete Informationen sichern und die persönlichen Daten ihrer Kunden bestmöglich schützen

  • die Genauigkeit ihres Risikomanagements verbessern

  • den Kundenservice und damit das Kundenerlebnis verbessern, da mögliche Schwachstellen früher erkannt werden

  • Verbindungen zwischen einzelnen Datensätzen erkennen

  • die Basis für genauere Prognosen legen

  • mithilfe von Web-Analytics ein besseres Verständnis über die Performance ihrer Webseite erlangen

  • neue Einnahmequellen identifizieren, denn laut IDC werden bis Ende 2018 etwa 50 Prozent der Erlöse großer Unternehmen aus Data-as-a-Service (Daas) durch den Verkauf von Rohdaten, abgeleiteten Metriken, Erkenntnissen und Empfehlungen generiert.

Die Analyse unstrukturierter Daten ist heute einfacher als je zuvor. Mithilfe von verbesserten Tools können Unternehmen ihre Prozesse automatisieren und beschleunigen, indem sie Datensätze miteinander verknüpfen. Sie erhalten so präzisere Erkenntnisse und Einblicke. Diese Tools können mit unterschiedlichen Techniken zum Data-Profiling sowohl strukturierte als auch unstrukturierte Daten scannen, um daraus eine automatische Dokumentation zu generieren, die das Unternehmensvermögen beschreibt und ein Metadaten-Repository erstellt. Auf dieser Grundlage können Unternehmen die Möglichkeiten erkunden, die in den Daten versteckt sind - und dann wird es erst richtig spannend.

Zur Startseite