Grund dafür, dass das Interesse an diesem Thema so stark wächst, ist laut Forrester eine sich wandelnde Einstellung: Unzählige Unternehmen haben aufgehört, Datenanalyse lediglich als neues, noch etwas exotisches Phänomen wahrzunehmen. Statt dessen Fragen sie sich, wie sie Big Data konkret und gewinnbringend für ihr Business einsetzen können.
"Aber solche Möglichkeiten auszuloten, bedeutet, sich durch einen konfusen Mix ganz unterschiedlicher Technologien zu navigieren, die sich schneller verändern, als irgendwer erwartet hätte", schreibt Brian Hopkins von Forrester, einer der Autoren des Reports.
Das Papier will deshalb Antworten liefern auf die fünf am häufigsten von Forrester-Klienten gestellten technologischen Fragen im Zusammenhang mit Big Data.
Hier sind sie.
1. Was genau ist gemeint, wenn von Big Data-Technologien die Rede ist?
Forrester hat die Erfahrung gemacht, dass die Meisten im Grunde Hadoop meinen, wenn sie Big Data sagen. Hadoop ist ein Framework für skalierbare, verteilt arbeitende Software. Durch den verwendeten MapReduce-Algorithmus von Google besitzt Hadoop die Fähigkeit, unterschiedlichste Arten von Abfragen und Analysen schnell und parallel durchführen zu können.
Das Framework wird mehr und mehr zu einer preiswerten Standardplattform für solche Prozesse. Hilfreich ist dabei auch die beinahe grenzenlose Konfigurierbarkeit von auf Hadoop basierenden Systemen.
Laut Forrester vergäßen viele IT-Verantwortliche aber, dass es noch viele andere Werkzeuge gibt, die dazu dienen, aus Datenmaterial für das Business nutzbare Analysen zu formen, Forrester nennt hier zum Beispiel den Hersteller SAS.
2. Wie reif ist der Anbietermarkt für Big Data Technologien?
In den zurückliegenden drei Jahren habe der Markt erheblich an Reife zugenommen. Die Anbieten ließen sich in fünf Gruppen einteilen. Erstens die großen, etablierten Player wie IBM, Oracle, Microsoft und SAP, zweitens Service Provider wie Accenture, Deloitte oder TCS.
Drittens die gesamte Open Source Community und mit ihr verbundene Dienstleister wie Hortonworks, MapR, viertens Anbieter von reinen BI- und Analyse-Tools und fünftens kleine wie mittelgroße Integrations- und Infrastruktur-Anbieter.
Forrest zählt 39 Firmen, die man als Big Data-Anbieter bezeichnen kann, wobei (natürlich) die Dienstleister vor Ort nicht mitgerechnet sind.
3. Wie steigen erfolgreiche, wachsende Unternehmen in das Thema Big Data ein?
36 Prozent der von Forrester befragten globalen IT-Entscheider implementieren entweder bereits eine Big Data-Lösung, erweitern eine bestehende Implementierung oder haben zumindest die Absicht, im kommenden Jahr eine Big Data-Lösung einzuführen.
Im Gegensatz zu Befragungen in den Jahren davor war bezüglich dieser Pläne kein genereller Unterschied feststellbar zwischen erfolgreichen und weniger erfolgreichen Unternehmen.
In Details der Entscheidungen unterschieden sich diese allerdings durchaus. So haben Firmen, die stark wachsen, in aller Regel höhere Erwartungen an Big Data, sind viel häufiger als weniger erfolgreiche Unternehmen davon überzeugt, dass sie Big Data-Lösungen ihren Business-Zielen näherbringen werden.
Dazu passt, dass sich erfolgreiche Firmen auch stärker der Grenzen ihrer aktuellen, ohne Big Data funktionierenden Business-IT-Landschaft bewusst sind.
Diese Unterschiede sind nach Ansicht der Autoren des Forrester-Reports ein Beleg dafür, dass es nicht nur vom Investitionsverhalten abhängt, ob Unternehmen mit einer neuen Technologie Erfolg haben. Sondern der Erfolg stellt sich dann ein, wenn sich die richtigen Investitionsentscheidungen mit der richtigen Mentalität paaren, also mit der Überzeugung, durch Big Data und BI die Situation des eigenen Unternehmens nachhaltig verbessern zu können.
4. In welcher Beziehung zueinander stehen Big Data- und Cloud-Technologien?
Das Zusammenwachsen von Big Data- und Cloud-Lösungen hat bereits 2011 begonnen, und dieser Trend hält bis heute an. Allerdings sollten IT-Verantwortliche beachten, dass mit einem "Cloud-Etikett" auf Big Data-Lösungen ganz unterschiedliche Dinge gemeint sein können.
Zum Beispiel erstens das Migrieren einer lokalen Hadoop-Plattform in eine Private Cloud. Zweitens das Nutzen einer Public Cloud-Infrastruktur, um auf dieser Big Data-Anwendungen laufen zu lassen. Drittens schließlich kann eine Kombination aus Big Data- und Cloud-Technologie auch darin bestehen, dass Unternehmen Big Data-as-a-Service nutzen. Microsoft zum Beispiel bietet eine solche Lösung an.
5. Welche Sicherheits- und Compliance-Aspekte sind wichtig?
Viele Unternehmen stellen sich diese Frage. Nach Ansicht von Forrester sollten sich die Verantwortlichen intensiv damit beschäftigen, weil hier eine Menge Fallstricke lauern.
Erster wichtiger Bereich ist die Frage der Zugangsberechtigung zu großen Datensammlungen und den dazugehörigen Auswertungen.
Zweitens spielt natürlich das Thema Datenschutz eine Rolle, wobei sich Forrester dazu nur sehr allgemein äußert. Wenn die regulatorischen und die Datenschutz-Anforderungen hoch seien, so die Analysten, sollten die IT-Verantwortlichen viel Zeit dafür einplanen, entsprechende Strukturen aufzubauen.
In Deutschland spielt dieser Bereich traditionell eine deutlich größere Rolle, und Datenschutzfragen sind bei Big Data besonders vertrackt.
Nach Ansicht von Marc Hilber, Datenschutzexperte und Anwalt der Kanzlei Oppenhoff & Partner aus Köln stellt sich zunächst die Frage, ob es ich bei den Informationen, die man auswerten möchte, um personenbezogene Daten handelt.
Das ist öfter der Fall, als IT-Verantwortliche gemeinhin annehmen, weil die Zusammenführung mehrerer, für sich genommen anonymisierter Datenbasen meist Rückschlüsse auf dahinter stehende Personen zulassen.
"Natürlich kann es ein berechtigtes Interesse von Unternehmen geben, Profile zu erstellen", so Hilber. Dies darf in Deutschland aber nicht grundlos und in hemmungslosem Umfang geschehen."
Erhebliche Unterschiede beim Datenschutz
Vor Datensammlungen muss der Zweck, der mit dieser Sammlung verfolgt wird, klar definiert sein. ‚Einfach mal so‘ auf Vorrat sammeln ist nach EU-Recht nicht zulässig.
Bei solchen Sammlungen zeigen sich die Unterschiede zwischen Europa und den USA am deutlichsten. Marc Hilber: "In den USA gibt es Big Data-Anwendungen im Recruitingbereich, die verschiedene Datenquellen zu einem Kandidaten miteinander verknüpfen, Facebook- und Mailaccount zum Beispiel. So etwas wäre in Deutschland selbst dann unzulässig, wenn der Bewerber dem Verfahren zugestimmt hätte."
Ebenfalls problematisch sind automatisierte Einzelfallentscheidungen: Entscheidungen, die auf Datensammlungen beruhen, dürfen nicht ausschließlich automatisiert erfolgen.
Dazu Jürgen Hartung, IT-Rechtler und Kollege von Marc Hilber bei Oppenhoff & Partner: "In diesem Zusammenhang ist auch schon die Frage diskutiert worden, ob es nicht eine Hinterlegungsstelle für jene Algorithmen geben sollte, die bei automatisierten Entscheidungen verwendet werden."
Nicht die ganze Technologie in Frage stellen
Davon abgesehen muss sich der Gesetzgeber nach Ansicht von Jürgen Hartung intensiver als bisher mit dem Thema Big Data beschäftigen. Datenschutzbelange dürften nicht dazu führen, "eine ganze Technologie in Frage zu stellen. Die europäische Gesetzgebung ist bisher nicht in der Lage, auch die Chancen, die in Big Data liegen, angemessen abzubilden."
Es gibt noch viel zu tun, auch für Unternehmen, wie Forrester Research festgestellt hat: Viele IT-Verantwortliche, die ein Big Data-Projekt planen und mit denen die Analyten gesprochen haben, äußerten offen ihre Frustration über eine ausufernde Komplexität entsprechender Anwendungen. Diese Komplexität rührt in erster Linie aus der schieren Menge der dabei eingesetzten Hard- und Softwarekomponenten - von den neu aufzusetzenden Prozessen gar nicht zu reden.
Dennoch - oder gerade deshalb - rät Forrester Unternehmen dazu, die möglichen Gewinne durch einen Big Data-Einsatz nicht aus dem Auge zu verlieren.