Das neue Data Warehouse
Doch auch wenn die Unternehmen nicht mehr jedes Byte in ihren Datensilos ablegen, dürften sich die Herausforderungen in Sachen Big Data kaum in Luft auflösen. "Das Wachstum der Datenmengen wird von den Anwendern als eines der größten Probleme im Data-Warehouse-Umfeld wahrgenommen", sagt Carsten Bange, Geschäftsführer des Business Application Research Center (Barc). Das sei allerdings nicht neu. Die Unternehmen beschäftigten sich bereits seit längerem damit. Jetzt habe das Thema mit "Big Data" einen griffigen Namen bekommen. Außerdem beeinflusse neben den wachsenden Datenmengen eine Reihe weiterer Faktoren das Data-Warehouse-Umfeld. Dazu zählt Bange die steigende Komplexität der Abfragen sowie höhere Ansprüche der Nutzer an die Abfrage-Performance. Außerdem wachse die Zahl der Anwender, die auf effizientere Datenanalysen angewiesen seien. "Das alles sind Einflüsse, die dafür sorgen, dass die Anforderungen an die Skalierbarkeit eines Data Warehouse steigen", stellt Bange fest.
Zudem müssten die Anwender im Zuge von Big Data auch mit neuen Datenarten zurechtkommen. Das Problem dabei sei jedoch, dass herkömmliche relationale Datenbanksysteme und traditionelle Analysetechniken mit den unterschiedlichen Datentypen nicht klarkämen. Längst seien es nicht mehr nur strukturierte Daten, die die Verantwortlichen in den Unternehmen verwalten müssen, betont auch Rüdiger Spies. Der IDC-Analyst will allerdings nicht von den vielzitierten unstrukturierten Daten reden: "Unstrukturiert sind vielleicht kosmische Strahlen, aber nicht Informationen in der IT." Spies spricht vielmehr von semi- beziehungsweise quasi-strukturierten Daten. Dazu zählten Texte und Videos. Die IT-Abteilungen in den Unternehmen seien gefordert, diese Datenstrukturen zu erkennen, auszuwerten und mit den klassischen Datenbank-, Data-Warehouse- und Analysesystemen zu verlinken.
Dafür gebe es mittlerweile jedoch Lösungen, sagt Bange, und verweist auf Techniken rund um NoSQL-Datenbanken. Diese Systeme könnten ergänzend zu klassischen Datenbanken zum Einsatz kommen, beispielsweise um Social Networks auf Stimmungen beziehungsweise Nennungen von Produkten oder Firmennamen zu analysieren. Die so gewonnenen Ergebnisse ließen sich wieder in strukturierte Daten überführen und als Kennzahlen in ein DW einspeisen, beschreibt Bange eine mögliche Vorgehensweise.