Im vergangenen Jahr hat Experton Group den ersten Big Data Vendor Benchmark für Deutschland vorgestellt. Wir werfen im heutigen ICT-Newsletter einen genaueren Blick auf den Quadranten der Kategorie "Analytics", in der Anbieter bewertet wurden, die für die Big-Data-Aufgaben der Anwender Dienstleistungen rund um den Rechenzentrumsbetrieb und den Betrieb von IT-Systemen anbieten. Außerdem weisen wir auf die Kontinuität im Thema "Big Data" hin, die vielfältig zum Ausdruck kommt.
Die Angebote im Bereich der Analytics-Software zeichnen sich unter anderem dadurch aus, dass sie um eine bereits existierende Software weitere Analyse-Tools entwickeln. Um diese Offerings werden dann vielfach Beratungsangebote entwickelt, die mit der Komplexität der Anwenderprobleme auch selbst an Komplexität zunehmen. Das kann auf Anwender mit unter verwirrend wirken.
Einzelne Anbieter liefern ihre Lösung zusätzlich als Appliances, die die eigentliche Analytics-Anwendung in ein vorkonfiguriertes System mit Server, Storage, Netzwerk, Datenbank und Middleware integriert.
Die betrachteten Big-Data-Analytics-Lösungen zeichnen sich dadurch aus, dass sie im Unterschied zu den bisherigen klassischen Business-Analytics/Business-Intelligence-Lösungen nicht nur größere Datenmengen, sondern mehr unterschiedliche Formate verarbeiten können und Berechnungsergebnisse schneller liefern.
1. Big-Data-Infrastruktur (Datenspeicherungslösungen, Verknüpfung von Daten und Datenbanken, Appliances, Computerhardware)
2. Big-Data-Aggregation (Zusammenführung von Daten aus unterschiedlichen Quellen, Integration, Data Quality)
3. Big Data Analytics (Business-Intelligence-Lösungen, Data Warehouses, Advanced Analytics)
4. Big-Data-Syndizierung (Visualisierung und Ausspielen von Berechnungsergebnissen an viele Benutzer, einschließlich Konzepten wie Linked Open Data)
5. Data Security und Data Integrity
6. Big-Data-Consulting und -Services
Historisch bedingt und auf Basis der ersten großen Erfolge liegt der Schwerpunkt häufig in einem bestimmten Marktsegment wie zum Beispiel dem Handel. Oft liegt der Fokus noch stark auf dem Datenvolumen, aber möglicherweise werden von der Anwendung auch schon stark diversifizierte Daten aus unterschiedlichen Quellen und in unterschiedlichen Formaten verarbeitet.
Bewertungskriterien
Ein maßgebliches Kriterium für die Beurteilung des Offerings ist die Fähigkeit der Verarbeitung von Daten aus den unterschiedlichsten Quellen. Das können viele Lösungen in der Theorie belegen. Die meisten praktischen Anwendungsbeispiele kommen jedoch noch aus Einsatzgebieten, deren Daten in der Regel sehr gut strukturiert sind - beispielsweise Maschinendaten oder Textdaten mit begrenzten Textlängen und Strukturelementen wie URL-Kurzformen bzw. durch Sonderzeichen markierte Bestandteile.
Die Verteilung der Unternehmen im Wettbewerbsfeld zeigt, dass eine ganze Reihe von Unternehmen technologisch sehr gut aufgestellt ist. Diese Unternehmen haben jetzt die Chance, mit neuen komplexen Anwendungsszenarien und einer Stärkung ihrer (Service-) Organisation weit nach vorn zu drängen, wobei sie auch große internationale Unternehmen verdrängen können.
Oracle weit vorne
Oracle Advanced Analytics, Oracle OLAP und Oracle RT Decision Server sind Lösungen, die zur Spitze der aktuell im Markt verfügbaren Offerings gehören. Bemerkenswert und durch positive Rückmeldungen von Anwendern bestätigt, ist Oracles eigene Distribution von R für die Oracle-Datenbanken 11g und 12c. Mit R wird eines der leistungsfähigsten Analytics-Tools mit leistungsfähigen Hardware-Lösungen verknüpft. Dadurch ist Oracle sicherlich auch für die engere Auswahl interessant. Die Existenz der entsprechenden Speicherlösungen (Oracles Engineered Systems) wirkte sich unterstützend auf diese Positionierung aus, weil Oracle dadurch insgesamt eine fortschrittliche Grundlage für Big-Data-Analysen liefern kann.
IBM punktet mit Unabhängigkeit
Gleich drei Analytics-Engines kann IBM in die Waagschale werfen: Da ist das Hadoop-basierende BigInsights, die InfoSphere Streams für die Verarbeitung von Streaming Data und die PureData-Systeme für Analysen oder DB2-Lösungen. Information Management und Data Governance, wie von manchen Anbietern im Markt fast schon als eigenständige Big-Data-Lösung angepriesen, werden von IBM als unterstützende Lösungskomponenten zugrunde gelegt. Bereits an anderer Stelle erwähnt wurde IBMs BLU-Technologie, die SQL-Abfragen nicht nur "in-memory", sondern auch auf komprimierte Daten gestattet, was einen enormen Leistungsschub bringt, wobei dieses Leistungsmerkmal hier nur unterstützend bewertet wurde. Die Bewertung unterstützt hat ebenfalls die weitgehende Unabhängigkeit IBMs von Dritten hinsichtlich des Produktportfolios ebenso wie hinsichtlich der Wettbewerbsstärke.