Platz 1: MapReduce
Warum in aller Welt würde man ein Programmierungs-Framework als wichtigste neue Technologie des Jahres 2009 wählen? Ganz einfach: Weil MapReduce Unternehmen die Analyse von ungeahnten Mengen von Daten zu moderaten Preisen ermöglicht. Das verspricht eine ungeahnte Veränderung der Business-Welt.
IDC hat eine Verzehnfachung der digitalen Informationen zwischen 2006 und 2011 von knapp 180 Exabyte auf 1800 Exabyte vorausgesagt (das sind 1 Billion und 800 Milliarden Gigabyte!). Diese Explosion ist natürlich eine Herausforderung (diese Daten müssen gespeichert, abgerufen und archivieren werden), aber auch eine große Chance für Unternehmen. Denn dieses Meer von Informationen bietet potenzielle Informationen im Überfluss - Informationen, die genutzt werden können, um richtige unternehmerische Entscheidungen zu treffen.
Bis vor kurzem brauchten Unternehmen, die Petabyte von individuellen Daten verarbeiten wollten, um die für das Geschäft relevanten Informationen zu filtern, einen sehr guten Grund, um in ein solches solchen Vorhaben viel Geld zu investieren; der Kosten- und Zeitaufwand war immens. Aber das verändert sich gerade schnell, weil sich langsam die Anwendung anderer Methoden, vornehmlich ist MapReduce zu nennen, durchzusetzen beginnt. Das ist ein Framework, das Seiten wie Google, Facebook, MySpace und anderen ermöglicht hat, enorme Datenmengen effektiv zu nutzen. Basierend auf einer funktionalen Programmierung können mit Hilfe tausender Rechnerknoten enorme Datenmengen verarbeitet werden.
In seiner einfachsten Form teilt MapReduce die Prozesse in viele kleine Blöcke, verteilt sie in einem Cluster von Rechenknoten (in der Regel Allerweltsserver) und fügt die Ergebnisse wieder zusammen. Durch die Unterstützung hoch-flexibler paralleler Verarbeitung ist MapReduce schnell, günstig und sicher. Wenn ein Knoten ausfällt, ist der Verlust auf die Leistung des einzelnen Knotens beschränkt.
Google führte das MapReduce Framework im Jahr 2004 ein, aber es gibt heute viele neue Implementierungen, darunter Apache Hadoop, Qizmt, Disco, Skynet und Greenplum. Apache Hadoop ist die führende Open-Source-Ausführung. Amazon nutzt Hadoop um MapReduce für den Amazon Web Service (auf der deutssprachigen Website von Amazon wird dieser Service bisher noch nicht angeboten). Cloudera, die ihr Angebot als "Apache Hadoop für Unternehmen" anpreisen, machen ebenfalls bedeutende Fortschritte.
Unterstützung für MapReduce-Programmierung wird von verschiedenen Business-Software-Produkten wie GigaSpaces eXtreme Application Platform, GridGain Cloud Development Platform, IBM WebSphere eXtreme Scale und Oracle Coherence angeboten; um nur einige zu nennen.
Lesen Sie auch:
Das unaufhaltsame Anwachsen der Datenflut ist eine Tatsache. Weil die Anbieter MapReduce mittlerweile in Ihre Angebote mit einbeziehen, gibt es neue Perspektiven bezüglich dieser genannten Petabytes an Daten. Es ist schwierig, sich heute vorstellen zu können, wie die Geschäftswelt vor 30 Jahren ohne die Vorteile von Business-Intelligence-Software oder sogar ohne Tabellen funktionieren konnte. Wenn MapReduce ein Teil der Unternehmenskultur wird, werden Business-Strategen in nicht allzu ferner Zukunft möglicherweise auf die heutige Zeit genauso zurückblicken. (pcwelt/cm)