Datenbanken für Big Data
Softwareseitig stoßen bei Big Data vor allem die herkömmlichen Datenbanken an ihre Grenzen. Sie können schlecht mit unstrukturierten Daten in Nicht-SQL-Formaten wie Bildern, Sounds oder E-Mail-Anhängen umgehen - also dem Löwenanteil bei hochvolumigen Datenmengen. Übliche relationale Datenbanksysteme und Analysetechniken kommen mit den unterschiedlichen Datentypen nicht zurecht.
Für unstrukturierte Daten gibt es Techniken wie NoSQL-Datenbanken. NoSQL ist der Sammelbegriff für nicht-relationale Datenbanksysteme und zugleich der Name einer Bewegung weg von den relationalen Datenbanken hin zu neuen beziehungsweise vergessenen Datenbankmodellen. Diese Datenbanksysteme lassen sich ergänzend zu den klassischen Datenbanken einsetzen. Sie können dann wieder in strukturierte Datensysteme überführt und als Kennzahlen beispielsweise in ein Datawarehouse eingespeichert werden.
NoSQL-Datenbanken wie die Opensource-Lösung Hadoop bieten ein hochskalierbares Filesystem, um unterschiedlich strukturierte Daten zu speichern. Außerdem verfügen sie über eine Entwicklungsumgebung, um Programme für eine parallelisierte Datenverarbeitung zu erstellen.