Datenbanksysteme für Industrieumgebungen

Betriebsfertige IT-Komplettlösungen für das IIoT

23.09.2020 von Christian Lutz
Die Ansprüche an IT-Lösungen sind seit 2018 rasant gewachsen. Die Komplexität ihrer Anwendungsmöglichkeiten und Einsatzbereiche ist für viele Nutzer nicht mehr ohne weiteres zu überblicken, weshalb immer mehr betriebsfertige Komplettlösungen zum Einsatz kommen.
Die Ansprüche an IT-Lösungen sind seit 2018 rasant gewachsen.
Foto: sdecoret - shutterstock.com

Betriebsfertige Komplettlösungen für IIot-Umgebungen werden nicht nur von Fachleuten erstellt und auf ihre Integrität geprüft, sondern können auch auf die besonderen Wünsche der Endkunden zugeschnitten werden. Auch industrielle Kunden vernetzen ihre Fertigungslinien oder ganze Fabriken nach und nach, sodass sich die Frage stellt, ob es betriebsfertige IIoT-Komplettlösungen (Industrial Internet of Things) geben kann und was diese dann leisten können müssen.

Endgeräte erzeugen eine immense Menge an Daten

Die besondere Herausforderung, die durch Geräte und Maschinen, die mit Steuer- und Analyseprogrammen kommunizieren, entsteht, ist die immense Menge an Daten, die aufgenommen werden müssen. Dabei muss man die verschiedenen Quellen jedoch nicht nur miteinander vernetzen und in die Prozesse einbinden, sie liefern in der Regel auch unterschiedliche Datenformate, die man verarbeiten muss. Damit all das auch tatsächlich umsetzbar ist, sollte dahinter eine Datenbank stehen, die zuverlässig genau diese Leistungen erbringt.

Lesetipp: Industrie 4.0-Projekte in der Azure-Cloud

Verglichen mit anderen Use Cases im Bereich IoT, ist das IIoT oftmals sehr viel komplexer: Es ist relativ einfach, die Heizungsanlage im Smart Home von unterwegs aus per Handy zu steuern oder sich von remote stehenden Windrädern regelmäßig einen Alive-Ping zusenden zu lassen. Wenn jedoch eine Produktionsstrecke oft hunderte oder tausende Sensoren hat, welche jeweils Daten im Sekunden- oder gar im Millisekundentakt sendet, ist das weit vielschichtiger. Denn diese Daten müssen dann oft noch mit denen aus anderen Quellen, zum Beispiel aus dem ERP-System, kombiniert, um dann in Echtzeit ausgewertet zu werden.

So lässt sich die Produktion effizient überwachen, das Verhalten vorhersehen und gegebenenfalls angrenzende Prozesse auslösen. Die dabei entstehenden endlosen Messdatenreihen, stehen in verschiedensten Relationen zueinander und erst durch komplexe Analysen lässt sich wertvolle Information gewinnen. Dadurch sind die praktischen Anforderungen an die IT-Infrastruktur eines IIoT, vor allem an die Performance, die Verfügbarkeit und die flexible Skalierbarkeit, deutlich höher, als es erste Initiativen im Rahmen von Piloten oder Proof of Concepts (PoC) vermuten lassen.

Kosten stets im Blick

Wie bereits angedeutet, unterscheidet sich die Struktur der Datenmengen und deren Analyse in einem IoT-Projekt zum Teil deutlich von dem, was sonst gewöhnlich anfällt. Die typischen performanten Zeitreihenanalysen, mit denen die Entwicklung bestimmter Werte in einem Zeitverlauf betrachtet wird, verlangen nach Datenbank-Tabellen, die automatisch nach Zeitintervallen partitioniert werden.

Doch auch die Speicherung spezieller Geo-Datentypen (z. B. geo_point und geo_shape) ist für viele Maschinendaten-Analysen essentiell, da sich damit beispielsweise der Standort der Maschine bestimmen lässt - was sowohl in größeren Fabriken als auch bei vernetzten Fabrikanlagen hilfreich und notwendig ist. Ist die Datenbank fähig, auch solche Datentypen auszulesen und zu verarbeiten, ist es möglich, skalare Funktionen wie etwa Entfernungen, präzise zu berechnen.

Um die oft in Stapeln gelieferten Analysedaten in Echtzeit in das System aufzunehmen, nutzen einige Anbieter, darunter die CrateDB, die Möglichkeit, den Sperr-Overheads, den solche Stapel-Dateien oft mit sich bringen, für den Schreibvorgang zu entfernen.

Um Produktionsprozesse zu optimieren und die Unzahl an Datenmengen verarbeiten zu können, muss die (I)IoT-Technologie nicht nur performant, sondern vor allem auch kosteneffizient arbeiten. Der Unterschied kann massiv sein, zum Beispiel bei einer speziell für IIoT-Umgebungen gebauten Datenbank sind oft minus 70 Prozent TCO (Total Cost of Ownership) im Vergleich zu traditionellen System der Fall.

Zusätzlich muss eine solche Lösung ausfallsicher sein und das bedeutet, dass für die Infrastruktur auch Hochverfügbarkeits-Maßnahmen ergriffen werden sollten. Aber auch, dass für die gewählte Datenbank entsprechende Features bereitstehen, wie etwa rollierende Software-Updates und die automatische Replikation von Daten im Cluster.

Relationen oder Performance - SQL versus NoSQL

Alle Unternehmen setzen bereits seit Jahren Datenbanksysteme, zumeist klassische RDBMS (Relational Database Management Systeme), ein. Die Voraussetzungen, unter denen diese angeschafft wurden, unterscheiden sich jedoch stark von denen, die heute unter IoT-Bedingungen herrschen. Daher stoßen konventionelle RDBMS schnell an ihre Grenzen, sobald es an die relationale Verarbeitung geht - da sowohl die Kosten als auch die Skalierung Schwierigkeiten bereiten.

Gerade in Bezug auf eine hohe Performance bei der Abarbeitung vieler Transaktionen bietet sich daher der Einsatz von Not-Only-SQL-Datenbanken (NoSQL-DB) an. Dieses Datenbankmodell verzichtet sowohl auf relationale Datenbankmodelle als auch auf vordefinierte Schemata und nutzt statt Spalten und Zeilen - zum Beispiel Wertepaare oder Objekte -, um die Daten zu organisieren. Dadurch sind sie bei der Datenbearbeitung performant einsetzbar und können auf verteilten Systemen agieren.

Dennoch ist der Einsatz von NoSQL-DB in IoT-Projekten nicht uneingeschränkt empfehlenswert. NoSQL eignet sich zwar hervorragend für das Abspeichern von Daten und das Abarbeiten von linearen Befehlen, aber weniger dafür, große Datenmengen miteinander zu verknüpfen - etwa durch Aggregationen und Joins oder individuell definierte, analytische Funktionen.

Optimalerweise fällt die Wahl daher auf Datenbanken, die die Performance und Skalierbarkeit von NoSQL-Systemen mit der relationalen SQL-Arbeitsweise verknüpfen. Dieses Vorgehen würde es auch ermöglichen, weiterhin das bereits vorhandene SQL-Know-how weiter zu verwenden. Der Markt bietet hier verschiedene Lösungen von verteilt arbeitenden Datenbanken mit einem Shared-Nothing-Ansatz an ohne SQL und mit Standard SQL an.

Bei shared-nothing handelt es sich um ein Vorgehen, bei dem jeder Knoten der verteilten Architektur autonom arbeitet und dadurch auf ausschließlich ihm zur Verfügung stehende Ressourcen, wie etwa Prozessorleistung, Betriebssystem und Arbeitsspeicher, zugreift. Dadurch werden alle Anfragen zur Berechnung auf die verfügbaren Knoten verteilt und können entsprechend schnell abgearbeitet werden, während das zugehörige Management-System automatisch das Ausbalancieren der Workloads durchführt.

Diese Parallelisierung ist es, die dem System eine schnelle und unkomplizierte Skalierung ermöglicht. Auf diese Weise lässt sich der Performance-Nachteil, den normalerweise SQL-Systeme gegenüber NoSQL-Datenbanken haben, nicht nur ausgleichen, sondern man verbindet das beste beider Welten.

Ist ein betriebsfertige IT-Komplettlösung für das IIoT sinnvoll?

Zurück zur Ausgangsfrage, ob es betriebsfertige IIoT-Komplettlösungen geben kann. Wie bereits angedeutet, verlangt die IoT-Praxis die Integration und die Verarbeitung von Daten aus mitunter sehr verschiedenen Quellen und in unterschiedlichen Formaten. Die Leistungsfähigkeit, die die zum Einsatz kommenden Datenbanksysteme hierbei erbringen müssen, ist beeindruckend.

Um damit nachhaltige Möglichkeiten zur Produktverbesserung und Effizienzsteigerung innerhalb der Fertigungsprozesse zu schaffen, muss nicht nur die Verarbeitung, sondern auch die Auswertung relevanter Maschinendaten in Echtzeit geschehen. Daher ist es auch - und vor allem im Bereich des IIoT - sinnvoll, eine auf diese Ansprüche zugeschnittene Datenbank und dazu passende individuelle Serviceleistungen aufeinander abzustimmen, um das Ergebnis zu optimieren.