Vorteile von RAID
In ihrem ursprünglichen Papier schlugen Patterson, Gibson und Katz insgesamt fünf verschiedene Methoden vor, mit denen sich einzelne Platten zu einem Array zusammenfassen lassen. Sie nummerierten sie in einer bis heute gültigen Terminologie als RAID-Level 1 bis 5 durch. Diese etwas unglückliche Bezeichnung sorgt immer wieder für Missverständnisse: Trotz der Bezeichnung "Level" handelt es sich nicht um stufenweise aufbauende Verfahren, sondern um von einander völlig unabhängige Techniken.
Neben den primär angepeilten Zielen - kostengünstige, hochkapazitive Speicherung und gute Ausfallsicherheit - bieten die vorgestellten Methoden weitere Vorteile. Zum einen stellt sich der RAID-Verbund auf Anwenderseite als einzelnes logisches Volume dar. Die Verwaltung gestaltet sich also ebenso einfach wie bei einem Einzellaufwerk. Zum anderen bieten viele RAID-Verfahren durch die Parallelisierung der Plattenzugriffe einen Geschwindigkeitsvorteil gegenüber Einzellaufwerken. Dieser lässt sich allerdings nur dann voll ausreizen, wenn eine ausreichende Kanalanzahl zur blockierungsfreien Ansprache der Laufwerke zur Verfügung steht.
Die Kombination derart vieler Vorteile sorgte nicht nur für eine rasche Verbreitung RAID-basierender Massenspeicher vor allem in Servern. Auch zusätzliche RAID-Varianten wurden entwickelt, die auf bestimmte Einsatzgebiete und spezifische Vorteile hin optimiert wurden. Heute reicht die Bandbreite der allgemein verfügbaren Level von RAID 0 bis RAID 6. Hinzu kommen kombinierte Technologien wie RAID 0+1 oder 50, mit RAID 6 verwandte Verfahren (RAID n+m) mit nochmals erhöhter Ausfallsicherheit, sowie herstellerspezifische Varianten. Zu den Letzteren zählen Techniken wie RAID-DP (Network Appliances), RAID-X (ECC Technologies) oder RAID ^n (Tandberg).
Software- vs. Hardware-RAID
Die etwas irreführenden Begriffe Hard- beziehungsweise Software-RAID - letztlich benötigen beide Varianten zum Betrieb Software - beziehen sich auf die Art und Weise der Implementierung.
Beim Software-RAID übernimmt eine auf der CPU des Hosts laufende Software die Steuerung des Plattenverbunds. Oft bringt bereits das Betriebssystem entsprechende Komponenten mit. So beherrschen Windows Vista und XP sowohl RAID 0 als auch RAID 1 und 5 - letztere allerdings nur in der Server-Version. Linux verwaltet generell Arrays der Level 0, 1, 4 und 5 sowie ab Kernel 2.6 auch solche des Levels 6.
Software-RAID stellt also meist die preisgünstigste und einfachste Lösung dar. Zudem lässt es sich - etwa per Prozessor-Upgrade am Host - relativ schnell an erhöhte Anforderungen anpassen. Andererseits verursacht es eine hohe CPU-Belastung und arbeitet naturgemäß plattform- und betriebssystemgebunden. Auch stehen zur Ansteuerung der Laufwerke meist nur zwei oder vier Anschlüsse zur Verfügung. Dies beschränkt die mögliche Parallelisierung der Plattenzugriffe und damit auch die Performance.
Dagegen übernimmt bei Hardware-RAID ein eigener Controller die Ansteuerung des Arrays. Das bringt eine Entlastung der Host-CPU und eine höhere Performance mit sich. Zudem binden RAID-Controller die Laufwerke über mehrere Kanäle an, was gleichzeitige Laufwerkszugriffe und damit hohe Transferraten ermöglicht. Dafür gilt es aber, einen deutlich höheren Preis zu zahlen. Hardware-RAIDs arbeiten zwar plattformunabhängig. Auch sie benötigen aber zur Verwaltung Software, die natürlich auf ein bestimmtes Betriebssystem zugeschnitten ist.
Software-RAID | Hardware-RAID | |
---|---|---|
Implementationskosten | niedrig | hoch |
Performance | niedrig | hoch |
CPU-Last am Host | hoch | niedrig |
Plattformabhängigkeit | ja | nein |
Betriebssystemabhängigkeit | ja | ja |
Anforderungen an die Festplatten
Noch vor wenigen Jahren ließen RAID-Controller bei der Anforderung an die verwendeten Platten nicht mit sich spaßen. Als Interface war SCSI Pflicht, alle verwendeten Platten mussten identische Kapazitäten aufweisen. Oft kam es sogar vor, dass sich im Array nur Platten aus derselben Bauserie verwenden ließen.
Mittlerweise gestaltet sich das Pflichtenheft für die verwendeten Laufwerke deutlich weniger rigide. Im klassischen Serverbereich kommt schon aus Performancegründen zwar nach wie vor SCSI beziehungsweise der serielle Nachfolger SAS zum Einsatz. Im Entry-Level-Server oder der Workstation tauscht der preisbewusste Anwender diese inzwischen aber gern gegen einen kostengünstigeren Serial-ATA-HBA aus. In den Desktop-PC sind Serial-ATA-Controller inzwischen ebenfalls Standard.
Zudem erlauben moderne Controller wie auch Software-RAID-Lösungen den Mix von Platten verschiedener Kapazität im Verbund. Allerdings lässt sich dabei nicht die gesamte vorhandene Nettokapazität für das Array verwenden. Da die RAID-Verfahren gleich große Platten voraussetzen wird in einer Mischkonfiguration jedes Laufwerk nur bis zur Kapazität der kleinsten vorhandenen Festplatte genutzt. Bei einer Kombination eines 1-TByte-Laufwerks mit zwei 2-TByte-Disks stehen beispielsweise nur drei mal 1 TByte für das Array zur Verfügung.