Von Andreas Wurm
Ob Personaldaten, per Customer Relationship Management (CRM) verwaltete Kundeninfos oder CAD-Dateien in Entwicklerbüros – jedes Unternehmen muss täglich eine Vielzahl von Daten bewältigen. Server, Plattensubsysteme und Bandlaufwerke halten diese Daten Tag für Tag bereit, um sie abrufen und bearbeiten zu können. Die große Gemeinsamkeit, die Kleinstbetriebe und global tätige Unternehmen verbindet: Die Zahl der zu speichernden, zu verarbeitenden und zu verwaltenden Daten und Dateien wächst fast im Sekundentakt an. Je größer der Datenbestand, desto wichtiger ist die Speichermethode.
Während früher die Technik Direct Access Storage Device (DASD) als Punkt-zu-Punkt-Verbindung zwischen Server und Massenspeicher wie Bandlaufwerk oder Plattensubsystem das Speichern großer Datenmengen erlaubte, gehen Hersteller und Anwender heute andere Wege. Der Grund: DASD führte zu einer ausufernden Anzahl von Servern, der Verwaltungsaufwand wurde größer und größer, die Kosten für das Speichermanagement stiegen rapide an. Um diesem Trend entgegenzuwirken, entwickelten die Hardware- Hersteller Netzwerkspeichertechniken, die das Storage als eigenständigen Baustein im Netzwerkdesign etablierten: SAN (Storage Area Network) und NAS (Network Attached Storage).
1. Storage Area Network (SAN )
Ein Storage Area Network ist nicht mit einem herkömmlichen LAN zu vergleichen, da hier ausschließlich Daten zwischen Anwender und Massenspeicher transportiert werden. Vereinfacht ausgedrückt handelt es sich bei einem SAN um ein sekundäres Netzwerk, das an das lokale LAN eines Unternehmens grenzt. In einem SAN sind Bandlaufwerke und Plattensubsysteme mehr als nur Geräte, die an einem Server angeschlossen sind. Sie sind zentraler Bestandteil eines solchen Netzes. Während Direct Attached Storage eine Punkt-zu-Punkt-Speichermethode zwischen einem Server und einem Speichermedium beschreibt, erfolgt in einem SAN die Anbindung mehrerer Server an verschiedene Massenspeicher über ein eigenes Netzwerk. Einer der Gründe für die Entwicklung von SAN war die Bandbreite. Während NAS-Systeme an das lokale Netz angeschlossen sind und über die vorhandenen Kapazitäten Daten bereitstellen, agiert ein SAN unabhängig vom LAN und erreicht somit eine höhere Nutzlastauslastung, die bei ungefähr 90 Prozent liegt. Somit handelt es sich bei 90 Prozent der Daten, die über ein SAN bewegt werden, um gespeicherte Daten, die von den Datenträgern abgerufen, respektive auf sie geschrieben werden. Bei NAS liegt diese Nutzlast bei rund 60 Prozent.
2. SAN -Infrastruktur im Detail
In einem SAN werden die Daten blockbasiert übertragen. Bei einem Blockzugriff fordert der Rechner einzelne Datenblöcke von einer Festplatte an. Bei der dateibasierten Datenabfrage wie sie NAS nutzt, fordert der Rechner ganze Dateien an. Ein SAN wird in den meisten Fällen in Form einer Fibre-Channel-Infrastruktur (FC) realisiert. Auch bestehen SANs aus mehreren Baugruppen: Die Server regeln die Anfrage der Clients, die Fibre-Channel-Switches (FC-Switches) sind mit Servern und Massenspeichern verbunden. Ein SAN ist also vergleichbar mit einem Backbone, allerdings ist die einzige Aufgabe dieses „Backbones“ der Transport riesiger Datenmengen. Die meisten SANs verwenden SCSI als Kommunikationsprotokoll, das dann auf Fibre Channel als Transportprotokoll aufsetzt. Solche Speicher-Backbones können auf unterschiedliche Weise arbeiten.
3. FC-Arbitrated Loop (FC-AL )
FC-AL ist eine Bus-Topologie. Server und Speichergeräte sind über einen virtuellen Ring miteinander verbunden. Der Datenaustausch ist in einem solchen Ring nur in eine Richtung möglich und auch nur zwischen zwei Komponenten. Wenn zwei Geräte Daten über einen solchen Ring austauschen, müssen die anderen angeschlossenen Geräte warten, bis der Bus wieder frei ist. In einem dieser Ringe lassen sich bis zu 128 Geräte zusammenschließen, die angeschlossenen Geräte teilen sich die vorhandene Bandbreite. Die weitaus gängigere Methode, ein SAN aufzusetzen, ist die Switched-Fabric-Technik.
4. Switched Fabric (FC-SW)
Die Switched-Fabric-Technik gilt als die robusteste Variante unter den Fibre-Channel-Ansätzen. Zentrale Einheit der Switched-Fabric-Topologie ist ein so genannter Fibre-Channel-Switch. Anders als ein Hub, verbindet ein Switch angeschlossene Server und Massenspeicher nicht nur. Er kann mit seiner Backplane (Hochgeschwindigkeits-Bus) mehrere Verbindungen zwischen Servern und Speichern bei voller Bandbreite schalten, so dass sie wie herkömmliche Switches in lokalen Netzen arbeiten.
Mit FC-Switches lassen sich Speichernetze kaskadieren und vermaschen. Normalerweise ist Fibre Channel eine Technik für Glasfaserkabel. Eine Verbindung über Kupferkabel ist jedoch nach wie vor möglich, scheitert bisweilen aber an der Längenbegrenzung dieses Übertragungsmediums. Da in einem Fibre-Channel- Netzwerk auch die Server über Glasfaserkabel an die FC-Switches angeschlossen sein sollten, benötigen sie einen speziellen Host Bus Adapter (HBA). Diese Steckkarten benötigen im Server normalerweise einen PCI-X-Steckplatz mit einem 64-Bit-Bus. Für kleinere SANs bieten sich FC-Switches mit vier bis zwölf Ports an. Enterprise-Geräte können bis zu 32 Anschlüsse haben, und die so genannten Directors – die Gegenstücke zu den Core-Switches in lokalen Netzen – lassen sich mit bis zu 140 Ports ausstatten. Sind die Server mit mehreren HBAs ausgestattet, lassen sie sich mit verschiedenen FC-Switches im SAN verbinden, was die Ausfallsicherheit erhöht. Außerdem sorgt die Architektur dafür, dass ein Server eine Anfrage immer auf dem am wenigsten belasteten Weg zum Massenspeicher senden kann.
Dieses als Multipathing bezeichnete Verfahren macht das Speichernetz ausfallsicherer, da es keinen Single Point of Failure mehr gibt und die Speicherdaten verschiedene Wege nehmen können. Fibre Channel arbeitet heute üblicherweise mit einer Bandbreite von zwei GBit/s bei ei ner Distanz von bis zu zehn Kilometern. Wie beim Kupferkabel ist auch beim Fibre-Channel- Standard eine Datenrate von zehn GBit/s angepeilt. Mittlerweile hat die Switched-Fabric-Methode den Arbitrated Loop so gut wie abgelöst, da mit FC-SW ein SAN besser zu skalieren ist und die verfügbare Bandbreite in einer geswitchten Umgebung höher ist als bei einer Bus-Topologie.
5. Speichervirtualisierung inside
Der Vorteil eines SANs ist die Speichervirtualisierung. Verteilte Massenspeicher lassen sich in einem SAN wie eine virtuelle Festplatte behandeln, indem einzelnen Servern auf dieser virtuellen Festplatte Partitionen zugewiesen werden. Die Server können diese Partitionen mit ihren HBAs wie eine eigenständige Festplatte einbinden. Der zugewiesene Speicherplatz lässt sich im laufenden Betrieb vergrößern und verkleinern. SANs auf Basis von Fibre Channel sind damit die ideale Infrastruktur für Speichernetze, sofern ein skalierbares Speichernetzwerk mit einer hohen Übertragungsgeschwindigkeit gefragt ist.
Durch die spezielle Hardware bringt dieses Konzept allerdings hohe Kosten mit sich. Und auch der Aufbau und die Verwaltung eines solchen Netzes sind nur etwas für Spezialisten. Außerdem sind die Produkte unterschiedlicher Hersteller nicht immer vollständig kompatibel. Anwender müssen die Geräte bei einem Neukauf vorher testen oder sich auf die Produkte eines Herstellers festlegen, um Problemen vorzubeugen.
6. Die Alternative: iSCSI
Neben den genannten Vorzügen eines SANs bringen dessen hohe Kosten die Entscheider dennoch immer wieder ins Grübeln. Ideal wäre es, wenn sich die Vorteile der Speichertechnik ohne die hohen Kosten nutzen ließen, die durch die FC-Hardware entstehen. Es gibt verschiedene Überlegungen,wie sich solche dezidierten Speichernetze auch ausschließlich mit der vorhandenen Infrastruktur verwirklichen lassen. Eine Möglichkeit ist iSCSI.
Die Grundidee von iSCSI ist es, das SCSIProtokoll über eine normale TCP/IP-Verbindung zu übertragen. Genau wie bei Fibre Channel ersetzt iSCSI hier das SCSI-Kabel. In diesem Fall handelt es sich um eine Ethernet-Verbindung, über die Daten per TCP/IPProtokoll versendet werden. Im Gegensatz zum SAN ließe sich so die vorhandene Hardware, wie zum Beispiel Switches, weiternutzen. Was die Bandbreite angeht, ist Ethernet seit Verabschiedung des Zehn-Gigabit-Standards mit Fibre Channel konkurrenzfähig. Sowohl bei iSCSI als auch bei Fibre Channel gibt es Vor- und Nachteile. Für Fibre Channel spricht, dass sich das Verfahren seit Jahren in der Praxis bewährt hat. Auf der Habenseite von iSCSI stehen die geringeren Kosten – ein Unternehmen muss keine neue Hardware anschaffen. Allerdings hat sich Fibre Channel am Markt etabliert, iSCSI kämpft noch gegen die Vorurteile, die Anwender einer Speichertechnik entgegenbringen, die mit dem Internet-Protokoll arbeitet. Und das, obwohl sich NAS in den vergangenen Jahren als eine zuverlässige IP-Speichertechnik erwiesen hat.
7. Network Attached Storage (NAS )
Wie es die Bezeichnung verrät, basiert die NAS-Technik auf einem anderen Ansatz als SAN: Bei NAS ist das Storage-Gerät an das vorhandene Netzwerk angeschlossen, bei SAN ist ein separates Netz mit den Speichereinheiten verbunden. Verwaltungsaufwand und Betriebskosten lassen sich immer dann senken, wenn zum Beispiel Speichersysteme und verteilte Server zu einer großen Speichereinheit zusammengefügt werden. Wirtschaftlichkeit und gleichartiger Betrieb sind die Vorteile, die sich daraus ergeben.
NAS-Systeme bestehen aus mehreren Servern mit vorab eingestellter Plattenkapazität und einem schlanken Betriebssystem. Sind Daten in einem NAS-Netz gespeichert, können mehrere Mitarbeiter gleichzeitig an den Daten arbeiten, ohne dass diese vervielfältigt werden müssen - ein in der Praxis wichtiges Kriterium. Im Gegensatz zu SAN lassen sich NAS-Einheiten - wie bereits erwähnt - direkt an das lokale Netz anschließen. Die Datenübertragung erfolgt im so genannten Dateiverfahren; das bedeutet, dass die gespeicherten Daten nur über ihren Namen angesprochen werden und nicht über den Ort, an dem sie gespeichert sind. Um über den Namen an die Dateien zu kommen, ist deshalb ein Fileserver nötig. Dieser arbeitet den Blockzugriff auf das eigentliche Speichermedium im Hintergrund unbemerkt ab.
Die Client-Rechner kennen also nur den Namen der Datei, nicht aber ihren genauen Speicherort. Und weil die Rechner auf den Dateiserver zugreifen und nicht auf den genauen Speicherort, können problemlos mehrere Anwender gleichzeitig ein und denselben Datenbestand nutzen.
8. Skalierbare NAS –Systeme
Der gleichzeitige Zugriff auf Daten von unterschiedlichen Systemen, das Filesharing, gilt als der Hauptvorteil eines NAS-Systems. Im Gegensatz zu einem herkömmlichen Server ist also der Einsatzzweck einer NAS-Einheit weitgehend bekannt. Ein Betriebssystem, das auf einer NAS-Einheit läuft, ist deshalb meist schlanker und lässt sich an die Anforderungen anpassen. Ein Standard-Betriebssystem soll hingegen auf möglichst vielen unterschiedlichen Maschinen laufen und ist deshalb umfangreicher.
Mit einem schlanken Betriebssystem lassen sich die auflaufenden Daten schneller verarbeiten. Der Wartungs- und Installationsaufwand lässt sich bei solchen Betriebssystemen reduzieren, weil der Administrator alle Betriebssystem-Komponenten verbannen kann, die für Filesharing-Aufgaben nicht benötigt werden. NAS-Einheiten sind gut skalierbar, ein Administrator kann für jedes neue Projekt oder für weitere anstehende Aufgaben weitere NAS-Geräte in das Netzwerk hängen.
NAS-Geräte sind, wie weiter oben beschrieben, vorkonfiguriert. Das heißt, der Administrator kann einzelne Einheiten nicht einfach durch leistungsstärkere austauschen. Er ist hier viel mehr auf die Upgrade-Möglichkeiten angewiesen, die ihm der Hersteller der verwendeten Hardware bietet.
9. Infrastruktur nutzen
Die NAS-Appliances arbeiten mit den Protokollen Common Internet File System (CIFS) beziehungsweise Server Message Block (SMB) sowie NFS (Network File Service). Die Dateien werden hierbei nicht übertragen. Der Anwender greift vielmehr darauf zu, als wären sie lokal auf seinem Rechner gespeichert. Mit NAS lassen sich Massenspeicher einfach an das lokale Netz anbinden, da die Technik speziell für IP-Netze entwickelt wurde. Solche Netze sind relativ ausgereift und fast flächendeckend im Einsatz.
Wenn Administratoren NAS-Systeme an LANs anschließen, arbeiten sie daher mit einer bestehenden Infrastruktur. Eine NAS-Umgebung ist also kein Speichernetz, das unabhängig vom LAN arbeitet und Datenverkehr generiert. Wenn Anwender auf Dateien zugreifen, die auf einer NASEinheit gespeichert sind, läuft der dadurch erzeugte Netzwerkverkehr über das normale LAN zum NAS-System und zurück.
Greifen mehrere Anwender gleichzeitig auf gespeicherte Dateien zu, kann das zu einem Engpass im lokalen Netz führen. Außerdem ist das Ethernet nicht für einen schnellen Zugriff auf Massenspeicher ausgelegt. Auf der anderen Seite lassen sich über ein IPNetz Daten zuverlässig übertragen, beim Ausfall einzelner Komponenten erreichen die Daten durch Rerouting (Schalten eines Ersatzweges) trotzdem ihr Ziel.
10. Flexible NAS-Systeme
NAS lässt sich auf zwei unterschiedliche Arten verwirklichen: Auf der einen Seite gibt es spezielle NAS-Systeme. Auf der anderen Seite lassen sich aber auch mit PCs Speichernetze realisieren. Rechner, die als NAS-Station dienen, sind flexibler einsetzbar, da sie neben ihrer Funktion als NAS-Station herkömmliche Anwendungen laufen lassen können. Sie sind also in dem Fall mehr als nur ein Dateiserver.
Diese Server sind billiger in der Anschaffung als spezielle NASPlattformen. Allerdings wurden diese Geräte eigentlich für den Betrieb mit allen möglichen Anwendungen entworfen. Sie stellen keine NAS-Hardware dar, die speziellen Anforderungen gerecht wird. Der niedrige Kaufpreis ist in den meisten Fällen der Grund für diese Art von NAS. Spezielle NAS-Systeme haben gegenüber herkömmlichen Servern Vorteile. Sie sind leistungsstärker, da sie ein angepasstes Betriebssystem haben, das einzig und allein auf eine Funktion ausgelegt ist: auf den Betrieb als Dateiserver. Zwar sind NAS-Einheiten teurer als handelsübliche Rechner, sie eignen sich allerdings auch besser für den Einsatz und sind aufgrund des speziellen Betriebssystems leistungsstärker. Außerdem sparen die Unternehmen auf diesem Wege Geld, da die Speicherinfrastruktur Zusammengelegt und zentralisiert wird.
11. Mischbetrieb ist möglich
NAS-Plattformen werden von den Herstellern regelmäßig um neue Funktionen erweitert. Mittlerweile sind selbst die günstigeren Geräte recht umfangreich ausgestattet. So können Administratoren auch in kleineren Umgebungen NAS einsetzen. Mit der SAN-Technik lassen sich so genannte Snapshots anfertigen, zu jedem Zeitpunkt kann man Abbilder einer Festplatte generieren. So ist es zum Beispiel ohne weiteres möglich, auf diese Weise schnell ein Komplett- Backup zu erstellen oder dieses Abbild einer Festplatte für andere Zwecke zu benutzen, ohne dabei auf die eigentlichen Platten zugreifen zu müssen.
Die physikalische Größe eines Schnappschusses hängt hierbei davon ab, wie oft die Daten auf einem bestimmten Laufwerk geändert werden. Die Faustregel: Je mehr Daten geschrieben werden, desto größer ist der Bedarf an Speicherplatz. Wie bei den SANs ist auch bei NAS ein Mischbetrieb mit iSCSI mittlerweile möglich. Bisher wurden NAS-Einheiten in einem reinen IP-Netz betrieben, die Hersteller haben die Anschlussmöglichkeiten mittlerweile um iSCSI erweitert. So ist nun auch bei NAS ein Blockzugriff möglich, der Daten schneller verarbeitet als der herkömmliche Dateizugriff.
Bisher waren die beiden Speicherwelten NAS und SAN strikt getrennt. In ihren Funktionen nähern sie sich immer weiter aneinander an, gerade durch iSCSI, das sowohl bei NAS als auch bei SAN zum Einsatz kommen kann. Ohnehin gibt es inzwischen in vielen Speichernetzwerken Lösungen, in denen SAN und NAS gemeinsam zum Einsatz kommen. Der Anwender entscheidet hierbei durch seine Anforderungen an Flexibilität, sinkende Kosten und Skalierbarkeit, welche Kombination der beiden Techniken im Unternehmen eingesetzt wird.
12. Fazit
Ganz klar: Gespeicherte Daten gehören zu den wichtigsten Werten eines Unternehmens. Damit diese Daten nicht unwiederbringlich verloren gehen, muss eine Firma unter allen Umständen dafür sorgen, die im Betrieb zum Einsatz kommenden Speicherinfrastrukturen ausfallsicher zu machen. Redundanz ist gefragt. Mit skalierbaren Speicherinfrastrukturen wie NAS und SAN lassen sich solche Netze recht kostengünstig realisieren und in die bestehende IT-Infrastruktur einbinden.
DAS, Kanal- und IP-Netze, Linux-NAS
Direct Access Storage: Nicht mehr im Trend
Im Rahmen der DASD-Strategie sind die meisten Speichergeräte über SCSI-Schnittstellen miteinander verbunden. Der letzte Parallel-SCSI-Standard trägt den Namen Ultra 320 SCSI, wobei die Zahl 320 auf die Übertragungsgeschwindigkeit von 320 MB/s hinweist. Die Busbreite beträgt 16 Bit. Das SCSI-Verfahren arbeitet nach dem Client-Server-Prinzip: Der Client stellt eine Leseanforderung an einen Server, der Server antwortet, indem er die gelesene Datei zum Client sendet. Die Übertragungsgeschwindigkeit hängt vom unterstützten SCSI-Standard ab. Der erste Standard hatte eine Übertragungsrate von fünf MB/s. Über eine Länge von sechs Metern ließen sich acht Geräte anschließen.
Ein SCSI-Adapter ist heute in die Geräte-Elektronik integriert und wird meist zur Anbindung von Bandlaufwerken und Festplatten verwendet. Ein neuer Standard, Serial Attached SCSI (SAS), soll die parallel arbeitende SCSI-Schnittstelle ablösen, da hier die Grenzen der Übertragungsgeschwindigkeit nahezu erreicht sind. SAS nutzt als Protokoll die Basisversion von SCSI, die Verbindungstechnik ist allerdings seriell anstatt parallel. Die Übertragungsgeschwindigkeit liegt zurzeit bei drei GBit/s. Speicherdaten lassen sich aber nicht nur über SCSI- und SAS-Kabel übertragen. Auch über das Internet-Protokoll (mit NAS) und über Fibre Channel (mit SAN) ist eine Übertragung möglich. Bei NAS lassen sich die Speichergeräte
direkt an das lokale Netzwerk anschließen. SAN bedient die Server in einem eigenen Hochgeschwindigkeitsnetzwerk, das meist über Glasfaserverbindungen realisiert ist.
Speichertechniken: Kanal- und IP-Netze
Grundsätzlich lassen sich die gängigen Speichertechniken in zwei Gruppen einteilen: Kanalnetze und IP-Netze. Kanalnetze wurden entwickelt, um Speichersysteme an Rechner anzubinden. Sie stellen eine schnelle Verbindung zur Verfügung, die wie ein eigener Kanal funktioniert. In Kanalnetzen können Speichermedien ihre Signale zur gleichen Zeit über eine gemeinsame Verbindung senden, ohne sich dabei gegenseitig zu behindern. Diese Art von Netzinfrastruktur ist jedoch nicht so verbreitet wie die IP-Netzwerke. Möchte ein Unternehmen ein solches Kanalnetz einsetzen, fallen zusätzliche Kosten an, da spezielle Hardware nötig ist. Auch müssen die Mitarbeiter eine spezielle Ausbildung erhalten, um diese Geräte installieren und administrieren zu können. Ein bekanntes Kanalnetz kommt in einem SAN (Storage Area Network) zum Einsatz. Ein SAN arbeitet meist mit der Fibre-Channel-Technik (FC).
Linux-NAS: Komplett-Distribution Openfiler
Das Linux-Projekt Openfiler (www.openfiler.com) basiert auf dem RHEL-Derivat rPath und ermöglicht dem Administrator das Aufsetzen einer NAS- oder SAN-Appliance. Unterstützt werden die Storage-Protokolle CIFS, NFS, HTTP/DAV, FTP sowie iSCSI. Es lassen sich lokale Festplatten (IDE, SCSI und S-ATA) oder Hardware-Raid-LUNs verwenden, Fibre-Channel- und iSCSI-LUNs importieren sowie auf Software-Raid-Geräte zugreifen. Die Unterstützung für DRBD (Distributed-Replicated-Block-Device) sorgt für Hochverfügbarkeit. Das System lässt sich komplett über einen Webbrowser im Netzwerk administrieren und bietet zusätzlich Verwaltungs-Werkzeuge.
Alternativ kann sich der Administrator auch mit der Konsole per Secure-Shell verbinden. Dazu enthält Openfiler eine SSH, die als Java-Applet im Browser läuft und mit einem Zertifikat geschützt ist. Bei der User-Verwaltung bedient sich der Systemverwalter an einemLDAP-kompatiblen Dienst, optional mit Transport-Layer-Security (TLS), oder einer Verbindung zu einem NT4-Domänen-Controller beziehungsweise einem Active-Directory-DC. Zu den weiteren Funktionen zählen das Einrichten von Shares mit Speicherplatz-Kontingenten (Quotas) und Remote-Zugriff über die Internet-Protokolle HTTP, WebDAV oder FTP.
Der Artikel stammt von der Computerwoche, der führenden Zeitschrift für IT-Entscheider im deutschsprachigen Raum. (haf)