Software-defined Storage

Unstrukturierte Daten effizient speichern

von Gerald Sternagl - 28.12.2015

Foto: Pavel Ignatov / Shutterstock.com

Klassische Storage-Methoden können das explosionsartige Datenwachstum kaum mehr bewältigen. Abhilfe gegen den Datenwust aus Bildern, E-Mails oder Dokumenten schafft SDS.

Wollen Unternehmen die drastisch ansteigende Datenmenge in den Griff bekommen, müssen sie effiziente Methoden zur Verwaltung einsetzen. Software-defined Storage, kurz SDS, ermöglicht den Aufbau hochskalierbarer, flexibler Architekturen, mit denen sich eine breite Vielfalt von Daten verwalten lässt.

In einer solchen Umgebung werden Daten (Blöcke, Files oder Objekte) hardwareunabhängig in einer verteilten Architektur auf einer großen Zahl von Standard-Servern als einheitlicher, gemeinsam zu nutzender Speicher-Pool abgelegt.

SDS – File-basiert

Typischer Vertreter einer File-basierten Shared-Nothing-Storage-Plattform (Scale Out) ist Red Hat Gluster Storage, ein verteiltes Dateisystem, das Speichergrößen im Petabyte-Bereich unterstützt. Es basiert auf dem Open-Source-File-System GlusterFS.

Red Hat Gluster zieht eine Abstraktionsschicht zwischen dem physikalischen Speicher und dem Benutzer ein. Zur Ablage werden blockbasierte Dateisysteme genutzt. Die Software verteilt die Daten nicht auf Server-Knoten-, sondern auf Brick-Ebene; die Bricks enthalten die Pfadangaben zum physischen Speicherort. Bricks sind Linux-Rechner mit frei verfügbarem Plattenplatz, etwa Partitionen, Festplatten oder RAID-Arrays. Dabei ist es egal, wie viele Datenträger pro Brick tatsächlich zur Verfügung stehen oder wie viele Server eingebunden sind. Ein Gluster Volume entsteht aus den Bricks verschiedener Server. Aus Benutzersicht entsteht so ein Shared Storage Pool, auf den lesend und schreibend zugegriffen werden kann. Die zweite zentrale Komponente sind Translatoren, die Funktionen wie Posix-Schnittstelle, die Verteilung von Daten im Hintergrund oder den Aufbau eines verteilten RAID-Verbunds über mehrere Bricks bereitstellen.

Ein weiteres Kennzeichen ist die Metadatenverwaltung: Dateien werden auf Basis eines Algorithmus im gesamten Storage-Cluster verteilt, das heißt die Anwender können Kapazität und Performance im Gleichschritt steigern. Damit entsteht eine leistungsfähige SDS-Infrastruktur, um unstrukturierte Daten File-basiert auf Standard-x86er-Servern zu speichern.

Gluster Storage stellt seine Speicher-Pools üblicherweise über die File-basierten Standard-Netzwerkprotokolle NFS und SMB zur Verfügung, bietet aber auch ein eigenes, hoch optimiertes Netzwerkprotokoll (GlusterFuse) samt eigenem API (libGFAPI) für Linux-basierte Clients und ermöglicht zudem einen objektbasierten Zugriff auf Dateien über die Swift-Schnittstelle.

Seite

Unstrukturierte Daten effizient speichern

Mehr zum Thema