Die Datenmenge in Unternehmen wächst unaufhaltsam und auch deren notwendige Verfügbarkeit steht längst außer Frage. Deshalb befasst sich IT-Administrator im ... (mehr)

Das leidige Thema Performance

Denn während verteilte Dateisysteme nahtlose Skalierbarkeit schaffen, opfern sie in aller Regel diesem Vorhaben die Performance – zumindest teilweise. Performance hat bekanntlich zwei Dimensionen: Zunächst stellt sich die Frage nach dem Durchsatz, also danach, welche Datenmengen eine Applikation in einem Zeitraum X tatsächlich verarbeiten kann. Durch ihre verteilte Architektur sind alle drei erwähnten Speicherlösungen hier klar besser als das, was einzelne Platten zu leisten im Stande sind. Kombiniert man beispielsweise Ceph mit SSDs, bringt das enorme Performance-Gewinne.

Die zweite Dimension von Performance ist die Zeit, die ein einzelnes Paket Information braucht, um von seiner Quelle zu seinem Ziel zu kommen: Die Latenz. Die vorgestellten Speicherlösungen setzen durchgehend darauf, dass Clients sie per Ethernet kontaktieren, und auch fast alle anderen Ansätze haben auf Ethernet für den Datentransfer gesetzt. Das bringt allerdings den unschönen Nebeneffekt mit sich, dass jeder Zugriff auf XtreemFS, GlusterFS oder Ceph zwangsläufig die Latenz von Ethernet aufweist, die sich in den vergangenen Jahren nicht verändert hat.

Das ist für wenige Anwendungen ein Problem – aber die Anwendungen, die unter Latenz leiden, leiden richtig: Der Betrieb einer Datenbank auf allen gängigen Distributed Filesystems macht beispielsweise keinen Spaß, eben weil durch die inhärente Latenz Queries messbar langsamer werden und die Zahl an IOPS merkbar niedriger ist, als es bei lokalem Storage der Fall wäre.

Abhilfe schaffen Netzwerktechnologien, die auf niedrige Latenzen ausgelegt sind. Dazu gehört FCoE, dazu gehört ebenfalls Infiniband. Allerdings treibt entsprechende Hardware die Kosten für Setups wieder in die Höhe. Außerdem ist es nötig, dass die eingesetzte Technik mit dem Netzwerk zurechtkommt – im Augenblick bringt aber beispielsweise Ceph keine native Unterstützung für Infiniband mit.

Fazit

Der Storage-Markt befindet sich gerade im Umbruch, und es sieht so aus, als seien die Tage von RAID als zentrale Speichertechnik gezählt und verteilte Dateisysteme übernähmen langsam das Feld. Das darf nicht darüber hinweg täuschen, dass es bei Letzteren noch mehr als genug offene Baustellen gibt. Das beschriebene Latenzproblem ist eine davon, ein anderes Problem ist, dass die meisten verteilten Systeme in Sachen Redundanz noch nicht so flexibel sind, wie Admins es von RAID gewohnt sind.

Ceph hat beispielsweise erst in der letzten stabilen Version das "Erasure Coding"-Feature erhalten. Dadurch hat der Admin die Möglichkeit, andere Replikationsmethoden als simple Spiegelung zu konfigurieren. Für Ceph-Cluster ist das von zentraler Bedeutung, denn dort, wo ein dreifach redundanter Cluster zuvor zwei Drittel seiner Brutto-Kapazität eingebüßt hat, verliert er in Zukunft bloß noch ein Viertel. Das geht zwar mit deutlich längeren Recovery-Zeiten einher, doch sind diese in Clustern mit verteilten Dateisystemen nicht gar so kritisch wie in RAID-Setups. Denn ein verteiltes Dateisystem, das im Hintergrund Recovery-Prozesse betreibt, liefert in aller Regel noch immer mehr Performance als ein RAID im Recovery-Modus.

Ein Patentrezept für Admins lässt sich an dieser Stelle leider nicht verschreiben – doch wer in naher Zukunft plant, neuen Storage zu installieren, sollte mit dem Finger am Storage-Puls bleiben und die dortigen Entwicklungen genau verfolgen. Ein ausführlicher Vergleich von GlusterFS und Ceph ist online unter [4] zu finden.

(of)

Link-Codes

[1] GlusterFS aufsetzen und verwalten: http://www.admin-magazin.de/Das-Heft/2012/02/Das-verteilte-Dateisystem-GlusterFS-aufsetzen-und-verwalten

[2] Wohin geht die Reise bei Ceph?: http://www.admin-magazin.de/Das-Heft/2014/02/Wohin-geht-die-Reise-beim-Ceph-Objectstore/

[3] ExtreemFS: http://www.xtreemfs.org/

[4] GlusterFS vs. Ceph: http://www.admin-magazin.de/Das-Heft/2014/04/Die-verteilten-Speichersysteme-GlusterFS-und-Ceph-im-Vergleich/

comments powered by Disqus
Mehr zum Thema

Das verteilte Dateisystem XtreemFS

Verteilte Dateisysteme haben die Forschungslabors verlassen und halten Einzug in Produktivumgebungen. Ein solches Filesystem unter freier Lizenz ist XtreemFS. Dieser Artikel stellt es näher vor und beschreibt seine Installation.
Einmal pro Woche aktuelle News, kostenlose Artikel und nützliche ADMIN-Tipps.
Ich habe die Datenschutzerklärung gelesen und bin einverstanden.

Konfigurationsmanagement

Ich konfiguriere meine Server

  • von Hand
  • mit eigenen Skripts
  • mit Puppet
  • mit Ansible
  • mit Saltstack
  • mit Chef
  • mit CFengine
  • mit dem Nix-System
  • mit Containern
  • mit anderer Konfigurationsmanagement-Software

Ausgabe /2023