Drahtlose Netzwerke sind überall: Zu Hause, im Café und in der Firma. Im Gegensatz zu Kabelnetzen verliert der Admin bei WLANs allerdings schnell die ... (mehr)

Stratosphere von der TU Berlin

Stratosphere verbindet eine einfache Installation mit leichter Bedienbarkeit und einer hohen Performance. Die Plattform skaliert auch auf großen Clustern, nutzt Mehrkernprozessoren und unterstützt In-Memory-Datenverarbeitung. Sie verfügt außerdem über fortgeschrittene Analytikfunktionalität und erlaubt es dem Anwender sogar, die Aufträge in Java und Scala zu programmieren.

Stratosphere wird in Deutschland unter der Federführung von Prof. Dr. Volker Markl an der TU Berlin im Fachgebiet Datenbanksysteme und Informationsmanagement (DIMA) entwickelt. Stratosphere läuft dabei sowohl on-premise als auch in der Cloud, also etwa auf Amazon EC2.

Hadoop-Dienste

Für den wachstumsorientierten Mittelstand gibt es inzwischen eine reiche Auswahl an Hadoop-Diensten.

Amazon bietet mit Elastic MapReduce (EMR) eine Implementierung von Hadoop mit Unterstützung für Hadoop 2.2 und HBase 0.94.7 sowie die MapR-M7-, M5- und M3-Hadoop-Distributionen von MapR Technologies an. Der Dienst adressiert Unternehmen, Forscher, Datenanalysten und Entwickler in den Bereichen Web-Indizierung, Data-Mining, Protokolldateianalyse, maschinelles Lernen, Finanzanalyse, wissenschaftliche Simulationen und bioinformatische Forschung. Kunden, die HBase implementieren möchten, bietet Elastic Map Reduce mit M7 nahtlose Splits ohne Komprimierung, sofortige Wiederherstellung nach Fehlern, Zeitpunktwiederherstellung, Full-HA, Spiegelung und konsistent geringe Latenzen. In dieser Ausführung fallen allerdings zusätzliche Kosten an. Auch Google (mit Compute Engine) und Microsoft (mit Azure) haben eigene Implementierungen von Hadoop im Köcher.

Mit Hadoop als Service in der Wolke entfallen für die betroffenen Unternehmen Vorabinvestitionen für Hardware, die verzögerte Bereitstellung bestellter Infrastruktur und andere Auslagen. Ein gutes Beispiel ist dank der übersichtlichen Preisstruktur Amazon EMR. Mit EMR können Sie einen Hadoop-Cluster bloß temporär einrichten, sodass er sich nach Abschluss der Analyse von selbst auflöst und Sie keine weiteren Kosten tragen. Die Preise beginnen bei 0,015 Dollar pro Stunde für den EMR-Dienst pro Instanz zuzüglich der ebenfalls im Stundentakt anfallenden EC2-Kosten für jede Instanz des gewählten Typs (ab 0,06 Dollar pro Instanz).

Für 100 Instanzen zahlen Sie also pro Stunde bis zu 1,50 Dollar für Hadoop (100 x 0,015 USD) und bis zu 6,00 Dollar für bis zu 100 laufende On-Demand-Instanzen (100 x 0,06 USD). Unterm Strich kommen Sie also mit 7,50 USD pro Stunde für 100 Small-Instanzen weg. Um die Kosten noch weiter zu drücken, könnte man diese Instanzen schließlich zusätzlich für bis zu drei Jahre reservieren.

Ähnliche Artikel

comments powered by Disqus
Einmal pro Woche aktuelle News, kostenlose Artikel und nützliche ADMIN-Tipps.
Ich habe die Datenschutzerklärung gelesen und bin einverstanden.

Konfigurationsmanagement

Ich konfiguriere meine Server

  • von Hand
  • mit eigenen Skripts
  • mit Puppet
  • mit Ansible
  • mit Saltstack
  • mit Chef
  • mit CFengine
  • mit dem Nix-System
  • mit Containern
  • mit anderer Konfigurationsmanagement-Software

Ausgabe /2023