Darüber, wie Sie mithilfe von Tools wie InfluxDB, Telegraf oder Collectd Metriken ihrer laufenden Systeme abfragen und in Grafana grafisch darstellen, haben wir bereits mehrfach berichtet. Doch bislang konzentrierten sich die Workshops auf die grundlegende Softwarearchitektur eines TICK-Stacks – Telegraf, InfluxDB, Chronograf, Kapacitor; alternativ TIG mit Grafana statt Chronograf oder CIG mit Collectd statt Telegraf – und wie Sie damit Leistungsdaten ihrer Umgebung einsammeln. Damit wissen Sie zwar, wie voll Ihre Massenspeicher sind und welche Performance die CPUs liefern. Neben den reinen Leistungsdaten wie Systemlast sollten Administratoren aber auch weitere Daten wie Temperaturen oder Spannungen im Auge behalten, denn diese haben einen erheblichen Einfluss auf die Haltbarkeit der Serverkomponenten.
Nun können Sie natürlich externe Sensoren und Temperaturfühler in ihr Rechenzentrum einbauen und diese abfragen. Doch bevor Sie in externe Geräte investieren, lohnt ein Blick auf die im System bereits vorhandenen Sensoren, wie Sie deren Informationen abfragen und Ihrem Metrik-Dashboard hinzufügen. Dieser Pfad empfiehlt sich auch für Nutzer, die gemietete Server eines Hardwareproviders nutzen und keinen physischen Zugriff auf deren Rechenzentren haben. Hier kann die Sensorüberwachung für Überraschungen sorgen. So zum Beispiel, als die Disk-Temperaturen in einem RAID-Verbund offenbarten, dass eine von vier Platten dauerhaft 20 Grad wärmer als alle anderen war. In diesem Fall erklärte das, weshalb dieses Laufwerk innerhalb eines Jahres gleich zwei Mal ausfiel und getauscht werden musste. Aufgrund der aufgezeichneten Metriken erhielt der Nutzer dann eine Austauschmaschine.
Für diejenigen Leser, die noch keinen TIG-Stack in Ihrem Rechenzentrum oder auf Ihrem Cloudserver betreiben, stellen wir nachfolgend eine simple Lösung mit Containern unter Podman vor.
Der komplette Artikel ist nur für Abonnenten des ADMIN Archiv-Abos verfügbar.