banner
Heim / Blog / Gremlin kann jetzt häufige Zuverlässigkeitsprobleme automatisch finden
Blog

Gremlin kann jetzt häufige Zuverlässigkeitsprobleme automatisch finden

Apr 25, 2024Apr 25, 2024

Gremlin, das Startup für Zuverlässigkeitstests, das vor allem für seine Chaos-Engineering-Tools bekannt ist, gab heute die Einführung seiner Funktion „Erkannte Risiken“ bekannt. Damit kann Gremlin nun automatisch Zuverlässigkeitsprobleme mit hoher Priorität wie Fehlkonfigurationen oder schlechte Standardwerte in Kubernetes-basierten Diensten identifizieren und diese dann nach der Schwere des Risikos, das sie darstellen, kategorisieren. Der Dienst schlägt auch mögliche Korrekturen vor.

„Zuverlässigkeit wird immer wichtiger“, sagte Kolton Andrus, CTO und Gründer von Gremlin. „Unsere digitale Infrastruktur ist genauso wichtig wie unsere physische Infrastruktur. Regierung, Gesundheitswesen, Transport, Kommunikation und Finanzen sind alle auf diese digitale Grundlage angewiesen, und sie birgt Risiken. Glücklicherweise lassen sich viele dieser Risiken leicht mindern – wenn man sie kennt. Aus diesem Grund freuen wir uns, unsere neuen „Detected Risks“ bekannt zu geben. Wir haben hart daran gearbeitet, schwerwiegende Probleme in den Systemen unserer Kunden schnell aufzudecken, Risiken, die sie dann mindern können, um den Zustand ihrer Systeme qualitativ zu verbessern.“

Bildnachweis:Gremlin

Während die Chaos-Engineering-Tools von Gremlin nach ungewöhnlichen Situationen suchen, die die Infrastruktur eines Unternehmens an ihre Grenzen bringen können, verwendet Detected Risks eine Reihe vorkonfigurierter Tests, 20 weitere werden später in diesem Jahr folgen. Diese Tests prüfen auf häufige Probleme, die sich darauf auswirken können, wie zuverlässig und belastbar die Infrastruktur eines Unternehmens wirklich ist. Detected Risks funktioniert, ohne dass Chaos-Engineering-Experimente oder Zuverlässigkeitstests durchgeführt werden müssen.

Diese Tests sind im Großen und Ganzen recht einfach und umfassen Best Practices, z. B. die Sicherstellung, dass eine Bereitstellung für die Ausführung in mehreren Verfügbarkeitszonen konfiguriert ist, um Redundanz sicherzustellen. Das mag zwar nach gesundem Menschenverstand klingen, aber bei der Betrachtung der Tausenden von Bereitstellungen, die seine Kunden ausführen, stellte Gremlin fest, dass 26 % keine Redundanz und 80 % der Bereitstellungen keine zwei Redundanzen aufwiesen. Das Unternehmen weist darauf hin, dass das System auch nach häufigen Kubernetes-Fehlkonfigurationen sucht, die sich beispielsweise auf die automatische Skalierung auswirken könnten.

„In unserer Branche gibt es viele kluge SREs, die hart daran arbeiten, diese Probleme persönlich zu lösen, aber dieser Ansatz ist nicht skalierbar“, sagte Andrus. „Wir lösen dieses Problem, indem wir etwas einfach zu verwendendes entwickeln, das wertvolle Einblicke in Tausende von realen Anwendungen bietet. Indem wir der technischen Führung Einblick in bestehende Risiken verschaffen, können sie diese wichtige Arbeit priorisieren und erledigen, sodass sie weiterhin das Kundenerlebnis schützen und qualitativ hochwertige Software entwickeln können.“

Bildnachweis: