Globaler Marktbericht für Oberflächenmontagetechnologie 2023
May 26, 2023Insider-Informationen: Die Verhandlungen von Aspocomp über eine Änderung in seinem Werk in Oulu sind beendet
May 27, 2023Angry Miaos AM AFA R2 ist teils Skulptur, teils Tastatur
May 28, 2023Sechs Überlegungen bei der Wahl der maschinellen Bildverarbeitung in kollaborativen Anwendungen
May 29, 2023Cornell Capital
May 30, 2023Gremlin kann jetzt häufige Zuverlässigkeitsprobleme automatisch finden
Gremlin, das Startup für Zuverlässigkeitstests, das vor allem für seine Chaos-Engineering-Tools bekannt ist, gab heute die Einführung seiner Funktion „Erkannte Risiken“ bekannt. Damit kann Gremlin nun automatisch Zuverlässigkeitsprobleme mit hoher Priorität wie Fehlkonfigurationen oder schlechte Standardwerte in Kubernetes-basierten Diensten identifizieren und diese dann nach der Schwere des Risikos, das sie darstellen, kategorisieren. Der Dienst schlägt auch mögliche Korrekturen vor.
„Zuverlässigkeit wird immer wichtiger“, sagte Kolton Andrus, CTO und Gründer von Gremlin. „Unsere digitale Infrastruktur ist genauso wichtig wie unsere physische Infrastruktur. Regierung, Gesundheitswesen, Transport, Kommunikation und Finanzen sind alle auf diese digitale Grundlage angewiesen, und sie birgt Risiken. Glücklicherweise lassen sich viele dieser Risiken leicht mindern – wenn man sie kennt. Aus diesem Grund freuen wir uns, unsere neuen „Detected Risks“ bekannt zu geben. Wir haben hart daran gearbeitet, schwerwiegende Probleme in den Systemen unserer Kunden schnell aufzudecken, Risiken, die sie dann mindern können, um den Zustand ihrer Systeme qualitativ zu verbessern.“
Bildnachweis:Gremlin
Während die Chaos-Engineering-Tools von Gremlin nach ungewöhnlichen Situationen suchen, die die Infrastruktur eines Unternehmens an ihre Grenzen bringen können, verwendet Detected Risks eine Reihe vorkonfigurierter Tests, 20 weitere werden später in diesem Jahr folgen. Diese Tests prüfen auf häufige Probleme, die sich darauf auswirken können, wie zuverlässig und belastbar die Infrastruktur eines Unternehmens wirklich ist. Detected Risks funktioniert, ohne dass Chaos-Engineering-Experimente oder Zuverlässigkeitstests durchgeführt werden müssen.
Diese Tests sind im Großen und Ganzen recht einfach und umfassen Best Practices, z. B. die Sicherstellung, dass eine Bereitstellung für die Ausführung in mehreren Verfügbarkeitszonen konfiguriert ist, um Redundanz sicherzustellen. Das mag zwar nach gesundem Menschenverstand klingen, aber bei der Betrachtung der Tausenden von Bereitstellungen, die seine Kunden ausführen, stellte Gremlin fest, dass 26 % keine Redundanz und 80 % der Bereitstellungen keine zwei Redundanzen aufwiesen. Das Unternehmen weist darauf hin, dass das System auch nach häufigen Kubernetes-Fehlkonfigurationen sucht, die sich beispielsweise auf die automatische Skalierung auswirken könnten.
„In unserer Branche gibt es viele kluge SREs, die hart daran arbeiten, diese Probleme persönlich zu lösen, aber dieser Ansatz ist nicht skalierbar“, sagte Andrus. „Wir lösen dieses Problem, indem wir etwas einfach zu verwendendes entwickeln, das wertvolle Einblicke in Tausende von realen Anwendungen bietet. Indem wir der technischen Führung Einblick in bestehende Risiken verschaffen, können sie diese wichtige Arbeit priorisieren und erledigen, sodass sie weiterhin das Kundenerlebnis schützen und qualitativ hochwertige Software entwickeln können.“
Bildnachweis: