Der jüngste weltweite IT-Ausfall eines Cloud-Hyperscalers hat uns eine universelle Wahrheit in der Technologie vor Augen geführt: Selbst wenn sie minimal sind, sind Ausfallzeiten und Dienstunterbrechungen unvermeidlich. Obwohl die Auswirkungen weitreichend waren und zu Störungen im Einzelhandel, im Bankwesen, im Gesundheitswesen und in anderen Branchen führten, handelte es sich hierbei nicht um einen Ausfall, der nur einen einzigen Anbieter oder eine einzige Cloud betraf. Es zeigt, dass Unterbrechungen überall auftreten können: in jeder Cloud-Region, bei jedem Anbieter.
Die wichtigste Erkenntnis ist klar: Unternehmen können und müssen die Kontrolle übernehmen, indem sie eine robuste Datenarchitektur aufbauen, die sich an ständige Veränderungen anpassen und davon profitieren kann. In diesem Blog berichten wir darüber, wie Kunden von Cloudera dank der Flexibilität unserer portablen Architektur und Tools, die ein nahtloses Failover und eine nahtlose Wiederherstellung gewährleisten, in einer einzigartigen Position sind, um die Geschäftskontinuität sicherzustellen. Cloudera ist das einzige Unternehmen für Daten- und KI-Plattformen, das KI überall für Daten verfügbar macht: in Clouds, Rechenzentren und an der Edge.
Datenresilienz ist die Fähigkeit eines Unternehmens, datenbezogene Störungen oder Ausfälle zu überstehen, sich schnell davon zu erholen und die Auswirkungen zu minimieren. Es handelt sich um einen proaktiven Ansatz zur Geschäftskontinuität, der über Datensicherung und Notfallwiederherstellung hinausgeht und sicherstellt, dass kritische Daten stets erhalten bleiben:
Verfügbar: Für Benutzer und Anwendungen bei Bedarf verfügbar (Minimierung von Recovery Time Objective oder RTO)
Intakt/genau (Datenintegrität): Unbeschädigt und unverändert (Minimierung von Recovery Point Objective oder RPO)
Sicher: Geschützt vor unbefugtem Zugriff, Verlust oder Diebstahl.
Die Entwicklung einer Architektur für echte Resilienz beruht auf zwei zentralen, miteinander verbundenen Säulen: Technologie zur Gewährleistung der Portabilität und einen geprüften Failover-Prozess.
Die Abhängigkeit von einem einzigen Anbieter, einer einzigen Cloud oder sogar einer einzigen Region innerhalb einer Cloud schafft eine kritische Schwachstelle für das Unternehmen oder eine einzige Fehlerquelle. Ausfälle entstehen durch Hardwarefehler, Softwareprobleme, menschliches Versagen, Naturkatastrophen oder Cyberangriffe. Das Ziel von Resilienz ist die Gewährleistung der nahtlosen und automatischen Fortsetzung Ihrer Betriebsabläufe an einem anderen Standort, falls eine Umgebung ausfällt.
Das bedeutet, dass Sie überall ein Failover durchführen können müssen – zwischen Cloud-Regionen, zwischen Cloud-Anbietern und sogar zurück zu einem Rechenzentrum. Der Geschäftsbetrieb muss fortgesetzt werden, und kritische Systeme müssen weiterhin funktionieren, unabhängig davon, wo die ursprüngliche Störung aufgetreten ist.
Technologie kann Resilienzfähigkeit bieten, aber der Prozess ist für eine erfolgreiche Geschäftskontinuität unerlässlich. Zu viele Disaster-Recovery-Pläne werden einmal erstellt und nur selten überarbeitet, selbst wenn sich Menschen und Technologie weiterentwickeln. Ein gut geprüfter Plan wird dokumentiert, geübt und regelmäßig überprüft, um sicherzustellen, dass das Unternehmen im Falle eines Ausfalls handlungsfähig bleibt. Zu den Elementen des Plans gehören:
Priorisierung von Workloads, um sicherzustellen, dass geschäftskritische Vorgänge wie die Transaktionsverarbeitung im Einzelhandel und die Remote-Überwachung im Gesundheitswesen die niedrigsten Service Level Agreements (SLAs) für RTO und RPO aufweisen.
Gewährleistung von Redundanz und hoher Verfügbarkeit durch die Einrichtung der Möglichkeit zum Failover zwischen Umgebungen, um den Betrieb aufrechtzuerhalten.
Sicherung kritischer Daten und Metadaten sowie Festlegung von Aufbewahrungsrichtlinien und Governance-Strukturen.
Cloudera ist der einzige Anbieter von Daten- und KI-Plattformen, der ein einheitliches Cloud-Erlebnis für Daten überall bietet. So können Unternehmen Daten und KI-Workloads ohne Reibungsverluste und ohne Bindung an einen bestimmten Anbieter zwischen Clouds und Rechenzentren verschieben und sind nicht mehr an eine bestimmte Infrastruktur gebunden. Dadurch können Unternehmen ihre Geschäftsrisiken reduzieren, indem sie Cloudera nutzen, um eine ausfallsichere Architektur zu schaffen und einen einheitlichen Betrieb sowie die Compliance unabhängig vom Speicherort der Daten aufrechtzuerhalten.
Die Plattform von Cloudera unterstützt hohe Verfügbarkeit und Resilienz durch unsere Lösungen und Dienste. Dazu gehören:
Portable Data Services: Die Plattform von Cloudera, einschließlich Cloud-nativer Datendienste und Data Lake, läuft konsistent auf jeder Cloud (AWS, Azure, Google Cloud) und lokal in Kubernetes. Die Unabhängigkeit von der zugrunde liegenden Infrastruktur ermöglicht den Kunden die Konfiguration einer Vielzahl verfügbarer Standorte, unter Einbeziehung verschiedener Clouds und On-Premises-Ressourcen, um die Abhängigkeit von einer einzigen Plattform oder einem einzigen Anbieter drastisch zu reduzieren.
Bewegtdaten: Cloudera Data Flow, Cloudera Streaming-Analytics und Cloudera Streams Messaging ermöglichen Kunden die Erfassung, Verarbeitung und Verteilung von Daten überall in Echtzeit. Bei unternehmenskritischen Echtzeit-Workloads wie Betrugserkennung und Netzwerküberwachung kann ein potenzieller Ausfall erhebliche Auswirkungen auf das Geschäft haben. Cloudera stellt sicher, dass diese Dienste hoch verfügbar bleiben und über Umgebungen hinweg repliziert werden können.
Replication Manager: Diese zentrale Cloudera Komponente bietet einen vereinfachten Ansatz für Datensicherung und -wiederherstellung. Dabei werden nicht nur die Daten, sondern auch die Metadaten sowie wichtige Sicherheits- und Governance-Richtlinien repliziert, die mit diesen Daten verbunden sind. Diese Replikation ermöglicht eine einfache Migration, kontinuierliche Synchronisierung und vor allem die Möglichkeit eines schnellen Failovers, indem neben der primären Betriebsumgebung eine sekundäre replizierte Umgebung mit minimalem Datenverlust gefördert wird.
Offene Data Lakehouse: Das offene Data Lakehouse von Cloudera bietet sichere Datenverwaltung und portable, cloudnative Datenanalyse mit einem „Write-Once, Run-Anywhere“-Ansatz. Dadurch entfallen der Zeit- und Kostenaufwand für das Refactoring von Anwendungen oder Workloads beim Wechsel zwischen verschiedenen Infrastrukturen.
Abbildung 1. Cloudera bietet überall Cloud-Erfahrung für KI überall
Zusammen ermöglichen diese Funktionen Kunden von Cloudera die zuverlässige Ausführung geschäftskritischer Daten- und KI-Workloads und gewährleisten selbst bei Ausfällen auf Infrastrukturebene nahezu keine Ausfallzeiten und Datenverluste für ihre wichtigsten Geschäftsprozesse.
Für viele Unternehmen war der jüngste Ausfall nur eine kleine Störung. Was aber, wenn es sich um eine echte Katastrophe wie einen Krieg handeln würde? Das in der Ukraine ansässige Unternehmen AM-BITS, ein Anbieter von IT-Lösungen für den Banken-, Telekommunikations- und Einzelhandelssektor, stand vor der dringenden Notwendigkeit, die geschäftskritischen Daten seiner Kunden zu sichern und zu migrieren, nachdem geopolitische Umwälzungen Unternehmen dazu zwangen, ihre Umstellung von lokalen Systemen auf die Cloud rasch voranzutreiben. Eine typische Cloud-Migration kann sechs Monate oder länger dauern – ein Zeitrahmen, den sich viele Unternehmen nicht leisten können.
Zur Bewältigung dieser Kontinuitätskrise hat AM-BITS eine moderne, Multi-Tenant-Daten- und KI-Plattform auf Grundlage von Cloudera entwickelt. Mithilfe von Cloudera Shared Data Experience (Cloudera SDX) stellte AM-BITS seinen Kunden schnell einen „technischen sicheren Hafen“ für ihre Datenbestände zur Verfügung und reduzierte so die Zeit für die sichere Migration von Daten in die Cloud um 50 %. Da Cloudera nahtlos in jeder Umgebung funktioniert, gewannen die Kunden von AM-BITS echte Flexibilität: Sie konnten schnell in die Cloud migrieren, behielten aber auch die Möglichkeit, zu einer anderen Cloud zu wechseln oder Daten wieder vor Ort zu speichern. Durch die Nutzung von Cloudera hat AM-BITS Portabilität zu einem leistungsstarken Tool für die Geschäftskontinuität gemacht.
Datenbedingte Störungen und Ausfälle können durch Hardwareausfälle, Softwareprobleme, menschliche Fehler, Naturkatastrophen, Cyberangriffe und mehr verursacht werden. Es ist von entscheidender Bedeutung, dass Unternehmen ihre Systeme unter Berücksichtigung dieser Fehlerquellen konzipieren und einen Plan zur schnellen Wiederherstellung ihrer IT-Systeme und Daten ohne nennenswerte Unterbrechungen bereithalten.
Um mehr darüber zu erfahren, wie Sie mit Cloudera eine resiliente Architektur aufbauen können, sehen Sie sich unsere Checkliste und Ressourcen zur Notfallwiederherstellung an oder wenden Sie sich an unser Team für professionelle Dienstleistungen, das Ihnen bei der Erstellung eines Plans für Resilienz behilflich sein kann.
This may have been caused by one of the following: