Was ist Geschäftskontinuität und Disaster Recovery?

Aaron Ricadela | Content Strategist | 26. April 2024

Unternehmen müssen in Krisenzeiten weiterlaufen. Ein zentraler Teil der Herausforderung besteht darin, Systemabstürze zu überbrücken, die den Verkauf, den Betrieb, die Produktion und den Transport zum Erliegen bringen können, und sich davon zu erholen. Unabhängig davon, ob IT-Ausfälle durch menschliches Handeln, Softwarefehler, extreme Wetterbedingungen oder Naturkatastrophen verursacht werden, benötigen Unternehmen gut durchdachte betriebliche und technische Strategien, um eine Krise zu überstehen, ohne dass wichtige Prozesse beeinträchtigt werden, und um sich anschließend schnell zu erholen und die normale Arbeit wieder aufzunehmen.

Ungeplante, disruptive Ereignisse, die kritische Geschäftsabläufe behindern, können den Markenruf schädigen und zu finanziellen Verlusten und behördlichen Verwarnungen führen. Aus diesem Grund verfügen Organisationen seit langem über umfassende Notfallpläne und Backup-Systeme. Die zunehmende Verbreitung von Cloud Computing und neueren, vom Internet inspirierten Anwendungsarchitekturen verändert die Art und Weise, wie Organisationen den Betrieb bei Ausfällen planen, Disaster-Recovery-Systeme für die Wiederherstellung kritischer Daten entwerfen und Budgets für eine verbesserte Widerstandsfähigkeit bereitstellen.

Während Pläne, die geografisch getrennte physische Rechenzentren als Grundlage für die Disaster Recovery verwenden, weit verbreitet sind, konzentrieren wir uns hier auf neuere Strategien, die den Einsatz von Cloud-Services beinhalten.

Die Ausführung einiger Anwendungen sowohl in einem Rechenzentrum als auch in einem Cloud-Infrastrukturservice kann eine einfache und erschwingliche Möglichkeit sein, die Ausfallsicherheit durch die geografische Verteilung von Anwendungssystemen zu verbessern. Kosten können weiter gesenkt werden, indem kleinere oder Standby-Instanzen in der Cloud ausgeführt und nur bei Bedarf hochskaliert werden.

Wie wir sehen werden, wird eine der schwierigsten Entscheidungen darin bestehen, zu entscheiden, wie man ständig aktualisierte Kopien kritischer Datenspeicher aufbewahrt, sodass der Verlust einer Kopie den Betrieb nur vorübergehend unterbricht. Ein System, das es Kunden ermöglicht, ihre Konten zu verwalten, ist beispielsweise nur dann nützlich, wenn der Kunde seine Einkäufe sehen und neue erstellen kann. Wenn eine Katastrophe diesen Zugang unterbricht, ist die Anwendung unbrauchbar. Strategien zur Datenbankreplikation sind oft ein entscheidender Faktor bei der Erstellung einer belastbaren Strategie.

Was ist Geschäftskontinuität?

Geschäftskontinuitätspläne bieten den Führungskräften einer Organisation einen Fahrplan, um den Betrieb aufrechtzuerhalten, wenn eine Katastrophe oder ein IT-Ausfall den normalen Arbeitsablauf stört und die Anwendungen, auf die sie angewiesen sind, offline sind. Die Pläne beschreiben die Menschen, Prozesse und technologischen Strategien, die eine Organisation benötigt, um während einer Katastrophe effektiv weiterarbeiten zu können. Die häufigsten Gründe für Unterbrechungen des normalen Betriebs sind laut Experten technische Fehler und Softwarefehler, die zu Abstürzen führen. Naturkatastrophen und zunehmend auch Systemprobleme, die durch überhitzte Rechenzentren aufgrund extremer Wetterbedingungen verursacht werden, können ebenfalls zu Betriebsunterbrechungen führen. Darüber hinaus können auch Terrorismus, Cyberkriminalität und Kriege Ursachen sein.

Geschäftskontinuitätspläne umfassen zwar die Disaster Recovery von Softwareanwendungen und Daten, gehen aber noch weiter und beinhalten die Kommunikation mit den Mitarbeitern, die Sicherstellung des physischen Zugangs der Mitarbeiter zu Computern und Mobilgeräten sowie notwendige Änderungen der Lieferketten und andere betriebliche Überlegungen.

Was ist Disaster Recovery?

Neben der Planung der Mitarbeiter, Prozesse und Technologien, die zur Aufrechterhaltung des Betriebs während einer Unterbrechung erforderlich sind, benötigen Unternehmen einen konkreten Plan für die Wiederherstellung des Zugriffs auf kritische Systeme, Daten und Anwendungen. Der Begriff Disaster Recovery beschreibt die detaillierten technischen Pläne, die Unternehmen erstellen, um Workloads in der Reihenfolge ihrer Wichtigkeit wieder zum Laufen zu bringen, die dafür bereitgestellten Budgets und die Pläne zur Überprüfung der Strategie.

Das Ziel besteht darin, Ausfallzeiten und Datenverluste zu minimieren und gleichzeitig die Kosten für den Schutz jeder Rechenlast auszugleichen. Hier können Cloud-Technologien helfen.

Als die Datenverarbeitung hauptsächlich auf Client-Server-Systemen in firmeneigenen oder gemieteten Rechenzentren erfolgte, konnten sich die IT-Budgets für jede Anwendung, die einen eigenen Satz an Lizenzen, doppelten Servern, Speicher, Netzwerk und Kühlung benötigte, verdoppeln oder verdreifachen, wobei alle in Einrichtungen liefen, die sich in angemessener Entfernung vom Produktionsrechenzentrum des Unternehmens befanden. Das Cloud-Computing hat diese Gleichung allerdings verändert, indem es Unternehmen ermöglicht, geschäftskritische Anwendungen in mehreren Cloud-Regionen oder Rechenzentren einzusetzen. Cloud-Technologien ermöglichen es IT-Abteilungen außerdem, die Größe von Serverressourcen oder Instanzen schnell anzupassen und bei Bedarf mithilfe von Fernverwaltungstools mehr Kapazität hinzuzufügen.

Unternehmen müssen wichtige Entscheidungen zu zwei zentralen Kennzahlen für die Disaster Recovery treffen: Wie schnell müssen wir uns von einem Ausfall erholen und wie hoch darf der Datenverlust maximal sein?

Das Recovery Time Objective (RTO) gibt an, wie lange ein Unternehmen bereit ist zu warten, bis ein Dienst wiederhergestellt ist, und das Recovery Point Objective (RPO) bestimmt die maximale Datenmenge, die ein Unternehmen im Katastrophenfall zu verlieren bereit ist. Je niedriger die Schwellenwerte, desto besser, aber desto teurer wird auch die Umsetzung eines Disaster Recovery-Plans. Jedes System, das von der IT betrieben wird, hat seine eigenen RTO- und RPO-Werte. Ein Verkaufstransaktionssystem wird kurze Wiederherstellungszeiten und -punkte haben, während ein System für Mitarbeiterausgaben einige Tage nach einer Katastrophe wiederhergestellt werden könnte.

Was ist BCDR (Business Continuity and Disaster Recovery)?

Geschäftskontinuität und Disaster Recovery beziehen sich auf die Technologien, Richtlinien und Verfahren, die eine Organisation einsetzt, um sicherzustellen, dass sie im Falle einer Katastrophe oder einer anderen ungeplanten Unterbrechung weiterarbeiten kann. BCDR umfasst die Identifizierung potenzieller Risiken für die Betriebszeit und die Entwicklung von Strategien zur Wiederherstellung und Wiederaufnahme des normalen Betriebs so schnell wie möglich.

Strategien zu Geschäftskontinuität und Disaster Recovery werden für immer mehr Unternehmen wichtiger denn je, da immer mehr Transaktionen mit Kunden, Lieferanten und anderen Partnern online abgewickelt werden und die Datenmengen gestiegen sind. Außerdem sind immer mehr Systeme voneinander abhängig. Das Kundenportal, über das Kunden bisherige Bestellungen einsehen und neue Bestellungen aufgeben können, erfordert möglicherweise eine Verbindung mit Bestandsverwaltungs-, Fulfillment- und Produktionsmanagementsystemen. Da sie alle erforderlich sind, erbt jedes die kürzesten RTO- und RPO-Anforderungen der Gruppe.

Während die Geschäftskontinuität für Unternehmen in allen Branchen wichtig ist, können effektive BCDR-Pläne für Organisationen in bestimmten Branchen besonders entscheidend sein. Unternehmen in stark regulierten Branchen wie dem Bankwesen, der Energiebranche und dem Gesundheitswesen haben beispielsweise strenge Anforderungen an die Geschäftskontinuität und können oft nicht die Zeit tolerieren, die für die Wiederherstellung von Daten aus Backups benötigt wird. Auch bestimmte Teilsektoren, wie der Kapitalmarkthandel, können es sich nicht leisten, auch für nur wenige Minuten Daten zu verlieren.

Unternehmen sollten ihre BCDR-Planung mit einer Auswirkungsanalyse beginnen, in der detailliert aufgeführt ist, welche Katastrophen eintreten und welche Arten von Verlusten daraus resultieren könnten. Der Plan sollte technische Konfigurationsfehler, Naturkatastrophen, Terrorakte und Cybersicherheitsvorfälle wie Ransomware-Angriffe berücksichtigen. Da die Datenmengen heute viel größer sind als in den vergangenen Jahrzehnten, müssen Führungskräfte in Unternehmen Prozesse und die damit verbundenen Softwareanwendungen priorisieren, indem sie festlegen, welche davon geschäftskritisch sind. Die anderen sollten in Gruppen mit unterschiedlicher Bedeutung eingeteilt werden, die als Tiers bezeichnet werden und für die weniger strenge RTO- und RPO-Standards gelten.

Die Ermittlung der kritischsten Bereiche eines Unternehmens und die Schätzung der Ausfallzeit, die jeder einzelne tolerieren könnte, helfen bei der Erstellung eines Plans, um diese Funktionen am Laufen zu halten, einschließlich Datensicherungen, „Pilotlicht“-IT-Installationen, die beim Start umfassenderer Rechenvorgänge helfen können, und der technischen Einrichtungen, die Mitarbeiter für die Arbeit von zu Hause aus benötigen würden. Pilotlicht-Systeme können als Warm-Standby-Systeme betrachtet werden. Solange sie Zugriff auf kritische Datenspeicher haben, können diese cloudbasierten Systeme innerhalb von Minuten nach einer Katastrophe einsatzbereit sein.

Cloud-Computing-Technologien sind wichtige Hilfsmittel, die Unternehmen bei der Umsetzung von Geschäftskontinuitäts- und Disaster Recovery-Plänen unterstützen können, ohne ihr Budget zu sprengen.

Hybride IT-Setups, bei denen einige Computerressourcen in der Public Cloud und andere in lokalen Rechenzentren ausgeführt werden, haben die Kosten für die Disaster Recovery gesenkt. Cloud-Workloads, die mit Microservices erstellt wurden – Sammlungen kleiner Softwarekomponenten, die auf verteilten, virtuellen Servern ausgeführt werden und zusammenarbeiten, um Anwendungen für Benutzer bereitzustellen – ermöglichen es Unternehmen, sogenannte Pilotlicht-IT-Bereitstellungen zu erstellen, d. h. Live-Daten auf dem neuesten Stand mit ungenutzten Diensten, die zum Neustart eines Systems in einem Cloud-Rechenzentrum verwendet werden können. Hybrid-Cloud-Umgebungen erfordern, dass Unternehmen Anwendungsabhängigkeiten identifizieren, katalogisieren und verwalten, die verhindern würden, dass ein Softwareprogramm neu gestartet werden kann, wenn ein anderes, auf das es angewiesen ist, offline ist.

Einige Unternehmen arbeiten daran, alle ihre Anwendungen in die Cloud zu verlagern, mit dem Ziel, ihre Rechenzentren schließlich ganz abzuschalten. In der Regel sind hier mehrere Faktoren ausschlaggebend, darunter der Wunsch, interne Anwendungen einfacher in andere cloudbasierte Systeme zu integrieren, eine einfachere System- und Anwendungsverwaltung, eine bessere Skalierbarkeit, Verfügbarkeit und Aktualisierbarkeit von Anwendungen sowie eine bessere BCDR. Zu den Vorteilen der Geschäftskontinuität gehören die Möglichkeit, Pilotlichtsysteme in Cloud-Rechenzentren in geografisch getrennten Cloud-Regionen zu betreiben, weniger Bedenken hinsichtlich der Erreichbarkeit von Mitarbeitern und Kunden im Katastrophenfall und ein grundlegend sichereres Anwendungsdesign mit wenigen oder keinen einzelnen Fehlerquellen. Um all diese Vorteile zu nutzen, reicht es jedoch nicht aus, eine vorhandene Anwendung einfach in ein Cloud-Rechenzentrum zu verlagern. Die Anwendung muss neu strukturiert und programmiert werden.

Dieser Prozess wird als Refactoring bezeichnet. Die beste Architektur für dieses Vorhaben sind Cloud-Services. Refactoring kann zeitaufwendig und teuer sein. Die daraus resultierenden Anwendungen sind jedoch widerstandsfähiger, vielseitiger und skalierbarer – alles Ergebnisse, die Ihrer BCDR-Strategie zugutekommen. Eine solche Anwendung wird sich auch leichter ändern lassen, um neue Funktionen bereitzustellen. Zum Beispiel wird das Hinzufügen von Analyse- und KI-Funktionen zu einem leichter zu handhabenden Prozess, da es sich dabei lediglich um neue Webservices handelt, die innerhalb der App genutzt werden können.

Unternehmen müssen bei der Planung eines Disaster Recovery-Ansatzes, der zu ihrem Budget passt, ihre Workloads nach erforderlicher Verfügbarkeit, RTO und RPO priorisieren. Die Wiederherstellung von Systemen aus einem Backup kann der kostengünstigste Weg sein – allerdings kann die Wiederherstellung großer Datensätze sehr lange dauern, und Offline-Sicherungen haben eine lange RPO. Dennoch sind Offline-Backups wichtig, insbesondere für kritische Daten, und können die einzige praktikable Option sein, um sich von einem Ransomware-Vorfall zu erholen. Durch den Einsatz von Pilotlicht können Systeme innerhalb von Minuten statt Stunden wieder in Betrieb genommen werden, sind jedoch in der Wartung teurer.

Warm-Standby-Methoden, die Live-Daten mit aktuellen Daten und Cloud-basierten Anwendungsreplikaten kombinieren, die Anfragen bei geringerer Auslastung verarbeiten können, haben RPOs, die in Sekunden gemessen werden, und RTOs, die in Minuten gemessen werden. Ein sogenannter Aktiv/Aktiv-Failover-Ansatz, bei dem mehrere Live-Sites mit voller Kapazität genutzt werden, kann Wiederherstellungszeiten und -punkte von nahezu Null liefern, ist aber am teuersten.

Disaster Recovery-Kompromisse

Unternehmen müssen bei der Planung einer DR-Strategie Entscheidungen über Wiederherstellungszeit, Datenverlust und Kosten treffen.

DR-Methode RPO RTO Kosten
Sicherung und Wiederherstellung Stunden Stunden $
Pilotflamme Minuten Minuten $$
Warm Standby Sekunden Minuten $$$
Aktiv/Aktiv Fast Null Potenziell null $$$$

Quelle: Oracle

Was ist der Unterschied zwischen Geschäftskontinuität und Disaster Recovery?

Geschäftskontinuitätspläne stellen sicher, dass ein Unternehmen auch während einer Krise weiterarbeiten und seine Produkte oder Dienstleistungen bereitstellen kann. Geschäftskontinuität umfasst die Bereitstellung von Personal, Prozessen und Technologie, um ein Katastrophenszenario zu bewältigen.

Disaster Recovery ist der Teil der Geschäftskontinuität, der sich mit der schnellen und möglichst verlustfreien Wiederherstellung des IT-Betriebs befasst. Sie umfasst technische Pläne für die Wiederaufnahme von Rechenlasten und einen abgestuften Wiederherstellungsansatz, der auf der Wichtigkeit und den Abhängigkeiten der Anwendungen basiert.

Wichtige Erkenntnisse

  • Geschäftskontinuitätspläne können von klar definierten Rollen und der Unterstützung durch eine sichtbare Führungskraft profitieren.
  • Disaster Recovery-Strategien sollten Vorkehrungen für die Wiederherstellung von Daten an einem Standort oder in einem Cloud-Rechenzentrum enthalten, das vor Unterbrechungen sicher ist. Sie sollten kritische Systeme dokumentieren, deren Arbeit auf mehrere Standorte verteilt werden muss, um im Falle eines Serverausfalls sofort verfügbar zu sein – oder um gegen Naturkatastrophen und regionale Ausfälle gewappnet zu sein.
  • BCDR erfordert oft Kompromisse, und Unternehmen müssen abwägen, wie schnell sie sich von einem ungeplanten IT-Ausfall erholen müssen, wie viele Daten sie zu verlieren bereit sind und wie hoch die Kosten und die Komplexität für die Wartung ihrer Backup-Systeme sind.
  • Durch die Nutzung von Cloud-Computing und Virtualisierung können übermäßige Ausgaben für die Duplizierung von Workloads, die sehr schnelle Wiederherstellungszeiten erfordern, vermieden werden. Cloud-Technologien wie Container und virtuelle Maschinen ermöglichen es Unternehmen, Workloads aus kleineren, kostengünstigeren IT-Umgebungen wiederherzustellen, die häufig in Cloud-Rechenzentren von Drittanbietern ausgeführt werden.
  • Bei der Planung von DR-Strategien müssen Unternehmen die Anwendungsabhängigkeiten genau untersuchen, die verhindern könnten, dass ein wichtiges Softwareprogramm gestartet wird, wenn ein anderes, auf das es angewiesen ist, offline ist. Kritische, katastrophenanfällige Anwendungen können von einer Umstrukturierung profitieren, um einzelne Fehlerquellen zu beseitigen.

BCDR erklärt

Die Geschäftskontinuitätsplanung sollte mit einer Bewertung potenzieller Risiken beginnen. Organisationen sollten dann die erwarteten Auswirkungen dieser Risiken auf die Prozesse messen und die Teammitglieder ermitteln, die bestimmte Rollen übernehmen, um diese Risiken zu mindern. Die Pläne sollten außerdem darlegen, wie das Unternehmen die Mitarbeiterkommunikation aufrechterhalten, den Kundenservice und die Verkaufsmöglichkeiten berücksichtigen und die Lieferketten anpassen wird. Sie sollten sich nicht auf eine einzige Person verlassen, um Systeme wieder online zu bringen.

Unternehmen müssen eine Bestandsaufnahme ihrer Hardware- und Software-Assets erstellen, die die Abhängigkeiten zwischen ihnen dokumentiert. Komponenten von Systemen, die nur bei Katastrophen zum Einsatz kommen, müssen besonders sorgfältig getestet werden, da sie normalerweise nicht verwendet werden und fehleranfällig sind.

Die erfolgreichsten BCDR-Programme bilden Abhängigkeiten ab, bestimmen Anwendungsebenen, bewerten Risiken, werden regelmäßig getestet und verfügen über qualifizierte Teams und einen sichtbaren Sponsor in der Geschäftsleitung, wie aus Untersuchungen von PwC hervorgeht.

Für Unternehmen ist es wichtig, bei der Planung ihrer Cloud-Computing-Ansätze zwischen hoher Verfügbarkeit und Disaster Recovery zu unterscheiden. Public Clouds, die sogenannte Availability-Zones im Umkreis von wenigen Kilometern oder sogar innerhalb desselben Gebäudekomplexes umfassen, können dazu beitragen, dass bei einem Ausfall in einem Rechenzentrum die Workloads der Kunden in den anderen in der Zone weiterlaufen. Dieser Ansatz bietet zwar eine höhere Verfügbarkeit, deckt jedoch keine Katastrophen mit einem größeren Radius ab, wie z. B. größere Wetterereignisse, regionale Stromausfälle und Hitzewellen.

Warum sind Geschäftskontinuität und Disaster Recovery für Unternehmen wichtig?

Störfälle, Naturkatastrophen oder unvorhergesehene IT-Ausfälle können den Verkauf und den Betrieb behindern, Büros unbenutzbar machen, Rechenzentren vom Netz nehmen oder Anlagen und Ausrüstung zerstören. Oftmals sind finanzielle Verluste die Folge. Ein Plan für Geschäftskontinuität und Disaster Recovery ermöglicht es Organisationen, im Krisenfall schnell zu reagieren, Verluste zu begrenzen, Compliance-Anforderungen zu erfüllen und weiterhin für ihre Kunden da zu sein.

Schwere Computerausfälle, die den Betrieb lahmlegen, können Schätzungen zufolge finanzielle Schäden in Höhe von 100.000 US-Dollar pro Stunde verursachen. Southwest Airlines zum Beispiel hat im April 2023 nach einem Netzwerk-Firewall-Problem fast 2.000 Flüge gestrichen, wodurch Passagiere in Terminals oder auf Rollfeldern festsaßen. Hinzu kommt, dass ungeplante Ausfälle immer teurer werden: Eine 2022 durchgeführte Umfrage unter 830 Unternehmen (PDF) der IT-Beratungsgruppe Uptime Institute ergab, dass ein Viertel der ungeplanten Ausfälle betroffene Unternehmen mehr als 1 Million US-Dollar kostete. Von den Befragten hatten 29 % einen Umsatz von weniger als 1 Million US-Dollar, 28 % erwirtschafteten zwischen 1 Million und 9,99 Millionen US-Dollar und der Rest 10 Millionen US-Dollar oder mehr.

Welche Komponenten sind in einem BCDR-Plan enthalten?

Geschäftskontinuitätspläne umfassen umfassende Bewertungen potenzieller Risiken und der dadurch verursachten Betriebsunterbrechungen, der möglichen Auswirkungen auf interne Mitarbeiter und Lieferanten sowie der finanziellen Verluste und behördlichen Bußgelder, die daraus resultieren könnten. Sie beschreiben auch die Mitarbeiter, Prozesse und technischen Schritte, die erforderlich sind, um wieder online und einsatzbereit zu sein und fehlende Daten wiederherzustellen. Schulungen und Tests sind ebenfalls unerlässlich.

Ein solider BCDR-Plan umfasst Folgendes:

  • Ermittlung von Szenarien, die normale Geschäftsprozesse unterbrechen würden, wobei wesentliche Personen, Ressourcen und Einrichtungen, die wahrscheinlich betroffen sind und während der Wiederherstellung besondere Aufmerksamkeit erfordern, zu berücksichtigen sind.
  • Eine Analyse der Auswirkungen auf das Unternehmen mit einer Diskussion über die Ziele für die Recovery Time Objectives und die Recovery Point Objectives. Die Analyse sollte Schätzungen zu Umsatz- und Gewinneinbußen nach einer Katastrophe enthalten und berücksichtigen, wie sehr diese Verluste das Überleben des Unternehmens gefährden würden.
  • Eine Strategie zur Auswahl und Bereitstellung von Backup-Standorten und zur Verteilung von Workloads in einer Public Cloud, sodass der Betrieb schnell wieder aufgenommen werden kann.
  • Eine Rangliste der kritischen und wichtigen Geschäftsanwendungen, die zuerst neu gestartet werden müssen, und eine Übersicht über die IT-Abhängigkeiten, die das Online-Schalten dieser Anwendungen behindern könnten.
  • Änderungen am Betrieb, die damit verbundenen Risiken und ein Programm zur Schulung von Mitarbeitern in der Notfallplanung.
  • Vorkehrungen für eine kontinuierliche Verbesserung des Plans und Genehmigung durch Führungskräfte der Geschäftsbereiche, deren Gruppen potenziell betroffen wären. Einzelne Geschäftsbereiche sollten außerdem Szenarien ermitteln, die ihre Arbeit unterbrechen würden, sowie die beteiligten Personen, Ressourcen, Standorte und Technologien, und Pläne für die Reaktion auf diese Szenarien entwickeln.

Erstellung eines BCDR-Plans

Die Erstellung eines BCDR-Plans umfasst mehrere Schritte, beginnend mit der Zusammenstellung eines Teams aus wichtigen Interessenvertretern. Wenn Sie diesen Prozess befolgen, können Sie einen umfassenden BCDR-Plan erstellen, der Ihr Unternehmen schützt und Störungen im Notfall minimiert.

  1. Identifizieren und bilden Sie ein Team von Personen, einschließlich eines leitenden Sponsors, das für die Erstellung und Umsetzung des Plans verantwortlich ist und sicherstellt, dass er auf dem neuesten Stand gehalten und regelmäßig getestet wird.
  2. Erfassen Sie die physischen und IT-Anlagen, die von einer Katastrophe betroffen sein könnten.
  3. Führen Sie eine Analyse der Auswirkungen von Katastrophen oder unvorhergesehenen Ausfällen auf den Geschäftsbetrieb und die Standorte durch, einschließlich der Auswirkungen auf Lieferanten, Vertriebspartner, Einzelhändler und andere externe Parteien.
  4. Richten Sie einen alternativen Standort ein, an dem die Mitarbeiter während der Unterbrechung arbeiten können, und erstellen Sie einen Plan für die Kommunikation mit den Mitarbeitern während dieser Zeit. Alternativ können Sie festlegen, wie Mitarbeiter während einer Katastrophe von jedem beliebigen Ort aus arbeiten können.
  5. Erstellen Sie einen Disaster Recovery-Plan, der sicherstellt, dass die Wiederherstellungszeiten der Wichtigkeit einer Anwendung entsprechen, und bedenken Sie dabei, dass die Wiederherstellung großer Datensätze von einem Backup-System sehr lange dauern kann.
  6. IT-Teams sollten festlegen, welche Workloads aus dem Backup wiederhergestellt werden können, welche Live-Daten in Kombination mit Diensten mit reduzierter Kapazität erfordern und welche Workloads immer die volle Servicekapazität benötigen, auch wenn sie auf Backup-Servern ausgeführt werden. Entscheiden Sie über ihre RPOs und RTOs und entwickeln sie Wiederherstellungsprozesse, um diese zu erfüllen.
  7. Testen Sie Ihre Geschäftskontinuitäts- und Disaster Recovery-Pläne entweder durch sogenannte „Tabletop-Tests“, bei denen die Schritte, die die wichtigsten Beteiligten unternehmen würden, mündlich besprochen werden, oder durch einen tatsächlichen Durchlauf dieser Maßnahmen. Temporäre Cloud-Bereitstellungen können beim Testen von Wiederherstellungsverfahren eine große Hilfe sein.

Auf der IT-Seite sollten Sie besonders darauf achten, Komponenten von Systemen zu testen, die nur im Katastrophenfall zum Einsatz kommen.

Kostenlosen Plan für Geschäftskontinuität und Disaster Recovery (DOC) herunterladen

Die Zukunft von BCDR

Die Bereiche Geschäftskontinuität und Disaster Recovery setzen auf neue Technologien, um die Arbeit zu automatisieren und die Genauigkeit zu verbessern. Im Vordergrund steht dabei die generative KI, die Normen und Dokumente zu Best Practices durchkämmen kann, um einen Ausgangspunkt für einen BCDR-Plan zu schaffen. Die Technologie kann Verbindungen zwischen Geschäftsprozessen und den dahinter stehenden Ressourcen herstellen und so bei der Erstellung der betrieblichen Auswirkungsanalyse helfen.

KI-Tools können dann den Verantwortlichen für die Geschäftskontinuität viel Zeit sparen, indem sie in der Auswirkungsanalyse detaillierte Informationen finden, die in den Wiederherstellungsplan einfließen können.

Generative KI in der IT-Entwicklung und im IT-Betrieb kann außerdem Nutzungsspitzen und ungewöhnliche Änderungen beim Datenzugriff analysieren, die den Mitarbeitern entgehen könnten und auf einen bevorstehenden Ausfall hindeuten könnten. Darüber hinaus kann sie helfen, Softwareabhängigkeiten zu identifizieren und Systeme neu zu strukturieren, um weniger einzelne Fehlerquellen zu haben.

Einfachere Umsetzung Ihrer Strategie zur Geschäftskontinuität mit Oracle Cloud Infrastructure

Das Cloud-Computing mit Oracle Technologie bietet mehrere Schutzmaßnahmen gegen Ausfallzeiten infolge von Katastrophen. Oracle Cloud Infrastructure (OCI) verwendet einen einzigartigen und besonders belastbaren Ansatz, bei dem jede seiner globalen Cloud-Regionen, die Dienste in verschiedenen geografischen Gebieten bereitstellen, in voneinander isolierte Availability-Domains unterteilt wird. Availability-Domains in derselben Region verfügen jeweils über eigene Strom- und Kühlsysteme, sodass ein Ausfall in einer Domain in der Region wahrscheinlich nicht die Rechenleistung in einer anderen beeinträchtigt.

Die Availability-Domains sind über ein Netzwerk mit geringer Latenz und hoher Bandbreite miteinander verbunden, sodass Kunden Systeme erstellen können, die für Hochverfügbarkeit und Disaster Recovery über Availability-Domains hinweg repliziert werden können. Das Netzwerk verbindet zudem Cloud-Umgebungen mit On-Premises-Rechnern für Hybrid-Cloud-Umgebungen.

Jede OCI-Availability-Domain umfasst wiederum drei Faultdomains, sodass Recheninstanzen nicht auf derselben Hardware innerhalb einer Availability-Domain liegen. Eine solche Architektur trägt außerdem zum Schutz vor ungeplanten Ausfällen bei. Die Strategie von Oracle besteht darin, zwei oder mehr Cloud-Regionen in Ländern bereitzustellen, in denen das Unternehmen eine Public Cloud betreibt, um den Anforderungen der Kunden an die Datenresidenz gerecht zu werden.

Darüber hinaus enthält Oracle Database die Real Application Clusters (RAC)-Technologie für integrierte Redundanz, unabhängig davon, ob die Workloads auf OCI oder Microsoft Azure laufen. Ein separates Produkt, Oracle Active Data Guard, eine Echtzeit-Standby-Kopie von Daten für eine höhere Verfügbarkeit und Disaster Recovery von Oracle Database. Für Kunden mit den anspruchsvollsten und ausgefeiltesten DR-Anforderungen kann Oracle Cloud Infrastructure GoldenGate Daten auf Blockebene replizieren und so schnelle Wiederherstellungszeiten von Wiederherstellungspunkten bieten.

Ein umfassender Plan für Geschäftskontinuität und Disaster Recovery kann dazu beitragen, Ausfallzeiten, finanzielle Verluste und Rufschädigungen zu minimieren. Er vermittelt Mitarbeitern, Kunden und Interessengruppen ein Gefühl der Sicherheit, da sie wissen, dass die Organisation auf unerwartete Situationen vorbereitet ist, gesetzliche Vorschriften einhält und kritische Daten und Vermögenswerte schützt. Die Sicherheit und Widerstandsfähigkeit, die ein BCDR-Plan bietet, machen ihn für Unternehmen jeder Größe lohnenswert.

2023 Gartner® Magic Quadrant™ for Distributed Hybrid Infrastructure, Worldwide

Eine verteilte Cloud bietet die Flexibilität, zu wählen, wo und wie Dienste bereitgestellt werden, um Ihren Anforderungen gerecht zu werden – einschließlich BCDR. Erfahren Sie, warum Oracle im Gartner® Magic Quadrant™ 2023 for Distributed Hybrid Infrastructure als Leader eingestuft wurde. Holen Sie sich den kostenlosen Bericht.

Häufig gestellte Fragen zu BCDR

Was sollte ein BCDR-Plan enthalten?

Ein Plan für die Geschäftskontinuität und Disaster Recovery sollte eine Risikobewertung der potenziellen Fehler und Ereignisse, die den normalen Betrieb unterbrechen könnten, eine Analyse der Auswirkungen auf die betroffenen Vermögenswerte und Computersysteme, eine Schätzung der potenziellen finanziellen Verluste und Vorkehrungen für die Aufrechterhaltung des Betriebs von Mitarbeitern und Prozessen während einer Krise enthalten. BCDR-Pläne enthalten außerdem detaillierte technische Beschreibungen, wie ein Unternehmen wichtige Anwendungen wieder online bringt und sicherstellt, dass Mitarbeiter Zugriff auf Daten haben, während gleichzeitig Datenverluste minimiert werden. Auch die Schulung des Personals ist ein wichtiger Bestandteil.

Wofür steht BCP?

BCP steht für Business Continuity Plan (Geschäftskontinuitätsplan), zu dem eine detaillierte Strategie und ein Katalog der Prozesse und Systeme gehören, die es einem Unternehmen ermöglichen, seinen Betrieb auch bei einer unvorhergesehenen Störung aufrechtzuerhalten. Ein BCP umfasst Vorkehrungen für das Management von Mitarbeitern, Prozessen und Technologie während einer Krise, mit dem Ziel, so schnell wie möglich in den Normalbetrieb zurückzukehren.