Sie sind hier: Startseite » Markt » Tipps und Hinweise

Datenbereinigung mit Dokumentation verbunden


Fahrplan in die Cloud: Fünf Tipps für eine reibungslose Datenbank-Migration
Die Migration von Datenbanken aus dem eigenen Rechenzentrum in die Cloud bietet Unternehmen die Chance, den Zugriff performanter zu gestalten


Von Kevin Kline, Principal Programme Manager, SentryOne

Die Verfügbarkeit und Verarbeitung von Daten ist für digitalisierte Unternehmen ein vitaler Bestandteil des täglichen Geschäftsbetriebs. Sämtliche Anwendungen, von der Personalverwaltungssoftware bis hin zum Onlineshop, sind mit Datenbanken verbunden und speisen ihre Prozesse aus deren Beständen. Brauchen Datenbankanfragen zu lange, geraten auch die Anwendungen, die auf diese zugreifen, ins Stottern. Nutzer oder auch Kunden bekommen dies durch Timeout-Fehler zu spüren. Die Migration von Datenbanken aus dem eigenen Rechenzentrum in die Cloud bietet Unternehmen die Chance, den Zugriff performanter zu gestalten, IT-Prozesse effizienter zu strukturieren und langfristig flexibler agieren zu können. Derartige Vorteile lassen sich allerdings nur erzielen, wenn die Cloud möglichst effizient genutzt wird. Um dies sicherzustellen, sollten Unternehmen vor und während der Migration sicherstellen, dass sie die folgenden Punkte beachten:

1. Zentrale Funktionsanforderungen frühzeitig ermitteln
Für den Umzug in die Cloud - wie auch auf jede andere Plattform - gilt für Unternehmen: Sie müssen vorab prüfen, inwieweit zwischen dem alten und dem neuen System Diskrepanzen bestehen vorab zu identifizieren, um sie bestmöglich adressieren zu können. Beispielsweise kann es beim Wechsel von einem SQL Server zu einer SQL-Datenbank in der Cloud vorkommen, dass einige Eigenschaften der vorhandenen Datenbank von dem Anbieter der Cloud nicht unterstützt werden. Die rasche Weiterentwicklung von Cloud-Diensten sorgt zwar dafür, dass die Liste nicht unterstützter Elemente immer kürzer wird. Versäumen Unternehmen es allerdings, dies frühzeitig zu prüfen, kann dies erhebliche Schwierigkeiten im Geschäftsablauf nach sich ziehen. Bei der Auswahl eines geeigneten Cloud-Anbieters sollten die potenziellen Herausforderungen bereits in einem frühen Stadium geklärt werden.

2. Datenbanken bereinigen und effizient organisieren
Die Kostenvorteile in der Cloud sind bestimmt durch eine effiziente Nutzung des Speicherplatzes. Werden zum Beispiel veraltete Datenbankarchive, die in der On-Premises-Umgebung nahezu in Vergessenheit geraten sind, in die Cloud migriert, kann sich das Einsparpotential schnell in Luft auflösen. Was die Verwaltung von Datenbanken anbelangt, markiert die Cloud für Unternehmen einen Neuanfang: Um diesen reibungslos vollziehen zu können, müssen Datenbankadministratoren zunächst den Datenbestand in aufräumen, in dem sie entscheiden, welche aufbewahrt werden sollen und welche nicht mehr benötigt werden. Dadurch lässt sich nicht nur die Migration schneller vollziehen. Der Speicherplatz – und damit auch die Kosten – bleibt auf ein Minimum beschränkt. Die Dauer der einzelnen Datenbankabfragen kann damit so gering wie möglich gehalten werden, was das System äußerst flüssig arbeiten lässt.

Neben Effizienz sollten Unternehmen beim Bereinigen ihrer Daten auch dem Aspekt der Compliance besondere Aufmerksamkeit widmen. Unter Umständen gelten für manche Datenkategorien in der Cloud andere Vorschriften als bei der lokalen Speicherung. Fallen Datensätze zum Beispiel in den Geltungsbereich der DSGVO, spielt der Serverstandort des Cloud-Anbieters eine entscheidende Rolle. Im Zuge dessen muss auch geprüft werden, inwieweit das Schutzniveau für sensible Daten ausreichend ist oder ob zusätzliche Maßnahmen erforderlich sind.

3. Datenherkunft und -verarbeitungswege dokumentieren
Mit der Datenbereinigung ist unweigerlich eine umfangreiche Dokumentation verbunden. Die Erfahrungen aus der Praxis zeigen leider, dass diese nur in wenigen Unternehmen in ausreichendem Umfang betrieben wird. Steht die Migration in die Cloud an, ist eine umfangreiche Dokumentation, in der die Herkunft aller Daten im System dargelegt ist, hingegen von essenzieller Bedeutung. Es gilt zu klären, woher einzelne Daten stammen und welche Stationen sie seit ihrer Erstellung durchlaufen haben. Beispielsweise können Daten ihren Ursprung in einem POS-System haben, das Daten in Flat Files speichert, die dann jede Nacht auf einen SQL-Server mit Zwischenspeicherung verschoben werden. Anschließend werden die Daten bereinigt, transformiert und mit Hilfe eines Python-Programms vom Staging-Server in die Produktionsdatenbank übertragen. Schließlich werden die Daten in der Produktionsdatenbank verschoben und auf einem Data Warehouse-Server aggregiert, wo die Endbenutzer ihre eigenen Berichte und Analysen ausführen können. Bei diesem beispielhaften System verfügt die Datenherkunft über eine Tiefe von vier Stufen beziehungsweise fünf, wenn man auch alle Endbenutzerberichte und -analysen mitzählt.

Hintergrund einer eingehenden Dokumentation ist die Frage, ob Daten vor der Migration in die Cloud modifiziert werden müssen – denn nicht alle Aspekte von On-Premises-gespeicherten Daten eignen sich für die Cloud. Sofern also Daten existieren, die besser weiterhin lokal aufbewahrt werden müssen, hilft die Dokumentation dabei, zu überblicken, welche Daten verschoben werden müssen und welche nicht.

4. Altes und neues System im Parallelbetrieb halten
Während der Migration selbst gibt es zwei Hauptaspekte zu berücksichtigen: Den ETL-Prozess (Extrahieren, Transformieren, Laden) der Daten und andererseits die Anwendungen, die beide parallel zwischen dem alten und dem neuen System betrieben werden müssen. Für ETL können Unternehmen die Daten auf das neue Cloud-System replizieren lassen, während die Benutzer noch in der lokalen Umgebung mit den vorhandenen Daten arbeiten.

Für die Anwendungen bestehen zwei Möglichkeiten. Die einfachste Variante wäre, in nur einem Schritt von der alten, lokal installierten Anwendung mit verbundener Datenbank auf die neue Cloud-Anwendung und der damit verbundenen Datenbank zu wechseln. In der überwältigenden Mehrheit der Fälle ist dies jedoch unmöglich. Daher müssen die DBA-Teams verstehen, wie ihre aktuellen Anwendungen konfiguriert sind, damit sie den Programmiercode für die Cloud neu schreiben können. Dabei muss jede Anwendungsschicht exakt repliziert werden. Häufig müssen sie neuen Code hinzufügen, um Cloud-native Funktionen ohne Einbußen nutzen zu können. Es ist für Datenbankadministratoren (DBAs) und die Mitarbeiter der Fachabteilungen, die die Anwendung verwenden, von entscheidender Bedeutung, die beiden Systeme im Anschluss gegeneinander zu testen, da einige lokale Anwendungen möglicherweise leicht hinter der aktualisierten Version, die für die Cloud neu geschrieben wurde, zurückbleiben oder leicht andere berechnete Werte liefern können.

5. Umfangreiches Testen vor Abschluss der Migration
Ein häufiges Problem bei Cloud-Migrationen ist, dass Teams ihr Cloud-System nach der Bereitstellung nicht überwachen und folglich erst nach Eintreffen der monatlichen Rechnung feststellen, dass sie die regulären Kosten dramatisch überschreiten. Sobald also das Cloud Computing-System betriebsbereit ist, besteht die wichtigste Aufgabe darin, im Parallelbetrieb das neue System gegen das alte zu testen, um sicherzustellen, dass Abfragen und Transaktionen in beiden Systemen identische Ergebnisse liefern. Für eine bestimmte Übergangszeit sollten IT-Teams beide Systeme eingehend überwachen, eine Reihe an Tests durchführen und entsprechende Reports erstellen. Auch regelmäßige routinemäßige Tests – wie Monats-, Quartals- oder Jahresreports - sollten versuchsweise durchgeführt werden. Viele Berichtsprozesse erfordern während der Verarbeitung nämlich zusätzliche CPU, IO und Speicherplatz. Wird bereits in der Testphase geprüft, ob derartige Prozesse reibungslos klappen, können IT-Teams sicherstellen, dass sie am Ende eines Reportzeitraums in der Cloud keine bösen Überraschungen erleben. Erst wenn dieser Punkt erreicht ist, kann die endgültige Migration in die Cloud vollzogen werden.

Bei der Migration von Datenbanken in die Cloud, geht es im Wesentlichen darum, einen Fehler zu vermeiden: Davon auszugehen, dass alle lokalen Funktionen auch selbstverständlich in der Cloud verfügbar sind. Stattdessen müssen Unternehmen zunächst die Datenbankverwaltung auf dem bestehenden System eingehend evaluieren. Damit schaffen sie die geeigneten Voraussetzungen für eine gelungene Migration und einen reibungslosen Datenbankbetrieb aus der Cloud. (SentryOne: ra)

eingetragen: 10.08.20
Newsletterlauf: 28.09.20

SentyOne: Kontakt und Steckbrief

Der Informationsanbieter hat seinen Kontakt leider noch nicht freigeschaltet.


Kostenloser PMK-Verlags-Newsletter
Ihr PMK-Verlags-Newsletter hier >>>>>>



Meldungen: Tipps und Hinweise

  • Private AI verfolgt einen Plattform-Ansatz

    Der Einzug der generativen KI (GenAI) in die breite Öffentlichkeit hat das KI-Wachstum in Unternehmen vergangenes Jahr beschleunigt. Motiviert durch Wettbewerbsdruck und potenzielle Vorteile forcieren Unternehmen und Regierungen ihre KI-Strategie.

  • Mangelnde Vorbereitung auf SaaS-Ausfälle

    Der Hycu State of SaaS Resilience 2024 Report deckte zuletzt kritische Datensicherungslücken auf, da 70 Prozent der Unternehmen Datenverluste erleiden. Trotzdem verlassen sich 60 Prozent immer noch auf ihre Software-as-a-Service (SaaS)-Anbieter, um sich zu schützen, und setzen sich damit weiteren Risiken aus.

  • KI gewinnbringend einsetzen

    Das KI-Potenzial ist praktisch unerschöpflich. Doch um es richtig zu nutzen und daraus echte Wettbewerbsvorteile zu generieren, muss vorab die Bereitschaft des Unternehmens dafür geklärt werden. Der IT-Dienstleister CGI erklärt, warum der Readiness-Check so wichtig ist, was er genau analysiert und was mit den daraus gewonnenen Erkenntnissen passiert.

  • Herausforderungen von Edge AI

    Künstliche Intelligenz hat längst den Netzwerkrand erreicht. Um zeitkritischen Daten den Umweg über die Cloud und das Rechenzentrum zu ersparen, bringen Edge-AI-Lösungen Modelle direkt in die Anwendungen vor Ort. Dieser Weg bietet immense Vorteile - er ist aber auch mit einigen Stolpersteinen gepflastert, wie Couchbase, Anbieter einer Cloud-Datenbankplattform, zeigt.

  • Cloud-Datenschutz im Gesundheitswesen

    Daten im Gesundheitswesen gehören zu den kritischsten Vermögenswerten. Sie umfassen hochsensible Informationen wie Krankengeschichten, Behandlungsunterlagen und persönliche Daten. Der Schutz dieser Daten ist von größter Bedeutung, da sie durch nationale und globale Vorschriften als besondere Kategorien personenbezogener Daten eingestuft werden.

  • Generative KI mit Serverless optimieren

    Der Einsatz von generativer KI kann komplex und teuer sein. Serverlose Cloud-Dienste und Vektordatenbanken bieten eine Lösung, um diese Hürden zu überwinden und KI-Anwendungen effizient und skalierbar zu gestalten.

  • Sensible Daten in der Cloud schützen

    Wenn Unternehmen in der Cloud geistiges Eigentum oder persönliche Informationen verlieren, drohen ihnen erhebliche Konsequenzen. Mit den richtigen Maßnahmen für Datensicherheit in der Cloud können sie zuverlässig Vorsorge treffen. Forcepoint erläutert die fünf wichtigsten davon. Datensicherheit in der Cloud wird für Unternehmen zunehmend zu einem kritischen Bestandteil ihrer IT-Infrastruktur.

  • Dank der Cloud: Flexibilität und Skalierbarkeit

    Cloud-Marktplätze sind heute zu einem unverzichtbaren Dreh- und Angelpunkt für unabhängige Softwareanbieter (ISVs) geworden, um ihre Reichweite zu vergrößern, den Verkaufsprozess zu rationalisieren und Wachstum zu fördern. Erfolg ist jedoch nicht allein dadurch garantiert, dass ein Produkt auf einem Marktplatz gelistet ist.

  • Beste Rendite für Serverinvestitionen?

    Laut Statista schätzen IT-Experten weltweit im Jahr 2024 eine Aufteilung von fast 50/50 zwischen Onsite- und Cloud-gehosteten Servern in ihren Unternehmen. Aufgrund der riesigen Datenmengen und der zunehmenden Nutzung von KI, werden künftig immer mehr Server benötigt.

  • Digitale Transformation kommt nicht ins Rollen?

    Dass die Digitalisierung unaufhaltsam voranschreitet, ist keine Neuigkeit mehr, trotzdem haben bislang viele deutsche Unternehmen den entscheidenden Schritt zur digitalen Transformation noch nicht gewagt. Die Corona-Pandemie hat als Katalysator für einen Digitalisierungsschub gesorgt und viele Prozesse auf den Prüfstand gestellt.

Wir verwenden Cookies um unsere Website zu optimieren und Ihnen das bestmögliche Online-Erlebnis zu bieten. Mit dem Klick auf "Alle akzeptieren" erklären Sie sich damit einverstanden. Erweiterte Einstellungen