15.02.2014 Aufrufe

Hochverfügbarer TSM Server - PROFI Engineering Systems AG

Hochverfügbarer TSM Server - PROFI Engineering Systems AG

Hochverfügbarer TSM Server - PROFI Engineering Systems AG

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

DEN <strong>TSM</strong> SERVER<br />

HOCHVERFÜGBAR MACHEN<br />

Tipps zur Realisierung


<strong>AG</strong>ENDA<br />

01 Ist eine HA-Lösung für <strong>TSM</strong> erforderlich<br />

02 Besonderheiten bei <strong>TSM</strong> Version 6<br />

03 Methoden der Absicherung des <strong>TSM</strong>-Betriebs<br />

04 Entscheidungskriterien<br />

05 Erfahrungen aus <strong>PROFI</strong>-Projekten<br />

06 Diskussion<br />

2<br />

28.10.2013<br />

WEBCast <strong>TSM</strong> hochverfügbar machen


<strong>AG</strong>ENDA<br />

01 Ist eine HA-Lösung für <strong>TSM</strong> erforderlich<br />

02 Besonderheiten bei <strong>TSM</strong> Version 6<br />

03 Methoden der Absicherung des <strong>TSM</strong>-Betriebs<br />

04 Entscheidungskriterien<br />

05 Erfahrungen aus <strong>PROFI</strong>-Projekten<br />

06 Diskussion<br />

3<br />

28.10.2013<br />

WEBCast <strong>TSM</strong> hochverfügbar machen


ANFORDERUNGEN AN DEN SERVICE ‚BACKUP‘<br />

• Datensicherung soll die erstellten Daten möglichst<br />

unauffällig lesen und sicher auf einem externen<br />

Datenträger speichern.<br />

• Der Service ‚Datensicherung‘ muss in der Lage sein,<br />

Dateien auf Anforderung wieder herstellen zu können.<br />

• Wie lange das dauern darf, hängt von den<br />

individuellen Ansprüchen der Anwender bzw. der<br />

Wertigkeit innerhalb des Produktionsbetriebes ab.<br />

• Für die normale Arbeit des IT-Anwenders ist<br />

Datensicherung nicht wirklich erforderlich.<br />

4<br />

28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen


ANFORDERUNGEN AN DEN SERVICE ‚BACKUP‘<br />

Das führt zu der Frage:<br />

Brauche ich eine HA-Lösung für <strong>TSM</strong>?<br />

5<br />

28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen


ANFORDERUNGEN AN DEN SERVICE ‚BACKUP‘<br />

• Hochverfügbarkeit unterscheidet sich allerdings von<br />

Katastrophenvorsorge!<br />

• Nach einer Katastrophe wird in der Regel eine passive<br />

Systemumgebung aktiviert.<br />

• Der Aufsetzpunkt (für Wiederherstellungen) kann<br />

dabei variieren.<br />

• Wichtig ist die Verfügbarkeit der gesicherten Daten!<br />

6<br />

28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen


ANFORDERUNGEN AN DEN SERVICE ‚BACKUP‘<br />

• Der Anspruch für eine Hochverfügbarkeit bedeutet:<br />

• Auf den Service ‚Datensicherung‘ kann nur eine kurze<br />

Zeit (< 1 Stunde?) verzichtet werden.<br />

• Wichtig ist neben der Verfügbarkeit der gesicherten<br />

Daten auch die Betriebsfähigkeit des <strong>TSM</strong>-<strong>Server</strong>s.<br />

7<br />

28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen


ANFORDERUNGEN AN DEN SERVICE ‚BACKUP‘<br />

• Wo ist Hochverfügbarkeit erforderlich<br />

• Sicherung von Datenbank-Transaktions-Logs<br />

• Archiv-Systeme mit <strong>TSM</strong> als Back-End<br />

• HSM – verwaltete Speichersysteme<br />

• Hier kann ein Ausfall des <strong>TSM</strong>-<strong>Server</strong>s zu ernsten<br />

Produktions-Störungen führen.<br />

8<br />

28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen


<strong>AG</strong>ENDA<br />

01 Ist eine HA-Lösung für <strong>TSM</strong> erforderlich<br />

02 Besonderheiten bei <strong>TSM</strong> Version 6<br />

03 Methoden der Absicherung des <strong>TSM</strong>-Betriebs<br />

04 Entscheidungskriterien<br />

05 Erfahrungen aus <strong>PROFI</strong>-Projekten<br />

06 Diskussion<br />

9<br />

28.10.2013<br />

WEBCast <strong>TSM</strong> hochverfügbar machen


BESONDERHEITEN BEI <strong>TSM</strong> V6<br />

• Der große Unterschied zur Version 5 ist die Datenbank<br />

• V5 hatte DB mit bis zu drei identischen Dateien (DB und DB-<br />

Copy), ebenso das Recovery-Log<br />

• Mit mindestens einer Version konnte gestartet werden!<br />

• V6 benutzt ein originales DB2 (Enterprise Edition)<br />

• Tablespaces und Transaktions-Logs gibt es nur einmal<br />

• Festplattenfehler führen immer zu DB2-Recovery-Aufgaben<br />

10<br />

28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen


<strong>AG</strong>ENDA<br />

01 Ist eine HA-Lösung für <strong>TSM</strong> erforderlich<br />

02 Besonderheiten bei <strong>TSM</strong> Version 6<br />

03 Methoden der Absicherung des <strong>TSM</strong>-Betriebs<br />

04 Entscheidungskriterien<br />

05 Erfahrungen aus <strong>PROFI</strong>-Projekten<br />

06 Diskussion<br />

11<br />

28.10.2013<br />

WEBCast <strong>TSM</strong> hochverfügbar machen


METHODEN ZUR ABSICHERUNG DES <strong>TSM</strong>-SERVERS<br />

• Tape Rotation 2 RZs, 2 <strong>Server</strong>, DRM zur Wiederherstellung des <strong>TSM</strong>-<br />

<strong>Server</strong>s<br />

• Datenspiegelung 2 RZs, 2 <strong>Server</strong>, Remote Volume Mirror mit Hilfe der<br />

Festplatten-Speicher<br />

• <strong>TSM</strong> Node Replication 2 RZs, 2 unabhängige <strong>TSM</strong>-<strong>Server</strong> und Storage<br />

Pools<br />

• HADR Replikation (mit <strong>TSM</strong> V6 möglich) 2 RZs, 2 <strong>TSM</strong>-<strong>Server</strong>,<br />

synchrone <strong>TSM</strong>-Datenbank<br />

• <strong>TSM</strong>-<strong>Server</strong> als geclusterte Systeme (AIX mit PowerHA, Linux mit Linux-<br />

HA)<br />

12<br />

28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen


TAPE ROTATION<br />

• Magnetbänder werden ausgelagert und transportiert<br />

• Die Entfernung zwischen den beiden Standorten ist nicht entscheidend<br />

(keine Leitungskosten, kein Bandbreiten-Problem)<br />

• Ist eine Cold-StandBy-Lösung, weil eine Wiederherstellung des <strong>TSM</strong>-<br />

<strong>Server</strong>s aus den ausgelagerten Datenbeständen einer Wiederaufnahme<br />

des <strong>TSM</strong>-Betriebs vorausgehen muss.<br />

• Ein weiteres Problem:<br />

Die manuelle Verwaltung der Bandbestände muss besonders sorgfältig<br />

erfolgen.<br />

13<br />

28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen


DATENSPIEGELUNG<br />

• Voraussetzung: RZs sind in LWL-Reichweite und die Festplattensysteme<br />

können die Daten spiegeln (PPRC, RVM o.ä.)<br />

• Am Backup-Standort muss ein <strong>Server</strong> vorgehalten werden.<br />

• Die Umschaltung beginnt mit der Aktivierung des Festplattenspiegels<br />

als aktive Seite.<br />

• Die Spiegelung muss konsistent sein (consistency groups)<br />

• Auf diese Art ist ein warmes StandBy-Szenario abbildbar, dass ohne<br />

Wiederherstellung der <strong>TSM</strong>-Datenbank auskommt.<br />

14<br />

28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen


<strong>TSM</strong> NODE REPLICATION<br />

• Voraussetzung: Zwei unabhängige <strong>TSM</strong>-<strong>Server</strong>, die über Netzwerk-<br />

Verbindungen miteinander in Kontakt treten können.<br />

• Die Replikation erfolgt auf Basis von <strong>TSM</strong> Nodes<br />

• Management-Regeln können differieren, viele Spielarten sind damit<br />

möglich.<br />

• Die verfügbare Netzwerk-Bandbreite zwischen den beiden <strong>Server</strong>n<br />

bestimmt die Leistungs-Fähigkeit.<br />

• Der gesicherte Client kennt nur einen <strong>Server</strong>. Das soll sich aber in<br />

Zukunft ändern.<br />

15<br />

28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen


HADR REPLIKATION<br />

• Voraussetzung: Zwei unabhängige <strong>TSM</strong>-<strong>Server</strong>, die über Netzwerk-<br />

Verbindungen miteinander in Kontakt treten können.<br />

• HADR (high availability disaster recovery) ist eine Funktion des DB2 und<br />

stellt die Replikation der <strong>TSM</strong> Datenbank durch DB2 Log-Shipping zur<br />

Verfügung.<br />

• Auf dem zweiten <strong>TSM</strong>-<strong>Server</strong> läuft eine DB2-Datenbank-Instanz, die von<br />

der primären Datenbank synchron gehalten wird.<br />

• Für die Einrichtung sind Eingriffe in die DB2-Konfiguration der <strong>TSM</strong>-<br />

<strong>Server</strong> notwendig.<br />

• Die Replikation betrifft nur die Datenbank. Die Verfügbarkeit der Storage<br />

Pools ist gesondert zu betrachten.<br />

16<br />

28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen


<strong>TSM</strong>-SERVER ALS GECLUSTERTE SYSTEME<br />

• Voraussetzung:<br />

Software zur Verwaltung der Cluster-Ressourcen (<strong>TSM</strong>, Speicher,<br />

Netzwerk-Adressen) und gemeinsam nutzbare Datenspeicher-Einheiten.<br />

• <strong>TSM</strong>, die Storage-Pools und die <strong>Server</strong>-Adresse werden als Cluster-<br />

Ressourcen zwischen mehreren gleichartigen <strong>Server</strong>-Systemen<br />

geschwenkt.<br />

• Die Cluster-Verwaltung übernimmt die Steuerung.<br />

• Wenige bzw. keine manuellen Eingriffe für die Umschaltung erforderlich.<br />

17<br />

28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen


<strong>AG</strong>ENDA<br />

01 Ist eine HA-Lösung für <strong>TSM</strong> erforderlich<br />

02 Besonderheiten bei <strong>TSM</strong> Version 6<br />

03 Methoden der Absicherung des <strong>TSM</strong>-Betriebs<br />

04 Entscheidungskriterien<br />

05 Erfahrungen aus <strong>PROFI</strong>-Projekten<br />

06 Diskussion<br />

18<br />

28.10.2013<br />

WEBCast <strong>TSM</strong> hochverfügbar machen


DIE VERSCHIEDENEN SZENARIEN<br />

Ausfall Cluster HADR Node Replikation Festplatten-Spiegel Tape Rotation<br />

<strong>Server</strong>-Hardware<br />

X<br />

Festplatte für <strong>TSM</strong> DB X X X X<br />

RZ-Raum (X) X X X X<br />

notwendige Aktionen<br />

Crash Recovery<br />

der Datenbank<br />

Crash Recovery<br />

und Audit der<br />

Storage Pools<br />

Crash Recovery und Audit<br />

der Storage Pools<br />

Restore der <strong>TSM</strong> DB,<br />

Audit der Storage<br />

Pools<br />

19<br />

28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen


<strong>AG</strong>ENDA<br />

01 Ist eine HA-Lösung für <strong>TSM</strong> erforderlich<br />

02 Besonderheiten bei <strong>TSM</strong> Version 6<br />

03 Methoden der Absicherung des <strong>TSM</strong>-Betriebs<br />

04 Entscheidungskriterien<br />

05 Beispiele aus <strong>PROFI</strong>-Projekten<br />

06 Diskussion<br />

20<br />

28.10.2013<br />

WEBCast <strong>TSM</strong> hochverfügbar machen


<strong>PROFI</strong> – ERFAHRUNGEN MIT HADR<br />

Die schlechte Nachricht zuerst:<br />

HADR ist nur sehr bedingt geeignet<br />

<strong>TSM</strong> weiß nichts von DB2<br />

DB2 weiß nichts von <strong>TSM</strong> (und seinen Besonderheiten)<br />

Start und Stop von DB2 passiert im <strong>TSM</strong> – Start bzw. Stop<br />

Ein Stop des <strong>TSM</strong>-<strong>Server</strong>s (geplant oder ungeplant) unterbricht die<br />

HADR Partnerschaft (db2stop force !!)<br />

21<br />

28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen


BEISPIEL MIT NODE REPLIKATION<br />

Kunde: Photo-Dienstleister<br />

• 2 RZs (innerhalb der Stadtgrenzen)<br />

• 10Gb/s Bandbreite zwischen den Standorten<br />

• Je einen <strong>TSM</strong>-<strong>Server</strong> in jedem RZ<br />

• Diskpools im RZ1 (rd. 120 TB, 70% used), Tape-Library im RZ2<br />

• Das tägliche Sicherungs-Volumen kann zeitlich problemlos repliziert werden ( Bandbreite ! )<br />

• Bei Ausfall des Haupt-<strong>Server</strong>s müssen vor einem Restore die Options-Dateien geändert<br />

werden ( wird vielleicht in Zukunft nicht mehr nötig sein )<br />

• Keine COPYPOOLS ! Bei Ausfall des Diskpools müssen alle Daten zurück repliziert werden<br />

• Empfehlung:<br />

• Copypools auf der primären Seite mit einplanen.<br />

• Für geeignet große Bandbreite sorgen<br />

22<br />

28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen


BEISPIEL MIT FESTPLATTENSPIEGELUNG<br />

Kunde: Zeitungsverlag<br />

• Hauptanwendung: SAP System mit Sicherung über TDP for ERP<br />

• 2 Rechnerräume (im gleichen Gebäude)<br />

• SAN LWL-Verkabelung zwischen den RZs<br />

• Je einen <strong>TSM</strong>-<strong>Server</strong> in jedem RZ<br />

• Diskpools im RZ1, Tape-Library im RZ2<br />

• DB-Instanz über zwei Festplattensysteme V7000 mit LVM gespiegelt<br />

• Linux-HA Cluster<br />

• DB2 Volumegruppe und Diskpools sind Cluster-Ressourcen<br />

• Einarbeitung in Linux-HA ist etwas aufwändiger<br />

• System läuft seit mehreren Monaten störungsfrei<br />

• Empfehlung:<br />

• Copypool-Tapes auslagern<br />

23<br />

28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen


BEISPIEL MIT SHARED DISK<br />

Kunde: Fernsehsender<br />

• Hauptanwendung: HSM-Archiv für Videodaten<br />

• 2 Rechnerräume (auf dem Campus – 500m Entfernung)<br />

• SAN LWL-Verkabelung zwischen den RZs<br />

• GPFS – Cluster aus drei Knoten ,Linux-HA Cluster über diesen GPFS-Cluster<br />

• <strong>TSM</strong>-<strong>Server</strong> ist Cluster Ressource<br />

• DB-Instanz auf GPFS-Filesystem<br />

• Kleine Diskpools, Backup und HSM-Archiv auf getrennte Tape Libraries<br />

• Linux-HA-Umgebung ist aufwändig (drei Knoten, viele Ressourcen, Anspruch auf<br />

bedienerlosen Betrieb)<br />

• System läuft schon seit mehreren Jahren so (früher schon mit V5)<br />

• Empfehlung:<br />

• Trennung der Cluster-Nodes – Verteilung auf verschiedene <strong>Server</strong>-Räume<br />

24<br />

28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen


ZUSAMMENFASSUNG<br />

Meine Empfehlungen<br />

• Wenn SAN-Verbindung zwischen den <strong>TSM</strong>-<strong>Server</strong>n möglich ist<br />

• <strong>TSM</strong> DB-Instanz als GPFS-Filesystem oder LVM-Spiegel über zwei<br />

Festplattensysteme<br />

• <strong>TSM</strong> als Cluster-System<br />

• Bei ausreichender Netzwerk-Bandbreite zwischen den <strong>TSM</strong>-<strong>Server</strong>n<br />

• Node-Replikation (uni- oder bi-direktional)<br />

• Copy-Pools auch auf der primären <strong>Server</strong>-Seite<br />

25<br />

28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen


<strong>AG</strong>ENDA<br />

01 Ist eine HA-Lösung für <strong>TSM</strong> erforderlich<br />

02 Besonderheiten bei <strong>TSM</strong> Version 6<br />

03 Methoden der Absicherung des <strong>TSM</strong>-Betriebs<br />

04 Entscheidungskriterien<br />

05 Beispiele aus <strong>PROFI</strong>-Projekten<br />

06 Diskussion<br />

26<br />

28.10.2013<br />

WEBCast <strong>TSM</strong> hochverfügbar machen


VIELEN DANK FÜR<br />

IHRE AUFMERKSAMKEIT<br />

ROLF MEYER<br />

SENIOR SYSTEMINGENIEUR<br />

TEL: 040-636699-0<br />

EMAIL: R.MEYER@<strong>PROFI</strong>-<strong>AG</strong>.DE

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!