28.11.2014 Aufrufe

Patagonia - Ein Mehrbenutzer-Cluster für Forschung ... - ETH Zürich

Patagonia - Ein Mehrbenutzer-Cluster für Forschung ... - ETH Zürich

Patagonia - Ein Mehrbenutzer-Cluster für Forschung ... - ETH Zürich

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>Patagonia</strong> - <strong>Ein</strong> <strong>Mehrbenutzer</strong>-<strong>Cluster</strong> <strong>für</strong><br />

<strong>Forschung</strong> und Lehre<br />

Felix Rauch<br />

Christian Kurmann, Blanca Maria Müller-Lagunez,<br />

Thomas M. Stricker<br />

Institut <strong>für</strong> Computersysteme<br />

<strong>ETH</strong> <strong>Zürich</strong><br />

Eidgenössische<br />

Technische Hochschule<br />

<strong>Zürich</strong><br />

25. März 1999<br />

1


<strong>Forschung</strong>scluster<br />

Bild: Distributed ASCI Supercomputer von Henri E. Bal<br />

2


Charakteristiken eines<br />

<strong>Forschung</strong>sclusters<br />

• Schnelle Prozessoren (1 - 4 pro Knoten)<br />

• Grosser Speicher (Haupt und Massenspeicher)<br />

• Leistungsfähiges Netzwerk (Switches und Gigabit/s)<br />

• Benutzungsmuster:<br />

Tagsüber Entwicklung - Nachts Experimente<br />

3


Schulungscluster<br />

Bild: <strong>Patagonia</strong> <strong>Cluster</strong> <strong>ETH</strong> <strong>Zürich</strong><br />

4


Charakteristiken eines<br />

Schulungsclusters<br />

• Grosse Festplatten <strong>für</strong> umfangreiche Softwareinstallationen<br />

• Betriebssysteme in Grundkonfiguration und spezieller<br />

Konfiguration<br />

• Grosse räumliche Ausdehnung<br />

• Systemsicherheit:<br />

• Installation und Daten vor Studenten<br />

• Hardware vor Diebstahl<br />

• Benutzungsmuster: Ausschliesslich tagsüber<br />

5


<strong>Mehrbenutzer</strong>-<strong>Cluster</strong><br />

Beobachtung:<br />

Beide <strong>Cluster</strong> haben ähnliche Anforderungen, aber<br />

unterschiedliche Nutzungsmuster<br />

These:<br />

<strong>Ein</strong> einziger <strong>Cluster</strong> genügt<br />

6


• Motivation<br />

Inhalt<br />

• Klassen von PC-Betriebssystemen bzgl. Sicherheit<br />

• Hardware des <strong>Patagonia</strong>-<strong>Cluster</strong>s<br />

• Technologien <strong>für</strong> <strong>Patagonia</strong>:<br />

• Multi-boot / Betriebssysteme<br />

• Installation durch Klonen<br />

• Sicherheit / Unterhalt<br />

• Performance Evaluation (Images Klonen)<br />

• Schlussfolgerungen<br />

7


Klassifikation von PC Betriebssystemen<br />

Oberon<br />

MacOS 8.x<br />

Windows 9x<br />

Netzwerkfähigkeit o o o + +<br />

Sicherheit - - - + +<br />

Getrennter Zustand<br />

System/User Config.<br />

- - - - +<br />

Windows NT<br />

UNIX<br />

8


Hardware<br />

Raum mit 24 Maschinen:<br />

• Intel Pentium II, 400 MHz<br />

• 128 MB SDRAM<br />

• Fast Ethernet Netzwerk<br />

• 9 GB Ultra2 SCSI Festplatten<br />

Davon 16 Maschinen mit:<br />

• Zwei Prozessoren<br />

• 256 MB SDRAM<br />

• Gigabit Ethernet<br />

9


System-Software<br />

Schulung:<br />

• Windows NT Deutsch<br />

• Windows NT Englisch<br />

• Oberon<br />

<strong>Forschung</strong>:<br />

• Linux<br />

• Windows NT<br />

• Oberon<br />

10


Boot-Manager System Commander<br />

11


Installation<br />

Partitionierung<br />

• Boot-Partition<br />

0.020 GB<br />

• Partitionen <strong>für</strong> Windows NT 4.0 Edu 2 x 2.0 GB<br />

• Partitionen <strong>für</strong> Windows NT Research 2.5 GB<br />

• Partition <strong>für</strong> Linux<br />

1.0 GB<br />

• Partitionen <strong>für</strong> Oberon 2 x 0.1 GB<br />

• Reservepartition (Solaris, Oracle usw...) 1.0 GB<br />

• Kleine LINUX Service-Partition<br />

0.25 GB<br />

(wünschenswert)<br />

ca. 9 GB<br />

12


Installation<br />

Replikation durch “Klonen”<br />

• Erstinstallation<br />

1. Erstellen einer Master-Platte<br />

2. Blockweises Kopieren der Master-Platte<br />

• Klonen einzelner Images / Partitionen<br />

1. Service-Betriebssystem Booten<br />

2. Blockweises Kopieren der Images über Netzwerk<br />

13


Konfiguration<br />

Konfiguration der maschinenspezifischen Parameter<br />

(IP Nummer, Hostname, Hostid)<br />

• Manuell<br />

• Automatisch über DHCP (mit Server)<br />

• Automatisch anhand der Ethernet MAC-Adresse<br />

mittels Tabelle<br />

DHCP = Dynamic Host Configuration Protocol<br />

MAC = Media Access Control<br />

14


Sicherheit<br />

Ziel: Sicherheit ohne Behinderung der Benutzer<br />

Wird erreicht durch drei Stufen:<br />

1 Booten mit System Commander<br />

2 Partitionen voreinander schützen und verstecken<br />

• Sperren mit Device Lock und Neuzuweisung zum<br />

Laufwerksbuchstabe C (Windows NT)<br />

• Mount-Tabellen (UNIX)<br />

• Schreibgeschützte Partitionen plus Ramdisk<br />

(Oberon)<br />

3 Verwendung von Zugriffsrechten und<br />

Autorisation bei zentralem Server<br />

15


Unterhalt<br />

• <strong>Cluster</strong> Administration Tool erlaubt Überblick über <strong>Cluster</strong><br />

und remote boot<br />

• Schnelles Netzwerk hilft bei Restauration von Partitionen<br />

und Updates<br />

16


Netzwerkkonten <strong>für</strong> UNIX und Windows NT<br />

Leistungsfähiger Sun-Server <strong>für</strong>:<br />

• Home-Verzeichnisse über SMB (mit Samba) bzw.<br />

NFS vom Sun-Server<br />

• Autorisierung über speziellen Windows NT-Server<br />

(NT-Clients) bzw. NIS vom Sun-Server (UNIX-Clients)<br />

Konten-Generierung auf UNIX - Übername auf NT mit Scripts<br />

Passwort-Synchronisation mit kommerziellem Programm<br />

Passync<br />

SMB = Server Message Block Protocol<br />

NFS = Network File System<br />

NIS = Network Information Service (früher yellow pages)<br />

17


Technische Limiten<br />

• Schreiben auf Ultra2 SCSI Platte<br />

(Seagate Cheetah write avg)<br />

• Lesen von lokaler Festplatte<br />

(Seagate Cheetah read avg)<br />

• Lesen von remote Files (NFS)<br />

(via UDP über Gigabit/s Ethernet)<br />

• Dekomprimieren eines Images<br />

(gunzip >/dev/null mit 400MHz)<br />

• Übertragung Punkt zu Punkt<br />

(Gigabit Ethernet via TCP)<br />

• Totale Kapazität im Ethernet Switch<br />

ca. 20 MByte/s<br />

ca. 16 MByte/s<br />

21 MByte/s<br />

12 MByte/s<br />

40 MByte/s<br />

>3 GByte/s<br />

18


Performance Evaluation (Klonen)<br />

Netzwerk-Topologie Fast Ethernet<br />

C<br />

C<br />

C C C C C C<br />

C<br />

C<br />

C C C C C C<br />

C<br />

C<br />

C C C C C S<br />

Hub Hub Hub Hub<br />

Switch<br />

19


Ausführungszeiten Klonen<br />

3500<br />

Execution Time [s]<br />

3000<br />

2500<br />

2000<br />

1500<br />

1000<br />

500<br />

0<br />

▲▲ ✕✕<br />

▲<br />

✕<br />

✦<br />

✦<br />

●<br />

✕<br />

✕<br />

▲<br />

▲<br />

✕<br />

✕<br />

✕<br />

▲<br />

✦<br />

●<br />

Fast Ethernet<br />

star/compressed<br />

Gigabit Ethernet<br />

star/compressed<br />

Fast Ethernet<br />

star/raw<br />

1 2<br />

5<br />

10<br />

15<br />

20<br />

Gigabit Ethernet<br />

star/raw<br />

Number of Nodes<br />

Windows NT Partition über NFS<br />

(2 GB raw, 1 GB compressed)<br />

22


Auswirkungen der Hub/Switch-Topologie<br />

Execution Time [s]<br />

2500<br />

2000<br />

1500<br />

1000<br />

500<br />

0<br />

Gigabit Ethernet<br />

(Pure-Switch)<br />

Fast Ethernet<br />

(Hub-Switch)<br />

10 nodes<br />

Fast Ethernet<br />

(Hub-Switch)<br />

20 nodes<br />

23


Totale Schreib-Bandbreite<br />

Aggregate Bandwidth [MByte/s]<br />

140<br />

●<br />

120<br />

100<br />

●<br />

80<br />

60<br />

●<br />

40<br />

■<br />

■<br />

20 ■<br />

▼■ ▼■<br />

▼ ▼ ▼<br />

● ●<br />

0<br />

0 5 10 15 20<br />

Number of Nodes<br />

●<br />

▼<br />

■<br />

Gigabit Ethernet<br />

multi-drop/raw<br />

Fast Ethernet<br />

star/compressed<br />

Gigabit Ethernet<br />

star/compressed<br />

24


Schlussfolgerungen<br />

• Erfolgreiche Installation und Inbetriebnahme eines<br />

universellen <strong>Cluster</strong>s <strong>für</strong> <strong>Forschung</strong> und Lehre<br />

• Erleichterung von Wartung und Installation durch:<br />

• Kleines Service-Betriebssystem<br />

• Schnelle, grosse Festplatten<br />

• Hochleistungs-Netzwerk<br />

• Multi-boot Installationen geben grosse Flexibilität<br />

• Klonen von ganzen Software Installationen als neue,<br />

interessante Anwendung von Gigabit/s Netzwerken<br />

(ausserhalb des parallelen und verteilten Rechnens)<br />

25


Performance Evaluation (Klonen)<br />

Netzwerk-Topologie Gigabit Ethernet<br />

Giga<br />

26

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!