Patagonia - Ein Mehrbenutzer-Cluster für Forschung ... - ETH Zürich
Patagonia - Ein Mehrbenutzer-Cluster für Forschung ... - ETH Zürich
Patagonia - Ein Mehrbenutzer-Cluster für Forschung ... - ETH Zürich
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>Patagonia</strong> - <strong>Ein</strong> <strong>Mehrbenutzer</strong>-<strong>Cluster</strong> <strong>für</strong><br />
<strong>Forschung</strong> und Lehre<br />
Felix Rauch<br />
Christian Kurmann, Blanca Maria Müller-Lagunez,<br />
Thomas M. Stricker<br />
Institut <strong>für</strong> Computersysteme<br />
<strong>ETH</strong> <strong>Zürich</strong><br />
Eidgenössische<br />
Technische Hochschule<br />
<strong>Zürich</strong><br />
25. März 1999<br />
1
<strong>Forschung</strong>scluster<br />
Bild: Distributed ASCI Supercomputer von Henri E. Bal<br />
2
Charakteristiken eines<br />
<strong>Forschung</strong>sclusters<br />
• Schnelle Prozessoren (1 - 4 pro Knoten)<br />
• Grosser Speicher (Haupt und Massenspeicher)<br />
• Leistungsfähiges Netzwerk (Switches und Gigabit/s)<br />
• Benutzungsmuster:<br />
Tagsüber Entwicklung - Nachts Experimente<br />
3
Schulungscluster<br />
Bild: <strong>Patagonia</strong> <strong>Cluster</strong> <strong>ETH</strong> <strong>Zürich</strong><br />
4
Charakteristiken eines<br />
Schulungsclusters<br />
• Grosse Festplatten <strong>für</strong> umfangreiche Softwareinstallationen<br />
• Betriebssysteme in Grundkonfiguration und spezieller<br />
Konfiguration<br />
• Grosse räumliche Ausdehnung<br />
• Systemsicherheit:<br />
• Installation und Daten vor Studenten<br />
• Hardware vor Diebstahl<br />
• Benutzungsmuster: Ausschliesslich tagsüber<br />
5
<strong>Mehrbenutzer</strong>-<strong>Cluster</strong><br />
Beobachtung:<br />
Beide <strong>Cluster</strong> haben ähnliche Anforderungen, aber<br />
unterschiedliche Nutzungsmuster<br />
These:<br />
<strong>Ein</strong> einziger <strong>Cluster</strong> genügt<br />
6
• Motivation<br />
Inhalt<br />
• Klassen von PC-Betriebssystemen bzgl. Sicherheit<br />
• Hardware des <strong>Patagonia</strong>-<strong>Cluster</strong>s<br />
• Technologien <strong>für</strong> <strong>Patagonia</strong>:<br />
• Multi-boot / Betriebssysteme<br />
• Installation durch Klonen<br />
• Sicherheit / Unterhalt<br />
• Performance Evaluation (Images Klonen)<br />
• Schlussfolgerungen<br />
7
Klassifikation von PC Betriebssystemen<br />
Oberon<br />
MacOS 8.x<br />
Windows 9x<br />
Netzwerkfähigkeit o o o + +<br />
Sicherheit - - - + +<br />
Getrennter Zustand<br />
System/User Config.<br />
- - - - +<br />
Windows NT<br />
UNIX<br />
8
Hardware<br />
Raum mit 24 Maschinen:<br />
• Intel Pentium II, 400 MHz<br />
• 128 MB SDRAM<br />
• Fast Ethernet Netzwerk<br />
• 9 GB Ultra2 SCSI Festplatten<br />
Davon 16 Maschinen mit:<br />
• Zwei Prozessoren<br />
• 256 MB SDRAM<br />
• Gigabit Ethernet<br />
9
System-Software<br />
Schulung:<br />
• Windows NT Deutsch<br />
• Windows NT Englisch<br />
• Oberon<br />
<strong>Forschung</strong>:<br />
• Linux<br />
• Windows NT<br />
• Oberon<br />
10
Boot-Manager System Commander<br />
11
Installation<br />
Partitionierung<br />
• Boot-Partition<br />
0.020 GB<br />
• Partitionen <strong>für</strong> Windows NT 4.0 Edu 2 x 2.0 GB<br />
• Partitionen <strong>für</strong> Windows NT Research 2.5 GB<br />
• Partition <strong>für</strong> Linux<br />
1.0 GB<br />
• Partitionen <strong>für</strong> Oberon 2 x 0.1 GB<br />
• Reservepartition (Solaris, Oracle usw...) 1.0 GB<br />
• Kleine LINUX Service-Partition<br />
0.25 GB<br />
(wünschenswert)<br />
ca. 9 GB<br />
12
Installation<br />
Replikation durch “Klonen”<br />
• Erstinstallation<br />
1. Erstellen einer Master-Platte<br />
2. Blockweises Kopieren der Master-Platte<br />
• Klonen einzelner Images / Partitionen<br />
1. Service-Betriebssystem Booten<br />
2. Blockweises Kopieren der Images über Netzwerk<br />
13
Konfiguration<br />
Konfiguration der maschinenspezifischen Parameter<br />
(IP Nummer, Hostname, Hostid)<br />
• Manuell<br />
• Automatisch über DHCP (mit Server)<br />
• Automatisch anhand der Ethernet MAC-Adresse<br />
mittels Tabelle<br />
DHCP = Dynamic Host Configuration Protocol<br />
MAC = Media Access Control<br />
14
Sicherheit<br />
Ziel: Sicherheit ohne Behinderung der Benutzer<br />
Wird erreicht durch drei Stufen:<br />
1 Booten mit System Commander<br />
2 Partitionen voreinander schützen und verstecken<br />
• Sperren mit Device Lock und Neuzuweisung zum<br />
Laufwerksbuchstabe C (Windows NT)<br />
• Mount-Tabellen (UNIX)<br />
• Schreibgeschützte Partitionen plus Ramdisk<br />
(Oberon)<br />
3 Verwendung von Zugriffsrechten und<br />
Autorisation bei zentralem Server<br />
15
Unterhalt<br />
• <strong>Cluster</strong> Administration Tool erlaubt Überblick über <strong>Cluster</strong><br />
und remote boot<br />
• Schnelles Netzwerk hilft bei Restauration von Partitionen<br />
und Updates<br />
16
Netzwerkkonten <strong>für</strong> UNIX und Windows NT<br />
Leistungsfähiger Sun-Server <strong>für</strong>:<br />
• Home-Verzeichnisse über SMB (mit Samba) bzw.<br />
NFS vom Sun-Server<br />
• Autorisierung über speziellen Windows NT-Server<br />
(NT-Clients) bzw. NIS vom Sun-Server (UNIX-Clients)<br />
Konten-Generierung auf UNIX - Übername auf NT mit Scripts<br />
Passwort-Synchronisation mit kommerziellem Programm<br />
Passync<br />
SMB = Server Message Block Protocol<br />
NFS = Network File System<br />
NIS = Network Information Service (früher yellow pages)<br />
17
Technische Limiten<br />
• Schreiben auf Ultra2 SCSI Platte<br />
(Seagate Cheetah write avg)<br />
• Lesen von lokaler Festplatte<br />
(Seagate Cheetah read avg)<br />
• Lesen von remote Files (NFS)<br />
(via UDP über Gigabit/s Ethernet)<br />
• Dekomprimieren eines Images<br />
(gunzip >/dev/null mit 400MHz)<br />
• Übertragung Punkt zu Punkt<br />
(Gigabit Ethernet via TCP)<br />
• Totale Kapazität im Ethernet Switch<br />
ca. 20 MByte/s<br />
ca. 16 MByte/s<br />
21 MByte/s<br />
12 MByte/s<br />
40 MByte/s<br />
>3 GByte/s<br />
18
Performance Evaluation (Klonen)<br />
Netzwerk-Topologie Fast Ethernet<br />
C<br />
C<br />
C C C C C C<br />
C<br />
C<br />
C C C C C C<br />
C<br />
C<br />
C C C C C S<br />
Hub Hub Hub Hub<br />
Switch<br />
19
Ausführungszeiten Klonen<br />
3500<br />
Execution Time [s]<br />
3000<br />
2500<br />
2000<br />
1500<br />
1000<br />
500<br />
0<br />
▲▲ ✕✕<br />
▲<br />
✕<br />
✦<br />
✦<br />
●<br />
✕<br />
✕<br />
▲<br />
▲<br />
✕<br />
✕<br />
✕<br />
▲<br />
✦<br />
●<br />
Fast Ethernet<br />
star/compressed<br />
Gigabit Ethernet<br />
star/compressed<br />
Fast Ethernet<br />
star/raw<br />
1 2<br />
5<br />
10<br />
15<br />
20<br />
Gigabit Ethernet<br />
star/raw<br />
Number of Nodes<br />
Windows NT Partition über NFS<br />
(2 GB raw, 1 GB compressed)<br />
22
Auswirkungen der Hub/Switch-Topologie<br />
Execution Time [s]<br />
2500<br />
2000<br />
1500<br />
1000<br />
500<br />
0<br />
Gigabit Ethernet<br />
(Pure-Switch)<br />
Fast Ethernet<br />
(Hub-Switch)<br />
10 nodes<br />
Fast Ethernet<br />
(Hub-Switch)<br />
20 nodes<br />
23
Totale Schreib-Bandbreite<br />
Aggregate Bandwidth [MByte/s]<br />
140<br />
●<br />
120<br />
100<br />
●<br />
80<br />
60<br />
●<br />
40<br />
■<br />
■<br />
20 ■<br />
▼■ ▼■<br />
▼ ▼ ▼<br />
● ●<br />
0<br />
0 5 10 15 20<br />
Number of Nodes<br />
●<br />
▼<br />
■<br />
Gigabit Ethernet<br />
multi-drop/raw<br />
Fast Ethernet<br />
star/compressed<br />
Gigabit Ethernet<br />
star/compressed<br />
24
Schlussfolgerungen<br />
• Erfolgreiche Installation und Inbetriebnahme eines<br />
universellen <strong>Cluster</strong>s <strong>für</strong> <strong>Forschung</strong> und Lehre<br />
• Erleichterung von Wartung und Installation durch:<br />
• Kleines Service-Betriebssystem<br />
• Schnelle, grosse Festplatten<br />
• Hochleistungs-Netzwerk<br />
• Multi-boot Installationen geben grosse Flexibilität<br />
• Klonen von ganzen Software Installationen als neue,<br />
interessante Anwendung von Gigabit/s Netzwerken<br />
(ausserhalb des parallelen und verteilten Rechnens)<br />
25
Performance Evaluation (Klonen)<br />
Netzwerk-Topologie Gigabit Ethernet<br />
Giga<br />
26