01.02.2013 Aufrufe

Das Forschungszentrum Jülich - d-nb, Archivserver DEPOSIT.D-NB ...

Das Forschungszentrum Jülich - d-nb, Archivserver DEPOSIT.D-NB ...

Das Forschungszentrum Jülich - d-nb, Archivserver DEPOSIT.D-NB ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

B - Programmstruktur<br />

<strong>Das</strong> Helmholtz-Programm Wissenschaftliches Rechnen ist in drei Themen gegliedert:<br />

• Thema 1: Nationales Supercomputer-Zentrum John von Neumann-Institut für Computing<br />

(NIC)<br />

• Thema 2: Computational Science, Algorithmen und Architekturen<br />

• Thema 3: Grid-Computing<br />

Die Themen 1 und 2 werden vollständig vom FZJ behandelt. Thema 3 wird gemeinsam von FZJ und<br />

FZK bearbeitet. Die Arbeit in <strong>Jülich</strong> wird weitgehend vom Zentralinstitut für Angewandte Mathematik<br />

(ZAM) ausgeführt. Ein kleiner, stark fokussierter Teil wird in der NIC-Forschungsgruppe Komplexe<br />

Systeme durchgeführt.<br />

C - Programmergebnisse<br />

Thema 1: Nationales Supercomputer-Zentrum John von Neumann-Institut für Computing (NIC)<br />

In diesem Programmteil werden die Forschungs- und Entwicklungsarbeiten des ZAM für Betrieb und<br />

Weiterentwicklung des Supercomputer-Systems im nationalen Supercomputer-Zentrum "John von<br />

Neumann-Institut für Computing (NIC)" beschrieben.<br />

Betrieb<br />

Anfang 2004 wurde der neue IBM-Supercomputer Jump (<strong>Jülich</strong> Multi Prozessor), bestehend aus 41<br />

Rechenknoten und einem knotenübergreifenden High Performance Switch, planmäßig in der neuen<br />

Maschinenhalle des ZAM installiert; der Benutzerbetrieb startete Anfang Februar. Zu diesem Zeitpunkt<br />

stand den Benutzern des FZJ und des NIC der leistungsfähigste Rechner Europas zur Verfügung, mit<br />

einer Peak-Performance von 8,9 TeraFlops, einem nach wie vor in Europa nicht übertroffenen 5<br />

TeraBytes großen Hauptspeicher und einer Plattenspeicherkapazität von 50 TeraBytes. Die<br />

Verfügbarkeit des IBM Systems ist sehr hoch; die Benutzer nahmen es schnell an und lasten es sehr<br />

gut aus. Den großen Bedarf für dieses System belegt u. a. die fünffache Überbuchung der zur<br />

Verfügung stehenden Rechenzeit durch die eingereichten Anträge.<br />

Um einen reibungslosen Betrieb zu gewährleisten, wurden Verfahren zur Software-Installation und -<br />

Adaption etabliert sowie Werkzeuge zur Systemadministration und zum automatisierten Betrieb<br />

entwickelt. Durch Tuning-Maßnahmen konnte der Gesamtdurchsatz verbessert werden. <strong>Das</strong><br />

Batchsystem LoadLeveler wurde an die Anforderungen der Benutzer angepasst und UNICORE als<br />

Grid-Zugang verfügbar gemacht. Durch das am ZAM entwickelte grafische Tool llview kann das<br />

System überwacht werden; in Verbindung mit dem Monitoring der System-Performance können<br />

zeitnah Engpässe aufgespürt und schnellstmöglich behoben werden. Durch mehrere Software-<br />

Upgrades konnten im Laufe des Jahres die Werte für Latenz und Bandbreite bei der<br />

knotenübergreifenden Kommunikation erheblich verbessert werden.<br />

Im Bereich Benutzerverwaltung, Überwachung und Monitoring, Administration und Benutzerberatung<br />

wurde LDAP als neue Technologie zur Benutzerauthentisierung eingesetzt und in die<br />

Produktionsumgebung integriert. Programme zur Benutzerkontingentierung und weitere Dispatch-<br />

Funktionen zum Accounting wurden entwickelt. Die Startup-Prozeduren des Systems wurden erweitert<br />

und durch Fehleranalysen und Recovery wichtiger Komponenten verfeinert. Durch Erweiterung der<br />

Überwachungsfunktionen stehen bei einem Knotenausfall jederzeit aktuelle Daten zur<br />

Problembearbeitung bereit. Weitere Tools zum Monitoring, zur Gewährleistung der Integrität der<br />

Systemdaten im Cluster, zur Erstellung relevanter Systeminformationen sowie Erstellung von<br />

Übersichten bzgl. des belegten residenten und migrierten Benutzer-Plattenplatzes wurden<br />

implementiert. Neue Software-Werkzeuge, Beratung und Dokumentation unterstützten die Benutzer,<br />

insbesondere bei der Migration von Daten der Cray-Rechner zum IBM-System. Die Dokumentation<br />

des IBM-Systems im Web wurde überarbeitet und erweitert.<br />

231

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!