26.12.2013 Aufrufe

Einführung in die Numerische Mathematik - Lehrstuhl Numerische ...

Einführung in die Numerische Mathematik - Lehrstuhl Numerische ...

Einführung in die Numerische Mathematik - Lehrstuhl Numerische ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

1 E<strong>in</strong>leitung<br />

CPU Jahr Flops Preis<br />

Zuse Z3 1941 0.3 E<strong>in</strong>zelstücke<br />

IBM 704 1955 5 · 10 3 >10 000 000 Euro<br />

Intel 8086 + 8087 1980 50 · 10 3 2 000 Euro<br />

i486 1991 1.4 · 10 6 2 000 Euro<br />

IPhone 4s 2011 100 · 10 6 500 Euro<br />

2xPentium III 2001 800 · 10 6 2 000 Euro<br />

Core i7 2011 100 · 10 9 1 000 Euro<br />

Helics I (Parallelrechner am IWR) 2002 1 · 10 12 1 000 000 Euro<br />

Nvidia GTX 580 (GPU) 2010 1 · 10 12 500 Euro<br />

K Computer 2011 10 · 10 15 ???<br />

Tabelle 1.4: Gleitkomma-Geschw<strong>in</strong>digkeit sowie Anschaffungskosten e<strong>in</strong>iger aktueller und<br />

historischer Computer.<br />

Laufzeit e<strong>in</strong>es Algorithmus hängt wesentlich von der Leistungsfähigkeit des Rechners ab.<br />

Diese wird <strong>in</strong> FLOPS, also float<strong>in</strong>g po<strong>in</strong>t operations per second gemessen. In Tabelle 1.4<br />

fassen wir <strong>die</strong> erreichbaren FLOPS für verschiedene Computer-Systeme zusammen. Die<br />

Leistung ist im Laufe der Jahre rapide gestiegen, alle zehn Jahre wird etwa der Faktor<br />

1000 erreicht. Die Leistungssteigerung beruht zum e<strong>in</strong>en auf effizienterer Hardware. Erste<br />

Computer hatten Register mit 8 Bit Breite, <strong>die</strong> <strong>in</strong> jedem Takt (das ist <strong>die</strong> MHz Angabe)<br />

verarbeitet werden konnten. Auf aktueller Hardware stehen Register mit 64 Bit zur<br />

Verfügung. H<strong>in</strong>zu kommt e<strong>in</strong>e effizientere Abarbeitung von Befehlen durch sogenanntes<br />

Pipel<strong>in</strong><strong>in</strong>g: <strong>die</strong> übliche Abfolge im Prozessor be<strong>in</strong>haltet “Speicher lesen, Daten bearbeiten,<br />

Ergebnis speichern”. Das Pipel<strong>in</strong><strong>in</strong>g erlaubt es dem Prozessor schon den Speicher für<br />

<strong>die</strong> nächste Operation auszulesen, während <strong>die</strong> aktuelle bearbeitet wird. So konnte <strong>die</strong><br />

Anzahl der notwendigen Prozessortakte pro Rechenoperation erheblich reduziert werden.<br />

Die Komb<strong>in</strong>ation aus Intel 8086 mit FPU 8087 hat bei e<strong>in</strong>em Takt von 8 Mhz und 50 000<br />

Flops etwa 150 Takte pro Fließkommaoperation benötigt. Der 486er braucht bei 66 Mhz<br />

und etwa 1 000 000 Flops nur 50 Takte pro Operation. Der Pentium III liegt bei etwa 5<br />

Takten pro Fließkommaoperation. In den letzten Jahren beruht <strong>die</strong> Effizienzsteigerung<br />

wesentlich auf e<strong>in</strong>em sehr hohen Grad an Parallelisierung. E<strong>in</strong> aktueller Core I7 Prozessor<br />

kann mehrere Operationen gleichzeitig durchführen. E<strong>in</strong>e Nvidia 580 GPU erreicht ihre<br />

Leistung mit über 500 Rechenkernen. Um <strong>die</strong>se Leistung effizient nutzen zu können müssen<br />

<strong>die</strong> Algorithmen entsprechend angepasst werden, so dass auch alle 500 Kerne ausgelastet<br />

werden. Kann e<strong>in</strong> Algorithmus <strong>die</strong>se spezielle Architektur nicht ausnutzen, so fällt <strong>die</strong><br />

Leistung auf etwa e<strong>in</strong> Gigaflop zurück, also auf das Niveau des Pentium III aus dem Jahr<br />

2001. Werden <strong>die</strong> 500 Kerne h<strong>in</strong>gegen optimal ausgenutzt, so erreicht e<strong>in</strong>e Grafikkarte <strong>die</strong><br />

gleiche Leistung wie der Heidelberger L<strong>in</strong>ux-Cluster helics aus dem Jahr 2002. Moderne<br />

Super-Computer wie der K Computer (schnellster Computer der Welt <strong>in</strong> 2012) vernetzen<br />

über 500 000 Kerne.<br />

14

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!