Einführung in die Numerische Mathematik - Lehrstuhl Numerische ...
Einführung in die Numerische Mathematik - Lehrstuhl Numerische ...
Einführung in die Numerische Mathematik - Lehrstuhl Numerische ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
1 E<strong>in</strong>leitung<br />
CPU Jahr Flops Preis<br />
Zuse Z3 1941 0.3 E<strong>in</strong>zelstücke<br />
IBM 704 1955 5 · 10 3 >10 000 000 Euro<br />
Intel 8086 + 8087 1980 50 · 10 3 2 000 Euro<br />
i486 1991 1.4 · 10 6 2 000 Euro<br />
IPhone 4s 2011 100 · 10 6 500 Euro<br />
2xPentium III 2001 800 · 10 6 2 000 Euro<br />
Core i7 2011 100 · 10 9 1 000 Euro<br />
Helics I (Parallelrechner am IWR) 2002 1 · 10 12 1 000 000 Euro<br />
Nvidia GTX 580 (GPU) 2010 1 · 10 12 500 Euro<br />
K Computer 2011 10 · 10 15 ???<br />
Tabelle 1.4: Gleitkomma-Geschw<strong>in</strong>digkeit sowie Anschaffungskosten e<strong>in</strong>iger aktueller und<br />
historischer Computer.<br />
Laufzeit e<strong>in</strong>es Algorithmus hängt wesentlich von der Leistungsfähigkeit des Rechners ab.<br />
Diese wird <strong>in</strong> FLOPS, also float<strong>in</strong>g po<strong>in</strong>t operations per second gemessen. In Tabelle 1.4<br />
fassen wir <strong>die</strong> erreichbaren FLOPS für verschiedene Computer-Systeme zusammen. Die<br />
Leistung ist im Laufe der Jahre rapide gestiegen, alle zehn Jahre wird etwa der Faktor<br />
1000 erreicht. Die Leistungssteigerung beruht zum e<strong>in</strong>en auf effizienterer Hardware. Erste<br />
Computer hatten Register mit 8 Bit Breite, <strong>die</strong> <strong>in</strong> jedem Takt (das ist <strong>die</strong> MHz Angabe)<br />
verarbeitet werden konnten. Auf aktueller Hardware stehen Register mit 64 Bit zur<br />
Verfügung. H<strong>in</strong>zu kommt e<strong>in</strong>e effizientere Abarbeitung von Befehlen durch sogenanntes<br />
Pipel<strong>in</strong><strong>in</strong>g: <strong>die</strong> übliche Abfolge im Prozessor be<strong>in</strong>haltet “Speicher lesen, Daten bearbeiten,<br />
Ergebnis speichern”. Das Pipel<strong>in</strong><strong>in</strong>g erlaubt es dem Prozessor schon den Speicher für<br />
<strong>die</strong> nächste Operation auszulesen, während <strong>die</strong> aktuelle bearbeitet wird. So konnte <strong>die</strong><br />
Anzahl der notwendigen Prozessortakte pro Rechenoperation erheblich reduziert werden.<br />
Die Komb<strong>in</strong>ation aus Intel 8086 mit FPU 8087 hat bei e<strong>in</strong>em Takt von 8 Mhz und 50 000<br />
Flops etwa 150 Takte pro Fließkommaoperation benötigt. Der 486er braucht bei 66 Mhz<br />
und etwa 1 000 000 Flops nur 50 Takte pro Operation. Der Pentium III liegt bei etwa 5<br />
Takten pro Fließkommaoperation. In den letzten Jahren beruht <strong>die</strong> Effizienzsteigerung<br />
wesentlich auf e<strong>in</strong>em sehr hohen Grad an Parallelisierung. E<strong>in</strong> aktueller Core I7 Prozessor<br />
kann mehrere Operationen gleichzeitig durchführen. E<strong>in</strong>e Nvidia 580 GPU erreicht ihre<br />
Leistung mit über 500 Rechenkernen. Um <strong>die</strong>se Leistung effizient nutzen zu können müssen<br />
<strong>die</strong> Algorithmen entsprechend angepasst werden, so dass auch alle 500 Kerne ausgelastet<br />
werden. Kann e<strong>in</strong> Algorithmus <strong>die</strong>se spezielle Architektur nicht ausnutzen, so fällt <strong>die</strong><br />
Leistung auf etwa e<strong>in</strong> Gigaflop zurück, also auf das Niveau des Pentium III aus dem Jahr<br />
2001. Werden <strong>die</strong> 500 Kerne h<strong>in</strong>gegen optimal ausgenutzt, so erreicht e<strong>in</strong>e Grafikkarte <strong>die</strong><br />
gleiche Leistung wie der Heidelberger L<strong>in</strong>ux-Cluster helics aus dem Jahr 2002. Moderne<br />
Super-Computer wie der K Computer (schnellster Computer der Welt <strong>in</strong> 2012) vernetzen<br />
über 500 000 Kerne.<br />
14