31.12.2013 Aufrufe

PDF-Version - freiesMagazin

PDF-Version - freiesMagazin

PDF-Version - freiesMagazin

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

PROGRAMMIERUNG<br />

> M2=matrix(rnorm(n^2),ncol=n)<br />

> system.time(M1%*%M2)<br />

user system elapsed<br />

35.642 0.056 35.758<br />

> system.time(gpuMatMult(M1, M2))<br />

user system elapsed<br />

5.144 0.032 5.187<br />

Das folgende Beispiel wurde auf der Amazon-<br />

GPU-Instanz mit zwei Intel Xeon X5570 CPUs<br />

und zwei NVIDIA „Tesla“ M2050 GPUs berechnet.<br />

Hier erfolgt eine Matrixmultiplikation von zwei mit<br />

normalverteilten Zufallszahlen gefüllten Matrizen<br />

der Dimension 5000x5000:<br />

> n=5000<br />

> set.seed(100)<br />

> M1=matrix(rnorm(n^2),ncol=n)<br />

> M2=matrix(rnorm(n^2),ncol=n)<br />

> system.time(M1%*%M2)<br />

user system elapsed<br />

161.930 0.140 162.036<br />

> system.time(gpuMatMult(M1, M2))<br />

user system elapsed<br />

0.792 0.280 1.073<br />

Bei beiden Szenarien wurde eine Überlegenheit<br />

der GPU-gestützten Berechnung beobachtet.<br />

Konnten schon beim lokalen Vergleich spürbare<br />

Geschwindigkeitsvorteile, Faktor 6-8, beobachtet<br />

werden, so zeigt die Nutzung der Tesla-GPU<br />

eine massive Beschleunigung. Hier dauerte die<br />

CPU-gestützte Berechnung 161,930 Sekunden,<br />

die GPU-gestützte Berechnung jedoch nur 0,792<br />

Sekunden.<br />

Matrixmultiplikation mit CPU und GPU.<br />

Diese Ergebnisse sind allerdings auch kritisch zu<br />

hinterfragen. So sind diese Messungen natürlich<br />

von der individuellen Systemkonfiguration und der<br />

gewählten Aufgabenstellung abhängig. Zudem<br />

konnte mit dem vorhandenen lokalen Testsystem<br />

(unter Verwendung der NVIDIA Quadro 410) eine<br />

Matrixmultiplikation mit Matrizen der Dimension<br />

5000x5000 mangels Arbeitsspeichers schon nicht<br />

mehr durchgeführt werden. Insofern müssen die<br />

Komplexität beziehungsweise Dimensionen der<br />

Tests immer auch an die Leistungsfähigkeit der<br />

für die Tests verwendeten Grafikkarte angepasst<br />

werden.<br />

© <strong>freiesMagazin</strong> CC-BY-SA 3.0 Ausgabe 12/2013 20

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!