27.01.2014 Aufrufe

(SCI) - Technologie und Leistungsanalysen.pdf

(SCI) - Technologie und Leistungsanalysen.pdf

(SCI) - Technologie und Leistungsanalysen.pdf

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

eim 2-Senderschalter sowohl in Ringlet- wie auch in Nicht-Ringlet-Konfiguration<br />

hatten. Entsprechend des gleichbleibenden Durchsatzes verändert sich<br />

der Sättigungspunkt nicht.<br />

1400<br />

uO4n4_1_1_1verschRing<br />

Clear Output Rates [MB/s]<br />

1200<br />

1000<br />

800<br />

600<br />

400<br />

200<br />

Total Output Payload<br />

Non-Retry Payload<br />

Ring Retry-Request<br />

Ring Data Losses<br />

0<br />

0<br />

100<br />

200<br />

300<br />

400<br />

500<br />

600<br />

700<br />

800<br />

900<br />

1000<br />

1100<br />

1200<br />

1300<br />

1400<br />

1500<br />

1600<br />

1700<br />

1800<br />

1900<br />

2000<br />

Gross Input Rates [MB/s]<br />

Bild 8.3.8: Leistungsanalyse der alternativen Kopplung für n=0 <strong>und</strong> 4 Sender/Empfänger.<br />

Die Latenz hat sich bei n=0 unterhalb Sättigungspunkts, von 2490 ns auf 3680<br />

ns leicht erhöht. Leider steigt sie ab dem Sättigungspunkt von ursprünglich<br />

12797 ns bei der Zwei-Sender-Ringlet-Konfiguration bzw. 48663 ns bei der<br />

Zwei-Sender-Nicht-Ringlet-Konfiguration auf jetzt 110094 ns an. Dies entspricht<br />

einer Zunahme um eine Größenordnung. Allerdings sind dafür auch<br />

doppelt so viele Sender am selben Schalter angeschlossen, <strong>und</strong> bei gegebener<br />

Datenlokalität kann eine beträchtliche Durchsatzerhöhung erzielt werden.<br />

Im nächsten Kapitel wird gezeigt, wie der Schalterdurchsatz erhöht werden<br />

kann, wenn keine Datenlokalität vorliegt. Ein solcher Fall liegt z.B. bei einer<br />

parallelen Matrixtransposition vor, bei der die Elemente zeilen- oder spaltenweise<br />

auf Prozessoren verteilt sind.<br />

Ergebnis:<br />

Das bedeutet, daß eine Konfiguration aus vier Sendern, die über durchgängige<br />

Ringe angeschlossen sind, bzgl. des Durchsatzes auch im ungünstigsten Fall<br />

nicht schlechter als die Ringlet-Konfiguration mit zwei Sendern abschneidet,<br />

jedoch doppelt so viele Sender/Empfänger verbinden kann. Im günstigsten Fall<br />

sind das 7,8-fache an Durchsatz zu erwarten, bei nur leicht erhöhter Latenz.<br />

Voraussetzung ist in allen Fällen, daß der Schalter nicht überlastet wird. Bei<br />

Überlastung steigt der Maximalwert der Latenz um eine Größenordnung auf<br />

409

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!