(SCI) - Technologie und Leistungsanalysen.pdf
(SCI) - Technologie und Leistungsanalysen.pdf
(SCI) - Technologie und Leistungsanalysen.pdf
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
eim 2-Senderschalter sowohl in Ringlet- wie auch in Nicht-Ringlet-Konfiguration<br />
hatten. Entsprechend des gleichbleibenden Durchsatzes verändert sich<br />
der Sättigungspunkt nicht.<br />
1400<br />
uO4n4_1_1_1verschRing<br />
Clear Output Rates [MB/s]<br />
1200<br />
1000<br />
800<br />
600<br />
400<br />
200<br />
Total Output Payload<br />
Non-Retry Payload<br />
Ring Retry-Request<br />
Ring Data Losses<br />
0<br />
0<br />
100<br />
200<br />
300<br />
400<br />
500<br />
600<br />
700<br />
800<br />
900<br />
1000<br />
1100<br />
1200<br />
1300<br />
1400<br />
1500<br />
1600<br />
1700<br />
1800<br />
1900<br />
2000<br />
Gross Input Rates [MB/s]<br />
Bild 8.3.8: Leistungsanalyse der alternativen Kopplung für n=0 <strong>und</strong> 4 Sender/Empfänger.<br />
Die Latenz hat sich bei n=0 unterhalb Sättigungspunkts, von 2490 ns auf 3680<br />
ns leicht erhöht. Leider steigt sie ab dem Sättigungspunkt von ursprünglich<br />
12797 ns bei der Zwei-Sender-Ringlet-Konfiguration bzw. 48663 ns bei der<br />
Zwei-Sender-Nicht-Ringlet-Konfiguration auf jetzt 110094 ns an. Dies entspricht<br />
einer Zunahme um eine Größenordnung. Allerdings sind dafür auch<br />
doppelt so viele Sender am selben Schalter angeschlossen, <strong>und</strong> bei gegebener<br />
Datenlokalität kann eine beträchtliche Durchsatzerhöhung erzielt werden.<br />
Im nächsten Kapitel wird gezeigt, wie der Schalterdurchsatz erhöht werden<br />
kann, wenn keine Datenlokalität vorliegt. Ein solcher Fall liegt z.B. bei einer<br />
parallelen Matrixtransposition vor, bei der die Elemente zeilen- oder spaltenweise<br />
auf Prozessoren verteilt sind.<br />
Ergebnis:<br />
Das bedeutet, daß eine Konfiguration aus vier Sendern, die über durchgängige<br />
Ringe angeschlossen sind, bzgl. des Durchsatzes auch im ungünstigsten Fall<br />
nicht schlechter als die Ringlet-Konfiguration mit zwei Sendern abschneidet,<br />
jedoch doppelt so viele Sender/Empfänger verbinden kann. Im günstigsten Fall<br />
sind das 7,8-fache an Durchsatz zu erwarten, bei nur leicht erhöhter Latenz.<br />
Voraussetzung ist in allen Fällen, daß der Schalter nicht überlastet wird. Bei<br />
Überlastung steigt der Maximalwert der Latenz um eine Größenordnung auf<br />
409