27.01.2014 Aufrufe

(SCI) - Technologie und Leistungsanalysen.pdf

(SCI) - Technologie und Leistungsanalysen.pdf

(SCI) - Technologie und Leistungsanalysen.pdf

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Fehlererkennung <strong>und</strong> Korrektur auf Blockbasis vom PC durchführen läßt. In<br />

beiden Fällen ist die erzielbare Endgeschwindigkeit dieselbe, jedoch wird sie<br />

bei der Software-Lösung erst bei einer wesentlich größeren Paketlänge von >64<br />

KB erreicht. Ohne Software-Blockprüfung <strong>und</strong> Korrektur wird im Gegensatz<br />

zum PentiumPro-Teststand die maximale Transferrate bereits bei 64 Byte erzielt.<br />

Die Setup-Zeit ist mit 2-3 s ebenfalls geringer, was auf einen effizienteren<br />

Gerätetreiber schließen läßt (Bild 5.3.4). Bei zusätzlicher Software-<br />

10000<br />

1 Stream + 100 MHz Pentium + FX PCI + NT 4.0<br />

Elapsed Time [us]<br />

1000<br />

100<br />

10<br />

HW error<br />

correction<br />

SW error<br />

correction<br />

1<br />

4<br />

8<br />

16<br />

32<br />

64<br />

128<br />

256<br />

512<br />

1k<br />

2k<br />

Block Size [Bytes]<br />

4k<br />

8k<br />

16k<br />

32k<br />

64k<br />

Bild 5.3.4: Gemessene Latenzen bei einem Stream auf dem Pentium-Testsystem.<br />

Blockprüfung steigt sie auf 11-12 s an. Für große Blocklängen konvergieren<br />

die Latenzen von beiden Varianten gegen denselben Wert <strong>und</strong> befinden sich damit<br />

in Übereinstimmung mit den gemessenen Bandbreiten.<br />

Der beim Pentium-Teststand verwendete Gerätetreiber erlaubt wahlweise,<br />

ein, zwei, vier oder 8 Pufferspeicherplätze zu koppeln, um so den Durchsatz bei<br />

entsprechend größerer Blocklänge zu steigern. Beim Linux-Treiber sind dagegen<br />

einem Stream vier Speicherplätze fest zugeordnet. Wie man anhand von<br />

Bild 5.3.5 <strong>und</strong> Bild 5.3.6 sieht, ist der Anstieg der maximalen Bandbreite nahezu<br />

linear zur Zahl der gekoppelten Speicherplätze, wobei sich die erforderliche<br />

Blocklänge ebenfalls verdoppelt. Die größte erzielbare Datenrate liegt bei 45<br />

MB/s. Bei 8 gekoppelten Puffern zeigt sich ein Einbruch im Durchsatz, der verhindert,<br />

daß eine höhere Datenrate als 45 MB/s erreicht wird. Bei der für diese<br />

Pufferzahl erforderlichen Blockgröße von 64*8 = 512 Byte fällt der Durchsatz<br />

auf 34 MB/s zurück. Dafür verantwortlich ist vermutlich die rel. langsame CPU<br />

des PCs, unter der Annahme, daß sie nicht schnell genug Daten auf dem PCI-<br />

Bus zur Verfügung stellen kann (Bild 5.3.7). Zur Ergänzung der Bandbreitemessungen<br />

sind in Bild 5.3.8-Bild 5.3.10 die Zeitverbräuche (Latenzen) für 2,4<br />

<strong>und</strong> 8 Streams gezeigt. Wie erwartet, ist die Latenz für den Fall von 4 Streams<br />

für alle Blocklängen am kleinsten. Die Setup-Zeiten hingegen sind unabhängig<br />

von der Zahl der verwendeten Streams.<br />

358

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!