(SCI) - Technologie und Leistungsanalysen.pdf

Weitere Magazine

Empfehlungen

Info

Fehlererkennung und Korrektur auf Blockbasis vom PC durchführen läßt. In beiden Fällen ist die erzielbare Endgeschwindigkeit dieselbe, jedoch wird sie bei der Software-Lösung erst bei einer wesentlich größeren Paketlänge von >64 KB erreicht. Ohne Software-Blockprüfung und Korrektur wird im Gegensatz zum PentiumPro-Teststand die maximale Transferrate bereits bei 64 Byte erzielt. Die Setup-Zeit ist mit 2-3 s ebenfalls geringer, was auf einen effizienteren Gerätetreiber schließen läßt (Bild 5.3.4). Bei zusätzlicher Software- 10000 1 Stream + 100 MHz Pentium + FX PCI + NT 4.0 Elapsed Time [us] 1000 100 10 HW error correction SW error correction 1 4 8 16 32 64 128 256 512 1k 2k Block Size [Bytes] 4k 8k 16k 32k 64k Bild 5.3.4: Gemessene Latenzen bei einem Stream auf dem Pentium-Testsystem. Blockprüfung steigt sie auf 11-12 s an. Für große Blocklängen konvergieren die Latenzen von beiden Varianten gegen denselben Wert und befinden sich damit in Übereinstimmung mit den gemessenen Bandbreiten. Der beim Pentium-Teststand verwendete Gerätetreiber erlaubt wahlweise, ein, zwei, vier oder 8 Pufferspeicherplätze zu koppeln, um so den Durchsatz bei entsprechend größerer Blocklänge zu steigern. Beim Linux-Treiber sind dagegen einem Stream vier Speicherplätze fest zugeordnet. Wie man anhand von Bild 5.3.5 und Bild 5.3.6 sieht, ist der Anstieg der maximalen Bandbreite nahezu linear zur Zahl der gekoppelten Speicherplätze, wobei sich die erforderliche Blocklänge ebenfalls verdoppelt. Die größte erzielbare Datenrate liegt bei 45 MB/s. Bei 8 gekoppelten Puffern zeigt sich ein Einbruch im Durchsatz, der verhindert, daß eine höhere Datenrate als 45 MB/s erreicht wird. Bei der für diese Pufferzahl erforderlichen Blockgröße von 64*8 = 512 Byte fällt der Durchsatz auf 34 MB/s zurück. Dafür verantwortlich ist vermutlich die rel. langsame CPU des PCs, unter der Annahme, daß sie nicht schnell genug Daten auf dem PCI- Bus zur Verfügung stellen kann (Bild 5.3.7). Zur Ergänzung der Bandbreitemessungen sind in Bild 5.3.8-Bild 5.3.10 die Zeitverbräuche (Latenzen) für 2,4 und 8 Streams gezeigt. Wie erwartet, ist die Latenz für den Fall von 4 Streams für alle Blocklängen am kleinsten. Die Setup-Zeiten hingegen sind unabhängig von der Zahl der verwendeten Streams. 358
25 2 Streams + 100 MHz Pentium + FX PCI + NT 4.0 20 Throughput [MB/s] 15 10 5 HW error correction SW error correction 0 4 8 16 32 64 128 256 512 1k 2k 4k 8k 16k 32k 64k Block Size [Bytes] Bild 5.3.5: Durchsatz bei 2 Streams und der DMOVE64-Transaktion. Throughput [MB/s] 50 45 40 35 30 25 20 15 10 5 0 4 4 Streams + 100 MHz Pentium + FX PCI + NT 4.0 8 16 32 Bild 5.3.6: Durchsatz bei 4 Streams und der DMOVE64-Transaktion. 64 128 256 512 1k 2k Block Size [Bytes] 4k 8k HW error correction SW error correction 16k 32k 64k 5.4 Bewertung der Meßergebnisse Die durchgeführten Messungen konnten verschiedene Antworten auf die gestellten Fragen liefern. Beispielsweise wurde die Frage, ob in einem Datenerfassungsystem die aufgenommenen Sensorwerte von den Rechnern aus den Sensormeßaufnahmespeichern gelesen werden sollen (Pull-Strategie) oder ob besser die Sensoren die Werte aktiv an die Rechner abliefern (Push-Strategie), eindeutig zugunsten der Push-Strategie beantwortet. Nur beim Schreiben auf einen entfernten Speicher - und nicht beim Lesen - lassen sich über SCI-Schnitt- 359
Seite 1 und 2:
1 Motivation Die vorliegende Ausarb
Seite 3 und 4:
nen und ihrer Eignung bei Echtzeita
Seite 5 und 6:
2.2 Warum SCI? SCI ist durch seine
Seite 7 und 8:
sten und die prinzipiell nicht an d
Seite 9 und 10:
Funktion der Bausteine wird durch e
Seite 11 und 12:
fen sein muß. Durch Split Transact
Seite 13 und 14: · DOTRY: Ein normales Request und
Seite 15 und 16: und kann seine lokale Kopie des Pak
Seite 17 und 18: 256 Byte aufnehmen. Bei Anforderung
Seite 19 und 20: eide ein Go-Bit enthalten (Low-Go b
Seite 21 und 22: dle-Speichers erneut ausgegeben, so
Seite 23 und 24: Ausgabe eines neg. Echos mit BUSY_D
Seite 25 und 26: IF PhaseField = NOTRY EchoPhaseFiel
Seite 27 und 28: Bild 3.1.1: 2-D-Gitter in SCI-Techn
Seite 29 und 30: en sind, dann kann man die Reaktion
Seite 31 und 32: Dynamische SCI-Banyans haben kein D
Seite 33 und 34: Data Amount [MB] 10 2 10 1 1: DIIID
Seite 35 und 36: meist werden dazu Glasfaser aufgrun
Seite 37 und 38: Datenaufnahmeseite Benutzerseite Wi
Seite 39 und 40: 4.4 Lastprofile der Datenerfassung
Seite 41 und 42: achten, daß bei jedem neuen Simula
Seite 43 und 44: gemachten Untersuchungen wird diese
Seite 45 und 46: To/From Attached User Device 4 B-Li
Seite 47 und 48: Parameter Name Default Einheit T 1,
Seite 49 und 50: 4.7.1 Graphische Äquivalenztransfo
Seite 51 und 52: einer größeren Zahl von Signalen
Seite 53 und 54: Port 1 Port 2 Port 3 Port 4 Sim Tim
Seite 55 und 56: net sich gemäß Gl. 4.7.3. Mit der
Seite 57 und 58: (simtime), die Zeit, nach der das N
Seite 59 und 60: ar ist. Leider ist in der IEEE SCI-
Seite 61: Teststand wurden NWRITE64 und NREAD
Seite 66 und 67: Throughput [MB/s] 50 45 40 35 30 25
Seite 68 und 69: 6 SCINET-Simulator 6.1 Einleitung D
Seite 70 und 71: Netzstufen, die zur Permutationsbas
Seite 72 und 73: Bild 6.2.3: Visualisierung eines Ge
Seite 74 und 75: NorResPay (= No-Retry Response Payl
Seite 76 und 77: Adreßkorrektur durchgeführt wurde
Seite 78 und 79: Voraussetzung für eine korrekte Si
Seite 80 und 81: 7.2 Elementarer SCI-Ring Ein elemen
Seite 82 und 83: Die Tatsache, daß bei 450 MB/s Pak
Seite 84 und 85: 7.2.2 Latenzzeit im Ring 3000 2500
Seite 86 und 87: Paketwiederholungen nicht auftreten
Seite 88 und 89: Retry-Verkehr auftritt, ist nur noc
Seite 90 und 91: 10000 Opt1SenderRingRetryConst100 L
Seite 92 und 93: Das bedeutet, daß ein durch statio
Seite 94 und 95: 250 Opt1SenderRingRetryConstVar3 Cl
Seite 96 und 97: inkrementierten Faktor multiplizier
Seite 98 und 99: 7.5 Leistungsanalyse bei multiplen
Seite 100 und 101: Ergebnis: Ein SCI-Ring bestehend au
Seite 102 und 103: vorigen Kapitel erläutert, aus pri
Seite 104 und 105: Opt2SenderRingBeeinRetryExp100 250
Seite 106 und 107: SCI0 Out SCI2 Out SCI0 In SCI0 Out
Seite 108 und 109: daraus 761 MB/s, was sich unter Ein
Seite 110 und 111: I-P0-O I-P1-O I: SCI input O: S CI
Seite 112 und 113: Offenbar sollte der Sättigungspunk
Seite 114 und 115:
Ring 1 Ring 0 I-P0-O I-P1-O I-P2-O
Seite 116 und 117:
160000 140000 120000 uO4n4_1_1_1ver
Seite 118 und 119:
oder Herkunftsadresse empfangen, wi
Seite 120 und 121:
Request-Paket Herkunft von S Sender
Seite 122 und 123:
O2n2_2_1_1 450 400 350 300 250 200
Seite 124 und 125:
20000 bO2n2_3_1_1 18000 16000 Laten
Seite 126 und 127:
uO2n2_2_1_1verschRing 500 450 400 3
Seite 128 und 129:
Zusammenfassend kann man sagen, da
Seite 130 und 131:
70000 uO4n4_3_1_1verschRing 60000 5
Seite 132 und 133:
P0 P1 P2 P3 P4 P5 P6 P7 M0 M1 M2 M3
Seite 134 und 135:
Generalized Cube- und Indirect Bina
Seite 136:
der Kaskadierung von Link Chips zu
Alle anzeigen

(SCI) - Technologie und Leistungsanalysen.pdf

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?