PC Games Hardware Magazin Grafikkarten (Vorschau)

grafikkarten | Multi-GPU-Renderingverfahren 

Alternate Frame Rendering 

Das meist als AFR abgekürzte Verfahren wird heute mit Abstand am 

häufigsten genutzt, weswegen wir es zuerst beschreiben. 

Beim AFR werden die beteiligten Grafikchips immer mit der Berechnung eines 

kompletten Bildes beauftragt, welches sie nach Fertigstellung über die MGPU- 

Brücken und/oder den PCI-Express-Anschluss an die Hauptkarte, an welcher der 

Monitor angeschlossen ist, zurücksenden. Mithilfe dieser Technik ist mit bis zu100 

Prozent Fps-Zuwachs pro beteiligter GPU die theoretisch höchste Leistungssteigerung 

möglich – was wohl auch ein Grund für die Beliebtheit des Verfahrens ist. 

Ein weiterer Vorteil von AFR ist die einfache Verteilung der Arbeit auch auf 

mehr als zwei Grafikkarten. Die Nachteile wie eine erhöhte Eingabeverzögerung 

(Inputlag) werden dabei prinzipbedingt in Kauf genommen. Auch die Tendenz zu 

Mikrorucklern, verursacht durch ungleichmäßige Bildberechnungszeiten, muss sich 

der Jagd nach höheren Bildraten meist unterordnen. 

Split Frame Rendering 

Das SFR-Verfahren ist dem Scan-Line-Interleave ähnlich: Das Bild wird 

streifenweise zwischen den beteiligten Grafikkarten aufgeteilt. 

Beim SFR, auch als Scissoring bekannt, wird das Bild horizontal geteilt. Die Anzahl 

der Streifen ist theoretisch variabel, in der Praxis wurde bei dem heute kaum noch 

genutzten Verfahren aber meist grob 60:40 zwischen oberer und unterer Bildhälfte 

aufgetrennt, da im oberen Bereich meist die wenig rechenintensive Himmelstextur 

den Löwenanteil der Fläche beanspruchte und man eine möglichst gleichmäßige 

Verteilung der Rechenlast für das komplette Bild erreichen wollte. 

Da die Dreiecke ohne Engine-Unterstützung in der Regel erst nach der Rasterisierung 

der Bildhälfte zugeordnet werden können, muss die Geometrieverarbeitung 

entweder von einem separaten Prozessor oder auf jedem der Grafikchips redundant 

erfolgen. SFR erlaubt, besonders in einer dynamischen Version, eine noch gute 

Lastverteilung, aber keine Fps-Gewinne von 100 Prozent wie AFR. 

GPU 2 GPU 1 

GPU 1 

GPU 2 

(Super-) Tiling 

Tiling stammt vom englischen Wort für Kachel und entsprechend wird 

das Bild hier nicht nur horizontal, sondern auch vertikal aufgeteilt. 

Wie beim SFR muss hier für Geometrie zusätzlicher Aufwand getrieben werden, da 

erst spät im Renderprozess feststeht, in welchem Bildbereich das fertige Dreieck 

liegt. Mehr noch: Es kann auch in verschiedene „Tiles“(oder Streifen) hineinragen 

und muss dann natürlich entsprechend an alle ausführenden GPUs verteilt werden. 

Doch das Tiling hat einen entscheidenden Vorteil: Es skaliert aufgrund der 

horizontalen wie vertikalen Unterteilung unabhängig vom Bildinhalt gut mit einer 

variablen Anzahl an GPUs und lastet diese voll aus. Theoretisch ist es bei verteiltem 

Rechnen wie Raytracing-Farmen sogar möglich, vollkommen unterschiedliche Prozessoren 

einzusetzen. Im Echtzeitbereich jedoch spielt auch der Verteilungsaufwand 

eine wichtige Rolle, sodass von diesem Verfahren im praktischen Einsatz wieder 

Abstand genommen wurde. 

Scan Line Interleave 

Der Urvater aktueller Multi-GPU-Systeme verteilt die Pixellast auf fest 

den einzelnen GPUs zugeordneten Bildschirmstreifen. 

Als 3Dfx die Multi-GPU-Bühne betrat, war die Pixelwelt noch in Ordnung, sprich 

einfach und übersichtlich. Wenn der Arbeitsauftrag an die Pixelbeschleuniger 

erging, war bereits klar, wo in der Szene welche Objekte und Dreiecke hingehörten, 

und es musste sich nur noch um die Bildpunkte mit überschaubarer 

Effektvielfalt gekümmert werden. Entsprechend leicht war es für das Scan-Line-Interleave-Verfahren, 

das Bild in Streifen zu zerteilen und an verschiedene Grafikkarten 

oder -chips zu verteilen. 100 Prozent gesicherte Informationen sind schwer 

zu bekommen, doch deutet die verfügbare Dokumentation auf einzeilige Streifen 

bei Voodoo und Voodoo 2 hin – Quad-basierte Pipelines und Texturcaches gab es 

noch nicht. Bei der Nachfolgearchitektur VSA-100 auf den Voodoo-5-Karten sollen 

es dagegen 32 Pixel breite Interleaves gewesen sein. Mit einem solchen Schema 

konnte man die Lokalität der Texturdaten mithilfe der Texturcaches besser nutzen. 

GPU 1 GPU 1 

GPU 2 

GPU 2 

54 

PC Games Hardware | 09/13 

www.pcgameshardware.de

Vorherige Seite

Nächste Seite

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

82

83

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

99

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

132

PC Games Hardware Magazin Grafikkarten (Vorschau)

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?