26.02.2014 Aufrufe

PC Games Hardware Magazin Grafikkarten (Vorschau)

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

grafikkarten | Multi-GPU-Renderingverfahren<br />

Alternate Frame Rendering<br />

Das meist als AFR abgekürzte Verfahren wird heute mit Abstand am<br />

häufigsten genutzt, weswegen wir es zuerst beschreiben.<br />

Beim AFR werden die beteiligten Grafikchips immer mit der Berechnung eines<br />

kompletten Bildes beauftragt, welches sie nach Fertigstellung über die MGPU-<br />

Brücken und/oder den <strong>PC</strong>I-Express-Anschluss an die Hauptkarte, an welcher der<br />

Monitor angeschlossen ist, zurücksenden. Mithilfe dieser Technik ist mit bis zu100<br />

Prozent Fps-Zuwachs pro beteiligter GPU die theoretisch höchste Leistungssteigerung<br />

möglich – was wohl auch ein Grund für die Beliebtheit des Verfahrens ist.<br />

Ein weiterer Vorteil von AFR ist die einfache Verteilung der Arbeit auch auf<br />

mehr als zwei <strong>Grafikkarten</strong>. Die Nachteile wie eine erhöhte Eingabeverzögerung<br />

(Inputlag) werden dabei prinzipbedingt in Kauf genommen. Auch die Tendenz zu<br />

Mikrorucklern, verursacht durch ungleichmäßige Bildberechnungszeiten, muss sich<br />

der Jagd nach höheren Bildraten meist unterordnen.<br />

Split Frame Rendering<br />

Das SFR-Verfahren ist dem Scan-Line-Interleave ähnlich: Das Bild wird<br />

streifenweise zwischen den beteiligten <strong>Grafikkarten</strong> aufgeteilt.<br />

Beim SFR, auch als Scissoring bekannt, wird das Bild horizontal geteilt. Die Anzahl<br />

der Streifen ist theoretisch variabel, in der Praxis wurde bei dem heute kaum noch<br />

genutzten Verfahren aber meist grob 60:40 zwischen oberer und unterer Bildhälfte<br />

aufgetrennt, da im oberen Bereich meist die wenig rechenintensive Himmelstextur<br />

den Löwenanteil der Fläche beanspruchte und man eine möglichst gleichmäßige<br />

Verteilung der Rechenlast für das komplette Bild erreichen wollte.<br />

Da die Dreiecke ohne Engine-Unterstützung in der Regel erst nach der Rasterisierung<br />

der Bildhälfte zugeordnet werden können, muss die Geometrieverarbeitung<br />

entweder von einem separaten Prozessor oder auf jedem der Grafikchips redundant<br />

erfolgen. SFR erlaubt, besonders in einer dynamischen Version, eine noch gute<br />

Lastverteilung, aber keine Fps-Gewinne von 100 Prozent wie AFR.<br />

GPU 2 GPU 1<br />

GPU 1<br />

GPU 2<br />

(Super-) Tiling<br />

Tiling stammt vom englischen Wort für Kachel und entsprechend wird<br />

das Bild hier nicht nur horizontal, sondern auch vertikal aufgeteilt.<br />

Wie beim SFR muss hier für Geometrie zusätzlicher Aufwand getrieben werden, da<br />

erst spät im Renderprozess feststeht, in welchem Bildbereich das fertige Dreieck<br />

liegt. Mehr noch: Es kann auch in verschiedene „Tiles“(oder Streifen) hineinragen<br />

und muss dann natürlich entsprechend an alle ausführenden GPUs verteilt werden.<br />

Doch das Tiling hat einen entscheidenden Vorteil: Es skaliert aufgrund der<br />

horizontalen wie vertikalen Unterteilung unabhängig vom Bildinhalt gut mit einer<br />

variablen Anzahl an GPUs und lastet diese voll aus. Theoretisch ist es bei verteiltem<br />

Rechnen wie Raytracing-Farmen sogar möglich, vollkommen unterschiedliche Prozessoren<br />

einzusetzen. Im Echtzeitbereich jedoch spielt auch der Verteilungsaufwand<br />

eine wichtige Rolle, sodass von diesem Verfahren im praktischen Einsatz wieder<br />

Abstand genommen wurde.<br />

Scan Line Interleave<br />

Der Urvater aktueller Multi-GPU-Systeme verteilt die Pixellast auf fest<br />

den einzelnen GPUs zugeordneten Bildschirmstreifen.<br />

Als 3Dfx die Multi-GPU-Bühne betrat, war die Pixelwelt noch in Ordnung, sprich<br />

einfach und übersichtlich. Wenn der Arbeitsauftrag an die Pixelbeschleuniger<br />

erging, war bereits klar, wo in der Szene welche Objekte und Dreiecke hingehörten,<br />

und es musste sich nur noch um die Bildpunkte mit überschaubarer<br />

Effektvielfalt gekümmert werden. Entsprechend leicht war es für das Scan-Line-Interleave-Verfahren,<br />

das Bild in Streifen zu zerteilen und an verschiedene <strong>Grafikkarten</strong><br />

oder -chips zu verteilen. 100 Prozent gesicherte Informationen sind schwer<br />

zu bekommen, doch deutet die verfügbare Dokumentation auf einzeilige Streifen<br />

bei Voodoo und Voodoo 2 hin – Quad-basierte Pipelines und Texturcaches gab es<br />

noch nicht. Bei der Nachfolgearchitektur VSA-100 auf den Voodoo-5-Karten sollen<br />

es dagegen 32 Pixel breite Interleaves gewesen sein. Mit einem solchen Schema<br />

konnte man die Lokalität der Texturdaten mithilfe der Texturcaches besser nutzen.<br />

GPU 1 GPU 1<br />

GPU 2<br />

GPU 2<br />

54<br />

<strong>PC</strong> <strong>Games</strong> <strong>Hardware</strong> | 09/13<br />

www.pcgameshardware.de

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!