Effizientes Lösen linearer Gleichungssysteme über GF(2) - CDC ...
Effizientes Lösen linearer Gleichungssysteme über GF(2) - CDC ...
Effizientes Lösen linearer Gleichungssysteme über GF(2) - CDC ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Kapitel 3<br />
Die Umsetzung des M4RI in<br />
CUDA<br />
Kapitel 3 ist der Hauptbestandteil der Arbeit und enthält alle Informationen<br />
zum Programm und zu den erreichten Ergebnissen.<br />
In Kapitel 3.1 wird zunächst der verwendete Algorithmus genau beschrieben.<br />
Wie dieser für die Ausführung auf einer Grafikkarte modifiziert wurde<br />
und welche Ergebnisse damit erzielt werden konnten, wird in Kapitel 3.2<br />
dargestellt. Dazu informiert dieses Unterkapitel zuerst dar<strong>über</strong>, welche GPU<br />
und API das Programm benutzt. Anschließend wird die Parallelisierung des<br />
Algorithmus beschrieben und erklärt, wie der Speicher organisiert und welche<br />
Parametereinstellungen gewählt wurden. Im späteren Verlauf konnte das<br />
Programm optimiert und somit die Berechnungszeit verbessert werden. Die<br />
dafür vorgenommenen Veränderungen und die Analyse der Ergebnisse sind<br />
ebenfalls dokumentiert. Da der Zeitvergleich mit Berechnungen auf der CPU<br />
zeigt, dass mit GPUs eine schnellere Bearbeitung möglich ist, sollte in Betracht<br />
gezogen werden, das Programm so zu ändern, dass die Möglichkeit<br />
besteht mit mehreren Grafikkarten zu arbeiten, um auch größere lineare <strong>Gleichungssysteme</strong><br />
lösen zu können. Die Arbeit enthält zu diesem Ansatz keinen<br />
Programmcode, zeigt und diskutiert aber in Kapitel 3.3 mehrere Wege, wie<br />
dies theoretisch realisiert werden kann und gibt einen Einstieg in die Umsetzung<br />
mit CUDA.<br />
37