Archivserver der Deutschen Nationalbibliothek - Katalog der ...
Archivserver der Deutschen Nationalbibliothek - Katalog der ...
Archivserver der Deutschen Nationalbibliothek - Katalog der ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Kapitel 2 Grundlagen & Stand <strong>der</strong> Forschung<br />
Bewertungs-<br />
positive Bewertung einem Punkt, eine neutrale Bewertung keinem Punkt und eine negative<br />
Bewertung einem Minuspunkt entspricht. Die Bewertungen <strong>der</strong> einzelnen Katemaßstab<br />
gorien erfolgen nach folgenden Kriterien, um eine Objektivität zu gewährleisten:<br />
Vergleichbarkeit. Vergleichbarkeit ist bei den meisten Benchmarks gegeben. Entwe<strong>der</strong><br />
verwenden Benchmarks feste Workloads für eine einfache Vergleichbarkeit<br />
o<strong>der</strong> sie sehen Referenzworkloads vor. Ist keine <strong>der</strong> beiden Möglichkeiten vorgesehen,<br />
wird eine negative Bewertung vergeben, sonst eine positive. Ebenso gibt<br />
es eine negative Bewertung, wenn <strong>der</strong> Benchmark nur für wenige spezifische<br />
Architekturen implementiert wurde.<br />
Repräsentativität. Benchmarks, die nur einen Workload unterstützen, erhalten in<br />
diesem Punkt eine negative Bewertung. Werden mehrere Lastverhalten unterstützt,<br />
wird hier eine neutrale Bewertung vergeben. Nur Benchmarks, die eine<br />
freie Definition von I/O-Lasten in ihrem Fokus verarbeiten können, erhalten eine<br />
positive Bewertung.<br />
Skalierbarkeit. Ist eine automatische o<strong>der</strong> einfache manuelle Skalierung <strong>der</strong> Lasten<br />
des Benchmarks an neue Systeme möglich, erhält ein Benchmark eine positive<br />
Bewertung in <strong>der</strong> Kategorie „Skalierung”. Ist eine Skalierung nur durch Än<strong>der</strong>ung<br />
und Neuübersetzung <strong>der</strong> Quellen möglich, wird eine neutrale Bewertung<br />
gegeben. Hingegen gibt es eine negative Bewertung, wenn keine Skalierung ermöglicht<br />
wird.<br />
Systemverständnis. Ein Benchmark hilft dann beim Systemverständnis, wenn einzelne<br />
Parameter variiert werden können, um <strong>der</strong>en Einfluss auf das System zu<br />
erkennen. Wenn dies einfach möglich ist o<strong>der</strong> automatisch vom Benchmark gemacht<br />
wird, gibt es eine positive Bewertung. Kann <strong>der</strong> Nutzer Parameter variieren,<br />
die aber einen neuen Benchmarklauf benötigen, ist die Bewertung neutral.<br />
Negative Bewertungen gibt es, wenn eine <strong>der</strong>artige Variation gar nicht möglich<br />
ist.<br />
Reproduzierbarkeit. Reproduzierbarkeit kann prinzipiell bei jedem Benchmark realisiert<br />
werden. Wichtig dafür ist eine gute Dokumentation des Entwicklers, in<br />
<strong>der</strong> genaue Hinweise zu erlaubten Optimierungen, zur Kompilation und Ausführungsumgebung<br />
gegeben werden. Viele Benchmark-Entwickler erlauben beliebige<br />
Compiler-Optimierungen. In solchen Fällen kann <strong>der</strong> Benchmark leicht zu<br />
einem Compiler-Test werden. Dennoch ist dies eine klare Aussage zur Kompilation<br />
und wird an dieser Stelle positiv bewertet. Fehlen Aussagen zur Kompilation<br />
und Ausführungsumgebung wird an dieser Stelle eine neutrale Bewertung<br />
gegeben.<br />
I/O-Bezug. Ein Benchmark erhält die positive Bewertung +, wenn ausschließlich I/O<br />
vermessen wurde, sonst gibt es eine neutrale Bewertung.<br />
Laufzeit. Diese Eigenschaft erfüllt je<strong>der</strong> verbreitete Benchmark, da er von Nutzern<br />
nicht eingesetzt werden kann, wenn seine Laufzeit eine nicht tolerierbare Grenze<br />
40