Vergleich des Oberon x86−Compilers mit dem GNU gcc - Computer ...

Weitere Magazine

Empfehlungen

Info

Eine Schwäche des Oberon−Compiler scheinen Array− bzw. Matrix−Zugriffe zu sein. In allenKernels, die Array−Zugriffe testen (mm, intmm, quick und bubble) schneidet der Compilerschlechter ab, als der gcc. Bemerkenswert ist hier, dass der gcc sehr stark von den Basis−Optimierungen (lokale CSE und Sprungoptimierungen) zu profitieren scheint.Interessant ist, dass Paar Quicksort vs. Bubble−Sort zu betrachten. Während beide vieleArray−Zugriffe durchführen (und daher der gcc schneller sein sollte, als der Oberon−Compiler), ist das Bild beim rekursiven Quicksort viel ausgeglichener als beim iterativenBubblesort.Prinzipiell lässt sich sagen, dass der gcc−Code mit eingeschalteten Basis−Optimierungensehr häufig schneller ist als der des Oberon−Compiler, es sei denn der Kernel enthält einengrossen Anteil an Prozeduraufrufen. Der weitere Leistungsgewinn (−O2 und −O3) ist häufigsehr klein oder gar negativ!Die logische Vorgehensweise wäre jetzt eigentlich, sich die Basis−Optimierungen genaueranzuschauen. Leider ist das aber nicht möglich. Der aktuelle gcc erlaubt es nicht, dieseOptimierungen einzeln zu aktivieren und zu deaktivieren. Wir können also keine genaueAussage darüber machen, welche Optimierungen in diesem Paket den grössten Effekterzielt.Anstattdessen werden wir im nächsten Schritt die separat einschaltbaren Optimierungengenauer betrachten, um herauszufinden, ob es darunter eine gibt, die einen überragendenEinfluss hat.5. Optimierungen im DetailZiel dieses Experiments ist, herauszufinden, welche der "weitergehenden" Optimierungendes gcc, welchen Einfluss auf die Leistung des Codes haben. Dafür wurden, ausgehend vomoptimierenden Compiler−Lauf, die einzelnen Optionen variiert.Aufteilung der gcc−Optimierungen im ExperimentIm Experiment wurde der aktuell verfügbare egcs 1.1.2 verwendet. Für die Berechnung derBeiträge der einzelnen Optimierungen, wurden sie in "Paketen" zusammengefasst. Leitfadenbei der Zusammenstellung war, möglichst ähnliche Optimierungen zusammenzufügen, bzw.mehrere gcc−Optionen, die verschiedene Varianten derselben Optimierung steuern,zusammenzunehmen. Mit diesem Ansatz wurde versucht, die Anzahl Parameter, die zuvariieren sind, in einem vernünftigen Rahmen zu halten. Sollte sich herausstellen, dass einPaket sehr starken Einfluss hat, oder stark mit einem anderen interagiert, so können sie ineinem zweiten Schritt noch aufgeteilt werden.Im folgenden sind die Pakete jeweils mit den genauen getesteten Compilerschalternangegeben:1. Local Common Subexpression EliminationEs ist zwar nicht möglich, die LCSE aus− oder einzuschalten, es gibt aber dennoch eineganze Reihe von Optionen, die das Verhalten der LCSE steuern. Sie wurden alle in
diesem Paket zusammengefasst.Die Schalter sind:−ffunction−cse−fforce−mem−fforce−addr−fcse−follow−jumps−fcse−skip−blocks2. Global Common Subexpression EliminationSchaltet die GCSE ein oder aus. Schalter:−fgcse3. Function InliningEs gibt die Möglichkeit, Function Inlining nur für Funktionen einzuschalten, die im Quelltextals "inline" markiert sind. Da aber der Vergleich zum Oberon−Compiler gesucht ist, und esdiese Möglichkeit in Oberon nicht gibt, wird nur zwischen gar kein FI und heuritischem FI(d.h. der Compiler versucht, herauszufinden, bei welcher Funktion es sich lohnt, sie direkteinzufügen) unterschieden.Compilerschalter kein FI:−fno−inlineCompilerschalter heuristisches Inlining:−finline4. Instruction SchedulingDer gcc bietet die Möglichkeit, das Scheduling nach der Registervergabe ein zweites Maldurchzuführen, um zu verhindern, dass Spilling Code den Schedule zerstört. Für denersten Schritt wurden beide Durchläufe aktiviert, mit der Option, sie später nochaufzutrennen.Compilerschalter:−fschedule−insns−fschedule−insns25. Loop OptimizationsAlle Schleifenoptimierungen in einem Paket:−fstrength−reduce−funroll−loops−fmove−all−movables−freduce−all−givs−frerun−cse−after−loop (durch −funroll−loops impliziert)−frerun−loop−opt6. DiverseEine ganze Reihe "kleinerer" Optimierungen, die sich im Wesentlichen mit Spezialitätendes Assemblercodes beschäftigen. Es handelt sich dabei um die folgenden:−fregmove:Optimiert das Verschieben von Registern.−fomit−frame−pointer:Optimiert den Stackframe von Prozeduren, indem kein Frame−Pointer angelegt wird.
Seite 6 und 7: Oberon gcc −O0 gcc −O1 gcc −O
Seite 10 und 11: −fthread−jumps:Optimiert kondit
Seite 12 und 13: quick (0.09%)puzzle (0.40%)tree (0.

Vergleich des Oberon x86−Compilers mit dem GNU gcc - Computer ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?