29.12.2013 Aufrufe

Fehlerbehebung und Optimieren der Datenbankleistung

Fehlerbehebung und Optimieren der Datenbankleistung

Fehlerbehebung und Optimieren der Datenbankleistung

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Datenwert<br />

Häufigkeit<br />

5 1<br />

Die Anzahl <strong>der</strong> Zeilen in <strong>der</strong> Tabelle ist 50, die Spaltenkardinalität 5. Genau 40 Zeilen<br />

erfüllen das Vergleichselement C1=3. Wenn angenommen wird, dass die Daten<br />

gleichmäßig verteilt wären, würde das Optimierungsprogramm die Anzahl <strong>der</strong><br />

Zeilen, die das Vergleichselement erfüllen mit 50/5 = 10 abschätzen, was einen<br />

Fehler von -75 % ausmacht. Wenn Statistikdaten zur Wertehäufigkeit auf <strong>der</strong> Basis<br />

nur des häufigsten Werte (d. h. N = 1) verfügbar sind, wird die Anzahl <strong>der</strong> Zeilen<br />

mit 40 abgeschätzt, sodass kein Fehler entsteht.<br />

Betrachten Sie ein an<strong>der</strong>es Beispiel, in dem zwei Zeilen das Vergleichselement C1 =<br />

1 erfüllen. Ohne Häufigkeitsstatistiken wird die Anzahl <strong>der</strong> Zeilen, die das Vergleichselement<br />

erfüllen, auf 10 geschätzt. Mithin entsteht ein Fehler von 400 %:<br />

geschätzte Zeilen - tatsächliche Zeilen<br />

--------------------------------------- X 100<br />

tatsächliche Zeilen<br />

10-2<br />

------ X 100 = 400%<br />

2<br />

Bei Verwendung <strong>der</strong> Häufigkeitsstatistik (N = 1) schätzt das Optimierungsprogramm<br />

die Anzahl <strong>der</strong> Zeilen, die diesen Wert enthalten, anhand <strong>der</strong> oben gezeigten<br />

Formel (1) wie folgt ab:<br />

(50 - 40)<br />

--------- = 3<br />

(5-1)<br />

Der Fehler wird dabei um eine Größenordnung verringert:<br />

3-2<br />

----- = 50%<br />

2<br />

Beispiel mit Quantilstatistiken<br />

In den folgenden Ausführungen zu Quantilstatistiken wird <strong>der</strong> Begriff „K-Quantile”<br />

verwendet. Das K-Quantil für eine Spalte ist <strong>der</strong> kleinste Datenwert V, sodass<br />

mindestens K Zeilen Datenwerte enthalten, die kleiner o<strong>der</strong> gleich V sind. Ein K-<br />

Quantil lässt sich berechnen, indem die Zeilen in <strong>der</strong> Spalte aufsteigenden sortiert<br />

werden. Das K-Quantil ist <strong>der</strong> Datenwert in <strong>der</strong> K-ten Zeile <strong>der</strong> sortierten Spalte.<br />

Wenn Quantilstatistiken verfügbar sind, kann das Optimierungsprogramm die Anzahl<br />

von Zeilen besser abschätzen, die ein Bereichsvergleichselement erfüllen, wie<br />

in folgenden Beispielen veranschaulicht wird. Betrachten Sie eine Spalte C1, die<br />

folgende Werte enthält:<br />

0,0<br />

5,1<br />

6,3<br />

7,1<br />

8,2<br />

8,4<br />

8,5<br />

9,1<br />

93,6<br />

100,0<br />

Kapitel 3. Faktoren mit Auswirkung auf die Leistung 515

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!