16.12.2012 Aufrufe

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

8 Evaluation<br />

Berechnung der Werte Precision und Recall voraus (siehe Abschnitt 8.2). Besser wäre es, für<br />

die Dokumente jedes einzelnen Benutzers n automatisch einen individuellen optimalen Ähnlichkeitsschwellwert<br />

τopt(n) zu ermitteln. Hierbei soll der Wert τEER als optimal betrachtet<br />

werden, der für jeden Benutzer n individuell zu bestimmen ist.<br />

Um die Möglichkeit einer automatischen Bestimmung optimaler Ähnlichkeitsschwellwerte<br />

aus Handschriftdaten zu untersuchen, soll für jeden Benutzer der Zusammenhang dargestellt<br />

werden, der zwischen τEER(n) und beispielsweise der Entropie H der jeweiligen Merkmalszeichenketten<br />

besteht [Sha48]. Die Entropie H reduziert hierbei, verkürzt ausgedrückt, die<br />

Merkmalszeichenketten auf den mittleren Informationsgehalt pro Merkmalszeichen. Auf diese<br />

Weise wird es möglich, in einem Streudiagramm (engl. scatter plot), welches den Schwellwert<br />

τEER und die Entropie H jedes Benutzers als einen Punkt in der Ebene abbildet, etwaige<br />

Zusammenhänge zwischen diesen Werten zu erkennen. Die Entropie H(s) einer Zeichenkette<br />

s ∈ A ∗ möge in der folgenden Weise definiert sein:<br />

|A|<br />

H(s) = − pi · log2(pi) (8.20)<br />

∑<br />

i=1<br />

Hierbei sei der Wert pi die relative Häufigkeit für das Auftreten des i-ten Elementes des Alphabetes<br />

A in der Zeichenkette s:<br />

pi = 1<br />

|s| �<br />

1 falls s j = i,<br />

|s| ∑ 0 sonst.<br />

j=1<br />

Es sei hierbei i ∈ A dieses i-te Element <strong>von</strong> A.<br />

optimal similarity threshold τ EER<br />

0.59<br />

0.585<br />

0.58<br />

0.575<br />

0.57<br />

0.565<br />

0.56<br />

0.555<br />

0.55<br />

0.545<br />

0.54<br />

0.535<br />

0.53<br />

2.7 2.72 2.74 2.76 2.78 2.8 2.82 2.84 2.86 2.88 2.9 2.92<br />

alphabet entropie H<br />

(8.21)<br />

Abbildung 8.10: Zusammenhang zwischen den individuellen Ähnlichkeitsschwellwerten<br />

τEER und der Entropie der jeweiligen Merkmalszeichenketten am Beispiel<br />

der quadratischen Gitterquantisierung (Gitterweite 10)<br />

114

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!