16.12.2012 Aufrufe

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

7 Fusion<br />

s f usion ∈ A f usion wie folgt definieren:<br />

s f usion =<br />

=<br />

���s1 �<br />

· |A2| + s2 · |A3| + s3<br />

� sk für k = 1,<br />

sk−1 · |Ak| + sk sonst.<br />

Hierbei gilt für die Größe des entstehenden Alphabetes A f usion:<br />

�<br />

k<br />

|A f usion| = ∏<br />

i=1<br />

�<br />

... · sk + |Ak| mit sk ∈ Ak (7.8)<br />

(7.9)<br />

|Ai| (7.10)<br />

Die oben geforderte eindeutige Zuordnung der Elemente der zu fusionierenden Merkmalssequenzen<br />

schränkt die Menge der fusionierbaren Merkmalstypen deutlich ein. Konkret lassen<br />

sich ohne weitere Verarbeitungsschritte nur solche Merkmale verwenden, für deren Gewinnung<br />

die selben Abtastpunkte verwendet wurden. Dies gilt für die Merkmale ϕ der lokalen<br />

Schriftneigung aus Abschnitt 5.3 und die Merkmale ψ der lokalen Schriftkrümmung aus Abschnitt<br />

5.4. Der jeweilige Parameter q der Größenquantisierung für ϕ und ψ kann frei gewählt<br />

werden. Für eine Fusion <strong>von</strong> Schriftrichtungsmerkmalen mit beispielsweise qϕ = 16<br />

und Schriftkrümmungsmerkmalen mit qψ = 8 ergäbe sich ein Alphabet A f usion, dessen Größe<br />

|A f usion| = 16 · 8 betragen würde.<br />

Der Parameter w der vorangehenden äquidistanten Neuabtastung muss für die Schriftneigung<br />

und die -krümmung identisch sein, andernfalls ergäben sich Merkmalssequenzen unterschiedlicher<br />

Länge, was zu einem Verlust der eindeutigen Zuordenbarkeit der Elemente<br />

führen würde.<br />

Eine multialgorithmische Fusion auf der Entscheidungsebene lässt sich in der selben Weise<br />

durchführen, wie dies für die Multi-Instanz-Fusion im vorangegangen Abschnitt beschrieben<br />

wurde (siehe Gleichungen 7.1 und 7.2); die Treffermengen der Einzelanfragen werden<br />

mittels Mengenalgebra zu einer einzigen Treffermenge vereinigt.<br />

Genauso wie für die Multi-Instanz-Fusion lässt sich eine multialgorithmische Fusion auf<br />

der Vergleichsebene realisieren. Wie im Fall der Fusion auf Merkmalsebene bieten sich hierfür<br />

insbesondere Verfahren der Merkmalsgewinnung an, die eine elementweise Zuordenbarkeit<br />

der Merkmalssequenzen untereinander gestatten. Dies liegt im Fall der Fusion auf Vergleichsebene<br />

darin begründet, dass bei der Suche je ein Ähnlichkeitswert für jedes Symbol<br />

der Merkmalssequenzen der Dokumentdaten bestimmt wird. (Wie in Abschnitt 6.2 erläutert,<br />

wird für die Suche der Editierabstand zwischen der Suchsequenz und bestimmten Teilen der<br />

Dokumentsequenz bestimmt, wobei jedes Element der Dokumentsequenz genau einmal das<br />

Ende einer solchen Teilsequenz ist.) Analog zur, im vorangegangenen Abschnitt beschriebenen,<br />

Fusion auf Vergleichsebene lässt sich diese auch für die multialgorithmische Fusion<br />

durch gewichtete Summen oder durch Bestimmung <strong>von</strong> Mittelwerten der Vergleichswerte der<br />

Einzelanfragen umsetzen (siehe Gleichungen 7.4 und 7.5).<br />

96

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!