16.01.2015 Aufrufe

4. Textalgorithmen Arten von String-Matching-Problemen ...

4. Textalgorithmen Arten von String-Matching-Problemen ...

4. Textalgorithmen Arten von String-Matching-Problemen ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>4.</strong> <strong>Textalgorithmen</strong> Konstruktion <strong>von</strong> Positionsbäumen<br />

Bemerkungen:<br />

<strong>4.</strong> <strong>Textalgorithmen</strong> Konstruktion <strong>von</strong> Positionsbäumen<br />

Beispiel <strong>4.</strong>19.<br />

Der partielle Positionsbaum für abba sieht wie folgt aus:<br />

• Nachteil der Rechts-Links-Konstruktion: Die gesamte Zeichenreihe<br />

muß bekannt sein, bevor sich der Positionsbaum konstruieren läßt.<br />

• Beim Entwickeln <strong>von</strong> Text möchte man aber u.U. schon vorher Textstellen<br />

identifizieren und Korrekturen vornehmen.<br />

a<br />

b<br />

• Einen Positionsbaum für den umgekehrten Text aufzubauen wäre unnatürlich.<br />

b<br />

a<br />

b<br />

• Kann ein Positionsbaum auch effizient <strong>von</strong> links nach rechts konstruiert<br />

werden<br />

1 3<br />

2<br />

Information Retrieval — FH Bonn-Rhein-Sieg, SS 06 266<br />

Information Retrieval — FH Bonn-Rhein-Sieg, SS 06 268<br />

<strong>4.</strong> <strong>Textalgorithmen</strong> Konstruktion <strong>von</strong> Positionsbäumen<br />

Links-Rechts-Konstruktion <strong>von</strong> Positionsbäumen<br />

<strong>4.</strong> <strong>Textalgorithmen</strong> Konstruktion <strong>von</strong> Positionsbäumen<br />

• Für Positionsbäume gilt eine sehr einfache und wichtige Verschachtelungseigenschaft,<br />

die beschreibt, wie sich Positionsidentifikatoren<br />

überlappen können.<br />

• Ziel ist es, ein sogenanntes on-line Verfahren für die Konstruktion <strong>von</strong><br />

Positionsbäumen zu entwickeln.<br />

• Da für Teilstrings der Positionsbaum nicht existiert, muß man partielle<br />

Positionsbäume betrachten.<br />

• Ein partieller Positionsbaum enthält für genau diejenigen Positionen<br />

des Textes einen Positionsidentifikator, für die es einen solchen Positionsidentifikator<br />

gibt.<br />

• Die wesentliche Aussage hierzu liefert das folgende Monotonie-<br />

Lemma.<br />

Lemma <strong>4.</strong>1<strong>4.</strong> [Monotonie-Lemma] Es sei e(i) die Position, bei der<br />

der Positionsidentifikator p(i) endet. Dann gilt:<br />

i < j =⇒ e(i) ≤ e(j)<br />

Beweis. Annahme: Es gibt in einem <strong>String</strong> s Positionen i < j mit e(i) ><br />

e(j).<br />

Information Retrieval — FH Bonn-Rhein-Sieg, SS 06 267<br />

Information Retrieval — FH Bonn-Rhein-Sieg, SS 06 269

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!