4. Textalgorithmen Arten von String-Matching-Problemen ...
4. Textalgorithmen Arten von String-Matching-Problemen ...
4. Textalgorithmen Arten von String-Matching-Problemen ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
<strong>4.</strong> <strong>Textalgorithmen</strong> Konstruktion <strong>von</strong> Positionsbäumen<br />
Bemerkungen:<br />
<strong>4.</strong> <strong>Textalgorithmen</strong> Konstruktion <strong>von</strong> Positionsbäumen<br />
Beispiel <strong>4.</strong>19.<br />
Der partielle Positionsbaum für abba sieht wie folgt aus:<br />
• Nachteil der Rechts-Links-Konstruktion: Die gesamte Zeichenreihe<br />
muß bekannt sein, bevor sich der Positionsbaum konstruieren läßt.<br />
• Beim Entwickeln <strong>von</strong> Text möchte man aber u.U. schon vorher Textstellen<br />
identifizieren und Korrekturen vornehmen.<br />
a<br />
b<br />
• Einen Positionsbaum für den umgekehrten Text aufzubauen wäre unnatürlich.<br />
b<br />
a<br />
b<br />
• Kann ein Positionsbaum auch effizient <strong>von</strong> links nach rechts konstruiert<br />
werden<br />
1 3<br />
2<br />
Information Retrieval — FH Bonn-Rhein-Sieg, SS 06 266<br />
Information Retrieval — FH Bonn-Rhein-Sieg, SS 06 268<br />
<strong>4.</strong> <strong>Textalgorithmen</strong> Konstruktion <strong>von</strong> Positionsbäumen<br />
Links-Rechts-Konstruktion <strong>von</strong> Positionsbäumen<br />
<strong>4.</strong> <strong>Textalgorithmen</strong> Konstruktion <strong>von</strong> Positionsbäumen<br />
• Für Positionsbäume gilt eine sehr einfache und wichtige Verschachtelungseigenschaft,<br />
die beschreibt, wie sich Positionsidentifikatoren<br />
überlappen können.<br />
• Ziel ist es, ein sogenanntes on-line Verfahren für die Konstruktion <strong>von</strong><br />
Positionsbäumen zu entwickeln.<br />
• Da für Teilstrings der Positionsbaum nicht existiert, muß man partielle<br />
Positionsbäume betrachten.<br />
• Ein partieller Positionsbaum enthält für genau diejenigen Positionen<br />
des Textes einen Positionsidentifikator, für die es einen solchen Positionsidentifikator<br />
gibt.<br />
• Die wesentliche Aussage hierzu liefert das folgende Monotonie-<br />
Lemma.<br />
Lemma <strong>4.</strong>1<strong>4.</strong> [Monotonie-Lemma] Es sei e(i) die Position, bei der<br />
der Positionsidentifikator p(i) endet. Dann gilt:<br />
i < j =⇒ e(i) ≤ e(j)<br />
Beweis. Annahme: Es gibt in einem <strong>String</strong> s Positionen i < j mit e(i) ><br />
e(j).<br />
Information Retrieval — FH Bonn-Rhein-Sieg, SS 06 267<br />
Information Retrieval — FH Bonn-Rhein-Sieg, SS 06 269