31.07.2013 Aufrufe

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Erkennung von Phrasen<br />

Informationsl<strong>in</strong>guistik<br />

• Eigennamen („Miranda Otto“, „He<strong>in</strong>rich-He<strong>in</strong>e-Universität<br />

Düsseldorf“)<br />

• Mehrwortbegriffe (häufig im Englischen: „high school“, „soft<br />

ice“; aber auch im Deutschen: „juristische Person“)<br />

• Phrasen müssen <strong>in</strong> den Dokumenten und <strong>in</strong> den<br />

Suchanfragen erkannt werden; bzl. der Dokumente geht <strong>die</strong><br />

Phrase (<strong>in</strong> Grundform) <strong>in</strong> <strong>die</strong> <strong>in</strong>vertierte Datei e<strong>in</strong><br />

• Methoden der Phrasenerkennung<br />

– Abgleich mit Phrasenwörterbuch (<strong>die</strong>ses muss auf- und<br />

ausgebaut werden; deshalb: Rückgriff auf weitere Methoden)<br />

– Textklumpen<br />

– Indikatorbegriffe (vor allem zur Identifikation von Eigennamen)<br />

HHU Düsseldorf, WS 2004/05 <strong>E<strong>in</strong>führung</strong> <strong>in</strong> <strong>die</strong> <strong>Informationswissenschaft</strong> 210

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!