31.07.2013 Aufrufe

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Informationsl<strong>in</strong>guistik<br />

Abtrennen / Bearbeiten nach dem Porter-Algorithmus<br />

Regel: (Bed<strong>in</strong>gung) S1 S2: falls e<strong>in</strong> Wort mit dem Suffix S1 endet und der<br />

Stamm vor S1 <strong>die</strong> Bed<strong>in</strong>gung erfüllt, dann wird S1 durch S2 ersetzt<br />

<strong>die</strong> Bed<strong>in</strong>gung wird durch m def<strong>in</strong>iert; etwa: (m > 1)<br />

Bsp.: (m>1) EMENT _<br />

S1 = EMENT; S2 = Null<br />

REPLACEMENT REPLAC<br />

*S der Stamm endet mit „S“<br />

*V* der Stamm enthält e<strong>in</strong>en Vokal<br />

*d der Stamm endet mit e<strong>in</strong>em Doppelkonsonant (etwa: -TT, -SS)<br />

and, or, not : Komb<strong>in</strong>ationen von Bed<strong>in</strong>gungen<br />

bei mehreren Regeln <strong>in</strong> e<strong>in</strong>em Schritt: nur e<strong>in</strong>e anwenden, und zwar <strong>die</strong> mit<br />

dem „longest match“<br />

HHU Düsseldorf, WS 2004/05 <strong>E<strong>in</strong>führung</strong> <strong>in</strong> <strong>die</strong> <strong>Informationswissenschaft</strong> 171

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!