13.07.2015 Aufrufe

Studienarbeit

Studienarbeit

Studienarbeit

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

zunächst in eine Normalform überführt werden. Die Konvertierung in die vom HTML-Konvertererzeugte Standardform erfolgt durch einen sed-Filter.Die Volltextsuche geschieht durch Filterung aller Artikeldokumente mit dem UNIX-Kommandogrep. Da das Satzformat der tageszeitung keine Silbentrennungen enthält, ist eine Freitextsuchemit diesem Werkzeug recht zuverlässig. Eine wesentliche Einschränkung ist durch die zeilenorientierteSuche von grep gegeben: die gesuchte Zeichenfolge wird nur dann gefunden, wenn siesich in ein und dersselben Textzeile des Artikeldokuments befindet.Vor dem Durchsuchen mittels grep werden die Artikeldokumente zunächst durch einen sed - Filtergeschickt, der sämtliche in ihnen enthaltenen HTML-Direktiven entfernt. Die grep Option -wwird entsprechend der im Formular gewählten Suchoption “Nur ganzes Wort suchen” gesetzt. Enthältein Artikeldokument die gesuchte Zeichenfolge, wird die zwischen den HTML-Direktiven und stehende Artikelüberschrift mittels eines sed-Filters extrahiert, mit einem linkauf den entsprechenden Artikel versehen und in die Ergebnisliste übertragen. Das Ergebnisdokumentbesteht aus dem Suchformular und der Liste aller Artikel, in der die gesuchte Zeichenfolgegefunden wurde,.60 Entwicklung einer World Wide Web Ausgabe einer Tageszeitung

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!