27.10.2014 Aufrufe

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

8.5. MT Analyser Web<br />

Auf allen Rechnern betrug die Ausführungszeit einer Textbewertung für 100 Sätze zwischen<br />

maximal 15 Sekunden auf dem Windows-Rechner und minimal fünf Sekunden auf<br />

den anderen Rechnern, die mehr RAM hatten. Bei der Bewertung der Textmerkmale<br />

benötigte der Algorithmus für Nominalklammern mit etwa fünf Sekunden auf dem Windows-Rechner<br />

die meiste Zeit, weil hier zahllose Abgleiche mit einem sehr großen regulären<br />

Ausdruck erfolgen. Insgesamt hält sich die Berechnungszeit einer Textanalyse also in akzeptablem<br />

Rahmen.<br />

8.5. MT Analyser Web<br />

Neben MT Analyser wurde noch eine leicht modifizierte Version des Programms als Webanwendung<br />

implementiert, daher die Bezeichnung MT Analyser Web. Im Gegensatz zu<br />

MT Analyser dient die Webanwendung weniger für den Produktiveinsatz als vielmehr als<br />

Vorführung für Menschen, die sich für maschinelle Übersetzung interessieren.<br />

8.5.1. Zusätzliche Hilfsmittel<br />

Weil das gesamte Programm bereits in Java geschrieben war, wurden Java Server Pages<br />

(JSP) benutzt, um die Weboberfläche zu erstellen. Als Server wurde Apache Tomcat<br />

5.5.x eingesetzt. Darüber hinaus wurden zwei weitere Hilfspakete der Apache-Jakarta-<br />

Projekts verwendet 2 : commons.fileupload und commons.io. Sie werden benötigt, um das<br />

Heraufladen <strong>von</strong> Dateien zur Bewertung zu ermöglichen, das standardmäßig nicht in der<br />

JSP-Spezifikation vorgesehen ist.<br />

8.5.2. Unterschiede zu MT Analyser<br />

Im wesentlichen benutzt MT Analyser Web dieselben Klassen, Attribute und Methoden<br />

wie auch MT Analyser, jedoch wurden einige Funktionen leicht verändert oder gestrichen.<br />

Entfallen sind insbesondere die Funktionen zum Bearbeiten des Mehrdeutigkeitslexikons.<br />

Diese werden für eine Demonstration der Bewertungsfunktion nicht unbedingt benötigt,<br />

und darüber hinaus beugt es Missbrauch vor, wenn Außenstehende keinen Zugriff auf<br />

die Lexikondatei haben und nicht nach Belieben falsche Einträge hinzufügen oder bereits<br />

bestehende löschen können. Dies würde zu einer Verfälschung der Analyse führen.<br />

Aus demselben Grund nicht vorhanden sind auch die Funktionen zum persistenten Setzen<br />

der Indexgewichte und zum Ändern der TreeTagger-Anbindung. Die zugehörigen Angaben<br />

sind in der Klasse SentenceAnalyser und in der Datei web.xml gespeichert und werden<br />

bei Bedarf <strong>von</strong> dort ausgelesen. Letztere können gegebenenfalls Systemadministratoren<br />

mit Zugriff auf den Server ändern.<br />

Hinzugefügt wurde ein Servlet, das die Interaktion zwischen den ausschließlich für die<br />

Datenaus- und -eingabe genutzten JSP-Seiten und dem Programmkern ermöglicht, indem<br />

es die Eingaben formatiert und an die Bewertungsfunktionen weiterleitet und die<br />

Ergebnisse angemessen formatiert zurückgibt, sowie ein Listener, der einen Upload abbricht,<br />

wenn die maximale Dateigröße (100 KB) überschritten wird.<br />

2 Im Internet erreichbar unter: http://jakarta.apache.org/commons/index.html, zuletzt besucht am<br />

8. April 2007<br />

113

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!