Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
8.5. MT Analyser Web<br />
Auf allen Rechnern betrug die Ausführungszeit einer Textbewertung für 100 Sätze zwischen<br />
maximal 15 Sekunden auf dem Windows-Rechner und minimal fünf Sekunden auf<br />
den anderen Rechnern, die mehr RAM hatten. Bei der Bewertung der Textmerkmale<br />
benötigte der Algorithmus für Nominalklammern mit etwa fünf Sekunden auf dem Windows-Rechner<br />
die meiste Zeit, weil hier zahllose Abgleiche mit einem sehr großen regulären<br />
Ausdruck erfolgen. Insgesamt hält sich die Berechnungszeit einer Textanalyse also in akzeptablem<br />
Rahmen.<br />
8.5. MT Analyser Web<br />
Neben MT Analyser wurde noch eine leicht modifizierte Version des Programms als Webanwendung<br />
implementiert, daher die Bezeichnung MT Analyser Web. Im Gegensatz zu<br />
MT Analyser dient die Webanwendung weniger für den Produktiveinsatz als vielmehr als<br />
Vorführung für Menschen, die sich für maschinelle Übersetzung interessieren.<br />
8.5.1. Zusätzliche Hilfsmittel<br />
Weil das gesamte Programm bereits in Java geschrieben war, wurden Java Server Pages<br />
(JSP) benutzt, um die Weboberfläche zu erstellen. Als Server wurde Apache Tomcat<br />
5.5.x eingesetzt. Darüber hinaus wurden zwei weitere Hilfspakete der Apache-Jakarta-<br />
Projekts verwendet 2 : commons.fileupload und commons.io. Sie werden benötigt, um das<br />
Heraufladen <strong>von</strong> Dateien zur Bewertung zu ermöglichen, das standardmäßig nicht in der<br />
JSP-Spezifikation vorgesehen ist.<br />
8.5.2. Unterschiede zu MT Analyser<br />
Im wesentlichen benutzt MT Analyser Web dieselben Klassen, Attribute und Methoden<br />
wie auch MT Analyser, jedoch wurden einige Funktionen leicht verändert oder gestrichen.<br />
Entfallen sind insbesondere die Funktionen zum Bearbeiten des Mehrdeutigkeitslexikons.<br />
Diese werden für eine Demonstration der Bewertungsfunktion nicht unbedingt benötigt,<br />
und darüber hinaus beugt es Missbrauch vor, wenn Außenstehende keinen Zugriff auf<br />
die Lexikondatei haben und nicht nach Belieben falsche Einträge hinzufügen oder bereits<br />
bestehende löschen können. Dies würde zu einer Verfälschung der Analyse führen.<br />
Aus demselben Grund nicht vorhanden sind auch die Funktionen zum persistenten Setzen<br />
der Indexgewichte und zum Ändern der TreeTagger-Anbindung. Die zugehörigen Angaben<br />
sind in der Klasse SentenceAnalyser und in der Datei web.xml gespeichert und werden<br />
bei Bedarf <strong>von</strong> dort ausgelesen. Letztere können gegebenenfalls Systemadministratoren<br />
mit Zugriff auf den Server ändern.<br />
Hinzugefügt wurde ein Servlet, das die Interaktion zwischen den ausschließlich für die<br />
Datenaus- und -eingabe genutzten JSP-Seiten und dem Programmkern ermöglicht, indem<br />
es die Eingaben formatiert und an die Bewertungsfunktionen weiterleitet und die<br />
Ergebnisse angemessen formatiert zurückgibt, sowie ein Listener, der einen Upload abbricht,<br />
wenn die maximale Dateigröße (100 KB) überschritten wird.<br />
2 Im Internet erreichbar unter: http://jakarta.apache.org/commons/index.html, zuletzt besucht am<br />
8. April 2007<br />
113