05.11.2013 Aufrufe

Ausgabe 03/07 - Siemens Mobility

Ausgabe 03/07 - Siemens Mobility

Ausgabe 03/07 - Siemens Mobility

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

ARTread TM ist am schnellsten und genauesten<br />

„Goldmedaille“ für<br />

Handschrifterkennung<br />

Wer an einem internationalen Wettbewerb teilnimmt, kann gewinnen –<br />

oder sich bis auf die Knochen blamieren. <strong>Siemens</strong> gewann mit Bravour und<br />

sicherte sich bei der diesjährigen ICDAR-Konferenz den ersten Platz bei der<br />

automatischen Erkennung arabischer Handschriften.<br />

Rückblickend sieht alles ganz einfach aus.<br />

Wenn jemand bereits im Jahr 2000 Lesegeräte<br />

für arabische Maschinenschrift<br />

nach Dubai geliefert hat, in<br />

den Folgejahren nach Saudi-<br />

Arabien und heute mit weiteren<br />

arabischen Ländern im<br />

Gespräch ist, dann verwundert<br />

es nicht, dass dieser Jemand<br />

auch den diesjährigen<br />

Wettbewerb der ICDAR (International<br />

Conference on Document<br />

Analysis and Recognition)<br />

im Erkennen arabischer<br />

Handschriften gewonnen hat.<br />

Rückblickend. „Denn als wir<br />

überlegten, ob wir bei dem<br />

Wettbewerb mitmachen sollen,<br />

war dieser Erfolg noch<br />

nicht abzusehen“, gibt Udo<br />

Miletzki, Produktmanager Reading<br />

Coding im <strong>Siemens</strong> Geschäftsbereich<br />

Infrastructure<br />

Logistics unumwunden zu.<br />

Die ersten Benchmark-Tests im<br />

Erkennen arabischer Handschriften<br />

fanden bereits vor<br />

zwei Jahren statt; sie lieferten<br />

Leseraten von 80 bis 85 Prozent.<br />

<strong>Siemens</strong> war damals<br />

nicht dabei und „uns war klar,<br />

dass die Konkurrenz ihre Verfahren<br />

inzwischen weiterentwickelt<br />

hat“, so Miletzki.<br />

„Wenn wir aber mitmachen<br />

würden, dann natürlich mit<br />

dem Ziel, Erster zu werden.“<br />

Kein leichtes Unterfangen, da<br />

das Kundengeschäft unter den<br />

Arbeiten für den Wettbewerb<br />

ja nicht leiden durfte.<br />

„Schließlich beschlossen wir<br />

doch, mitzumachen, die Aussicht auf die<br />

ausgezeichnete Referenz war zu verlockend“,<br />

erklärt der Produktmanager.<br />

Innerhalb von vier Wochen baute das<br />

Team unter Anleitung von Marc-Peter<br />

Schambach und Jörg Rottland aus der Entwicklungsabteilung<br />

den Handschriftleser<br />

zusammen. Keiner von ihnen<br />

sprach Arabisch. „Schließlich<br />

reichten wir zwei Systeme ein,<br />

eines war auf Schnelligkeit,<br />

das andere auf Genauigkeit<br />

optimiert“, erklärt Miletzki.<br />

Schnelligkeit und Genauigkeit<br />

waren die entscheidenden Bewertungskriterien<br />

des ICDAR-<br />

Wettbewerbs.<br />

ARTread TM liest<br />

auch arabisch<br />

Die Entwickler nutzten das<br />

<strong>Siemens</strong> ARTread TM Erkennungssystem<br />

für arabische Maschinenschrift,<br />

das bereits in der<br />

Praxis erprobt ist. Als Daten<br />

standen die von den Organisatoren<br />

des Wettbewerbs gesammelten<br />

handgeschriebenen<br />

arabischen Wörter zur Verfügung.<br />

Die <strong>Siemens</strong>-Entwickler<br />

destillierten daraus Modelle<br />

für arabische Handschriften,<br />

trainierten das Lesesystem mit<br />

bekannten Begriffen und testeten<br />

es anschließend mit<br />

Wörtern, die dem System unbekannt<br />

waren.<br />

Dann kam der Tag der Wahrheit.<br />

<strong>Siemens</strong> musste gegen<br />

acht Konkurrenten antreten<br />

– meist Forschungseinrichtungen,<br />

aber auch Industrie im<br />

Hintergrund, kurz, alles was<br />

Rang und Namen hat – die insgesamt<br />

zwölf Systeme eingereicht<br />

hatten. Jeder Kandidat bekam 937<br />

tunesische Städtenamen zum Lesen, die<br />

von verschiedenen Personen geschrieben<br />

worden waren.<br />

<strong>Siemens</strong> gewann mit seinem auf Genauigkeit<br />

optimierten System in allen Kategorien<br />

und erreichte mit 94,6 Prozent die<br />

höchste Leserate, die zwar „nur“ ein Prozent<br />

besser war als der Zweitplatzierte,<br />

dafür aber rund 70 Prozent schneller –<br />

und 14 mal schneller als der Durchschnitt!<br />

Das beeindruckte auch die Jury:<br />

Bei den meisten Kandidaten habe man<br />

nach dem Leserstart erst mal Kaffee trinken<br />

gehen können, bis erste Ergebnisse<br />

eintrudelten, bemerkte der Jury-Leiter<br />

Volker Märgner von der TU Braunschweig<br />

anlässlich der Preisverleihung. Die Anstrengungen<br />

von <strong>Siemens</strong> sind bereits als<br />

Produkt innerhalb der ARTread TM Familie<br />

eingeflossen und stehen für Leseaufgaben<br />

mit arabischer Schrift zur Verfügung.<br />

Verwandt, aber<br />

doch völlig anders<br />

Das lateinische und arabische Alphabet<br />

haben dieselben Wurzeln.<br />

Allerdings hat im Arabischen jedes<br />

Zeichen vier Formen, die sich<br />

zum Teil erheblich voneinander<br />

unterscheiden. Welche Form die<br />

richtige ist, hängt davon ab, wo<br />

das Zeichen im Wort steht. Doch<br />

es kommt noch schlimmer: Wie<br />

bei deutschen Umlauten gibt es<br />

auch im Arabischen Punkte – bis<br />

zu drei über einem Zeichen und<br />

bis zu zwei unter einem Zeichen.<br />

Ihnen kommt entscheidende Bedeutung<br />

zu. In der arabischen<br />

Schrift wird auch meist auf Vokale<br />

verzichtet, was die Texte<br />

mehrdeutig macht.<br />

Newsletter SILOG News

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!