Ausgabe 03/07 - Siemens Mobility
Ausgabe 03/07 - Siemens Mobility
Ausgabe 03/07 - Siemens Mobility
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
ARTread TM ist am schnellsten und genauesten<br />
„Goldmedaille“ für<br />
Handschrifterkennung<br />
Wer an einem internationalen Wettbewerb teilnimmt, kann gewinnen –<br />
oder sich bis auf die Knochen blamieren. <strong>Siemens</strong> gewann mit Bravour und<br />
sicherte sich bei der diesjährigen ICDAR-Konferenz den ersten Platz bei der<br />
automatischen Erkennung arabischer Handschriften.<br />
Rückblickend sieht alles ganz einfach aus.<br />
Wenn jemand bereits im Jahr 2000 Lesegeräte<br />
für arabische Maschinenschrift<br />
nach Dubai geliefert hat, in<br />
den Folgejahren nach Saudi-<br />
Arabien und heute mit weiteren<br />
arabischen Ländern im<br />
Gespräch ist, dann verwundert<br />
es nicht, dass dieser Jemand<br />
auch den diesjährigen<br />
Wettbewerb der ICDAR (International<br />
Conference on Document<br />
Analysis and Recognition)<br />
im Erkennen arabischer<br />
Handschriften gewonnen hat.<br />
Rückblickend. „Denn als wir<br />
überlegten, ob wir bei dem<br />
Wettbewerb mitmachen sollen,<br />
war dieser Erfolg noch<br />
nicht abzusehen“, gibt Udo<br />
Miletzki, Produktmanager Reading<br />
Coding im <strong>Siemens</strong> Geschäftsbereich<br />
Infrastructure<br />
Logistics unumwunden zu.<br />
Die ersten Benchmark-Tests im<br />
Erkennen arabischer Handschriften<br />
fanden bereits vor<br />
zwei Jahren statt; sie lieferten<br />
Leseraten von 80 bis 85 Prozent.<br />
<strong>Siemens</strong> war damals<br />
nicht dabei und „uns war klar,<br />
dass die Konkurrenz ihre Verfahren<br />
inzwischen weiterentwickelt<br />
hat“, so Miletzki.<br />
„Wenn wir aber mitmachen<br />
würden, dann natürlich mit<br />
dem Ziel, Erster zu werden.“<br />
Kein leichtes Unterfangen, da<br />
das Kundengeschäft unter den<br />
Arbeiten für den Wettbewerb<br />
ja nicht leiden durfte.<br />
„Schließlich beschlossen wir<br />
doch, mitzumachen, die Aussicht auf die<br />
ausgezeichnete Referenz war zu verlockend“,<br />
erklärt der Produktmanager.<br />
Innerhalb von vier Wochen baute das<br />
Team unter Anleitung von Marc-Peter<br />
Schambach und Jörg Rottland aus der Entwicklungsabteilung<br />
den Handschriftleser<br />
zusammen. Keiner von ihnen<br />
sprach Arabisch. „Schließlich<br />
reichten wir zwei Systeme ein,<br />
eines war auf Schnelligkeit,<br />
das andere auf Genauigkeit<br />
optimiert“, erklärt Miletzki.<br />
Schnelligkeit und Genauigkeit<br />
waren die entscheidenden Bewertungskriterien<br />
des ICDAR-<br />
Wettbewerbs.<br />
ARTread TM liest<br />
auch arabisch<br />
Die Entwickler nutzten das<br />
<strong>Siemens</strong> ARTread TM Erkennungssystem<br />
für arabische Maschinenschrift,<br />
das bereits in der<br />
Praxis erprobt ist. Als Daten<br />
standen die von den Organisatoren<br />
des Wettbewerbs gesammelten<br />
handgeschriebenen<br />
arabischen Wörter zur Verfügung.<br />
Die <strong>Siemens</strong>-Entwickler<br />
destillierten daraus Modelle<br />
für arabische Handschriften,<br />
trainierten das Lesesystem mit<br />
bekannten Begriffen und testeten<br />
es anschließend mit<br />
Wörtern, die dem System unbekannt<br />
waren.<br />
Dann kam der Tag der Wahrheit.<br />
<strong>Siemens</strong> musste gegen<br />
acht Konkurrenten antreten<br />
– meist Forschungseinrichtungen,<br />
aber auch Industrie im<br />
Hintergrund, kurz, alles was<br />
Rang und Namen hat – die insgesamt<br />
zwölf Systeme eingereicht<br />
hatten. Jeder Kandidat bekam 937<br />
tunesische Städtenamen zum Lesen, die<br />
von verschiedenen Personen geschrieben<br />
worden waren.<br />
<strong>Siemens</strong> gewann mit seinem auf Genauigkeit<br />
optimierten System in allen Kategorien<br />
und erreichte mit 94,6 Prozent die<br />
höchste Leserate, die zwar „nur“ ein Prozent<br />
besser war als der Zweitplatzierte,<br />
dafür aber rund 70 Prozent schneller –<br />
und 14 mal schneller als der Durchschnitt!<br />
Das beeindruckte auch die Jury:<br />
Bei den meisten Kandidaten habe man<br />
nach dem Leserstart erst mal Kaffee trinken<br />
gehen können, bis erste Ergebnisse<br />
eintrudelten, bemerkte der Jury-Leiter<br />
Volker Märgner von der TU Braunschweig<br />
anlässlich der Preisverleihung. Die Anstrengungen<br />
von <strong>Siemens</strong> sind bereits als<br />
Produkt innerhalb der ARTread TM Familie<br />
eingeflossen und stehen für Leseaufgaben<br />
mit arabischer Schrift zur Verfügung.<br />
Verwandt, aber<br />
doch völlig anders<br />
Das lateinische und arabische Alphabet<br />
haben dieselben Wurzeln.<br />
Allerdings hat im Arabischen jedes<br />
Zeichen vier Formen, die sich<br />
zum Teil erheblich voneinander<br />
unterscheiden. Welche Form die<br />
richtige ist, hängt davon ab, wo<br />
das Zeichen im Wort steht. Doch<br />
es kommt noch schlimmer: Wie<br />
bei deutschen Umlauten gibt es<br />
auch im Arabischen Punkte – bis<br />
zu drei über einem Zeichen und<br />
bis zu zwei unter einem Zeichen.<br />
Ihnen kommt entscheidende Bedeutung<br />
zu. In der arabischen<br />
Schrift wird auch meist auf Vokale<br />
verzichtet, was die Texte<br />
mehrdeutig macht.<br />
Newsletter SILOG News