Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
OCR mit Cuneiform<br />
PRAXIS<br />
len Sie die Sprache per Dropdown<br />
Menü aus (Abbildung D).<br />
Um Problemen aus dem Weg zu<br />
gehen, die bei Mischdokumenten<br />
mit mehreren Zeichensätzen entstehen,<br />
können CuneiformQt wie<br />
YAGF zwei Zeichensätze simultan<br />
zur Texterkennung heranziehen.<br />
Diese Fähigkeit ist vor allem dann<br />
interessant, wenn Markennamen<br />
oder Bezeichnungen aus dem<br />
westeuropäischen oder angelsächsischen<br />
Raum den kyrillischen<br />
Text durchsetzen. Im Falle einer<br />
Erkennung ausschließlich mit<br />
kyrillischem Zeichensatz werden<br />
solche Bezeichnungen nicht korrekt<br />
wiedergegeben, was den<br />
Nachbearbeitungsaufwand eines<br />
Dokumentes drastisch erhöht.<br />
CuneiformQt bietet lediglich die<br />
Option, gemischte russischenglische<br />
Zeichensätze bei der Texterkennung<br />
zu nutzen, während<br />
YAGF auch die Kombination mit<br />
spanischen, deutschen <strong>und</strong> französischen<br />
Zeichensätzen anbietet.<br />
Letzteres deckt so gut wie alle in<br />
den verschiedenen westeuropäischen<br />
Sprachen genutzten Sonderzeichen<br />
ab.<br />
Erkennungsraten<br />
Im Test verwendeten wir für beide<br />
Oberflächen unterschiedliche<br />
Vorlagen, die neben verschiedenen<br />
Schriftgrößen auch serifenhaltige<br />
wie serifenlose Schrifttypen<br />
beinhalteten. Zusätzlich zogen<br />
wir einen Textausschnitt mit<br />
kyrillischem Zeichensatz heran,<br />
um die Qualität der Texterkennung<br />
beurteilen zu können.<br />
Das auch von den einstellbaren<br />
Optionen her sehr einfach gehaltene<br />
CuneiformQt hatte, wie bereits<br />
erwähnt, Probleme, andere<br />
Bilddateiformate als BMP zu erkennen.<br />
Die weitverbreiteten<br />
Bildformate PNG <strong>und</strong> TIFF liest<br />
es nicht ein. Die Erkennungsgenauigkeit<br />
von Text in BMP<br />
Dateien lässt unter CuneiformQt<br />
keinerlei Wünsche offen, sofern<br />
die Vorlage ausreichend scharf<br />
ausfällt <strong>und</strong> die Schriftgröße über<br />
zehn Punkt liegt. Kleinere Schriftgrößen<br />
oder unscharf gescannte<br />
Vorlagen (wie sie beispielsweise<br />
beim Einlesen von Buchseiten am<br />
Buchrücken auftreten) bringen<br />
D Mehrsprachigkeit?<br />
Für YAGF stellt das<br />
kein Problem dar.<br />
1. Lernen Sie!<br />
Ja, ã training-on-the-jobÒ , oft praktiziert, aber nicht<br />
Ÿ berzeugend. Denn die Kollegen haben nie Zeit<br />
fŸ r echte ErklŠ rungen, au§ erdem werden ã NeueÒ<br />
sofort von dem vereinnahmt, was im Unternehmen<br />
schon seit Ewigkeiten tradiert wird. Warum gibt's<br />
seit 2000 Jahren Schulen <strong>und</strong> UniversitŠ ten?<br />
ã LERNENÒ ist eine vollwertige TŠ tigkeit, auf die<br />
man sich konzentrieren mu§ , die man nicht 'mal<br />
eben so nebenbei tun kann, <strong>und</strong> die immer auch<br />
eine Prise ã ErneuerungÒ beinhalten sollte!<br />
2. Ineffiziente Arbeit nicht akzeptieren!<br />
Je spezialisierter Sie arbeiten, desto weniger<br />
echte, fachliche Kollegen haben Sie in Ihrem eigenen<br />
Unternehmen. Wir stellen deshalb Gruppen<br />
zusammen, in denen Sie neben hilfsbereiten<br />
Kollegen mit Š hnlichen Kenntnissen an IHREM<br />
Projekt arbeiten. Und stŠ ndig ist ein fachlicher Berater<br />
anwesend.<br />
ã Guided CoworkingÒ nennen wir das, <strong>und</strong> es<br />
kš nnte DIE Lš sung fŸ r so manches Projekt sein,<br />
das in Ihrer Firma ã haktÒ .<br />
3. Hintergr<strong>und</strong><br />
Wer den riesigen OpenSource-Baukasten schnell<br />
beherrschen mu§ , geht zu einer unserer Ÿ ber 100<br />
Schulungen. Wer das bereits kann, aber schneller<br />
mit seinen Projekten vorankommen will, der<br />
kommt mit seiner Arbeit zum Guided Coworking.<br />
Wir sind eine der erfolgreichsten Schulungseinrichtungen<br />
im gesamten Bereich ã OpenSourceÒ<br />
- sowohl fŸ r Admins, als auch fŸ r Entwickler.<br />
Siehe www.linuxhotel.de<br />
www.linux-user.de<br />
04 | 11 51