Institut für Informatik - Dokumentenserver - Universität Leipzig

Weitere Magazine

Empfehlungen

Info

3.3.3 Automatische Sprachverarbeitung 3.3.3.1 Personelle Zusammensetzung Univ.-Professor Prof. Dr. Gerhard Heyer wiss. Mitarbeiter Dr. habil. Uwe Quasthoff wiss. Assistent Dr. habil. Christian Wolff wiss. Assistent Thomas Wittig (ab Oktober 2000) Programmiererin Regine Gabler Sekretärin Renate Schildt 3.3.3.2 Projekte Projekt Deutscher Wortschatz (Heyer, Quasthoff) Begleitend zu einem mittlerweile abgeschlossenen DFG-Projekt wurde ein umfassendes Korpus des deutschen Wortschatzes als Vollformenlexikon erstellt. Die in den letzten Jahren aufgebaute Lexikondatenbank auf CD-ROM wurde übers Internet verfügbar gemacht und so einem breiten Interessentenkreis zur Bearbeitung und Ergänzung zur Verfügung gestellt (http://www.wortschatz.unileipzig.de). Die Bearbeiter haben die Möglichkeit, die bestehenden Daten zu sichten und zu korrigieren als auch aus elektronischen Texten automatisch neue Einträge generieren zu können. Die von den Bearbeitern eingehenden Listen neuer bzw. überarbeiteter Einträge werden am Institut in die zentrale Datenbank integriert. Grundidee des Vorhabens ist die Kombination einer Nutzung dezentralen Expertenwissens auf der Basis einer zentralen Datenbankverwaltung. Derzeit sind in der Datenbank fast 6,5 Millionen Wörter (Vollformen) gespeichert zusammen mit verschiedenen Angaben (Anzahl, Grammatik, Sachgebiet, Beispielsätze usw) sowie ca. 20 Millionen Beispielsätzen. Die Sammlung ist mit Abstand die größte ihrer Art fürs Deutsche und wird entsprechend nachgefragt (monatliches Wachstum der Anzahl der Zugriffe ca. 20%). Die Daten des Projekts Deutscher Wortschatz und die Algorithmen, die für ihre statistische Auswertung entwickelt worden sind, bilden die Grundlage für weitere Forschungen und Anwendungen auf dem Gebiet der natürlichen Sprachverarbeitung und der Texttechnologie. Neben zahlreichen Drittmittelprojekten (u.a zur linguistischen Optimierung von information retrieval Algorithmen wie sie im BMBF Projekt INCCA - Innovative Call Center Anwendungen entwickelt werden) zählen dazu vor allem die Forschungsarbeiten im Graduiertenkolleg "Universalität und Diversität sprachlicher Prozesse und Strukturen" sowie im Graduiertenkolleg "Wissensrepräsentation" und der Linguistischen Forschergruppe Wissensrepräsentation und Semantik. 42
Electronic Publishing (Heyer/Wolff) Die Möglichkeit, Informationen nicht nur im traditionellen Medium Papier, sondern zunehmend auch im elektronischen Medium zu veröffentlichen und zu verteilen, hat ein neues Forschungsfeld geschaffen, das im Schnittpunkt zwischen Software Engineering, automatischer Sprachverarbeitung, Information Retrieval und Multimedia-Entwicklung liegt. Schwerpunktmäßig werden an der Problematik von Standards für elektronisches Publizieren, der Entwicklung und Evaluation von Software-Werkzeugen für elektronisches Publizieren sowie deren Verbesserung durch Verfahren der automatischen Sprachverarbeitung gearbeitet. Dabei erfolgt eine Zusammenarbeit mit Verlagen sowie dem Arbeitskreis elektronisches Publizieren des Börsenvereins des deutschen Buchhandels. 3.3.3.3 Publikationen - Heyer, G.; Quasthoff, U.; Wolff, Ch.: Aiding Web Searches by Statistical Classification Tools. In: Knorz, Gerhard; Kuhlen, Rainer (eds.) (2000). Informationskompetenz - Basiskompetenz in der Informationsgesellschaft. Proc. 7. Intern. Symposium f. Informationswissenschaft, ISI 2000, Darmstadt. Konstanz: UVK, 163 - 177. - Heyer, G.; Läuter, M.; Quasthoff, U.; Wolff, Ch.: Texttechnologische Anwendungen für Inter- und Intranet. In: Schmitz, Klaus-Dirk (ed.) (2000). Sprachtechnologie für eine dynamische Wirtschaft im Medienzeitalter. Tagungsakten der XXVI. Jahrestagung der Internationalen Vereinigung Sprache und Wirtschaft, Köln, November 2000. Wien: TermNet Publisher, 203 - 209. - Heyer, G.; Herrmann, K.; Quasthoff, U.: Entwurf und Implementierung eines Systems zur automatischen Klassifikation von Post nach Sachgebieten, in: Proc. 12th European Symposium on Language for Special Purposes (LSP '99), Gunther Narr: Tübingen - Heyer, G.; Quasthoff, U.; Wolff, Ch.: Text Mining - Grundlagen und Anwendungen In: Forum Versicherungsinformatik, Oktober 2000 - Quasthoff, U.; Wolff, Ch.: A Flexible Infrastructure for Large Monolingual Corpora, in: Proceedings of the Second International Conference on Language Resources and Evaluation, ELRA, Paris, 2000, 241 - 245 - Heyer, G.; Läuter, M.; Quasthoff, U.; Wolff, Ch.: Wissensextraktion durch linguistisches Postprocessing bei der Corpusanalyse. Akzeptierter Beitrag für: Sprache und Text. GLDV-Jahrestagung 2001, Universität Gießen. - Wolff, Ch.: Vergleichende Evaluierung von Such- und Metasuchmaschinen im World Wide Web. In: Knorz, Gerhard; Kuhlen, Rainer (edd.) (2000). Informationskompetenz - Basiskompetenz in der Informationsgesellschaft. Proc. 7. Intern. Symposium f. Informationswissenschaft, ISI 2000, Darmstadt. Konstanz: UVK, 31 - 48. 43
Seite 1 und 2: Universität Leipzig Institut für
Seite 3 und 4: Vorwort ...........................
Seite 5 und 6: Vorwort Im Jahr 2000 hat sich das I
Seite 7: Universität sehr ungünstig. Zur U
Seite 11 und 12: Prof. Dr. Klaus-Peter Fähnrich, ge
Seite 13 und 14: schwerpunkte sind multimediale und
Seite 15 und 16: Prof. Dr. Ralf Der, geb. 1942 in Br
Seite 17 und 18: 2. Organisation, Mitarbeit und Mitg
Seite 19 und 20: 2.2 Funktionen und Gremienmitarbeit
Seite 21 und 22: Rahm, E.: - Haushaltskommission der
Seite 23 und 24: Gerber, S.: - Projektleiter im BLK-
Seite 25 und 26: - Mitglied des Fachgruppe 3.1.2 (Bi
Seite 27 und 28: Herre, H.: - Zentralblatt (2) Heyer
Seite 29 und 30: - Reports in Mathematical Logic (1)
Seite 31 und 32: Müller, R.: - ACM - Gesellschaft f
Seite 33 und 34: 3. Forschung Zunächst erfolgt eine
Seite 35 und 36: Stankovic, Vladimir 01.09.2000 - 30
Seite 37 und 38: - Prof. Kebschull: System Managemen
Seite 39 und 40: Forschergruppe Service Engineering
Seite 41 und 42: - Fähnrich, K.-P.: Workflow-Manage
Seite 43: Modularisierung (Gerber, Schötz) D
Seite 47 und 48: - Wolff, Ch.: Structuring and Proce
Seite 49 und 50: der Bildsegmente durch geometrisch
Seite 51 und 52: Fehlerschutz mit einer Biterrorrate
Seite 53 und 54: FREIKOM (DFG-Projekt) (Melle, Trieb
Seite 55 und 56: Inhaltsbasiertes 3D Model-Retrieval
Seite 57 und 58: OpenGL basierendens Visualisierungs
Seite 59 und 60: 3.3.4.3 Publikationen - Burkhardt,
Seite 61 und 62: - Melle, M.: Components of Intersho
Seite 63 und 64: - Die Einführungsvorlesung "Datenb
Seite 65 und 66: Parallele Datenbanksysteme (Märten
Seite 67 und 68: Im Berichtszeitraum wurden daneben
Seite 69 und 70: Web Usage Mining (Rahm, Stöhr) Der
Seite 71 und 72: - Decker, S.; Mitra, P.; Melnik, S.
Seite 73 und 74: 3.3.6 Formale Konzepte 3.3.6.1 Pers
Seite 75 und 76: 3.3.7 Intelligente Systeme 3.3.7.1
Seite 77 und 78: Modellierung und Computersimulation
Seite 79 und 80: - Werner, H.; Schierwagen, A.: Cate
Seite 81 und 82: 3.3.8 Rechnernetze und Verteilte Sy
Seite 83 und 84: Entwicklung und Einsatz von Telemat
Seite 85 und 86: 3.3.9 Parallelverarbeitung und komp
Seite 87 und 88: tionierungsstrategie, welche die Ko
Seite 89 und 90: lel Computing 2000 (LCPC'00), IBM T
Seite 91 und 92: 3.3.10 Technische Informatik Die Ab
Seite 93 und 94: Steuerung eines Hardwareemulators (
Seite 95 und 96:
3.3.11 Versicherungsinformatik 3.3.
Seite 97 und 98:
3.4 Graduierungsarbeiten am Institu
Seite 99 und 100:
Dr. Wolff, Christian: Dynamische El
Seite 101 und 102:
12. Hoop, K.-U.: Einsatz von Metada
Seite 103 und 104:
3.5 Messebeteiligungen CeBIT99, in
Seite 105 und 106:
3.6.3 3. Halle - Leipziger Seminar
Seite 107 und 108:
Puppe, B. (Deutschland)Computer-Bas
Seite 109 und 110:
20.12.2000 Saupe, D., Universität
Seite 111 und 112:
3.7.4 Theorie-Seminar 19.12.2000 No
Seite 113 und 114:
zw. eine Studienarbeit zu absolvier
Seite 115 und 116:
lagen der Sprachverarbeitung, des a
Seite 117 und 118:
4.3 Lehrveranstaltungen im SS00 GRU
Seite 119 und 120:
PRAKTISCHE INFORMATIK Vorlesungen D
Seite 121 und 122:
SCHWERPUNKT ANGEWANDTE INFORMATIK V
Seite 123 und 124:
MEDIZININFORMATIK Vorlesungen Biolo
Seite 125 und 126:
Übungen, Praktika und Seminare Alg
Seite 127 und 128:
HAUPTSTUDIUM Spezialvorlesungen SCH
Seite 129 und 130:
Übungen, Praktika und Seminare Art
Seite 131 und 132:
Übungen, Praktika und Seminare Bio
Seite 133 und 134:
4.5.3 Praktikum Datenbanken Prof. D
Seite 135 und 136:
4.6 Lehrbezogene Schriften 4.6.1 St
Seite 137 und 138:
4.7.2 Betriebspraktikum, Betreuung
Seite 139 und 140:
- Die Abteilung Technische Informat
Alle anzeigen

Institut für Informatik - Dokumentenserver - Universität Leipzig

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?