Jahresbericht informatik 2009 - KIT – Fakultät für Informatik

Weitere Magazine

Empfehlungen

Info

Modellierung zu ermöglichen. Speaker Recognition Institut für Anthropomatik (T. Schultz, Q. Yang) Die Zuweisung von Stimmen zu Personen unter Verwendung von Informationen aus der Stimme wird als "Speaker Tracking" bezeichnet. In ein Speaker Tracking System gibt man den Audio File eines Sprechers. Ausgegeben werden die Bereiche des Audio Files, in denen der Zielsprecher eine Äußerung macht. Um die Identität eines Sprechers auszugeben, müssen die Namen der zu erkennenden Sprecher zuvor in das System eingegeben werden sowie Beispiel-Äußerungen der Sprecher, die für das Training des Systems verwendet werden. "Speaker Tracking" kann als eine Kombination aus unterschiedlichen Sprecher- Erkennungsdisziplinen verstanden werden wie die Speaker Diarization und die Open-set Speaker Identification. Es gibt viele potentielle Anwendungen wie z.B. das automatische Strukturieren und Indexieren von Audiodaten im Internet ohne manuellen Aufwand. Das Speaker Tracking System, das wir im Rahmen des Quaero Projektes entwickelten, besteht aus zwei Hauptkomponenten: Der Speaker Segmentation und der Open-set Speaker Identification. Für eine gegebene Audiodatei werden zunächst nicht-sprachliche Regionen entfernt, gefolgt von einer Segmentierung der Sprachregionen basierend auf den Wechseln der Sprecher. Die Sprachsegmente werden dann in einem Open-set Speaker Identification (SID) System weiterverarbeitet, um die entsprechenden Sprecher zu erkennen. Unsere Experimente wurden auf den ESTER2-Daten durchgeführt, die aus französischen Nachrichten bestehen. Das Baseline-System erreichte eine Half Total Error Rate in Bezug auf die Zeit (HTER-time) von 25.30% und 31.94% HTER im Bezug auf den Spracher (HTER-speaker). Nach der Frame-base Score Competition-Methode (FSC) sanken die HTER-time und die HTER-speaker auf 24.098% bzw. 31.319%. Für die Verbesserung des Baseline-Systems wurden verschiedene Ansätze untersucht. Beispielsweise kann multimodale Information kombiniert werden, um die Robustheit des Systems zu erhöhen, wie z. B. aus Video. Spektrale Methoden zur EMG-basierten Erkennung lautloser Sprache (T. Schultz, M. Wand) Diese Arbeit präsentiert neue Analysen und Resultate für die Spracherkennung mittels Elektromyographie (EMG), bei der die Aktivität der artikulatorischen Muskeln mittels geeigneter Elektroden direkt an der Hautoberfläche abgegriffen wird. Diese Technik ermöglicht Silent Speech Interfaces, da ein bloßes Artikulieren, ohne Produktion von akustischen Signalen, für die Spracherkennung ausreichend ist. Es hat sich herausgestellt, dass eine hohe Diskrepanz zwischen EMG-Signalen bei hörbarer und lautloser Sprache besteht, was negative Auswirkungen auf die Erkennungsleistung von EMG-basierten Spracherkennern hat. In dieser Arbeit wird eine Methode der spektralen Analyse vorgestellt, die es ermöglicht, diese Unterschiede zu analysieren und zu quantifizieren. 257 3
Die Institute der Fakultät und ihre Forschungsvorhaben Auf dieser Grundlage wurde ein spektraler Abbildungsalgorithmus entwickelt, mit dessen Hilfe sich die Erkennung lautloser Sprache im Schnitt um 16,5 % verbessern lässt. Dieser Algorithmus kann auch auf einzelnen Phonemgruppen, wie z. B. Konsonanten und Vokalen, angewendet werden. Die spektrale Analyse der untersuchten EMG-Daten wird durch eine mögliche Verwendung von spektralen Merkmalen bei der Erkennung ergänzt. Kognitive Interaktionssysteme (F. Putze, T. Schultz) Im Berichtszeitraum wurde die Entwicklung kognitiver Interaktionssysteme, die sich an die mentalen Zustände ihrer Benutzer anpassen können, vorangetrieben. Es wurde ein vollautonomer, sprachbasierter Dialogmanager implementiert, der den realisierten Dialogverlauf an die gemessene mentale Auslastung anpassen kann. Die Klassifikation dieser Auslastung erfolgt auf der Basis multimodaler Biosignalströme mit statistischen Methoden. Das System ist für den Einsatz im Fahrzeug entworfen und in den am CSL aufgebauten Fahrsimulator integriert, um dort Benutzerstudien durchführen zu können. Weitergeführt wurde die Arbeit an einem Rahmenwerk zur Simulation von Dialogen, mit deren Hilfe optimale Strategien für die spätere Interaktion gelernt werden können. Dabei werden für die Simulation und Modellierung des Menschen kognitive Modelle eingesetzt, die z. B. den jeweils aktuellen Zustand des Kurzzeitgedächtnisses modellieren, der die Dringlichkeit bestimmter Interaktionsziele widerspiegelt. Weiterhin wurde im Rahmen einer FYS-Studie begonnen, Interaktionsabläufe zwischen Benutzern und verschiedenen von menschlichen Operatoren simulierten Interaktionssystemen aufzuzeichnen und zu analysieren, um einen Goldstandard für die Entwicklung automatischer Systeme zu ermitteln. Multilinguale Sprachverarbeitung (T. Schlippe, T. Schultz, N. T. Vu) Im Arbeitsgebiet "Multilinguale Spracherkennung" wurden am CSL verschiedene Spracherkenner entwickelt. Im Rahmen des "Quaero-Projektes" wird ein französischer Spracherkenner für Nachrichten und verschiedene Audioquellen im Internet entwickelt und optimiert. Wir haben an verschiedenen Komponenten wie die Signalvorverarbeitung, am Aussprachewörterbuch, am Sprachmodell und am akustischen Modell gearbeitet. Das erste System verwendet Cross-Adaption mit 3-pass Decoding unter der Verwendung verschiedener Techniken wie Feature Space Adaptation (FSA) und Maximum Likelihood Linear Regression (MLLR). Unser erster Spracherkenner liefert 46.6% Wortfehlerrate auf dem 2009 Quaero Development-Set und 36.8% Wortfehlerrate bei dem 2009 Quaero Evaluierungsset. Zu den wichtigsten Zielen der multilingualen Spracherkennung gehört die Untersuchung von wenig erforschten Sprachen beispielsweise Vietnamesisch. Am CSL wird ein vietnamesischer Spracherkenner für gelesene Sprache entwickelt und optimiert. Als erstes wurde eine umfangreiche Datensammlung von vietnamesischen Text- und Audiodaten durchgeführt. Danach wurde ein Baseline-Spracherkenner mit Hilfe unserer Rapid Adaptation Language Tools (RLAT) entwickelt. Dieses System hat eine Wortfehlerrate von ~27%. 258
Seite 1 und 2:
Jahresbericht 2009 der Fakultät f
Seite 3 und 4:
Impressum Herausgeber: Fakultät f
Seite 6 und 7:
Inhaltsverzeichnis Vorwort Inhaltsv
Seite 8:
4.2.1 Bachelorstudiengang Informati
Seite 11 und 12:
1 Die Fakultät für Informatik 1.1
Seite 13 und 14:
Die Fakultät für Informatik Meile
Seite 15 und 16:
Die Fakultät für Informatik Zur z
Seite 17 und 18:
Die Fakultät für Informatik Entwi
Seite 19 und 20:
Die Fakultät für Informatik 10 Pe
Seite 21 und 22:
Die Fakultät für Informatik 1.2 L
Seite 23 und 24:
Die Fakultät für Informatik 14 In
Seite 25 und 26:
1.3 Struktur der Fakultät - Instit
Seite 27 und 28:
2 Höhepunkte der Fakultät im Jahr
Seite 29 und 30:
Höhepunkte der Fakultät im Jahr 2
Seite 31 und 32:
Seite 33 und 34:
Seite 35 und 36:
Seite 37 und 38:
Seite 39 und 40:
Seite 41 und 42:
Seite 43 und 44:
Seite 45 und 46:
Seite 47 und 48:
Seite 49 und 50:
Seite 51 und 52:
Seite 54 und 55:
Einrichtungen der Fakultät Institu
Seite 56 und 57:
Forschungsbereich Systemarchitektur
Seite 58 und 59:
Institut für Betriebs- und Dialogs
Seite 60 und 61:
Seite 62 und 63:
Forschungsbereich Angewandte Geomet
Seite 64 und 65:
Seite 66 und 67:
Tagungsbände und Beiträge in Tagu
Seite 68 und 69:
Kontakt Prof. Dr. K. Böhm 608-4396
Seite 70 und 71:
Institut für Programmstrukturen un
Seite 72 und 73:
Netzwerkbildung in Strukturierten P
Seite 74 und 75:
Reputation von Teilnehmern. TAS3 -
Seite 76 und 77:
Heidinger C.; Buchmann, E.; Böhm,
Seite 78 und 79:
Architecture-based Quality Predicti
Seite 80 und 81:
Qualitätsbewusste Software-Evoluti
Seite 82 und 83:
Sicherheit Institut für Programmst
Seite 84 und 85:
Seite 86 und 87:
Seite 88 und 89:
Seite 90 und 91:
Seite 92 und 93:
Seite 94 und 95:
Seite 96 und 97:
Seite 98 und 99:
Seite 100 und 101:
Seite 102 und 103:
Bücher und Buchbeiträge: Paoli, H
Seite 104 und 105:
Forschungsbereich DFG Emmy-Noether
Seite 106 und 107:
Seite 108 und 109:
Forschungsbereich Komplexe Systeme
Seite 110 und 111:
Institut für Prozessrechentechnik,
Seite 112 und 113:
Der handgeführte Roboter wird an e
Seite 114 und 115:
GENESYS: Generisches Entladesystem
Seite 116 und 117:
schen Engineering-Werkzeugen im Aut
Seite 118 und 119:
Kombination von neuer Sensorik mit
Seite 120 und 121:
ein neuartiger Ansatz vorgestellt,
Seite 122 und 123:
grundlegende Aspekte der Gewährlei
Seite 124 und 125:
Die Softwarearchitektur sowie die z
Seite 126 und 127:
Christian, T.; Mehrwald, M.; Mönni
Seite 128 und 129:
Invasive Interventions, Endoscopy a
Seite 130 und 131:
Forschungsbereich Cooperation & Man
Seite 132 und 133:
Institut für Telematik von sichere
Seite 134 und 135:
Forschungsbereich Dezentrale System
Seite 136 und 137:
Institut für Telematik Modellierun
Seite 138 und 139:
Institut für Telematik Signalüber
Seite 140 und 141:
Institut für Telematik Zur Untersu
Seite 142 und 143:
aufbauend wurden Ansätze zur Leist
Seite 144 und 145:
Institut für Telematik analysierte
Seite 146 und 147:
Beiträge in Zeitschriften: Härri,
Seite 148 und 149:
Institut für Telematik Softwareent
Seite 150 und 151:
Forschungsbereich Telecooperation O
Seite 152 und 153:
Polytos Institut für Telematik (C.
Seite 154 und 155:
4WARD Forschungsbereich Hochleistun
Seite 156 und 157:
Institut für Telematik dann automa
Seite 158 und 159:
Institut für Telematik und Mechani
Seite 160 und 161:
Institut für Telematik auf das Rü
Seite 162 und 163:
Institut für Telematik welche eine
Seite 164 und 165:
Ausgewählte Veröffentlichungen de
Seite 167 und 168:
3.1 Institute und ihre Forschungsvo
Seite 169 und 170:
Die Institute der Fakultät und ihr
Seite 171 und 172:
Seite 173 und 174:
Seite 175 und 176:
Seite 177 und 178:
Seite 179 und 180:
Seite 181 und 182:
Seite 183 und 184:
Seite 185 und 186:
Seite 187 und 188:
Seite 189 und 190:
Seite 191 und 192:
Seite 193 und 194:
Seite 195 und 196:
Seite 197 und 198:
Seite 199 und 200:
Seite 201 und 202:
Seite 203 und 204:
Seite 205 und 206:
Seite 207 und 208:
Seite 209 und 210:
Seite 211 und 212:
Seite 213 und 214:
Seite 215 und 216: Die Institute der Fakultät und ihr
Seite 217: Die Institute der Fakultät und ihr
Seite 220 und 221: Forschungsbereich Interaktive Echtz
Seite 222 und 223: Aktive Beleuchtungssysteme in der a
Seite 224 und 225: eine effiziente Entscheidungsfindun
Seite 226 und 227: variieren. Mittels einer Multi-Sens
Seite 228 und 229: Multimodale Display-übergreifende
Seite 230 und 231: Institut für Anthropomatik Flexibi
Seite 232 und 233: dächtige Objekte noch zuverlässig
Seite 234 und 235: Karlsruhe, 29.9.-01.10.2009. Fraunh
Seite 236 und 237: Institut für Anthropomatik humanoi
Seite 238 und 239: Institut für Anthropomatik mensche
Seite 240 und 241: Institut für Anthropomatik durch d
Seite 242 und 243: gearbeitet, der Vorschläge für vi
Seite 244 und 245: Benutzeroberfläche ist das System
Seite 246 und 247: Ein neu entwickelter FEM-Algorithmu
Seite 248 und 249: Institut für Anthropomatik verschi
Seite 250 und 251: Ausgewählte Veröffentlichungen de
Seite 252 und 253: Roennau, A.; Kerscher, T.; Ziegenme
Seite 254 und 255: 245 3
Seite 256 und 257: welche einem Benutzer den Eindruck
Seite 258 und 259: Miniaturisierte Laufroboter (A. Hek
Seite 260 und 261: hybride Dichten dargestellt werden.
Seite 264 und 265: Institut für Anthropomatik Leiter:
Seite 268 und 269: Institut für Anthropomatik Währen
Seite 270 und 271: Institut für Anthropomatik Leiter:
Seite 272 und 273: Institut für Anthropomatik Geschwi
Seite 276 und 277: Institut für Anthropomatik Wir sin
Seite 280 und 281: Fahrerassistenzsysteme (T. Bär, T.
Seite 282 und 283: Institut für Anthropomatik führt.
Seite 286 und 287: Institut für Anthropomatik Nachwuc
Seite 288 und 289: Institut für Anthropomatik 1. Die
Seite 290 und 291: Kontakt Prof. Dr. T. Dreier Tel. 60
Seite 292 und 293: Zentrum für Angewandte Rechtswisse
Seite 294 und 295: Bücher und Buchbeiträge: Bartsch,
Seite 296 und 297: Zentrum für Angewandte Rechtswisse
Seite 298 und 299: Forschungsbereich Öffentliches Rec
Seite 300 und 301: Aktuelle Probleme aus dem Datenschu
Seite 302 und 303: Einrichtungen der Fakultät Angegli
Seite 304 und 305: Interfakultatives Institut für Ent
Seite 306 und 307: Kontakt Prof. Dr. R. Vollmar (Leite
Seite 308 und 309: Studienzentrum für Sehgeschädigte
Seite 310 und 311: Graduiertenkolleg 1194 „Selbstorg
Seite 312 und 313: Graduiertenkolleg 1126 „Intellige
Seite 314 und 315: Sonderforschungsbereich 588: Humano
Seite 316 und 317:
Interfakultatives Institut für Anw
Seite 318 und 319:
Freundeskreis der Fakultät für In
Seite 320 und 321:
Institut für Angewandte Informatik
Seite 322 und 323:
Seite 324 und 325:
MeRegioMobil hat zum Ziel, durch de
Seite 326 und 327:
Seite 328 und 329:
Einrichtungen der Fakultät Die zen
Seite 330 und 331:
Dekanat Die Hauptaufgabengebiete de
Seite 332 und 333:
Lehrunterstützung/Rechnergestützt
Seite 334 und 335:
Abteilung Technische Infrastruktur
Seite 336 und 337:
Seite 338 und 339:
Seite 340 und 341:
Die Lehre im Jahr 2009
Seite 342 und 343:
4.1.1 Diplomstudiengang Informatik
Seite 344 und 345:
� Entwurf eingebetteter Systeme u
Seite 346 und 347:
2. Im Vertiefungsstudium sind folge
Seite 348 und 349:
Das Studium der Informatik in Karls
Seite 350 und 351:
Das Studium der Informatik in Karls
Seite 352 und 353:
4.3.2 Lehrveranstaltungen der Fakul
Seite 354 und 355:
Das Lehrangebot im Jahr 2009 Intell
Seite 356 und 357:
Das Lehrangebot im Jahr 2009 M.; We
Seite 358 und 359:
Das Lehrangebot im Jahr 2009 Hanebe
Seite 360 und 361:
Das Lehrangebot im Jahr 2009 Compil
Seite 362 und 363:
Das Lehrangebot im Jahr 2009 Wagner
Seite 364 und 365:
Das Lehrangebot im Jahr 2009 Werner
Seite 366 und 367:
Das Lehrangebot im Jahr 2009 für d
Seite 368 und 369:
Das Lehrangebot im Jahr 2009 Speake
Seite 370 und 371:
Das Lehrangebot im Jahr 2009 Nachri
Seite 372 und 373:
Das Lehrangebot im Jahr 2009 4.4 St
Seite 374 und 375:
Mit durchschnittlich 14 Fach - seme
Seite 376:
Das Lehrangebot im Jahr 2009 Studie
Seite 379 und 380:
5 Ein Blick in die Arbeit der Fakul
Seite 381 und 382:
Ein Blick in die Arbeit der Fakult
Seite 383 und 384:
Seite 385 und 386:
Seite 387 und 388:
Seite 389 und 390:
Seite 391 und 392:
Seite 393 und 394:
Seite 395 und 396:
Seite 397 und 398:
Seite 399 und 400:
Seite 401 und 402:
Seite 403 und 404:
Seite 405 und 406:
Seite 407:
Alle anzeigen

Jahresbericht informatik 2009 - KIT – Fakultät für Informatik

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?