forum ware - DGWT - Deutsche Gesellschaft für Warenkunde und ...

dgwt.de

forum ware - DGWT - Deutsche Gesellschaft für Warenkunde und ...

24 USABILITY

BEDIENBARKEIT VON SPRACHAPPLIKATIONEN – WO HAKT’S?

Thomas Hempel*

USABILITY OF SPEECH APPLICATIONS – WHERE’S THE RUB?

Abstract:

In spite of an increased use of automated speech applications, e.g., phone banking, users are sometimes not really

satisfied with the usability of such systems. Selected problems and solutions are provided, supplemented by a

pleading for strengthening the role of speech dialog designers in the development process.

Zusammenfassung:

Trotz zunehmender Verbreitung von automatisierten Sprachapplikationen wie z. B. Telefonbanking, sind die Nutzer

bisweilen nicht richtig zufrieden mit der Bedienführung solcher Systeme. Ausgewählte Probleme solcher Systeme

und Verbesserungsvorschläge werden aufgezeigt und um ein Plädoyer für eine zentralere Rolle des Sprachdialoggestalters

ergänzt.

1 Einleitung

Sprachgesteuerte Anwendungen finden immer weiter Einzug in unser Alltagsleben. Solche Anwendungen

sind z. B. das Wählen per Spracheingabe bei Mobiltelefonen (besonders im Zusammenhang mit Freisprecheinrichtungen)

oder Telefonieapplikationen wie z. B. sprachgesteuerte Banküberweisungen, Versandhausbestellungen

oder Auskunftssysteme. Warum sind die Nutzer trotz so mancher Vorteile und Erleichterungen durch

sprachgesteuerte Anwendungen dennoch oft unzufrieden?

Im vorliegenden Artikel sollen sowohl einige ausgewählte Gründe vorgestellt werden als auch Forderungen

an den Entwicklungsprozess zukünftiger sprachgesteuerter Anwendungen gestellt werden.

2 Physikalische und technische Rahmenbedingungen

Es ist klar, dass sprachgesteuerte Anwendungen niemals eine 100%ige Spracherkennungsrate haben können.

Die haben Menschen übrigens auch nicht – jedoch erschließen wir vieles aus dem Sinnzusammenhang.

Wissenschaftler und Entwickler arbeiten derzeit daran, wie solches Wissen geeignet in Spracherkennungssysteme

integriert werden kann.

Insbesondere Umgebungslärm stellt in der Praxis immer noch eine große technische Herausforderung im

Bereich der Optimierung von Spracherkennungssystemen dar. Hier stellt sich auch der physikalische Abstand

des Sprechers zum Mikrofon bzw. seine Position im Raum als problematisch dar (z. B. je weiter desto

schlechter). Aus diesem Grund überwiegen in der Praxis bislang diejenigen Sprachanwendungen, bei denen

das Mikrofon eine gleichmäßige Distanz zum Mund des Sprechenden aufweist (Telefon, Kopfbügelmikrofon

usw.).

Wenn man als Sprachdialoggestalter dies weiß und den automatisierten Sprachdialog entsprechend dieser

technischen Einschränkungen gestaltet, ist es möglich, einige der Einschränkungen für den Benutzer nicht

allzu sehr zu Tage treten zu lassen. Einige Beispiele sind im nächsten Abschnitt aufgeführt.

3 Aspekte zur Dialoggestaltung

Boyce (1999) und andere Dialoggestalter halten es für angemessen, sich bei der Gestaltung von

sprachlichen Mensch-Maschine-Dialogen ruhig an natürlichsprachlichen Dialogen von Mensch zu Mensch zu

orientieren. Das heißt aber auch: Wenn ein menschlicher Gesprächspartner etwas nicht versteht, fragt er auf

unterschiedliche Art und Weise nach, nämlich abhängig davon, ob er nur ein Wort nicht oder nicht eindeutig

verstanden hat, es für ihn inhaltlich keinen Sinn ergibt, oder auch was für ein gesellschaftlicher Kontext

besteht. Wissenschaftler sind auch hier dabei, geeignete Strategien für die Mensch-Maschine-Kommunikation

zu entwickeln.

Erwartungshaltung

Der Einstieg in das System ist sehr wichtig, formt er doch die Erwartungshaltung und damit die Wortwahl

des Benutzers. Z. B. reagiert ein Benutzer auf einen maschinellen, menüartigen Einstieg eher mit kurzen

Kommandowörtern. Je nach Zielgruppe und Nutzungskontext kann eine solche Effizienz gewünscht sein.

Moderne natürlichsprachliche Systeme erlauben darüber hinaus auch frei geäußerte Eingaben, also auch ganze

FORUM WARE 32 (2004) NR. 1 - 4

Weitere Magazine dieses Users
Ähnliche Magazine