3 Stemmebaseret interaktion - The Game Design Chronologist ...

Recommendations

Info

og laves til (simple) feature-vektorer, der kunne samles til speech-patterns som blev sammenlignet med hinanden. Succesraten var dog alt for lav til, at systemet kunne have en praktisk anvendelse, hvorfor jeg i stedet fokuserede på finpudsning af de semantiske og pragmatiske lag i genkendelsen. Ved at antage at et opfanget ord kan være en hvilken som helst talekommando, og derefter udelukkende basere genkendelsen på konteksten i spillet, kunne en semantisk mening, i form af et logisk udtryk eller et funktionskald, tildeles alle spillerens talte input. Da spillet samtidig er opbygget sådan, at der ikke kan opstå pragmatisk tvetydighed, er behovet for at de lavere lag i genkenderen fungerer ikke så stort. I prototypen blev den pragmatiske genkendelse af talekommandoerne NINJA og MOUNT implementeret, sådan at det er muligt at gå omkring i landskabet og hverve ninjaelever, for derefter at bede dem bestige en panda. I mit tidlige design havde jeg forventet at de laveste lag i talegenkendelsen ville have større betydning, men den egentlige implementering og efterfølgende ludic engineering / leg med spillet viste, at det semantiske og det pragmatiske lag var klart vigtigst. Faktisk er jeg nu af den opfattelse, at det i spillet vil være nok med et delvist fungerende morfologisk lag, som kan opfange unikke ord men ikke genkende dem, er det eneste nødvendige supplement til den semantiske og pragmatiske genkendelse. Dette er delvist implementeret (og har været det siden papegøje funktionen i prototype 1), så egentlig vil jeg mene, at talegenkenderen er tæt på at indeholde al den funktionalitet, der er nødvendig for genkendelse i den begrænsede kontekst som mit spil udgør. Det vil jeg selv betegne som en stor bedrift - at jeg har implementeret en funktionsdygtig talegenkender helt fra bunden. Det er i høj grad technology inspiration og en opfyldelse af indie-princippet om at udnytte de tekniske svagheder til egen fordel. Designet af de pragmatiske målinger var forholdsvist hurtigt klaret, idet de blot udnytter objekternes eksisterende attributter for syn og hørelse, samt fysikvektorerne der indeholder informationer om blandt andet retning og hastighed. Med dem udregnes hvornår Sensei kan se en ninjaelev, hvor meget Sensei larmer og om en ninjaelev kan høre Sensei, og det er disse informationer der udgør de indtil videre implementerede pragmatiske målinger. Den semantiske logik er nogle funktionskald der returnerer sandhedsværdier baseret på de pragmatiske målinger, og som på den måde kan afgøre hvilket funktionskald der skal afvikles. Synliggørelsen af genkendelse af NINJA blev den førnævnte lysende ring omkring den valgte elev, og da jeg samtidig udførte den omtalte analyse af dialogen gennem Winograd & Flores’ conversation for action-model, fik jeg også synliggjort, hvordan en selektion kun holder fem sekunder. Det andet arbejde som blev udført i forbindelse med denne prototype var den grafiske udarbejdelse af en panda (se Figur 21), og den tilfældige placering af træer. Sidstnævnte 102 Figur 21: Prototype 3, ninjaelev med selektion og en omvandrende panda
lev realiseret ved at lave en funktion der returnerede et tilfældigt punkt i landskabet med en angivet fri radius omkring sig, hvor træet så kunne placeres. En sidegevinst ved denne funktion var at den også kunne bruges til at placere ninjaeleverne tilfældigt med, hvormed et udforskende element allerede her blev tilført spillet. Nu indeholdt spillet den udfordring det er at finde en flok tilfældigt placerede ninjaelever, hvormed det igen blev sjovere at teste og finpudse de forskellige funktioner. Her en klassificering af prototypen: • Breadth: 40% o Den tiltænkte funktionalitet er stadig ikke fuldt ud repræsenteret, men med tilføjelsen af talekommandoer, tilfældig generering af landskab og pandaer er der alligevel sket meget siden sidst. • Depth: 65% o Der er stadig mere funktionalitet i koden end hvad spilleren kan se, men spillet har med tilføjelsen af talekommandoer en betydeligt højere depth, da spilleren nu kan tilgå mere af denne funktionalitet. • Look: 40% o Med tilfældigt placerede træer opnår landskabet en større troværdighed, og pandaerne hjælper også på den højere score her. • Interaction: 75% o Talekommandoerne har givet spillet en interaktion der ligger meget tæt på den det endelige spil vil have. Med den lysende cirkel omkring den valgte ninja, er output-delen af interaktionen også tydeligere. Spillet har nu en funktionalitet, som jeg vurderede ville være egnet til en mindre test der involvere andre end mig selv. Jeg viste spillet til andre udviklere via et web-forum, og i det lokale spiludviklernetværk Dreamgames.dk, hvormed det blev en slags uformel heuristisk inspektion (testet af eksperter), og fik udelukkende positiv feedback. Kommentarerne har endnu ikke fået betydning for spillet, da dette er den sidste prototype jeg beskriver i projekt, men en kommentar er dog værd at gengive: Haha very weird, I like it ... 27 I al beskedenhed er innovation altså ikke det forkerte ord at bruge om mit spil. 14.4 Opsummering Med prototype nummer 3 er den del af udviklingen som overlapper med dette projekt beskrevet. I det store hele har udviklingen forløbet uden nævneværdige problemer, og de valgte metoder og teknikker har støttet den perfekt. Teorien har ligeledes været givtig, og især anvendeligheden af Winograd & Flores’ conversation for action-model har overrasket. Jeg har løst projektets problemstilling, idet et spil der ikke synliggør tekniske svagheder i den stemmebaserede interaktion er blevet udviklet. 27 http://forum.gbadev.org/viewtopic.php?t=7732 103
Page 3 and 4:
Titel: Kontekstsensitiv talegenkend
Page 5 and 6:
Læsevejledning Projektrapporten er
Page 7:
8.2 LUDIC ENGINEERING..............
Page 10 and 11:
Stemmebaseret interaktion er dog bl
Page 12 and 13:
1 Problemstilling Med semestrets og
Page 15 and 16:
Del II TEORI Facts are meaningless.
Page 17 and 18:
2.1 Seks perspektiver Det sprog vi
Page 19 and 20:
udskille fra støj, mens kraftigere
Page 21 and 22:
forståelse af ordet flodhest; det
Page 23 and 24:
undgå tvetydighed, og meningen med
Page 25 and 26:
naturligvis åbenlys, da det fra al
Page 27 and 28:
3.1 Talegenkendelse Talegenkendelse
Page 29 and 30:
kraftfuld maskine, mens HMM og Vite
Page 31 and 32:
En talesynteseproces starter med, a
Page 33 and 34:
command and control, hvor der det o
Page 35 and 36:
4 Computerspil Sprog og en digitali
Page 37 and 38:
tegnet. Hvis spilleren eksempelvis
Page 39 and 40:
Vi er symbolbeherskende væsner, og
Page 41 and 42:
interaktionen mellem spillerne og s
Page 43 and 44:
Det er også interessant at se, hvo
Page 45 and 46:
• Interessante handlinger, at enh
Page 47:
I kapitel 4 introducerede jeg en r
Page 50 and 51:
6 Systemudvikling Systemudvikling e
Page 52 and 53: 52 • Fra OOA&D tager jeg den obje
Page 54 and 55: 7 Udvikling af computerspil Udvikli
Page 56 and 57: Selvom de økonomiske ressourcer ho
Page 58 and 59: 58 stemmegenkendelse være en del a
Page 60 and 61: 8 Innovation Som beskrevet i teorie
Page 62 and 63: Også andre folk har anvendt techno
Page 64 and 65: 9 Metodisk delkonklusion Uden at br
Page 66 and 67: 9.1 Fravalgte metoder og ulemper ve
Page 68 and 69: 10 Filosofi Som beskrevet i forrige
Page 70 and 71: at hun slet ikke gider tænde spill
Page 72 and 73: forskellige missioner, så har Digi
Page 74 and 75: 74 hvervet, skal han desuden oplær
Page 76 and 77: 76 7. Forsvar af tempelskat eller l
Page 78 and 79: 78 For at lette implementeringen ha
Page 80 and 81: synes dog ikke det er så interessa
Page 82 and 83: Spillet er på alle måder multimod
Page 84 and 85: Ergonomisk besværlig brug af maski
Page 86 and 87: ATTACK udelukkes og kigger Sensei i
Page 88 and 89: 88 forestille at tænke over situat
Page 90 and 91: frem for eksempelvis symboler er, a
Page 92 and 93: dialogen mellem spiller og spil, sa
Page 94 and 95: forvirrede. Behovet for forhandling
Page 96 and 97: objekter af RigidBody-klassen, der
Page 98 and 99: 14 Prototyper Udviklingen af spille
Page 100 and 101: 14.2 Nummer 2 Meget tid gik i perio
Page 104 and 105: 104
Page 106 and 107: 106 en begrebsmæssig ramme om en a
Page 108 and 109: 15 Perspektiverende diskussion Med
Page 110 and 111: 16 Litteraturliste Posterne i litte
Page 112 and 113: Rouse, 2005 Game Design: Theory and
Page 114 and 115: Merriam-Webster, Creativity http://
Page 116 and 117: 17 Softwareliste Posterne i littera
Page 118: 18 Bilag A - International Phonetic
show all

3 Stemmebaseret interaktion - The Game Design Chronologist ...

Create successful ePaper yourself

Delete template?

Save as template?