19.09.2013 Views

En jämförelse mellan ord för ansiktsuttryck på svenska och mandarin

En jämförelse mellan ord för ansiktsuttryck på svenska och mandarin

En jämförelse mellan ord för ansiktsuttryck på svenska och mandarin

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

styra. I Bieber <strong>och</strong> Jones (2009:1295) beskrivs det som ”how a w<strong>ord</strong> tends to occur together with other<br />

specific w<strong>ord</strong>s”. I egenskap av att kollokationen <strong>för</strong>ekommer ofta tillsammans med sök<strong>ord</strong>et kan den<br />

säga någonting om sök<strong>ord</strong>ets betydelse. Ett sätt att mäta styrkan i en kollokation, eller med andra <strong>ord</strong><br />

hur sannolikt det är att kollokationen beror <strong>på</strong> ett faktiskt semantiskt samband <strong>och</strong> inte <strong>på</strong> slumpen, är<br />

Mutual Information (MI). MI kommer från början från informationsteorin; Kenneth Ward Church <strong>och</strong><br />

Patrick Hanks (Church <strong>och</strong> Hanks, 1990) <strong>för</strong>eslog en applikation av metoden <strong>för</strong> att fastställa graden<br />

av koppling <strong>mellan</strong> <strong>ord</strong>. Det enklaste sättet att beräkna MI är genom att dividera den observerade<br />

frekvensen med vilken en kollokation <strong>för</strong>ekommer med sök<strong>ord</strong>et i fråga, med den <strong>för</strong>väntade<br />

frekvensen (hur ofta man enligt slumpen kan <strong>för</strong>vänta sig att <strong>ord</strong>et i fråga skulle <strong>för</strong>ekomma<br />

tillsammans med sök<strong>ord</strong>et) (Biber <strong>och</strong> James, 2009:1297). Den <strong>för</strong>väntade frekvensen = (sök<strong>ord</strong>ets<br />

totala frekvens i korpusen * kollokations<strong>ord</strong>ets totala frekvens i korpusen)/ det totala antalet <strong>ord</strong> i<br />

korpusen. I <strong>och</strong> med att MI är en logaritmisk skala så är skillnaden i gemensam information relativt<br />

stor <strong>mellan</strong> två närliggande värden. Konkret betyder det att ”ett rapporterat MI-värde <strong>på</strong> 5 innebär att<br />

kollokationen är 2 5 = 32 gånger vanligare än vad slumpen skulle ge. Omvänt skulle ett värde <strong>på</strong> -5<br />

betyda att kollokationen är 2 -5 = 1/32 så vanlig, alltså 32 gånger ovanligare än slumpen skulle ge.”<br />

(Robert Ö stling, doktorand i datorlingvistik vid institutionen <strong>för</strong> lingvistik <strong>på</strong> Stockholms universitet,<br />

privat konversation). Man kan även ta hänsyn till kollokationsspannet vid beräkningen, varvid MI<br />

beräknas:<br />

MI = log ((AB * korpusstorlek) / (A * B * kollokationsspann)) / log(2)<br />

där A = sök<strong>ord</strong>et <strong>och</strong> B = kollokations<strong>ord</strong>et (corpus.byu.edu/mutualInformation.asp, observerat 3:e maj<br />

2013). Ju högre MI-värde som erhålls, desto starkare är kopplingen. Det ska också sägas att MIvärdena<br />

<strong>för</strong> kollokationer som har en väldigt låg <strong>för</strong>ekomst i korpusen som helhet kan generera ett högt<br />

MI-värde <strong>på</strong> grund av denna låga frekvens, var<strong>för</strong> sådana kollokationer måste tas med en nypa salt<br />

(Biber <strong>och</strong> Jones, 2009:1298). I ett helt kapitel i sin avhandling diskuterar Stefan Evert (Evert,<br />

2005:från sida 119) <strong>på</strong> djupet problemet med att få fram användbar information vid låga frekvenser.<br />

I denna uppsats har beräkningen av MI skett automatiskt vid sökningen efter kollokationer i de<br />

två korpora som använts. Ett sökspann om 6 <strong>ord</strong> användes <strong>för</strong> både <strong>svenska</strong> <strong>och</strong> <strong>mandarin</strong>, <strong>och</strong> <strong>för</strong> de<br />

<strong>svenska</strong> <strong>ord</strong>en <strong>och</strong> uttrycken har Simple Query Syntax använts <strong>för</strong> att få fram alla böjningar av<br />

respektive <strong>ord</strong> vid en <strong>och</strong> samma sökning (Hoffmann et al., 2008). För uttrycken pluta med munnen,<br />

gnissla med tänderna <strong>och</strong> snörpa <strong>på</strong> munnen användes<br />

söksträngarna ”pluta[r,de,nde,ndes,]”, ”gnissla* tänder*” respektive ”snörp[a,te,ande,andes,t]<br />

mun*”. På grund av <strong>för</strong> litet antal träffar <strong>för</strong> pluta med munnen söktes endast <strong>på</strong> pluta. När det<br />

gäller söksträngarna <strong>för</strong> de senare två uttrycken så fångar de även in uttryck som ”gnissla högt med<br />

tänderna”, ”gnissla tänderna”, ”snörpa surt <strong>på</strong> munnen” <strong>och</strong> dylikt. Antalet <strong>ord</strong> som kan <strong>för</strong>ekomma<br />

<strong>mellan</strong> gnissla <strong>och</strong> tänder, respektive snörpa <strong>och</strong> mun är alltså 5.<br />

<strong>En</strong> viss rensning av kollokationsresultaten ut<strong>för</strong>des sedan, där alla kollokationer med ett MIvärde<br />

som var negativt eller lika med 0, alla funktions<strong>ord</strong> (såvida de inte troddes ha relevans <strong>för</strong><br />

sök<strong>ord</strong>et, som till exempel åt har <strong>för</strong> flina), skiljetecken, person- <strong>och</strong> platsnamn, samt sök<strong>ord</strong>et i sig<br />

när det <strong>för</strong>ekom som kollokation, rensades bort. Ä ven kollokationer som beror <strong>på</strong> fasta uttryck<br />

rensades bort i viss mån. Till exempel gj<strong>ord</strong>e uttrycket ”vet inte om man ska skratta eller gråta” att<br />

skratta <strong>och</strong> gråta kollokerade starkare <strong>på</strong> <strong>svenska</strong> än xiào <strong>och</strong> kū <strong>på</strong> <strong>mandarin</strong>, vilket Robert Ö stling<br />

också gj<strong>ord</strong>e mig uppmärksam <strong>på</strong>. Att rensa bort fasta uttryck visade sig dock vara svårare <strong>på</strong><br />

kinesiska, då mer eller mindre fasta uttryck är extremt vanliga där. De mest uppenbara fallen rensades<br />

emellertid bort.<br />

2.4. Intervjuer med modersmå lstalare<br />

Syftet med intervjuerna var att få informanterna att berätta om hur de utvalda <strong>ord</strong>en <strong>och</strong> uttrycken<br />

användes i deras respektive modersmål, <strong>för</strong> att därigenom <strong>för</strong>stå deras semantik. De <strong>svenska</strong><br />

informanterna bestog av två kvinnor <strong>och</strong> tre män, i åldrarna 19, 25, 29, 61 <strong>och</strong> 22 år <strong>och</strong> de kinesiska<br />

informanterna bestog av tre kvinnor <strong>och</strong> två män i åldrarna 23, 28, 32, 28 <strong>och</strong> 19 år. Alla svensktalande<br />

informanter kom från Sverige <strong>och</strong> alla <strong>mandarin</strong>talande informanter kom från Kina. Intervjuerna hölls<br />

9

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!