3 Automatisk detektering av partikelverb - Stp - Uppsala universitet
3 Automatisk detektering av partikelverb - Stp - Uppsala universitet
3 Automatisk detektering av partikelverb - Stp - Uppsala universitet
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>Uppsala</strong> <strong>universitet</strong><br />
Institutionen för lingvistik<br />
Oktober 2000<br />
Examensarbete på<br />
språkteknologiprogrammet<br />
<strong>Automatisk</strong> <strong>detektering</strong><br />
<strong>av</strong> <strong>partikelverb</strong><br />
Bodil Mattisson<br />
Handledare:<br />
Åbylundsvägen 75<br />
Lars Borin, inst. för lingvistik, <strong>Uppsala</strong> <strong>universitet</strong><br />
137 32 Västerhaninge Charlotta Berglund, Telia Promotor AB<br />
Hem. 08-500 248 92<br />
Harald Berthelsen, Telia Promotor AB<br />
Arb. 08-764 35 04<br />
bodil.m.mattisson@telia.se<br />
1
Innehåll<br />
1 INLEDNING ......................................................................................................................... 8<br />
1 INLEDNING ......................................................................................................................... 8<br />
1.1 SYFTE................................................................................................................................... 8<br />
1.2 BAKGRUND: TALSYNTES OCH PROSODI ............................................................................ 8<br />
TILLÄMPNINGAR............................................................................................................................ 8<br />
PRODUKTION AV SYNTETISKT TAL................................................................................................ 9<br />
MOTIVERING AV UPPGIFTEN.......................................................................................................... 9<br />
2 DEFINITION AV PARTIKELVERB................................................................................. 9<br />
2.1 UPPBYGGNAD OCH BETONING ......................................................................................... 10<br />
PARTIKELNS ORDKLASSTILLHÖRIGHET....................................................................................... 10<br />
PARTIKELNS SATSDELSTILLHÖRIGHET........................................................................................ 11<br />
2.2 FUNKTION.......................................................................................................................... 11<br />
2.3 FORM ................................................................................................................................. 11<br />
2.4 BETYDELSE ....................................................................................................................... 12<br />
2.5 PARTIKELVERBENS SYNTAX ............................................................................................ 12<br />
ORDFÖLJD.................................................................................................................................... 13<br />
INSKOTTSMATERIAL.................................................................................................................... 14<br />
PARTIKEL ELLER PREPOSITION ?.................................................................................................. 15<br />
PARTIKEL ELLER ADVERB ?......................................................................................................... 16<br />
VALENS ....................................................................................................................................... 16<br />
3 AUTOMATISK DETEKTERING AV PARTIKELVERB.............................................................. 17<br />
3.1 LINDBERGS ARBETE.......................................................................................................... 17<br />
3.2 MITT EGET ARBETE I KORTHET....................................................................................... 19<br />
4 METOD ............................................................................................................................... 20<br />
4.1 MATERIAL......................................................................................................................... 20<br />
4.2 KRITERIER ........................................................................................................................ 20<br />
4.3 ARBETETS OLIKA FASER .................................................................................................. 20<br />
SÖKNING, SORTERING OCH SÅLLNING......................................................................................... 20<br />
KONTEXTEXTRAKTION................................................................................................................ 21<br />
KONTEXTSTUDIER ....................................................................................................................... 22<br />
5 RESULTAT ......................................................................................................................... 24<br />
5.1 PARTIKELVERBSLEXIKON................................................................................................ 24<br />
TERMINOLOGI.............................................................................................................................. 24<br />
STRUKTUR OCH INFORMATION.................................................................................................... 25<br />
LEXIKONINGÅNGAR..................................................................................................................... 26<br />
AV................................................................................................................................................ 26<br />
I.................................................................................................................................................... 26<br />
MED............................................................................................................................................. 27<br />
OM ............................................................................................................................................... 28<br />
3
PÅ ................................................................................................................................................ 28<br />
BORT............................................................................................................................................ 29<br />
FRAM ........................................................................................................................................... 29<br />
IHOP ............................................................................................................................................. 30<br />
IN ................................................................................................................................................. 30<br />
TILL ............................................................................................................................................. 32<br />
UPP .............................................................................................................................................. 33<br />
UT................................................................................................................................................ 35<br />
5.2 GENERELLA REGLER........................................................................................................ 36<br />
HÖGERKONTEXT.......................................................................................................................... 36<br />
GRUPPERING................................................................................................................................37<br />
SPECIALFALL ............................................................................................................................... 37<br />
ADVERBIAL.................................................................................................................................. 37<br />
5.3 SYNTAKTISKA REGLER..................................................................................................... 38<br />
IMPLEMENTERING AV LEXIKON OCH REGLER ........................................................ 39<br />
6.1 BESKRIVNING AV PROGRAMMET..................................................................................... 39<br />
6.2 VAD KLARAR PROGRAMMET AV ? ................................................................................... 39<br />
7 TESTNING AV PROGRAMMET .................................................................................... 40<br />
7.1 TESTRESULTAT ................................................................................................................. 40<br />
7.2 TYPER AV FEL OCH FÖRSLAG TILL ÄNDRINGAR............................................................. 41<br />
7.3 UTVÄRDERING AV RESULTATET ...................................................................................... 43<br />
8 ALLMÄNNA FÖRBÄTTRINGAR AV PROGRAMMET............................................. 43<br />
9 SAMMANFATTNING ....................................................................................................... 44<br />
LITTERATUR........................................................................................................................... 45<br />
INNEHÅLL................................................................................................................................ 47<br />
PARTIKELVERB SOM OMFATTAS AV UNDERSÖKNINGEN:.................................... 48<br />
HÖGERKONTEXTER............................................................................................................. 49<br />
PARTIKELVERBSINGÅNGAR............................................................................................. 50<br />
AV ............................................................................................................................................... 50<br />
4
I ................................................................................................................................................... 50<br />
MED............................................................................................................................................. 51<br />
OM............................................................................................................................................... 53<br />
PÅ ................................................................................................................................................ 54<br />
BORT ........................................................................................................................................... 56<br />
FRAM........................................................................................................................................... 56<br />
IHOP ............................................................................................................................................ 56<br />
IN................................................................................................................................................. 57<br />
TILL............................................................................................................................................. 59<br />
UPP.............................................................................................................................................. 60<br />
UT................................................................................................................................................ 62<br />
5
Sammandrag<br />
<strong>Automatisk</strong> <strong>detektering</strong> <strong>av</strong> <strong>partikelverb</strong><br />
Syftet med mitt examensarbete är att genom att skriva ett program som kan detektera<br />
<strong>partikelverb</strong> förbättra kvalitén på talsyntesen i Telia Promotors text-till-talomvandlare,<br />
Infovox. Partikelverben skiljer sig enbart genom sitt uttal från vissa andra konstruktioner,<br />
t.ex. verb följt <strong>av</strong> prepositionsfras. Ambiguiteter mellan partiklar och prepositioner eller<br />
adverb är således ett problem som gör <strong>detektering</strong>en komplicerad. Ett annat bekymmer är<br />
att det mellan verbet och partikeln kan förekomma inskottsmaterial i form <strong>av</strong> subjekt eller<br />
adverbial. Jag har försökt att lösa problemen genom att utifrån en korpus ta fram<br />
information om i vilka kontexter <strong>partikelverb</strong> får och inte får förekomma. Informationen<br />
har jag samlat i ett <strong>partikelverb</strong>slexikon vilket utgör underlag för själva <strong>detektering</strong>sprogrammet.<br />
Programmet opererar på ordklasstaggad text och det är meningen att det ska<br />
ingå som en del i preprocessningen i Infovox.<br />
6
1 Inledning<br />
Denna rapport är en redogörelse för ett examensarbete utfört på Telia<br />
Promotor AB i Solna inom ramen för språkteknologiprogrammet vid <strong>Uppsala</strong><br />
<strong>universitet</strong>. Arbetet ingår i en magisterexamen i datorlingvistik med inriktning<br />
mot talteknologi och omfattar 20 poäng.<br />
1.1 Syfte<br />
Det övergripande ändamålet med examensarbetet är att förbättra prosodin i<br />
Telia Promotors text-till-talomvandlare, Infovox. Arbetet innefattar att<br />
undersöka i vilka kontexter <strong>partikelverb</strong> förekommer och utifrån detta skapa<br />
regler för disambiguering <strong>av</strong> <strong>partikelverb</strong> och konstruktioner som liknar<br />
<strong>partikelverb</strong>en ortografiskt men har annorlunda prosodi. Vidare ingår det i<br />
uppgiften att <strong>av</strong>göra vilka <strong>av</strong> dessa regler som är tillräckligt pålitliga för att<br />
användas i Infovox.<br />
1.2 Bakgrund: talsyntes och prosodi<br />
Talsyntes innebär i korthet att en dator får en ortografiskt skriven text som<br />
sedan läses upp med syntetiskt, d.v.s. konstgjort, tal. Målet är oftast att<br />
syntesen ska efterlikna mänskligt tal så mycket som möjligt. Nyckeln till<br />
naturlighet i detta fall är bra prosodi, d.v.s. att kunna efterlikna det mänskliga<br />
talets melodi.<br />
Tillämpningar<br />
Det är många människor, framför allt talskadade och synskadade som har nytta<br />
<strong>av</strong> talsyntes. För talskadade finns det program som fungerar som talproteser.<br />
Synskadade kan få annars svårtillgängligt skrivet material, såsom<br />
tidningsartiklar och brev, uppläst förutsatt att materialet finns i elektronisk<br />
form. Både synskadade och dyslektiker kan dra nytta <strong>av</strong> talsyntes genom att få<br />
egenhändigt skriven text uppläst och på så sätt upptäcka eventuella fel.<br />
Människor med talsvårigheter har även nytta <strong>av</strong> texttelefoni; de skriver vad de<br />
vill säga och låter syntesen läsa upp meddelandet. Om texttelefonen klarar <strong>av</strong><br />
taligenkänning, d.v.s. att konverteraa talat språk till skrivet språk, kan även<br />
hörselskadade ha glädje <strong>av</strong> den då de kan få samtalspartnerns yttranden i<br />
skriven text.<br />
I och med att talsyntesens kvalité ökar blir det allt vanligare att talsyntes<br />
används för att producera yttranden i dialogsystem och<br />
informationsförmedlingsystem. Förr användes ofta färdiginspelade meningar<br />
från en människa i den här sortens applikationer. Det blir dock ohållbart att<br />
vara beroende <strong>av</strong> en person (vars röst dessutom varierar med bl.a. hälsa och<br />
ålder) om systemet måste uppdateras ofta. Detta gör att det är särskilt lämpligt<br />
att använda talsyntes när variabel information ska vidarebefordras via telefon,<br />
t.ex. väderprognoser, nyheter, och e-post. Ytterligare tillämpningar är dataspel<br />
och interaktiva läromedel.<br />
8
Produktion <strong>av</strong> syntetiskt tal<br />
För att en dator ska klara <strong>av</strong> att läsa upp en skriven text med någorlunda<br />
naturligt uttal måste texten först konverteras till en underliggande fonetisk<br />
beskrivning. Ett grundläggande steg i denna process är att den fonetiska<br />
transkription för alla orden i texten slås upp i lexikon. Ett alternativ till detta är<br />
att använda grafem-till-fonemregler i kombination med ett undantagslexikon.<br />
Ett annat viktigt steg är den lingvistiska analysen. Omfattningen <strong>av</strong> analysen<br />
varierar mycket mellan olika system men den är nödvändig för att åstadkomma<br />
en hyfsad prosodi då lingvistisk analys gör det möjligt att sätta ut prosodiska<br />
markörer. Syntaktisk, morfologisk och ibland även semantisk analys gör att vi<br />
kan sätta markörer för t.ex. st<strong>av</strong>elsestruktur och frasgränser. Dessa markörer<br />
styr sedan talljudens längd, grundtonskurvans mönster och intensiteten och de<br />
är <strong>av</strong>görande för prosodins kvalitet. Även mänskliga faktorer såsom ålder, kön,<br />
ansatsrörets längd, hälsa och sinnesstämning påverkar indirekt prosodin men<br />
dessa parametrar går sällan att få fram utifrån den skrivna texten.<br />
Den färdiga fonetiska representationen konverteras sedan till tal. Det finns<br />
olika tekniker för detta; formantsyntes är parameterstyrd och helt<br />
datorgenererad, konkateneringssyntes innebär att förinspelade ljudsegment från<br />
en människa, t.ex. difoner, klistras ihop. En difon består <strong>av</strong> övergången mellan<br />
två ljud, t.ex. andra halvan <strong>av</strong> ett ”b” följt <strong>av</strong> första halvan <strong>av</strong> ett ”a”. Vitsen<br />
med difoner är att man fångar övergångarna mellan olika fonem (t.ex.. låter ”b”<br />
framför ett ”a” lite annorlunda än framför ett ”i”). För att syntestisera ordet<br />
”bad” hämtas följande difoner från en difondatabas: tystnad+b, b+a, a+d<br />
och d+tystnad.<br />
Motivering <strong>av</strong> uppgiften<br />
Varför är det då viktigt att kunna detektera <strong>partikelverb</strong> vid text-tilltalomvandling?<br />
För det första skiljer sig <strong>partikelverb</strong>ens betoningsmönster<br />
från andra verbfrasers och detta påverkar prosodin. Detta gör att om man inte<br />
kan hitta <strong>partikelverb</strong>en kommer dessa alltid att betonas fel vilket leder till att<br />
det kan vara svårt att förstå vad som menas och helhetsintrycket <strong>av</strong> syntesen<br />
blir sämre. För att göra syntesen så lättförståelig som möjligt är det därför<br />
viktigt att hitta <strong>partikelverb</strong>en men att samtidigt se till att andra, liknande<br />
konstruktioner inte får <strong>partikelverb</strong>sbetoning om de inte ska ha det. För det<br />
andra är det behändigt att kunna behandla <strong>partikelverb</strong>en som hela enheter i<br />
stället för två ord (verb och partikel) under förarbetet <strong>av</strong> texten inför syntesen.<br />
Detta gäller framför allt när verbet och partikeln står efter varandra. I dessa<br />
fall blir materialet enklare att parsa, d.v.s. analysera syntaktiskt, och vi får en<br />
bättre grammatisk beskrivning. Detta i sin tur leder till att det är lättare att sätta<br />
ut prosodiska markörer. Summan <strong>av</strong> det hela är att vi får ett naturligare uttal på<br />
både fras- och meningsnivå.<br />
2 Definition <strong>av</strong> <strong>partikelverb</strong><br />
Att hitta en definition <strong>av</strong> ordet ”<strong>partikelverb</strong>” i svenska grammatikböcker är<br />
inte lätt då det oftast inte finns med. Dock verkar grammatikboksförfattarna<br />
vara ense om att det finns konstruktioner i svenskan som består <strong>av</strong> ett<br />
obetonat verb följt <strong>av</strong> en betonad partikel eller ett verb med en betonad<br />
9
partikel som förled. Hur sådana konstruktioner ska benämnas, vad partikeln<br />
har för ordklasstillhörighet och vilken satsdel den tillhör finns det varierande<br />
åsikter om i litteraturen. Den vanligaste beskrivningen <strong>av</strong> ett <strong>partikelverb</strong> är<br />
dock något i stil med det som följer. De flesta exemplen nedan är tagna från<br />
Thorell(1981).<br />
2.1 Uppbyggnad och betoning<br />
Ett <strong>partikelverb</strong> utgörs <strong>av</strong> ett obetonat verb och en betonad partikel,<br />
tillsammans har de sammanfattningsaccent (även kallad idiomatiseringsaccent,<br />
gruppordsaccent och konnektiv prosodi), d.v.s. tryckaccent på sista ledet i<br />
ordgruppen. Jämför exempelmeningarna nedan. I det första exemplet nedan är<br />
på obetonat, i det andra betonat.<br />
Han hälsade på henne / d.v.s. sade ”hej”<br />
Han hälsade på henne / d.v.s. besökte<br />
(verb + prepositionsfras)<br />
(<strong>partikelverb</strong>)<br />
Partikelns ordklasstillhörighet<br />
Enligt t.ex. Thorell (1973) kan partikeln antingen bestå <strong>av</strong> ett adverb (t.ex. ut,<br />
fram, ihop) eller en preposition (t.ex. på, <strong>av</strong>, om). Partikelverb kan även<br />
konstrueras med en preposition följd eller föregången <strong>av</strong> ett reflexivt<br />
pronomen (t.ex. (sätta)på sig/(ta) sig in).<br />
En del räknar också en del (mer idiomatiska) konstruktioner med adjektiv och<br />
substantiv som <strong>partikelverb</strong>, t.ex. göra färdigt och slå dank. I det sista exemplet är<br />
det svårt att utröna <strong>partikelverb</strong>ets betydelse utifrån de ingående delarnas<br />
betydelse och sådana konstruktioner kallas ofta lexikaliserade <strong>partikelverb</strong>.<br />
Senare grammatikboksförfattare, t.ex. Järner (1993) och Stroh-Wollin (1998),<br />
uttrycker sig mycket försiktigare om partklarnas ordklasstillhörighet genom att<br />
säga att verbpartiklarna liknar/ser ut som adverb och prepositioner och att de<br />
självständigt kan fungera som sådana. Båda nämnda författare anser dock att<br />
verbpartiklar och prepositioner skiljer sig åt i en rad <strong>av</strong>seenden:<br />
- Prepositioner är obetonade i kontexten ifråga, verbpartiklar<br />
betonande.<br />
- Verbpartiklarna är starkare bundna till verben de är knutna<br />
till än vad prepositionerna är.<br />
- Prepositionerna måste förekomma tillsammans med<br />
substantiv, detta gäller ej verbpartiklar.<br />
Med detta i åtanke tar det emot att klassificera verbpartiklar som prepositioner.<br />
Stroh-Wollin påpekar att verbpartiklarna traditionellt har räknats till adverben.<br />
Detta är i linje med den information man finner om man konsulterar en<br />
någorlunda utförlig ordbok. I, <strong>av</strong>, med och på räknas alla till ordklassen adverb i<br />
de fall de uppträder som verbpartiklar.<br />
10
Senare kommer vi se att <strong>partikelverb</strong>en uppför sig lite olika beroende på typ <strong>av</strong><br />
partikel, det är därför praktiskt att tala om ”prepositionsliknande” och<br />
”adverbliknande” partiklar.<br />
Partikelns satsdelstillhörighet<br />
Verbpartikeln kan räknas som utgörande en del <strong>av</strong> predikatet eller som ett<br />
adverbial. Partikeln bildar en syntaktisk, semantisk och uttalsmässig enhet med<br />
verbet och därför är det inte svårt att se den som en del <strong>av</strong> predikatet. Det är<br />
heller inte ologiskt att räkna verbpartikeln som ett adverbial då den liksom ett<br />
adverbial modifierar verbet. En som följt denna linje är Erik Andersson (1993).<br />
Han kallar verbpartiklar för partikeladverbial. Detta synsätt återfinns också i<br />
den nyutkomna Svenska akademiens grammatik (1999) där han är en <strong>av</strong><br />
medförfattarna.<br />
2.2 Funktion<br />
Partikeln har tre funktioner: transitivering, objektsväxling samt förändring <strong>av</strong><br />
verbets aktionssätt.<br />
Transitivering innebär att intransitiva verb görs transitiva. Ett exempel på detta<br />
är verbet tänka, som är intransitivt och tar en prepositionsfras, och<br />
<strong>partikelverb</strong>et tänka ut som är transitivt, d.v.s. det konstrueras med objekt.<br />
Ett exempel på objektsväxling är konstruktionerna:<br />
skriva [sitt namn]obj. [på ett kontrakt]pp.<br />
skriva på [ett kontrakt]obj. [med sitt namn]pp.<br />
Det enkla verbets objekt (sitt namn) motsvaras <strong>av</strong> en prepositionsfras (med sitt<br />
namn) vid <strong>partikelverb</strong>. Prepositionsfrasen vid enkelt verb (på ett kontrakt)<br />
motsvaras <strong>av</strong> ett objekt (ett kontrakt) i konstruktionen med <strong>partikelverb</strong>.<br />
I svenskan skiljer vi på t.ex. terminativt och durativt aktionssätt. Ett verb som<br />
är terminativt är begränsat i tiden, t.ex. bestiga, och ett durativt verb är<br />
obegränsat i relation till tiden, t.ex. klättra. En partikel kan ändra ett verbs<br />
aktionssätt, t.ex. från durativt till terminativt. Exempel på detta är blomma –<br />
blomma upp.<br />
2.3 Form<br />
Partikeln kan vara efterställd och lösgjord från verbet, då talar man om lös<br />
förbindelse/sammansättning. Ett exempel på detta är ställa in. Partikeln kan<br />
även stå som förled till verbet, så är fallet i t.ex. inställa. Här är det istället en<br />
fast förbindelse/sammansättning vi har att göra med.<br />
Man måste skilja på partikelsammansatta verb, t.ex. inställa, och prefix<strong>av</strong>ledda<br />
verb, t.ex. beställa. Partikeln (i detta fall in) består alltid <strong>av</strong> ett fritt morfem med<br />
motsvarigheter i ett självständigt ord medan prefixet utgörs <strong>av</strong> ett bundet<br />
morfem (i detta fall be-). Partiklarna till skillnad mot prefixen kan oftast skiljas<br />
från sitt verb men det finns undantag, se nedan. Partiklar och prefix har mycket<br />
gemensamt då de båda modifierar verbets betydelse och förmåga att ingå i<br />
11
olika syntaktiska konstruktioner. Märk dock att i inställa är det partikeln som<br />
har huvudtrycket och i beställa är det verbet.<br />
Vissa <strong>partikelverb</strong> förekommer enbart som fasta förbindelser, t.ex. tillåta och<br />
urarta. Andra finns bara i lös förbindelse, däribland tycka om och rycka till. En<br />
tredje grupp bildar de <strong>partikelverb</strong> som kan förekomma i båda formerna, t.ex.<br />
inställa - ställa in. I den sistnämnda gruppen finner vi en stilistisk skillnad mellan<br />
de olika formerna; den fasta konstruktionen är mer formell och typisk för<br />
skriftspråk, medan den lösa varianten är vanlig i talspråk och informella<br />
sammanhang. Vid participbildning är det emellertid alltid fast förbindelse som<br />
gäller, t.ex. utvecklande.<br />
Många <strong>partikelverb</strong> finns i reflexiva varianter. En del, som t.ex. ta med och ta<br />
med sig är semantiskt knutna till varandra och har liknande syntaktiska<br />
egenskaper. Andra par har väldigt lite gemensamt förutom formen. Detta<br />
gäller t.ex. ta till (hammaren), ta till sig (ngt) och (vad ska man) ta sig till.<br />
2.4 Betydelse<br />
Det är inte alltid det går att förutsäga ett <strong>partikelverb</strong>s betydelse utifrån de<br />
ingående delarna. Det enkla verbets betydelse förändras ofta då det kombineras<br />
med en partikel. Detta kan exemplifieras <strong>av</strong> verbet duka och <strong>partikelverb</strong>et<br />
duka under som inte alls betyder samma sak. Vidare finns det homografer hos<br />
<strong>partikelverb</strong>en som kan ha helt olika betydelser. T.ex. gå på har minst tre olika<br />
betydelser: ”gå in i” (t.ex. en buss) , ”bli lurad”, och ”forsätta med det man<br />
håller på med”.<br />
Många <strong>partikelverb</strong> uppvisar både semantisk och en stilistisk skillnad beroende<br />
på förbindelseformen. Jämför t.ex. framställa - ställa fram, <strong>av</strong>bryta - bryta <strong>av</strong>. De<br />
fasta förbindelserna är abstrakta med bildlig betydelse medan deras lösa<br />
motsvarigheter är mer konkreta i sin betydelse. I flera fall är det svårt att<br />
överhuvudtaget se något semantiskt samband mellan de två formerna. Detta<br />
gäller t.ex. <strong>av</strong>göra (besluta) - göra <strong>av</strong> (med pengar).<br />
2.5 Partikelverbens syntax<br />
Partikelverben utgör en undergrupp till lexikaliserade fraser som i sin tur utgör<br />
en undergrupp till kollokationer, d.v.s. ord som ofta förekommer tillsammans.<br />
Några exempel på lexikaliserade fraser är t.ex. fina fisken, Dagens Nyheter, kniv och<br />
gaffel, full i sjutton och hålla klaffen. Enligt Anward & Linell (1976) kännetecknas<br />
lexikaliserade fraser bl.a. <strong>av</strong> att de utgör en syntaktisk enhet, t.ex. en<br />
konstituent, och att de (ofta) har konnektiv prosodi. Vi har sett ovan att detta<br />
även gäller <strong>partikelverb</strong>en.<br />
Liksom enkla verb kan man dela in <strong>partikelverb</strong> i transitiva och intransitiva.<br />
Partikelverb kan förekomma i meningar med omvänd ordföljd och vissa<br />
<strong>partikelverb</strong> kan även förekomma i passiverade och topikaliserade meningar.<br />
Till skillnad från enkla verb är de löst sammansatta <strong>partikelverb</strong>en tvådelade<br />
och inskottsmaterial i form <strong>av</strong> ett eller flera ord kan förekomma mellan verbet<br />
och partikeln. I och med att partikeln till formen kan vara identisk med adverb<br />
eller prepositioner uppstår även ambiguiteter.<br />
12
Nedan följer en redogörelse för hur <strong>partikelverb</strong>en uppträder i olika<br />
sammanhang, vad inskottsmaterialet kan bestå <strong>av</strong> och vilka ambiguiteter som<br />
är förknippade med <strong>partikelverb</strong>.<br />
Ordföljd<br />
I detta <strong>av</strong>snitt presenteras olika typer <strong>av</strong> förändringar <strong>av</strong> ordföljden, de<br />
processer som ligger bakom och vilka mönster de ger upphov till i de fall<br />
<strong>partikelverb</strong> är närvarande.<br />
I fasta förbindelser står partikeln alltid före och tillsammans med verbet o<strong>av</strong>sett<br />
typ <strong>av</strong> sats.<br />
Han inställde mötet.<br />
Vad gäller lösa förbindelser i huvudsatser med rak ordföljd står partikeln<br />
frånskiljt från, men direkt efter, verbet. Förekommer satsadverb placeras detta<br />
mellan verbet och partikeln (i påståendesatser och uppmaningar). Exempel:<br />
Oskar skrev på kontraktet igår.<br />
Oskar skrev inte på kontraktet igår.<br />
Skriv inte på kontraktet!<br />
Om ett annat satsled än subjektet står först i en huvudsats (d.v.s. i<br />
fundamentet) får vi omvänd ordföljd. Detta gäller också vissa typer <strong>av</strong><br />
frågesatser. Den omvända ordföljden gör att subjektet hamnar mellan verbet<br />
och partikeln.<br />
Igår skrev Oskar på kontraktet.<br />
Om jag inte minns fel, skrev Oskar på kontraktet igår.<br />
Skrev Oskar på kontraktet igår?<br />
(omvänd)<br />
(omvänd)<br />
(omvänd)<br />
I bisatser är partikeln alltid placerad direkt efter verbet o<strong>av</strong>sett om satsadverb<br />
förekommer eller ej.<br />
Han sade att han (inte) ställde in mötet igår.<br />
I exemplen ovan påverkas inte högerkontexten (objektet står kvar direkt efter<br />
partikeln) men objektet kan mycket väl flyttas fram till fundamentet. T.ex. ger<br />
en del transformationer upphov till förändringar <strong>av</strong> högerkontexten. Detta<br />
gäller främst passivering och topikalisering. Definitionerna nedan kommer från<br />
Dahl (1982).<br />
Passivering innebär att följande förändring sker <strong>av</strong> en mening i aktiv diates:<br />
subjektet placeras efter verbet, prepositionen ”<strong>av</strong>” läggs till framför subjektet,<br />
objektet placeras på subjektets plats och verbet får passiv form. Exempel:<br />
Oskar skrev på kontraktet<br />
Kontraktet skrevs på <strong>av</strong> Oskar<br />
(aktiv)<br />
(passiv)<br />
13
Endast meningar med ett transitivt verbled kan genomgå en sådan<br />
transformation.<br />
Det är dock inte alltid den passiva konstruktionen uppvisar samma mönster<br />
som ovan. Subjektet kan strykas i passiva konstruktioner i tre fall; om det är<br />
underförstått som i exempelmeningen nedan, om det är obekant eller om syftet<br />
är att dölja subjektet.<br />
Kontraktet skrevs på och affären <strong>av</strong>slutades.<br />
Utelämnande <strong>av</strong> subjekt eller objekt är ett vanligt fenomen i olika sorters<br />
satsförkortningar, oberoende <strong>av</strong> diates. I nästa exempel har objektet uteslutits:<br />
Alla var nöjda med kontraktet, till och med Oskar skrev på.<br />
Topikalisering innebär att en nominalfras, oftast det direkta objektet, i en<br />
mening flyttas fram till fundamentsposition. Topikaliseringen medför också att<br />
det finita verbet flyttas fram före subjektet (s.k. finit-framflyttning).<br />
Oskar g<strong>av</strong> bort boken (till Anna).<br />
Boken g<strong>av</strong> Oskar bort (till Anna).<br />
(rak ordföljd)<br />
(topikaliserad version)<br />
Observera även följande passiva variant <strong>av</strong> meningen:<br />
Boken g<strong>av</strong>s bort till Anna.<br />
Här har givaren (Oskar) uteslutits, vilket enligt Thorell (1973) är vanligt när det<br />
gäller verb som t.ex. ”giva”, ”lämna” och ”lova”. Det kan också tänkas att det<br />
var uppenbart vem som g<strong>av</strong> boken till Anna och att det var därför subjektet<br />
uteslöts.<br />
Inskottsmaterial<br />
Lindberg (1994) har arbetat med automatisk <strong>detektering</strong> <strong>av</strong> lexikaliserade fraser<br />
och har även inkluderat <strong>partikelverb</strong> i sin undersökning. Lindberg har kommit<br />
fram till att följande gäller för inskottsmaterial och jag har inte hittat något som<br />
emotsäger detta:<br />
1) Om inskottet innehåller ett subjekt kan detta bestå <strong>av</strong> allt från enkla<br />
pronomen till hela nominalfraser med attribut <strong>av</strong> olika slag samt även<br />
proprier och förkortningar.<br />
2) Om inskottet innehåller ett adverbial utgörs detta allt som oftast <strong>av</strong><br />
ett kort satsadverbial (t.ex. inte eller ju), eller en prepositionsfras, men<br />
även tyngre adverbial förekommer (Lindbergs exempel):<br />
Han ställer inte upp idag<br />
Jag kommer tyvärr inte speciellt bra ihåg henne<br />
3) I följande fall kan det inte förekomma något inskottsmaterial:<br />
- i satser som innehåller hjälpverb<br />
14
- i bisatser<br />
- när verbet står i infinitiv eller particip<br />
Partikel eller preposition ?<br />
Det kan vara mycket svårt och ibland t.o.m. omöjligt för både datorer och<br />
människor att skilja följande konstruktioner från varandra då det enda som<br />
skiljer konstruktionerna åt är betoningen och den kan man inte sluta sig till<br />
enbart utifrån texten. Exempel:<br />
Du måste skruva på korken.<br />
(dvs. sätta på korken på flaskan t.ex.)<br />
Du måste skruva på korken.<br />
(dvs. du ska inte trycka på korken,<br />
utan skruva på den).<br />
(<strong>partikelverb</strong> + nominalfras)<br />
(verb+advl (prep. + nominalfr.))<br />
Då osäkerhet uppstår finns det en rad olika ”förflyttningstester” att ta till.<br />
Teleman(1983) föreslår bl.a. följande tester (mina språkexempel):<br />
- Om prepositionskandidaten samt efterföljande nominal kan brytas<br />
ut och göras till fundament, inleda en relativ sats eller frågesats, så<br />
är det en preposition:<br />
Kalle går på tricket<br />
*Det är på tricket som Kalle går<br />
Kalle går på vägen<br />
Det är på vägen som Kalle går<br />
- Det prepositionsliknande ordet är en partikel om det efterföljande<br />
nominalet lätt kan göras till subjekt i passiv sats:<br />
käppen bröts <strong>av</strong><br />
- Ordet ”särskilt” kan användas för att disambiguera prepositioner och<br />
partiklar. Ett nominal i en prepositionsfras kan framhävas på<br />
följande sätt:<br />
jag har lekt särskilt med Kalle.<br />
Det går däremot inte att placera ”särskilt” framför en partikel i<br />
<strong>av</strong>sikten att framhäva det efterföljande objektet:<br />
jag har brutit <strong>av</strong> särskilt käpparna<br />
*jag har brutit särskilt <strong>av</strong> käpparna<br />
- Om man kan sätta prepositionskandidaten som förled till verbet utan<br />
att ändra ordföljden är det ett <strong>partikelverb</strong> vi har att göra med:<br />
ta (i)från Svensson bilen<br />
frånta Svensson bilen<br />
ta bilen från Svensson<br />
*frånta bilen Svensson<br />
15
Testerna ovan må vara nog så praktiska men de går tyvärr inte att använda i<br />
datorsammanhang.<br />
Partikel eller adverb ?<br />
Lindberg har funnit att ett verb tillsammans med en adverbliknande partikel<br />
oftast utgör ett <strong>partikelverb</strong>. Sådana konstruktioner ger därför upphov till få<br />
ambiguiteter. Men om verbet betecknar rörelse kan det ibland vara svårt att<br />
<strong>av</strong>göra om t.ex. ”upp” är en partikel eller om det är ett adverb som bestämmer<br />
ett rumsadverbial. Rumsadverbialet börjar ofta med mot/till. Exempel:<br />
Han gick upp mot kyrkan.<br />
Han gick upp mot kyrkan<br />
Det bör nämnas här att prepositioner och adverb kan vara betonade i<br />
emfatiska konstruktioner, till exempel i meningen ”Han gick på mattan (inte<br />
bredvid den)”. Denna betoning går det heller inte att sluta sig till enbart från<br />
texten om där inte finns en speciell fördefinierad markör.<br />
Valens<br />
Vad gäller valens menar Lindberg att om man anger både de enkla verbens och<br />
<strong>partikelverb</strong>ens valens i lexikon löser man en del ambiguiteter, men inte alla.<br />
Om man vet att ett <strong>partikelverb</strong> är intransitivt så kan man utesluta<br />
konstruktioner där den eventuella partikeln följs <strong>av</strong> en nominalfras. Lindbergs<br />
exempel (här och framåt tills annat anges):<br />
* Han gick under stegen.<br />
Han gick under stegen.<br />
Notera att detta kan vara lite vanskligt då adverbial kan utgöras <strong>av</strong><br />
nominalfraser (t.ex. han tittade in en torsdagskväll) vilka dessutom gärna följer<br />
direkt efter partikeln i meningen (min anmärkning).<br />
För de enkla verben är det (enligt Lindberg) också bra att ange huruvida de kan<br />
efterföljas <strong>av</strong> en prepositionsfras eller ej. Genom att i lexikon ange sådan<br />
information jämte uppgifter om ordklass och valens kan meningsanalyser som<br />
de nedan undvikas:<br />
De såg på oss.<br />
Hon klippte <strong>av</strong> några centimeter.<br />
Han satte i fönstret.<br />
Valensinformation räcker emellertid inte i de fall då det enkla verbet kan bilda<br />
både transitiva <strong>partikelverb</strong> och ta prepositionsfras. Ambiguiteten består t.ex. i<br />
följande meningar:<br />
Slå i sina böcker<br />
Slå i sina vänner att…<br />
16
3 <strong>Automatisk</strong> <strong>detektering</strong> <strong>av</strong> <strong>partikelverb</strong><br />
Vad är det då ett program för automatisk <strong>detektering</strong> <strong>av</strong> <strong>partikelverb</strong> måste<br />
klara <strong>av</strong>? Den övergripande uppgiften är att <strong>av</strong>göra huruvida ett verb följt <strong>av</strong><br />
ett adverb eller en preposition utgör ett <strong>partikelverb</strong> eller ej. Detta innebär att<br />
programmet måste kunna hantera följande:<br />
1) Eventuella inskottsmaterial, d.v.s. hitta inskottsmaterialet och<br />
analysera det.<br />
2) Eventuella högerkontexter, d.v.s. identifiera det material som<br />
kommer efter partikeln och analysera det.<br />
3) Hantera förändringar i ordföljden. T.ex. ska både meningar med rak<br />
och omvänd ordföljd kunna behandlas.<br />
Detta innebär att det någonstans måste formuleras vilka inskott och<br />
högerkontexter som är tillåtna och att programmet måste klara <strong>av</strong> en viss grad<br />
<strong>av</strong> syntaktisk analys eller samverka med andra moduler som ger sådan<br />
information.<br />
Jag kommer i detta kapitel kortfattat presentera Lindbergs förslag till lösning<br />
från 1994 och även nämna hur han ser på problemet idag. Mitt eget<br />
lösningsförslag, som i mångt och mycket liknar Lindbergs, redovisas därefter i<br />
korta ordalag för att sedan presenteras närmare i resultatkapitlet.<br />
3.1 Lindbergs arbete<br />
För att detektera lexikaliserade fraser och då även <strong>partikelverb</strong> automatiskt<br />
föreslog Lindberg 1994 en metod som bygger på både regler och lexikon. I<br />
korthet såg hans förslag till lösning ut som följer:<br />
- Hantera <strong>partikelverb</strong> innehållande prepositionsliknande<br />
partiklar genom att lista dem i lexikonet.<br />
- Hantera <strong>partikelverb</strong> innehållande adverbliknande partiklar<br />
med regler. Om disambigueringsreglerna kräver ett verb, ett<br />
begränsat inskottsmaterial och sedan den adverbliknande<br />
partikeln blir andelen övergenereringar ganska liten.<br />
- Tillåt subjekt, adverbial och objektspronomina som inskott.<br />
- Uteslut dock verb, subjunktioner och skiljetecken i inskottet.<br />
- Begränsa antalet inskottsord till ca fem.<br />
- Ange ordklass i lexikonet.<br />
- Ange <strong>partikelverb</strong>ens och de enkla valens i lexikonet.<br />
- Ange även i lexikonet huruvida enkla verb kan ta<br />
prepositionsfraser.<br />
Sammanfattningsvis säger Lindberg att reglerna har fördelen att de kan hitta<br />
alla konstruktioner som uppfyller vissa kriterier och de kan även hitta<br />
nybildningar. Täckningsgraden är dock inte tillräckligt stor även om man<br />
begränsar reglerna till att enbart omfatta t.ex. <strong>partikelverb</strong> som tar<br />
adverbliknande partiklar, och dessutom släpps en hel del tvetydigt och felaktigt<br />
material igenom. En metod som helt förlitar sig på lexikonet övergenererar inte<br />
17
lika mycket som en regelbaserad men <strong>partikelverb</strong>en är å andra sidan väldigt<br />
många.<br />
I en senare rapport, Lindberg (1999), har Lindberg ändrat uppfattning på flera<br />
punkter vad gäller <strong>partikelverb</strong>en. Till att börja med har han genom att utgå<br />
från semantiska kriterier snarare än formella och prosodiska begränsat vilka<br />
<strong>partikelverb</strong> som får vara med i fraslexikonet. Han fokuserar därmed på de mer<br />
idiomatiska <strong>partikelverb</strong>en. Därför utesluter han <strong>partikelverb</strong> vars partikel<br />
används i sin ursprungliga rumsliga betydelse, därmed utesluts ”slänga in” men<br />
”lägga in” får vara med i och med att en <strong>av</strong> dess betydelser (”konservera”) inte<br />
är semantiskt kompositionell, d.v.s. det går inte att sluta sig till betydelsen<br />
utifrån de ingående delarna. Den andra typen <strong>av</strong> <strong>partikelverb</strong> som utesluts är<br />
sådana som används i rumsliga metaforer, t.ex. ”slunga ut” och ”sväva ut”.<br />
Vad gäller regler och lexikon har Lindberg frångått idén att hantera<br />
adverbliknande partiklar med hjälp <strong>av</strong> regler då där fanns för många<br />
ambiguiteter. Han menar att övriga får skötas <strong>av</strong> parsern. Han ser ej heller<br />
längre någon fördel i att i lexikonet ange huruvida enkla verb kan ta<br />
prepositioner efter sig i och med att alla verb kan ta adverbiella prepositioner. I<br />
övrigt gäller det som listades ovan.<br />
LP-Detect är namnet på Lindbergs program och det innehåller tre<br />
komponenter: ett lexikon över lexikaliserade fraser, ett <strong>detektering</strong>sprogram<br />
och en disambigueringsdel (Dis). Lexikonet innehåller totalt drygt 8000 fraser<br />
som med hjälp <strong>av</strong> variabler kan härledas utifrån ca 4800 typer <strong>av</strong> fraser.<br />
Lexikonet innehåller följande uppgifter:<br />
- Vilken typ <strong>av</strong> fras det rör sig om och hur många exempel <strong>av</strong><br />
den typen det finns i lexikonet<br />
- En approximering <strong>av</strong> hur långt det minst frekventa ordet är<br />
anges genom att lista det längsta ordet i frasen.<br />
- Ordklassanalys <strong>av</strong> frasen (med subkategorisering <strong>av</strong> verben<br />
som t.ex. anger om verbet är transitivt, bitransitivt eller<br />
intransitivt).<br />
- Ett reguljärt uttryck som används för att hitta frasen i texten.<br />
Uttrycket kan innehålla ord, ordklasser och variabler.<br />
- Prosodisk och morfologisk information m.m.<br />
Detekteringsprogrammet använder de reguljära uttrycken. Sökrymden<br />
begränsas genom att endast de fraser vars längsta ord finns med i meningen<br />
anses som möjliga. Programmet innehåller både disambigueringsregler och<br />
uteslutningsregler (”discarding rules”) som tillsammans hittar den rätta<br />
lösningen.<br />
Input till programmet är textfiler från SUC innehållande ord:ordklass-par. Om<br />
ordet är ett verb står dess grundform. Output är samma mening med<br />
eventuella lexikaliserade fraser markerade med hakparenteser och taggar.<br />
Programmet klarar <strong>av</strong> att hitta 94 % <strong>av</strong> de lexikaliserade fraserna i SUC. Jag har<br />
ingen uppgift på vilka <strong>partikelverb</strong> han hanterar och om procentsiffran även<br />
gäller för den gruppen.<br />
18
3.2 Mitt eget arbete i korthet<br />
I detta <strong>av</strong>snitt presenterar jag mitt eget lösningsförslag i stora drag. En mer<br />
detaljerad redovisning återfinns i kapitlet Resultat. Jag har fått stor hjälp <strong>av</strong><br />
Lindbergs arbete och i mycket <strong>av</strong> det jag har gjort syns det spår efter honom.<br />
Hans uppgift var mer övergripande än min då han syftade till att hantera alla<br />
sorters lexikaliserade fraser medan jag enbart har koncentrerat mig på<br />
<strong>partikelverb</strong> och till och med bara ett begränsat antal sådana (se kapitlet<br />
Metod). Även jag anger ordklass och valens i lexikonet, tillåter subjekt och<br />
adverbial som inskott och begränsar inskottet till fem ord. Jag godkänner dock<br />
inte objektspronomina rakt <strong>av</strong> utan anger för varje <strong>partikelverb</strong> om de kan<br />
förekomma i reflexiv form eller ej.<br />
Jag listar både <strong>partikelverb</strong>en med adverbliknande partiklar och dem med<br />
prepositionsliknande partiklar i lexikonet. Jag anger huruvida <strong>partikelverb</strong>en är<br />
intransitiva eller transitiva men den informationen är bara till för att framtida<br />
syntaktiska regler (t.ex. regler för att hantera passivering) ska veta vilka<br />
<strong>partikelverb</strong> de kan operera på. Huruvida Lindberg har några syntaktiska regler<br />
som hanterar förändringar i ordföljden vet jag inte men dessa torde vara<br />
nödvändiga om man vill få en hög täckningsgrad, åtminstone för ickeidiomatiserade<br />
<strong>partikelverb</strong>. För lexfraser <strong>av</strong> typen ”hålla sig underrättad” eller<br />
”skämt åsido” är det möjligt att ordföljden inte påverkar fraserna i sig utan bara<br />
deras omgivningar. Jag anger valens i form <strong>av</strong> en lista <strong>av</strong> godkända högerkontexter.<br />
En subkategorisering <strong>av</strong> <strong>partikelverb</strong>en har jag varit inne på, se mer<br />
om detta i <strong>av</strong>snitt 5.2. När det gäller inskottet sköts detta hos Lindberg genom<br />
att det i de reguljära uttrycken även lämnas plats för inskott. Om jag har<br />
förstått rätt använder han samma begränsningar <strong>av</strong> inskottet för alla typer <strong>av</strong><br />
lexfraser. Vi godkänner i stort sätt samma inskott men jag förhindrar en hel del<br />
feltolkningar genom att för vissa <strong>partikelverb</strong> förbjuda ett eller flera inskott,<br />
detta görs i lexikonet.<br />
Våra lösningar liknar varandra i det att vi båda valt att lista <strong>partikelverb</strong>en i<br />
lexikon och där även ange valens- och kontextinformation. Jag har dock använt<br />
listor <strong>av</strong> kontexter i stället för reguljära uttryck, detta gäller även hanteringen <strong>av</strong><br />
inskottsmaterialet. På det stora hela har jag varit mer specifik i mina uppgifter<br />
och detta är naturligt då hans arbete omfattar ett mycket större och<br />
månsidigare material.<br />
19
4 Metod<br />
I de tidigare <strong>av</strong>snitten har en definition <strong>av</strong> begreppet <strong>partikelverb</strong> presenterats<br />
och mitt och Lindbergs lösningsförslag har beskrivits. Fokus skiftar nu från de<br />
grundläggande bakgrundsstudierna i undersökningen till det faktiska arbetet.<br />
Nedan följer en redovisning <strong>av</strong> det material som används vid sökning efter<br />
<strong>partikelverb</strong>, vilka kriterier sökningen grundar sig på och vilket tillvägagångssätt<br />
som använts.<br />
4.1 Material<br />
Det textmaterial som använts i undersökningen är Stockholm Umeå Corpus<br />
(SUC), utvecklad <strong>av</strong> institutionen för lingvistik på Stockholms <strong>universitet</strong> och<br />
motsvarande i Umeå. Den version som används här är SUC 2.0. Korpusen<br />
innehåller drygt en miljon ord och den är taggad med <strong>av</strong>seende på ordklass,<br />
lemma och böjningsmorfologi. Taggningen är till största delen gjord med<br />
manuella metoder och tagguppsättningen finns beskriven i Ejerhed et al (1992).<br />
SUC består <strong>av</strong> 500 texter om 2000 ord vardera. Dessa är hämtade från vitt<br />
skilda ämnesområden för att täcka så många olika språkstilar som möjligt. De<br />
flesta texterna är tryckta under åren 1990-1993 och någon enstaka 1994.<br />
Meningen är att korpusen ska spegla den nutida svenskan i största möjligaste<br />
mån.<br />
4.2 Kriterier<br />
De <strong>partikelverb</strong> som skulle studeras valdes ut från SUC enligt vissa kriterier.<br />
Dels var det önskvärt att studera de mest frekventa <strong>partikelverb</strong>en. Att enbart<br />
kunna hantera dessa skulle i sig vara ett stort lyft för talsyntesen. Det var också<br />
önskvärt att titta på de produktivaste verben och partiklarna, d.v.s. de verb som<br />
kan kombineras med flest partiklar och vice versa. Jag hoppades på detta sätt<br />
underlätta sökningen efter samband och mönster som kan leda till någon form<br />
<strong>av</strong> gruppering <strong>av</strong> <strong>partikelverb</strong>en. Med andra ord var målet att hitta de vanligaste<br />
<strong>partikelverb</strong>en med de produktivaste beståndsdelarna. Med Lindbergs arbete i<br />
bakhuvudet anpassades även metoden för att kunna studera <strong>partikelverb</strong>ens<br />
eventuella inskottsmaterial och deras högerkontexter.<br />
4.3 Arbetets olika faser<br />
Arbetet med att undersöka hur olika <strong>partikelverb</strong> uppför sig syntaktiskt och<br />
vilka ambiguiteter de ger upphov till kan delas upp i ett antal olika delmoment<br />
vilka redovisas nedan.<br />
Sökning, sortering och sållning<br />
Det första steget var att ta fram alla enskilda <strong>partikelverb</strong> i SUC, d.v.s.<br />
konstruktioner där ett verb följs <strong>av</strong> ett optionellt inskott följt <strong>av</strong> en preposition<br />
eller ett adverb som blivit taggade som PL. Det blev ca 1600 st. Utifrån<br />
frekvenslistor sorterade jag ut dem som förekom 10 eller fler gånger i SUC,<br />
varefter återstod ca 260 st. Från dessa 260 valdes de <strong>partikelverb</strong> ut vars verb<br />
20
och partikel i sig själva var produktiva, d.v.s. de kunde kombineras med många<br />
partiklar respektive verb. Notera att en del väldigt vanliga <strong>partikelverb</strong> föll bort<br />
i detta moment beroende på improduktiva komponenter. I slutändan hade 173<br />
st. frekventa <strong>partikelverb</strong> valts ut. Dessa utgör kombinationer <strong>av</strong> 85 verb och<br />
12 partiklar:<br />
betala gå måla stänga<br />
bjuda göra nå stöta<br />
bli ha passa sudda<br />
breda hinna plocka säga<br />
bry hjälpa ringa sända<br />
bryta hoppa råka sätta<br />
bygga hyra räcka ta<br />
byta hålla räkna tala<br />
bära hälsa rätta titta<br />
dela hänga samla träda<br />
dra höra se tränga<br />
dyka klara skicka tycka<br />
falla kliva skjuta vara<br />
finnas komma skriva veta<br />
flytta känna slå visa<br />
fylla köpa släppa välja<br />
få köra stanna vända<br />
fånga lyfta sticka växa<br />
följa låsa stiga äta<br />
föra lägga sträcka<br />
ge lämna stå<br />
glömma lösa ställa<br />
Tabell 1: Verb (85 st.)<br />
<strong>av</strong> i med till<br />
bort ihop om upp<br />
fram in på ut<br />
Tabell 2: Partiklar (12 st.)<br />
Kontextextraktion<br />
Nästa moment bestod i att extrahera alla de utvalda <strong>partikelverb</strong>en i sin kontext<br />
ur SUC. För varje <strong>partikelverb</strong> togs alla meningar fram som innehöll verbet<br />
och partikeln i rätt följd med eventuellt inskottsmaterial emellan. För att kunna<br />
undersöka vilka inskottsmaterial och högerkontexter <strong>partikelverb</strong>en kunde<br />
förekomma tillsammans med sparades resultatfilerna i olika varianter. (a) visar<br />
hur en mening i SUC ser ut. (b) visar samma mening men här med fokus på<br />
taggarna, bara verbet och partikelns ortografiska (grund)form finns kvar.<br />
Stjärnorna är till för att det ska vara lättare att hitta verbet och partikeln vid<br />
manuell läsning om det förekommer långt inskottsmaterial. I (c) finns bara<br />
verbet och partikeln samt deras eventuella inskott med. För att underlätta<br />
vanlig läsning <strong>av</strong> meningarna skapades även en filvariant där enbart texten syns<br />
med partikeln och verbet markerade (d).<br />
a)<br />
<br />
FattaruINfattaru<br />
21
,MID,<br />
allaPNUTR/NEU PLU IND<br />
SUb/ObJalla<br />
vissteVbPRT AKTveta<br />
omPLom<br />
detPNNEU SIN DEF SUb/ObJdet<br />
utomKNutom<br />
jagPNUTR SIN DEF SUbjag<br />
...MAD...<br />
<br />
b)<br />
<br />
IN MID PN ***veta Vb PL om*** PN KN PN MAD <br />
c)<br />
veta Vb PL om<br />
veta Vb Ab Ab PL om<br />
d)<br />
<br />
Fattaru, alla ***visste om*** det utom jag …<br />
För att kunna identifiera och studera ambiguitetsproblem extraherades även de<br />
meningar innehållande snarlika konstruktioner som inte blivit taggade som<br />
<strong>partikelverb</strong>, d.v.s. meningar innehållande ett verb, ett eventuellt inskott och en<br />
preposition eller ett adverb. (e) är ett exempel på en sådan konstruktion.<br />
e)<br />
<br />
I dag ***vet ingen om*** Volvo lyckas i Uddevalla . <br />
Samma sorts resultatfiler som för <strong>partikelverb</strong>en producerades och studerades.<br />
I detta moment upptäcktes mängder <strong>av</strong> feltaggningar i SUC. I de allra flesta fall<br />
visade det sig att det var ett riktigt <strong>partikelverb</strong> vi hade att göra med.<br />
Resterande undersökningar omfattar även det feltaggade materialet. Det är jag<br />
själv som <strong>av</strong>gjort vad som är <strong>partikelverb</strong> eller ej i dessa fall. En del<br />
felbedömningar har med all sannolikhet släppts igenom men jag hoppas att<br />
detta inte har påverkat det övergripande resultatet.<br />
Kontextstudier<br />
De taggade resultatfilerna användes för att studera inskottsmaterial på<br />
ordklassnivå. För varje <strong>partikelverb</strong> noterades vilka inskott som kunde<br />
förekomma och vilka som var vanligast. Lindberg hade helt rätt i att de<br />
vanligaste inskotten var subjekt och adverbial och ofta korta sådana.<br />
Inskottsmaterialet i <strong>partikelverb</strong>en jämfördes med motsvarande hos liknande<br />
konstruktioner med annat betoningsmönster.<br />
För att ta reda på vilka högerkontexter som får och inte får förknippas med<br />
varje <strong>partikelverb</strong> undersöktes de ortografiska filerna för både <strong>partikelverb</strong> och<br />
liknande obetonade konstruktioner. Ambiguiteter noterades på både ord-,<br />
ordklass- och frasnivå. För varje enskilt <strong>partikelverb</strong> funderade jag dessutom<br />
länge och väl vilka övriga kontexter som var tillåtna respektive otillåtna, detta<br />
var tvunget då SUC inte är så stort.<br />
22
Ett antal uppgifter noterades för varje <strong>partikelverb</strong>: totala antalet förekomster,<br />
antalet förekomster <strong>av</strong> varje typ <strong>av</strong> inskottsmaterial och antalet förekomster <strong>av</strong><br />
varje typ <strong>av</strong> högerkontext. Genom att jämföra med liknande information om<br />
”falska” konstruktioner gick det att identifiera ambiguitetsproblem, utröna vad<br />
som är särskiljande mellan <strong>partikelverb</strong> och deras falska motsvarigheter och<br />
utifrån detta formulera disambigueringsregler.<br />
23
5 Resultat<br />
Kontextstudierna resulterade i två lexikon och ett antal generella regler som i<br />
samverkan beskriver det syntaktiska uppträdandet hos 173 <strong>partikelverb</strong>.<br />
Partikelverbslexikonet innehåller information om vilka kontexter <strong>partikelverb</strong>en<br />
får och inte får uppträda i och verb lexikonet anger för varje verb vilka<br />
partiklar som är tillåtna. Det sistnämnda verblexikonet har ingångar <strong>av</strong> typen:<br />
betala:particles:in,ut<br />
Verblexikonet skulle eventuellt kunna vara en del <strong>av</strong> ett större ordklasstaggat<br />
lexikon och kommer inte att presenteras närmare här. För närvarande är båda<br />
lexikonen fullformslexikon, d.v.s. det finns en ingång för varje verbform.<br />
Medan informationen i lexikonen beskriver uppträdandet hos de enskilda<br />
verben och <strong>partikelverb</strong>en arbetar reglerna på en mer övergripande nivå.<br />
Reglerna förbjuder eller släpper igenom vissa inskott och högerkontexter och<br />
det är meningen att de även ska hantera ordföljdsförändringar.<br />
5.1 Partikelverbslexikon<br />
I detta <strong>av</strong>snitt beskrivs vilka beteckningar som använts i <strong>partikelverb</strong>slexikonet,<br />
lexikonets struktur och vilken information det innehåller. Därefter presenteras<br />
själva lexikoningångarna. Vi börjar med ingångarna för <strong>partikelverb</strong> som tar<br />
prepositionsliknande partiklar följt <strong>av</strong> dem som tar adverbliknande partiklar.<br />
Vilka ambiguitetsproblem som är förknippade med varje partikel presenteras<br />
kortfattat. I vissa fall diskuteras även enskilda <strong>partikelverb</strong>, speciellt om deras<br />
uppförande begränsas <strong>av</strong> någon restriktion utöver de vanliga. Den<br />
diskussionen sker i så fall i Appendix.<br />
Terminologi<br />
Följande förkortningar och termer har använts i lexikoningångarna:<br />
PV<br />
HK<br />
INS<br />
PL<br />
NP<br />
VP<br />
Sats<br />
intrans<br />
trans<br />
sig1<br />
sig2<br />
nn<br />
pn<br />
pm<br />
vb<br />
pp<br />
ab<br />
ok<br />
<strong>partikelverb</strong><br />
högerkontext<br />
inskottsmaterial<br />
partikel<br />
nominalfras<br />
verbfras<br />
här: nominalfras följt <strong>av</strong> en verbfras<br />
intransitiv<br />
transitiv<br />
vb sig PL (t.ex. ta sig till)<br />
vb PL sig (t.ex. ta till sig)<br />
nomen<br />
pronomen<br />
proprium<br />
verb<br />
preposition<br />
adverb<br />
inga restriktioner förekommer (generella regler gäller dock).<br />
24
Om ett <strong>partikelverb</strong> har blivit definierat som både intrans och trans kan detta<br />
betyda två saker. Dels kan det vara så att <strong>partikelverb</strong>et uppträder i båda<br />
formerna, ”dra fram” är ett exempel på ett detta: man kan ”dra fram över<br />
prärien” och man kan ”dra fram en pistol”. Dels kan det betyda att det är<br />
vanligt att man utelämnar objektet. Exempel: ”Han lade på (luren) och gick ut<br />
i köket”. ”Trans” i sig betyder att <strong>partikelverb</strong>et kan passiveras och att den tar<br />
något <strong>av</strong> de tillåtna objekten. ”Intrans” betyder att <strong>partikelverb</strong>et ej kan<br />
passiveras men att det eventuellt kan ta objekt (i så fall är detta angivet). Efter<br />
intransitiva <strong>partikelverb</strong> ska dessutom en rad adverbial tillåtna.<br />
Om det bara står sig1 eller sig2 i HK-fältet betyder detta att <strong>partikelverb</strong>et<br />
endast kan förekomma i reflexiv form. ”ej” framför en ordklass eller en<br />
konstituent anger förbud. Detta förekommer bara i två fall: ”ej s” som anger<br />
att <strong>partikelverb</strong>et inte kan förekomma i s-form, och ”ej sats” som anger att<br />
högerkontexten inte få innehålla en sats. En sats är tillsvidare definierad som<br />
en kort NP (ett eller två ord lång) följt <strong>av</strong> VP.<br />
Struktur och information<br />
En lexikoningång kan sägas vara indelad i tre fält: PV anger vilket <strong>partikelverb</strong><br />
det är fråga om och INS-restr anger vilka restriktioner som gäller för<br />
inskottsmaterialet mellan verbet och partikeln. HK specificerar en mängd<br />
egenskaper: <strong>partikelverb</strong>ets valens, vilka högerkontexter som är tillåtna, om<br />
<strong>partikelverb</strong>et förekommer i s-form eller ej samt huruvida det kan ingå i<br />
reflexiva konstruktioner.<br />
PV INS-restr. HK<br />
lägga <strong>av</strong> ej NP att Sats, NP, med NP,sig2, intrans, trans, s<br />
Figur 1: Exempel på en lexikoningång<br />
Informationen i lexikoningången för <strong>partikelverb</strong>et lägga <strong>av</strong> ovan ska därmed<br />
tolkas på följande sätt:<br />
! det får inte ta någon nominalfras som inskottsmaterial<br />
! det kan ta högerkontexterna att Sats, NP och med NP<br />
! det kan ingå i reflexiv konstruktion <strong>av</strong> typen ”VB PL sig” (lägga <strong>av</strong> sig),<br />
! det kan konstrueras både intransitivt och transitivt<br />
! det kan förekomma i s-form<br />
Vidare gäller följande: lägga <strong>av</strong> får inte förekomma med några andra<br />
högerkontexter än de som anges i HK-fältet förutom dem som anges <strong>av</strong> de<br />
generella reglerna. Vad gäller inskottet får det inte innehålla en NP. Om<br />
reglerna och informationen i lexikonet emotsäger varandra gäller det som står i<br />
lexikonet. Reglerna presenteras i <strong>av</strong>snitt 5.2 efter lexikoningångarna.<br />
25
Lexikoningångar<br />
Nedan redovisas alla lexikoningångar. För varje partikel diskuteras allmänt vilka<br />
problem den är förknippad med. Själva ingångarna redovisas i listform.<br />
Kommentarer till listorna finns i Appendix.<br />
Av<br />
Orsaksadverbial <strong>av</strong> typen <strong>av</strong> hjärtans lust, <strong>av</strong> flera skäl etc. kan ställa till det i och<br />
med att så gott som alla <strong>partikelverb</strong> i denna grupp har NP som sin mest<br />
frekventa högerkontext. Jämför t.ex.<br />
Jag drog <strong>av</strong> flera skäl (in till stan).<br />
Jag drog <strong>av</strong> flera lager (från barken).<br />
Jag har dock inte hittat en enda förekomst <strong>av</strong> den här typen <strong>av</strong> adverbial<br />
tillsammans med verben nedan. Detta tillsammans med att NP är bland de<br />
vanligaste högerkontexterna gör att jag väljer att tillåta den utom i några<br />
enstaka fall där jag bedömer att det är stor risk för ambiguiteter.<br />
PV INS-restr. HK<br />
känna <strong>av</strong> ok trans, att Sats, NP, ej s<br />
bli <strong>av</strong> ok intrans, att Sats, NP, med NP, ej s<br />
lägga <strong>av</strong> ej NP intrans, trans, att Sats, NP, med NP, s, sig2<br />
gå <strong>av</strong> ok intrans, trans, NP, ej s<br />
hoppa <strong>av</strong> ok intrans, trans, NP, från NP, ej s<br />
göra <strong>av</strong> ok intrans, trans, NP, med NP, s, sig1<br />
höra <strong>av</strong> ok trans, NP, s,sig2<br />
klara <strong>av</strong> ej NP trans, att Sats, att VP, NP, s, sig2<br />
stänga <strong>av</strong> ok intrans, trans, NP, s, sig2<br />
dra <strong>av</strong> ok trans, NP, s<br />
ta <strong>av</strong> ok trans, NP, s, sig2<br />
Tabell 3: Verb + <strong>av</strong><br />
I<br />
Tyvärr så är partikeln ”i” väldigt sparsamt representerad i min undersökning<br />
och det är svårt att <strong>av</strong>göra hur pass allvarliga ambiguiteter den kan ge upphov<br />
till. I och med att många adverbial börjar med ”i” (t.ex. ”i morse”, ”i skålen”, ”i<br />
alla fall”) så är det främst de <strong>partikelverb</strong> som tar NP och som kan ta sådana<br />
adverbial som borde vara problematiska. Det enda som går att göra är att<br />
förbjuda NP som högerkontext. Se kommentaren till ”lägga i” i Appendix.<br />
PV INS-restr. HK<br />
fylla i ok trans, att Sats, att VP, NP, Sats, s<br />
lägga i ej NP trans, NP, s, sig1<br />
ta i ej NP intrans, med NP, s<br />
Tabell 4 : Verb + i<br />
26
Med<br />
Här nedan kommer vi snudda vid ett vanligt och problematiskt fenomen som<br />
vi kommer att se mer <strong>av</strong> när de adverbliknande partiklarna diskuteras.<br />
Problemet är att rörelseverb kan ta emfas. Meningen ”Han gick med Kalle till<br />
dagis” kan läsas på två sätt; om vi har <strong>partikelverb</strong> betyder det ”följde med”<br />
annars betyder det att man gick snarare än ta sig dit med t.ex. bil eller cykel.<br />
Huruvida NP ska uteslutas som högerkontext måste man <strong>av</strong>göra från fall till<br />
fall. Min princip har varit följande: om det är så att exemplen utan konnektiv<br />
betoning är få eller obefintliga och betydelseskillnaden mycket liten har jag<br />
undvikit att utesluta NP främst p.g.a. att så många <strong>partikelverb</strong> skulle<br />
underkännas.<br />
Några andra bekymmer är t.ex. att adverbial som börjar med ”med”, t.ex. ”med<br />
stor sannolikhet” krånglar till det liksom bestämningar <strong>av</strong> typen ”med den röda<br />
tröjan”.<br />
PV INS-restr. HK<br />
få med ok intrans, trans, att Sats, NP, ej s, sig2<br />
vara med ok<br />
intrans, att VP, NP, om, på att Sats,<br />
på NP, när Sats, som NP, i NP, ej s<br />
hinna med ok intrans, trans, att VP, NP, s<br />
ha med ok trans, NP, ej s, sig2<br />
hänga med ok<br />
intrans, trans, på NP, när Sats, i NP,<br />
till NP, ej s<br />
gå med ok<br />
intrans, trans, NP, på NP, som NP, i NP,<br />
till NP, ej s<br />
följa med ej NP<br />
intrans, trans, NP, på NP, som NP, i NP,<br />
till NP, ej s<br />
komma med ok<br />
intrans, trans, NP, på NP, som NP, i NP, till NP,<br />
ej s<br />
finnas med ok intrans, på NP, som NP, i NP, vid NP, s<br />
hålla med ok intrans, trans, NP, om, s<br />
föra med ok trans, NP, s, sig2<br />
ta med ej NP trans, NP, s, sig2<br />
Tabell 5: Verb + med<br />
27
Om<br />
”Om” förekommer ytterst sällan som preposition med verben jag tittat på.<br />
”Om” som subjunktion är dock vanligt förekommande och tar alltid en sats<br />
som högerkontext – detta gör inte <strong>partikelverb</strong>. För att känna igen en sats<br />
måste reglerna klara <strong>av</strong> att först identifiera en nominalfras och sedan en<br />
verbfras efter denna. Någon form <strong>av</strong> begränsning är oundviklig och jag har<br />
funnit att det är i ytterst få fall som verbfrasen börjar fler än 2-3 ord efter<br />
partikeln. Vanligast är alltså nominalfraser bestående <strong>av</strong> endast ett ord. Den<br />
slutliga lösningen blir att om vi inte hittat en nominalfras och ett verb (i den<br />
ordningen) bland de närmast följande orden efter partikeln är det inte en sats<br />
efteråt och vi kan gå vidare och titta på restriktionerna för inskott och de<br />
tillåtna högerkontexterna.<br />
PV INS-restr. HK<br />
tycka om ok trans, att Sats, att VP, NP, när Sats, ej s<br />
veta om ok trans, att Sats, NP, ej s, ej Sats<br />
vända om ok intrans, ej s, ej Sats<br />
bygga om ok intrans, trans, så att Sats, NP, till NP, s, ej Sats<br />
göra om ej NP, tvärt, helt intrans, trans, så att Sats, NP, till NP, s, sig2, ej Sats<br />
bry om - -<br />
tala om ej NP trans, att Sats, att VP, NP, för NP, hur Sats, när Sats, s<br />
se om ok trans, NP, s, sig2, ej Sats<br />
Tabell 6: Verb + om<br />
På<br />
Problemet med <strong>partikelverb</strong> som tar ”på” som partikel är att ”på” följt <strong>av</strong> NP<br />
är en mycket vanlig konstruktion i rumsadverbial/tidsadverbial samtidigt som<br />
flera <strong>av</strong> <strong>partikelverb</strong>en har NP som sin vanligaste högerkontext.<br />
PV INS-restr. HK<br />
komma på ej NP intrans, att Sats, s, sig2<br />
passa på ok intrans, att VP, ej s<br />
hålla på ok intrans, att VP, med att, med NP, s<br />
se på ok intrans, hur Sats, när Sats, s<br />
stöta på ok trans, NP, ej s<br />
lägga på ej NP intrans, trans, NP, s, sig2<br />
ta på ok sig2<br />
dra på ok trans, s, sig2<br />
hälsa på ok trans, trans, NP, hos NP, s<br />
sätta på ej NP trans, NP, s, sig2<br />
Tabell 7: Verb + på<br />
28
Bort<br />
Inget <strong>av</strong> <strong>partikelverb</strong>en som innehåller ”bort” har blivit försedda med några<br />
restriktioner. Så länge någon <strong>av</strong> de angivna högerkontexterna förekommer efter<br />
verbet (eller någon <strong>av</strong> de som är godkända för alla <strong>partikelverb</strong>) så går det bra.<br />
Den enda som skulle kunna vara lite problematisk är ”gå bort” (p.g.a. att det är<br />
ett rörelseverb). T.ex. meningen ”han reste sig och gick (barfota/långsamt)<br />
bort mot strandkanten” kan man diskutera hur den ska uttalas. Det blir dock<br />
aldrig riktigt fel att ha konnektiv betoning på ”gå bort” och därför har jag valt<br />
att inte sätta upp några restriktioner. Detta synsätt kommer att återspeglas i<br />
hanteringen <strong>av</strong> flera liknande <strong>partikelverb</strong>.<br />
PV INS-restr. HK<br />
gå bort ok intrans, med NP, mot NP, på NP, till NP, från NP, ej s, sig2<br />
glömma bort ok intrans, trans, att Sats, att VP, NP, när Sats, hur Sats, s, sig2<br />
få bort ok trans, NP, s<br />
ta bort ok trans, NP, s, sig1<br />
Tabell 8: Verb + bort<br />
Fram<br />
Endast vid några enstaka verb behövs restriktioner, se tabellen nedan och<br />
kommentarer i Appendix.<br />
PV INS-restr. HK<br />
komma fram ok<br />
intrans, att Sats, med NP, mot NP, hur Sats, som NP,<br />
i NP, vid NP, till NP, från NP, ur NP, ej s<br />
gå fram ej NP intrans, mot NP, i NP, till NP, ej s<br />
nå fram ok intrans, i NP, till NP, ej s<br />
växa fram ok intrans, NP, på NP, som NP, i NP, ur NP, ej s<br />
få fram ok trans, NP, s<br />
träda fram ok intrans, på NP, som NP, i NP, till NP, ej s<br />
dra fram ok intrans, trans, NP, mot NP, på NP,som NP, över NP, s<br />
föra fram ok trans, att Sats, NP, s<br />
lyfta fram ok trans, NP, s<br />
lägga fram ok trans, NP, s<br />
plocka fram ok trans, NP, s<br />
sträcka fram ok trans, NP, s<br />
ta fram ej NP trans, NP, s, sig1<br />
Tabell 9: Verb + fram<br />
29
Ihop<br />
Man skulle kunna tänka sig emfas på ”slå” och ”dra” nedan men jag har inte<br />
hittat några exempel på det. För övrigt har jag inte funnit några ambiguiteter i<br />
samband med ”ihop”.<br />
PV INS-restr. HK<br />
hänga ihop ok intrans, med NP, ej s<br />
hålla ihop ok intrans, trans, NP, s<br />
slå ihop ok intrans, trans, NP, sig1, sig2<br />
dra ihop ok trans, NP, sig2<br />
Tabell 10: Verb + ihop<br />
In<br />
I tabellen för partikeln ”in” på nästa sida är det också väldigt tomt på<br />
kontextrestriktioner. Detta betyder emellertid inte att det inte förekommer<br />
några ambiguiteter när partikeln ”in” är inblandad. Betydelseskillnaden är ofta<br />
väldigt liten eller helt försumbar om man väljer konnektiv betoning eller ej.<br />
Några exempel på detta är meningarna ”han tittar in genom fönstret” och ”han<br />
går in mot mitten”. I SUC verkar de flesta meningarna <strong>av</strong> den här typen uttalas<br />
som innehållande <strong>partikelverb</strong> och jag har inte velat utesluta prepositionsfraser<br />
<strong>av</strong> typen ”mot/till/genom + NP” som högerkontext då så många <strong>partikelverb</strong><br />
skulle missas i <strong>detektering</strong>en. Samma princip har använts för de flesta<br />
adverbliknande partiklarna.<br />
Ett annat fall där det kan vara svårt att veta vilken betoning som ska användas<br />
är när det finns ett adverb mellan verbet och ”in”. Jämför t.ex. ”hon gick in i<br />
rummet” och ”hon gick tillbaka in i rummet”. En lösning är att utesluta alla<br />
adverb utom satsadverb som ”inte”, ”aldrig”, ”kanske”, ”tyvärr” etc. Detta<br />
skulle i så fall endast gälla rörelseverb (vilka tyvärr är dåligt representerade när<br />
det gäller partikeln ”i”). Denna lösning är än så länge bara aktuell för just ”gå<br />
in”.<br />
30
PV INS-restr. HK<br />
falla in ok<br />
intrans, att VP, mot NP, på NP, i NP, till NP,<br />
från NP, ej s, sig1<br />
titta in ok<br />
intrans, med NP, mot NP, på NP, i NP,<br />
till NP, från NP, hos NP, ej s<br />
träda in ok intrans, med NP, på NP, i NP, ej s<br />
komma in ok<br />
intrans, med NP, på NP, som NP, i NP,<br />
vid NP, till NP, från NP, ej s<br />
kliva in ok<br />
intrans, mot NP, på NP, i NP, till NP,<br />
från NP, ej s<br />
stiga in ok<br />
intrans, mot NP, på NP, i NP, till NP,<br />
från NP, ej s<br />
få in ok trans, NP, ej s, sig2<br />
passa in ok intrans, trans, NP, på NP, i NP, s<br />
flytta in ok<br />
intrans, trans, NP, på NP, i NP, till NP,<br />
hos NP, s, sig2<br />
köra in ok intrans, trans, NP, på NP, i NP, till NP, s<br />
tränga in ok intrans, trans, NP, på NP, i NP, till NP, s<br />
gå in ok, ej ab<br />
intrans, trans, NP, på NP, som NP, i NP,<br />
till NP, från NP, för NP, för att NP, ej s<br />
dra in ok intrans, trans, NP, s<br />
lämna in ok intrans, trans, NP, s<br />
sätta in ok intrans, trans, NP, s, sig 1<br />
ta in ej NP trans, NP, på NP, s, sig1<br />
betala in ok trans, NP, s<br />
föra in ok trans, NP, s<br />
samla in ok trans, NP, s<br />
släppa in ok trans, NP, s<br />
ställa in ok trans, NP, s, sig1, sig2<br />
dela in ok trans, NP, s, sig2<br />
köpa in ok trans, NP, s, sig2<br />
lägga in ok trans, NP, s, sig2<br />
bjuda in ok trans, NP, till NP, s, sig2<br />
Tabell 11: Verb + in<br />
31
Till<br />
Adverbial på ”till + NP” ställer till problem. Det förekommer även<br />
ambiguiteter när ”till” betyder ytterligare. Det är i själva verket så att alla<br />
verben nedan kan ta en NP och sedan ”till” i den betydelsen. Därför är NP<br />
uteslutet som inskott för samtliga verb i tabellen.<br />
PV INS-restr. HK<br />
se till ej NP intrans, trans, att Sats, så att Sats, att VP, s<br />
hjälpa till ej NP intrans, att VP, med att, med NP, ej s<br />
komma till ej NP, ab intrans, för att VP, ej s<br />
stanna till ej NP intrans, för att VP, ej s<br />
vara till ej NP intrans, för NP, för att NP, för att VP, ej s, sig2<br />
ställa till ej NP intrans, trans, NP, med NP, ej s<br />
hålla till ej NP intrans, på NP, i NP, vid NP, ej s<br />
gå till ej NP intrans, så att Sats, ej s<br />
säga till ej NP intrans, trans, att Sats, NP, om, hur Sats, när Sats, s<br />
lägga till ej NP intrans, trans, att Sats, NP, s, sig1+med<br />
dra till ej NP intrans, trans, med NP, med att, s<br />
slå till ej NP intrans, trans, NP, mot NP, på NP, när Sats, med NP, s<br />
räcka till ej NP, länge intrans, åt NP, för NP, för att NP, ej s<br />
känna till ej NP trans, att Sats, NP, hur Sats, när Sats, s<br />
ta till ej NP trans, NP, i NP, s<br />
rätta till ej NP trans, NP, s<br />
Tabell 12: Verb + till<br />
32
Upp<br />
Det finns många fall som talar för att utesluta adverbial som högerkontext för<br />
vissa <strong>partikelverb</strong> som tar ”upp”. Om partikeln följs <strong>av</strong> t.ex. emot, mot, till, över,<br />
längs, längst, genom, rakt, snett, högt eller och ner och sedan en nominalfras kan det<br />
vara mycket svårt t.o.m. för en människa att <strong>av</strong>göra om betoningen ska ligga på<br />
verbet eller den förmodade partikeln. Det är emellertid så att de flesta fall gör<br />
det ingenting om ”upp” får betoning i stället för verbet. Undantaget är när<br />
<strong>partikelverb</strong>et betyder något helt annat än det enkla verbet följt <strong>av</strong> adverbial.<br />
Högerkontexten ”till” intar en särställning då ”upp till” + NP är en vanlig<br />
konstruktion, t.ex. ”det kan ta upp till åtta veckor” och här blir det definitivt fel<br />
om ”upp” betonas. Exemplet talar för att förbjuda ”till” som högerkontext.<br />
Dessvärre är det vanligt med prepositionsfraser bestående <strong>av</strong> ”till” + NP efter<br />
rörelseverb, t.ex. ”han gick upp till huset”.<br />
Ett adverbial i dess olika realiseringar i inskottet kan ställa till problem.<br />
Åtminstone stiga, växa, gå, hoppa, titta, stanna, se, skjuta, leva, hänga och måla skulle<br />
kunna följas <strong>av</strong> nominalfrasen ”en meter upp” följd <strong>av</strong> t.ex. ”i luften”. Många<br />
verb skulle likaså kunna ta adjektivet ”högre” eller adverbet ”snabbt” som<br />
adverbial mellan sig och ”upp”. Jag har bara uteslutit NP som inskott i de fall<br />
där jag hittat meningar <strong>av</strong> den typen. Det enda jag kan göra vad gäller<br />
adverbialen är nog att utesluta allt utom några enstaka satsadverbial.<br />
Jag har funnit exempel på meningar med emfas på några <strong>av</strong> verben nedan (t.ex.<br />
bära). Det är alltid en fara och det går inte att göra något åt det.<br />
33
PV INS-restr. HK<br />
stiga upp ej NP, AL intrans, från NP, mot NP, ur NP, ej s<br />
växa upp ej AL<br />
intrans, med NP, på NP, som NP,<br />
i NP, ej s<br />
ge upp ej AL intrans, NP, ej s, sig1<br />
gå upp ej NP, AL<br />
intrans, NP, för , mot NP, på NP,<br />
i NP, till NP, från NP, ej s<br />
göra upp ej AL intrans, trans, NP, med NP, om, s<br />
sticka upp ej AL intrans, trans, NP, på NP, i NP, ur NP, s<br />
hoppa upp ej NP, AL<br />
intrans, på NP, i NP, från NP,<br />
ur NP, ej s<br />
komma upp ej AL<br />
intrans, på NP, i NP, till NP, från NP,<br />
ur NP, ej s, sig2<br />
dyka upp ej AL intrans, på NP, som NP, i NP, ej s<br />
titta upp ej AL intrans, på NP, till NP, från NP, ej s<br />
stanna upp ej AL intrans, på NP, vid NP, s<br />
se upp ej AL<br />
intrans, så att Sats, med NP, för, mot<br />
NP, på NP, i NP, till NP, från NP, ej s<br />
bryta upp ej AL intrans, trans, från NP, s<br />
skjuta upp ej AL<br />
intrans, trans, NP, från NP, ur NP, s,<br />
sig2<br />
ställa upp ej AL<br />
intrans, trans, NP, med NP, för, på NP,<br />
som NP, i NP, till NP, s, sig2<br />
låsa upp ej AL intrans, trans, NP, s<br />
lösa upp ej AL intrans, trans, NP, s<br />
ringa upp ej AL intrans, trans, NP, s<br />
äta upp ej AL intrans, trans, NP, s, sig2<br />
leva upp ej AL intrans, trans, NP, till NP, s<br />
ta upp ej AL trans, att Sats, NP, hur Sats, s<br />
visa upp ej AL trans, att Sats, NP, s, sig2<br />
plocka upp ej AL trans, NP, efter mig/sig, s<br />
få upp ej AL trans, NP, ej s<br />
följa upp ej AL trans, NP, hur Sats, s<br />
bära upp ej AL trans, NP, s<br />
dra upp ej AL trans, NP, s<br />
fånga upp ej AL trans, NP, s<br />
hänga upp ej AL trans, NP, s<br />
lyfta upp ej AL trans, NP, s<br />
måla upp ej AL trans, NP, s<br />
slå upp ej AL trans, NP, s<br />
bygga upp ej AL trans, NP, s, sig2<br />
dela upp ej AL trans, NP, s, sig2<br />
lägga upp ej AL trans, NP, s, sig2<br />
säga upp ej AL trans, NP, s, sig2<br />
sätta upp ej AL trans, NP, s, sig2<br />
Tabell 13: Verb + upp<br />
34
Ut<br />
”Ut” är en tacksam partikel som ger upphov till få ambiguiteter.<br />
PV INS-restr. HK<br />
se ut<br />
ok<br />
intrans, att VP, mot NP, som NP, som om NP,<br />
över NP, genom NP, ej s<br />
råka ut ok intrans, för NP, för att Sats, ej s<br />
titta ut ok intrans, genom NP, över NP<br />
stå ut ok intrans, med NP, med att Sats, ej s<br />
komma ut ok<br />
intrans, med NP, på NP, som NP, i NP, till NP,<br />
från NP, ur NP, ej s<br />
få ut ok trans, NP, ej s<br />
sträcka ut ok intrans, NP, s, sig2<br />
gå ut<br />
ej fullt<br />
intrans, på NP, på att Sats, som NP, i NP, till<br />
NP, från NP, över NP, genom NP, över NP, ej s<br />
bryta ut ok intrans, trans, NP, i NP, s, sig1<br />
hyra ut ok intrans, trans, NP, i NP, till NP, s<br />
slå ut ok intrans, trans, NP, med NP, i NP, s<br />
ställa ut ok intrans, trans, NP, på NP, i NP, s<br />
dra ut ej NP intrans, trans, NP, på NP, s<br />
skriva ut ok intrans, trans, NP, s<br />
räkna ut ok trans, att Sats, NP, hur Sats, när Sats, var Sats, s<br />
betala ut ok trans, NP, s<br />
bygga ut ok intrans, trans, NP, s<br />
dela ut ok trans, NP, s<br />
föra ut ok trans, NP, s<br />
lägga ut ok intrans, trans, NP, s<br />
lämna ut ok trans, NP, s<br />
skicka ut ok trans, NP, s<br />
släppa ut ok trans, NP, s<br />
sudda ut ok trans, NP, s<br />
sända ut ok trans, NP, s<br />
välja ut ok trans, NP, s<br />
ge ut ok trans, NP, s, sig1<br />
breda ut ok trans, NP, s, sig2<br />
ta ut ej NP trans, NP, s, sig2<br />
Tabell 14: Verb + ut<br />
35
5.2 Generella regler<br />
Utöver de <strong>partikelverb</strong>sspecifika restriktionerna i tabellerna ovan finns ett antal<br />
regler/restriktioner som gäller för alla <strong>partikelverb</strong> i undersökningen.<br />
”Ok” i inskottsfältet i lexikonet betyder att inga andra begränsningar råder<br />
förutom följande:<br />
! Inskottet får bestå <strong>av</strong> ett subjekt och/eller ett adverbial. Ordningen<br />
dem emellan spelar ingen roll. Ett subjekt har definierats som att<br />
det utgörs <strong>av</strong> en NP, detta är förstås en generalisering men det<br />
räcker ganska långt.<br />
! Inskottet får inte innehålla skiljetecken, verb eller subjunktioner.<br />
! Inskottet får inte vara större än fem ord.<br />
Vissa typer <strong>av</strong> meningar som innehåller <strong>partikelverb</strong> utesluts (felaktigt) <strong>av</strong> dessa<br />
regler:<br />
Här kommer Kenneth Simonsson,SGIF, in på 41:a plats.<br />
(Inskottet innehåller skiljetecken)<br />
Ingen ska komma sprängande in till henne i rök och damm.<br />
(Adverbialet besår <strong>av</strong> ett verb i presens particip).<br />
För högerkontexten gäller att utöver de tillåtna kontexterna som angivits i<br />
lexikonet godkänns alltid ”och VP”.<br />
Jag är övertygad om att de generella reglerna kan utökas. T.ex. vore det<br />
intressant att testa en regel som taggar verb + ett optionellt begränsat inskott +<br />
adverb som <strong>partikelverb</strong>, om inte annat bara för att se vad man får för resultat.<br />
Det kan hända att åtminstone några <strong>partikelverb</strong>en är så säkra att de kan<br />
släppas igenom utan att några andra kontextrestriktioner gäller förutom de<br />
generella. Denna regel föreslogs <strong>av</strong> Lindberg (1994).<br />
Högerkontext<br />
När det gäller högerkontexten måste det påpekas att de i <strong>partikelverb</strong>slexikonet<br />
angivna högerkontexterna speglar innehållet i SUC. Flera <strong>partikelverb</strong><br />
(framförallt de intransitiva) kan t.ex. ta en rad olika prepositioner följt <strong>av</strong> NP.<br />
Dessa prepositioner hade kanske inte varit desamma om jag använt en annan<br />
korpus i undersökningen. Det vore därför nyttigt att testa med den mer<br />
generella restriktionen ”pp NP”.<br />
Jag har bara angivit en generell restriktion <strong>av</strong> högerkontexter, nämligen att det<br />
alltid får förekomma ”och VP” efter <strong>partikelverb</strong>et. Här kan man nog lägga till<br />
att ett orsaksadverbial som börjar med ”för att” eller ”därför att” också ska<br />
godkännas. Listan över konstruktioner som allt som oftast kan komma efter<br />
verb (oberoende <strong>av</strong> verbets betydelse eller form) kan säkert göras mycket<br />
längre. Med en mer komplett sådan lista skulle hanteringen <strong>av</strong> de intransitiva<br />
36
<strong>partikelverb</strong>en troligtvis bli bättre, detsamma gäller för transitiva <strong>partikelverb</strong><br />
som fått sitt objekt flyttat.<br />
När den förmodade partikeln följs <strong>av</strong> meningsslut (d.v.s. utropstecken, punkt,<br />
semikolon eller frågetecken) är det oftast ett <strong>partikelverb</strong> som hittats. Undantag<br />
finns dock, t.ex. ”Sean Connery är säkert en man som damer gärna vill ta på”.<br />
Hur ofta händer det att enkla verb följd <strong>av</strong> en preposition eller ett adverb står i<br />
slutet <strong>av</strong> en mening? Är det vanligt eller skulle man kunna markera sådana<br />
konstruktioner som innehållande ett <strong>partikelverb</strong> utan att göra alltför många<br />
misstag?<br />
Gruppering<br />
Min ambition var från början att kunna dela in <strong>partikelverb</strong>en i olika grupper<br />
utifrån hur de uppträdde, d.v.s. subkategorisera dem på något sätt. Först var jag<br />
inne på att <strong>partikelverb</strong> som betyder samma sak skulle uppträda på samma sätt<br />
men i och med att ett <strong>partikelverb</strong> kan ha flera olika betydelser var detta inte en<br />
bra utgångspunkt. Om man istället delar in <strong>partikelverb</strong>en efter deras<br />
valensegenskaper får man fram bättre grupper då transitiva och intransitiva<br />
verb följer vissa mönster. Det hela kompliceras <strong>av</strong> att vissa <strong>partikelverb</strong><br />
konstrueras både intransitivt och transitivt (oftast beroende på betydelse eller<br />
att det är vanligt att utesluta ett objekt) och då kan valensangivelsen bli en<br />
motsägelse (t.ex. tar NP, tar inte NP). Det är dock inte så enkelt att ett<br />
intransitivt <strong>partikelverb</strong> kan det ta alla högerkontexter som sina intransitiva<br />
kamrater kan. Lösningen på problemet är, tror jag, att ange dels <strong>partikelverb</strong>ens<br />
transitivitet men att även komplettera den informationen med mer specifika<br />
kontexter som endast tas <strong>av</strong> ett eller några enstaka <strong>partikelverb</strong>.<br />
Specialfall<br />
”På” och ”till” är speciella jämfört med de andra partiklarna i det att de är<br />
mycket produktiva. ”På” kan tillsammans med många verb bilda <strong>partikelverb</strong><br />
som uttrycker ”fortsätt/öka tempot”, t.ex. ”jobba på” och ”snabba på”. ”Till”<br />
tillsammans med verb kan betyda att något sker hastigt eller kortvarigt, t.ex.<br />
”stanna till” och ”hosta till”. Det som behövs göras är att undersöka om det är<br />
några speciella typer <strong>av</strong> verb som kan ta ”till” och/eller ”på” i dessa betydelser.<br />
Adverbial<br />
De flesta <strong>av</strong> ambiguiteterna som uppstår i samband med <strong>partikelverb</strong> har att<br />
göra med verb som återföljs <strong>av</strong> ett adverbial som börjar på en preposition eller<br />
ett adverb. Dessa är svåra att hantera. Det finns emellertid en rad adverbial<br />
som börjar på ord som inte kan förväxlas med partiklar. Bland tidsadverbialen<br />
hittar vi t.ex. sedan, då, genast, alltid, länge, ännu, ofta, ibland, aldrig, längre. Likaså<br />
finns det en hel del satsadverbial (som t.ex. bör godkännas som inskott) vilka<br />
bör läggas in i programmet: nog, väl, dock, ändå, därför, alltså, emellertid, trots allt,<br />
antagligen, inte.<br />
En idé jag har haft om adverbial som börjar på preposition är att godkänna<br />
sådana som innehåller orden ”kväll”, ”eftermiddag”, ”klockan 14.00” (o. dyl.),<br />
”morgon” och andra som uttrycker tidpunkter.<br />
37
5.3 Syntaktiska regler<br />
I kapitlet ”Partikelverbens syntax” presenterades bl.a. hur <strong>partikelverb</strong>en<br />
uppför sig vid passivering och topikalisering. När detta skrivs klarar inte<br />
programmet <strong>av</strong> att hitta <strong>partikelverb</strong>en i sådana kontexter. Därför är det viktigt<br />
att implementera syntaktiska regler som kan hantera sådan fenomen. Nedan<br />
har jag skrivit förslag på hur sådana regler skulle kunna fungera.<br />
Passivering:<br />
Om vi söker en NP efter ett transitivt <strong>partikelverb</strong> men istället<br />
hittar prepositionen ”<strong>av</strong>” gör följande: kontrollera om ”<strong>av</strong>” följs<br />
<strong>av</strong> en NP , om verbet står i s-form och om verbet föregås <strong>av</strong> en<br />
NP. Om allt detta gäller, godkänn <strong>partikelverb</strong>et.<br />
Topikalisering:<br />
Om meningar är topikaliserade får inte fundamentet och platsen<br />
mellan verbet och partikeln vara tomma. Om vi söker en NP<br />
efter ett transitivt <strong>partikelverb</strong> men inte hittar det (och inget ”<strong>av</strong>”<br />
heller) bör vi kontrollera om det finns en NP både framför<br />
verbet och som inskott. Är detta fallet, godkänn <strong>partikelverb</strong>et.<br />
Den passiva varianten <strong>av</strong> topikaliseringen med uteslutet subjekt<br />
hittas om vi istället söker efter en NP före verbet och<br />
kontrollerar att verbet står i s-form.<br />
Det finns många fler sätt det går att förbättra programmet på, se kapitel 8 och 9.<br />
38
Implementering <strong>av</strong> lexikon och regler<br />
Lexikon och regler samverkar i ett <strong>detektering</strong>sprogram för <strong>partikelverb</strong> som är<br />
skrivet i Perl. Nedan beskrivs hur programmet är uppbyggt och hur det<br />
fungerar, vad det klarar <strong>av</strong> och inte klarar <strong>av</strong>. Utöver <strong>partikelverb</strong>slexikonet och<br />
verblexikonet som diskuterades ovan behöver <strong>detektering</strong>sprogrammet en<br />
ordklasstaggad inputtext för att fungera.<br />
6.1 Beskrivning <strong>av</strong> programmet<br />
I detta <strong>av</strong>snitt beskrivs mycket kortfattat hur programmet fungerar.<br />
Programmet tar hela texter som input men det opererar på meningsnivå. I<br />
beskrivningen utgår jag från en mening som innehåller både inskottsmaterial<br />
och högerkontext.<br />
1) Meningen görs om till en lista <strong>av</strong> ord.<br />
2) För varje ord kontrolleras om det är ett verb mot verblexikonet. Om ordet<br />
är ett verb hämtas dess partikellista från nämnda lexikon, d.v.s. en lista som<br />
specificerar vilka partiklar verbet får bilda <strong>partikelverb</strong> med.<br />
3) Därefter kontrolleras för varje partikel om den finns i resten <strong>av</strong> meningen.<br />
Om den gör det sparas det eventuella inskottet och den eventuella<br />
högerkontexten undan.<br />
4) Partikelverbet slås upp i <strong>partikelverb</strong>slexikonet där det anges vilka sorters<br />
inskott och högerkontexter som är tillåtna. Först kontrolleras inskottet och<br />
därefter högerkontexten.<br />
5) Om både inskott och högerkontext blir godkända kontrolleras de mot de<br />
generella reglerna. Om de klarar även detta test betraktas <strong>partikelverb</strong>et<br />
som godkänt och markeras i outputfilen med stjärnor.<br />
6.2 Vad klarar programmet <strong>av</strong> ?<br />
I listan nedan anges ett antal stereotypa meningar för att beskriva vad programmet<br />
klarar <strong>av</strong>. De är skrivna så som de ser ut när det kommer från<br />
<strong>detektering</strong>sprogrammet.<br />
Mening:<br />
Bodil *stannar upp*.<br />
Bodil *stannade upp* och gick sedan vidare.<br />
Bodil *stannade upp* och ***gick <strong>av</strong>*** vägen.<br />
Bodil *stannar inte upp*.<br />
Där *stannade Bodil upp*.<br />
Där *stannade Bodil inte upp*.<br />
Där *stannade inte Bodil upp*.<br />
Bodil *bröt sig ut* från fängelset.<br />
Bodil *slet ut* sig i fabriken.<br />
Mönster:<br />
VB PL (intransitivt <strong>partikelverb</strong>)<br />
VB PL och VP<br />
(fler PV i samma mening)<br />
VB inskott(AL) PL<br />
VB inskott(SUBJ) PL<br />
VB inskott(SUBJ AL) PL<br />
VB inskott(AL SUBJ) PL<br />
VB obj.pron. PL (refl. <strong>partikelverb</strong>)<br />
VB PL obj.pron. (refl. <strong>partikelverb</strong>)<br />
I följande meningar blir inga <strong>partikelverb</strong> detekterade:<br />
Bodil stannade, upp med händerna sa den maskerade mannen. (skiljetecken mellan VB och PL)<br />
Bodil stannar och upp gick solen. ( ”och” är ej AL eller SUBJ)<br />
39
De fel programmet gör presenteras i kapitlet om testning.<br />
Programmet begränsas bl.a. <strong>av</strong> att listor lagts in över vad en nominalfras,<br />
verbfras och ett adverbial kan bestå <strong>av</strong>. Dessa listor är inte framtagna på någon<br />
systematisk väg; jag har helt enkelt manuellt tittat på massor <strong>av</strong> meningar och<br />
antecknat de mönster jag funnit. Jag har heller ingen liten fiffig mekanism som<br />
kan uttrycka optionella element i mina listor så alla möjliga<br />
frassammansättningar måste specificeras. Exempel: nn (bilen), det nn (den<br />
bilen) och det jj nn (den gröna bilen). Det går alltså inte att skriva (det) (jj) nn.<br />
7 Testning <strong>av</strong> programmet<br />
Testningen <strong>av</strong> <strong>detektering</strong>programmet gjordes mot ordklasstaggade sändningar<br />
<strong>av</strong> Dagens Eko i textformat. Ordklasstaggningen är gjord maskinellt.<br />
Sammanlagt innehåller ekosändningarna 3992 meningar. Vad det gäller<br />
<strong>partikelverb</strong> finns 99 <strong>av</strong> de jag tittat på representerade.<br />
Det är meningen att programmet ska jobba direkt på ordklasstaggad text men i<br />
testningen löstes ordklasstaggningen genom att hela det taggade testmaterialet<br />
läses in till ett stort lexikon. Nackdelen med detta är att ordklassambiguiteter<br />
orsakar en del missar och övergenereringar. Det otaggade textmaterialet tjänade<br />
sedan som input till programmet.<br />
7.1 Testresultat<br />
I testmaterialet fanns 157 förekomster <strong>av</strong> <strong>partikelverb</strong> som programmet ska<br />
klara <strong>av</strong> att hitta. Av dessa hittades 119 och 38 missades. Det betyder att lite<br />
drygt 75% blev hittade och ca 25% missades. Utöver detta har programmet<br />
felaktigt markerat ytterligare 132 fall som <strong>partikelverb</strong>. Översatt till recall och<br />
precision får vi resultatet nedan. Termen recall beskriver täckningen, d.v.s. hur<br />
många procent <strong>av</strong> de möjliga fallen som hittades, och termen precision<br />
beskriver träffsäkerheten, d.v.s. hur många procent <strong>av</strong> de totala antalet träffar<br />
som var relevanta..<br />
Recall: A ∩ B/B = 119/157 = 0,757962 = 76%<br />
Precision: A ∩ B/A = 119/251 = 0,474104 = 47%<br />
A ∩ B = det som är gemensamt för både A och B (snittet): 119<br />
A = övergenereringen + snittet: 132 + 119 = 251<br />
B = d.v.s. de missade fallen + snittet: 38 + 119 = 157<br />
Dessa siffror betyder på vanlig svenska att 76 % <strong>av</strong> de befintliga <strong>partikelverb</strong>en<br />
hittades men att endast 47% <strong>av</strong> alla konstruktioner som taggades som<br />
<strong>partikelverb</strong> verkligen var sådana. Då ingen <strong>av</strong> dessa siffror är särskilt<br />
tillfredställande redovisas nedan vilka typer <strong>av</strong> fel som förekom och vad som<br />
behöver göras för att programmet ska bli bättre.<br />
40
7.2 Typer <strong>av</strong> fel och förslag till ändringar<br />
För varje fel som gjordes finns det antecknat vilket <strong>partikelverb</strong> det gällde, i<br />
vilken mening <strong>partikelverb</strong>et förekommer och vilken typ <strong>av</strong> fel det handlade<br />
om. Det finns sex olika typer <strong>av</strong> fel vilka listas nedan. Om vi slår ihop<br />
övergenereringsfelen (132 st.) med antalet missade <strong>partikelverb</strong> (38) får vi totalt<br />
170 fel. Vid varje typ nedan anges hur många procent fel just den typen g<strong>av</strong><br />
upphov till.<br />
1. Partikelverbens kontextinformation är inte rillräckligt restriktiv.<br />
Exempel på fel: godkänner NP som objekt, godkänner NP som<br />
inskottsmaterial. (68 fall, 40%)<br />
2. De generella reglerna är inte fullständigt implementerade i programmet.<br />
Exempel: relativa och passiva konstruktioner hanteras ej, adverbialhanteringen<br />
är bristfällig. (49 fall, 28%).<br />
3. Det saknades kontextinformation i <strong>partikelverb</strong>slexikonet.<br />
Exempel: ”ta till NP” fanns inte med som kontext för några <strong>partikelverb</strong>. (24<br />
fall, 14%).<br />
4. Ingångar saknades i verb- och partikellexikonet.<br />
Exempel: verbformerna ”tog”, ”går” och ”tala”. Även en del talspråksformer<br />
saknades. (10 fall, 6%).<br />
5. Ogrammatiskt språk i testmaterialet.<br />
Exempel: upprepningar och lustig ordföljd. (11 fall, 7%).<br />
6. Ordklassambiguiteter.<br />
Exempel: verb och substantiv förväxlas. (8 fall, 5%).<br />
Siffrorna ovan visar att det framför allt är de tre första grupperna som orsakar<br />
fel i <strong>detektering</strong>en (82% <strong>av</strong> felen närmare bestämt) och vi ska titta lite närmare<br />
på dem.<br />
Den första gruppen är det mycket viktigt att ta hand om då vi där finner<br />
huvudorsaken till den omfattande övergenereringen. Partikelverben ”ha med”,<br />
”säga till”, ”vara med” och ”ta till” står för en tredjedel <strong>av</strong> felen.<br />
Kontextinformationen för dessa verb är troligtvis för generös och måste därför<br />
ses över. Många andra <strong>partikelverb</strong> som tar ”med” som partikel finns också<br />
representerade i denna grupp varför hela ”med”-gruppen bör granskas<br />
närmare.<br />
I den andra gruppen är det framförallt de syntaktiska reglerna som fungerat<br />
dåligt. Listan nedan beskriver vad som behöver ses över.<br />
! Hanteringen <strong>av</strong> adverbial måste förbättras. Om man godkänner ett<br />
enkelt adverbial mellan partikeln och det efterföljande objektet skulle<br />
många fler meningar hittas.<br />
! Partikelverb i passiva eller relativa satser missas ofta och även mycket<br />
enkla regler för att hantera sådan konstruktioner skulle göra stor nytta.<br />
41
! Vad olika konstituenter kan bestå <strong>av</strong> måste också ses över. Framför allt<br />
är det nominalfraslistan som inte är tillräckligt innehållsrik. T.ex. hade<br />
jag missat att det kan ingå siffror i nominalfraser vilket orsakat en del<br />
misstag.<br />
! Vissa kontexter hade programmet problem med att känna igen<br />
överhuvudtaget. Bland dem återfinns bland annat det viktiga ”och VP”<br />
som ska tillåtas efter alla <strong>partikelverb</strong>. I detta test berördes bara några<br />
få fall men detta måste åtgärdas. Likaså hanteringen kontexten ”att NP<br />
VP” (d.v.s. ”att + sats) måste förbättras.<br />
! I några enstaka fall träffade inte programmet på första förekomsten <strong>av</strong><br />
partikelkandidaten, t.ex. ”upp”, utan undersökte istället ett ”upp” som<br />
kom senare i meningen. Då inskottet oftast blev för långt eller innehöll<br />
otillåtna ordklasser eller konstituenter underkändes <strong>partikelverb</strong>et.<br />
Den tredje gruppen innehåller de fall där kontextinformationen inte varit<br />
tillräcklig. Hälften <strong>av</strong> felen beror på att någon prepositionsfras saknades i<br />
kontextlistan. För ”komma fram” saknades ”till att NP” som tillåten kontext<br />
och i några andra fall tilläts inte ”NP” efter <strong>partikelverb</strong>et.<br />
Det som saknades i lexikonet i grupp 4 är redan inlagt. Grupp nr 5 går det inte<br />
att göra så mycket åt då ogrammatiskt språk används ofta, främst i informella<br />
sammanhang. De flesta ordklassambiguiteterna berodde på att ett ord fanns<br />
flera gånger i lexikonet med olika ordklasstaggar och att programmet helt<br />
enkelt valde den första ingången. När programmet körs mot ett entydigt taggat<br />
material kommer nog mängden ambiguiteter att minska men en liten del<br />
sådana fel får man alltid räkna med.<br />
Om man tittar på vilka <strong>partikelverb</strong> som blir felhanterade flest gånger ser man<br />
att 16 <strong>av</strong> <strong>partikelverb</strong>en förekommer i 132 fall eller ca 80% <strong>av</strong> feltaggningarna.<br />
De har feltaggats 4 eller fler gånger.<br />
PV Antal fel PV Antal fel<br />
vara med 24 ta till 8<br />
ha med 16 se till 7<br />
se ut 12 tala om 7<br />
säga till 11 ta ut 6<br />
lägga fram 10 komma med 4<br />
komma fram 9 lägga på 4<br />
skjuta upp 8 sätta in 4<br />
ta till 8 sätta på 4<br />
se till 7 visa upp 4<br />
Tabell 15: Partikelverb som ofta blir felhanterade<br />
Förhoppningsvis borde en granskning <strong>av</strong> dessa <strong>partikelverb</strong>s kontextlistor leda<br />
till ett bättre resultat.<br />
42
7.3 Utvärdering <strong>av</strong> resultatet<br />
Att programmet bara markerar ca 75 % <strong>av</strong> de befintliga <strong>partikelverb</strong>en tycker<br />
jag inte är inte någon katastrof. Siffran går dessutom att höja lite genom att<br />
man fyller i de verbformer som saknades i lexikonet, uppdaterar kontextlistorna<br />
med det material som kom fram i testningen, ser över definitionerna <strong>av</strong> NP<br />
och tillåter ett enkelt enordsadverbial mellan partikeln och högerkontexten.<br />
Övergenereringen är dock oacceptabelt hög. Genom att titta närmare på de<br />
<strong>partikelverb</strong> som stod för många <strong>av</strong> felen hoppas jag kunna minska antalet<br />
feldetekeringar något men jag tror det är väldigt svårt att helt stoppa dem. För<br />
många <strong>partikelverb</strong> är det så att den vanligaste högerkontexten (oftast NP)<br />
även är den som kan ställa till problem.<br />
Hur pass mycket bättre resultatet kan bli om de förslagna ändringarna görs är<br />
mycket svårt att uppskatta. Att bara drygt hälften <strong>av</strong> <strong>partikelverb</strong>en som ingår i<br />
undersökningen fanns med i testmaterialet gör bedömningen ännu svårare. Om<br />
ett test som inkluderar även de återstående 74 <strong>partikelverb</strong>en skulle höja eller<br />
sänka värdena på precision och recall återstår att se. Inget <strong>av</strong> de otestade<br />
<strong>partikelverb</strong>en bör ingå i Infovoxsystemet.<br />
8 Allmänna förbättringar <strong>av</strong> programmet<br />
Förutom de ändringar som nämnts ovan är det en del andra, mer generella,<br />
förbättringar som kan göras för att programmet ska fungera bättre.<br />
! Utöka täckningen vad gäller nominalfraser, verbfraser och<br />
adverbial.<br />
! För reflexiva <strong>partikelverb</strong> finns det ingen kontroll <strong>av</strong> kontexter,<br />
dessa godkänns bara om de står i rak ordföljd utan inskott. Jag<br />
själv har valt ut vilka som ska släppas igenom. En bättre<br />
hantering <strong>av</strong> dessa är önskvärd.<br />
! Jag har inte gjort någon gruppindelning <strong>av</strong> <strong>partikelverb</strong>en. Det är<br />
däremot lätt att utifrån <strong>partikelverb</strong>slexikonet skapa en sorterad<br />
lista där det tydligt syns vilka <strong>partikelverb</strong> som uppför sig lika.<br />
När det är dags att lägga in fler <strong>partikelverb</strong> kan det åtminstone<br />
vara nyttigt studera en sådan lista först för att få en uppfattning<br />
om hur de nya <strong>partikelverb</strong>en kan tänkas uppföra sig.<br />
! Jag har inte lagt in någon specialhantering <strong>av</strong> partiklarna ”till”<br />
och ”på” som kan förekomma efter väldigt många verb, t.ex.<br />
”rycka till” och ”jobba på”. Deras kontexter bör undersökas lite<br />
närmare.<br />
43
9 Sammanfattning<br />
Mitt examensarbete har resulterat i ett program som detekterar <strong>partikelverb</strong> i<br />
ordklasstaggad text. Programmet jobbar mot ett <strong>partikelverb</strong>slexikon där det<br />
finns angivet i vilka kontexter varje enskilt <strong>partikelverb</strong> får förekomma.<br />
Kontexter kan anges på ord- och/eller konstituentnivå. Som komplement till<br />
<strong>partikelverb</strong>slexikonet finns ett antal generella regler som talar om vilka<br />
kontexter som är tillåtna och förbjudna för samtliga <strong>partikelverb</strong> i<br />
undersökningen. Programmet hanterar för närvarande 173 vanliga <strong>partikelverb</strong><br />
med produktiva beståndsdelar samt ett en del reflexiva varianter <strong>av</strong> dessa.<br />
Programmet övergenererar en del för närvarande och i rapporten finns förslag<br />
på hur programmet skulle kunna göras bättre. I slutändan är det meningen att<br />
programmet ska användas till att förbättra prosodin i Telia Promotors<br />
text-till-tal-system Infovox.<br />
44
Litteratur<br />
Andersson, Erik, 1993. Grammatik från grunden. Hallgren och Fallgren<br />
Studieförlag AB, MO-Print AB, <strong>Uppsala</strong> 1993. 2:a upplagen 1994. Sid. 86-88.<br />
Anward, Jan & Linell, Per, 1976. Om lexikaliserade fraser i svenskan. Nysvenska<br />
studier. 55-56, s77-119.<br />
Dahl, Östen,1982. Grammatik, Studentlitteratur, Lund. Sid. 95-96.<br />
Ejerhed, Eva; Källgren, Gunnel; Wennstedt, Ola & Åström, Magnus, 1992.<br />
The Linguistic Annotation System of the Stockholm-Umeå Corpus Project, Report no. 33,<br />
Institutionen för lingvistik, Umeå <strong>universitet</strong>.<br />
Järner, Karin, 1993. Bra Böckers svenska grammatik. Bokförlaget Bra Böcker,<br />
Finland 1993. Sid 46.<br />
Lindberg, Jan,1994. Lexikaliserade fraser och ordaccent, strukturella drag och implementering för<br />
text-till-tal, Intern rapport INFOVOX.<br />
Lindberg, Jan, 1999. Automatic Detection of Lexicalised Phrases in Swedish.<br />
Institutionen för lingvistik, Stockholms <strong>universitet</strong>. Nodalida 99.<br />
Stroh-Wollin, Ulla, 1998. Koncentrerad nusvensk formlära och syntax.<br />
Studentlitteratur, Lund 1998. §58.<br />
Teleman, Ulf, 1983. Manual för grammatisk beskrivning <strong>av</strong> talad och skriven svenska,<br />
Lundastudier i nordisk språkveteskap, serie C nr 6, 2:a tryckningen, Lund, sid. 66,<br />
kapitel 14.<br />
Teleman, Ulf; Hellberg, Staffan; Andersson, Erik, 1999. Svenska akademiens<br />
grammatik. Del 3 (Fraser), <strong>av</strong>snittet om adverbial, §6 Partikelvadverbial, sid 417,<br />
Stockholm 1999.<br />
Thorell, Olof, 1981. Svensk ordbildningslära, Esselte Studium AB, Norstedts Tryckeri,<br />
Stockholm. §140 – 153.<br />
Thorell, Olof, 1973. Svensk grammatik, Esselte Studium AB, Norstedts Tryckeri,<br />
Stockholm 1987.<br />
45
Appendix<br />
46
Innehåll<br />
INNEHÅLL ..................................................................................................................... 47<br />
PARTIKELVERB SOM OMFATTAS AV UNDERSÖKNINGEN: ......................... 48<br />
HÖGERKONTEXTER .................................................................................................. 49<br />
PARTIKELVERBSINGÅNGAR .................................................................................. 50<br />
AV................................................................................................................................ 50<br />
I.................................................................................................................................... 50<br />
MED ............................................................................................................................. 51<br />
OM ............................................................................................................................... 53<br />
PÅ................................................................................................................................. 54<br />
BORT............................................................................................................................ 56<br />
FRAM ........................................................................................................................... 56<br />
IHOP............................................................................................................................. 56<br />
IN.................................................................................................................................. 57<br />
TILL ............................................................................................................................. 59<br />
UPP............................................................................................................................... 60<br />
UT ................................................................................................................................ 62<br />
47
Partikelverb som omfattas <strong>av</strong> undersökningen:<br />
klara <strong>av</strong> dela in sätta på lyfta upp<br />
dra <strong>av</strong> flytta in stöta på fånga upp<br />
stänga <strong>av</strong> betala in se till stanna upp<br />
hoppa <strong>av</strong> titta in känna till hänga upp<br />
göra <strong>av</strong> stiga in gå till måla upp<br />
bli <strong>av</strong> samla in hjälpa till äta upp<br />
lägga <strong>av</strong> lägga in räcka till bryta upp<br />
höra <strong>av</strong> falla in ta till plocka upp<br />
ta <strong>av</strong> lämna in vara till ringa upp<br />
känna <strong>av</strong> köra in slå till lösa upp<br />
gå <strong>av</strong> passa in komma till hoppa upp<br />
ta bort köpa in ställa till se ut<br />
gå bort bjuda in lägga till gå ut<br />
få bort ställa in hålla till komma ut<br />
glömma bort släppa in dra till ta ut<br />
komma fram kliva in säga till få ut<br />
ta fram vara med rätta till släppa ut<br />
få fram ta med stanna till ge ut<br />
växa fram följa med ta upp betala ut<br />
gå fram gå med bygga upp slå ut<br />
lägga fram finnas med dyka upp välja ut<br />
plocka fram ha med gå upp lägga ut<br />
lyfta fram hålla med ställa upp breda ut<br />
dra fram komma med växa upp stå ut<br />
föra fram hinna med sätta upp ställa ut<br />
träda fram få med säga upp dela ut<br />
nå fram hänga med komma upp bygga ut<br />
sträcka fram föra med titta upp räkna ut<br />
lägga i tycka om visa upp byta ut<br />
ta i bry om göra upp råka ut<br />
fylla i tala om ge upp sträcka ut<br />
hålla ihop göra om dra upp föra ut<br />
slå ihop veta om bära upp dra ut<br />
dra ihop se om slå upp skicka ut<br />
hänga ihop bygga om lägga upp lämna ut<br />
komma in vända om få upp sända ut<br />
gå in lägga på dela upp skriva ut<br />
sätta in passa på se upp hyra ut<br />
ta in dra på stiga upp bryta ut<br />
dra in hälsa på skjuta upp titta ut<br />
tränga in se på låsa upp sudda ut<br />
föra in hålla på följa upp<br />
träda in ta på leva upp<br />
få in komma på sticka upp<br />
48
Högerkontexter<br />
att +sats<br />
så att + sats<br />
att + VP<br />
tar NP<br />
reflexiva (Vb PL sig)<br />
reflexiva (Vb sig PL)<br />
med (NP)<br />
för (NP)<br />
åt NP<br />
mot NP<br />
om<br />
på<br />
hur + sats<br />
när + sats<br />
som NP<br />
som om + sats<br />
i NP<br />
vid NP<br />
till NP<br />
från NP<br />
Vb jj ab PL<br />
för NP<br />
för att NP<br />
för att VP<br />
sats<br />
<strong>av</strong> NP<br />
49
Partikelverbsingångar<br />
AV<br />
PV INS-restr. HK<br />
känna <strong>av</strong> ok intrans, trans, att Sats, NP, ej s<br />
bli <strong>av</strong> ok intrans, att Sats, NP, med NP, ej s<br />
lägga <strong>av</strong> ej NP intrans, trans, att Sats, NP, med NP, s, sig2<br />
gå <strong>av</strong> ok intrans, trans, NP, ej s<br />
hoppa <strong>av</strong> ok intrans, trans, NP, från NP, ej s<br />
göra <strong>av</strong> ok intrans, trans, NP, med NP, s, sig1<br />
höra <strong>av</strong> ok trans, NP, s,sig2<br />
klara <strong>av</strong> ej NP intrans, trans, att Sats, att VP, NP, s<br />
stänga <strong>av</strong> ok intrans, trans, NP, s, sig2<br />
dra <strong>av</strong> ok trans, NP, s<br />
ta <strong>av</strong> ok trans, NP, s, sig2<br />
Tabell 16: Verb + <strong>av</strong><br />
PV<br />
Restriktioner<br />
Anledning/exempel:<br />
lägga <strong>av</strong><br />
ins ≠ NP<br />
Jag lägger patiens <strong>av</strong> flera skäl.<br />
PV<br />
Restriktioner<br />
Anledning/exempel:<br />
klara <strong>av</strong><br />
ins ≠ NP<br />
Jag måste klara tentan <strong>av</strong> flera skäl.<br />
I<br />
PV INS-restr. HK<br />
fylla i ok trans, att Sats, att VP, NP, Sats, s<br />
lägga i ej NP trans, NP, s, sig1<br />
ta i ej NP intrans, med NP, s<br />
Tabell 17 : Verb + i<br />
PV<br />
Restriktioner<br />
Kommentar<br />
fylla i<br />
(inga)<br />
Den vanligaste betydelsen <strong>av</strong> fylla i (9<strong>av</strong> 12 i SUC) finner man i<br />
meningar som ”jag for och fyllde i en del papper och sen åt vi<br />
lunch”. Objektet är här en nominalfras. När fylla i istället betyder<br />
”säga något” kan objektet bestå <strong>av</strong> vad som helst (i och med att vi<br />
kan säga vad som helst), t.ex.:<br />
50
”Erfaren och klok” fyllde jag i.<br />
”Då kan man väl med viss förtröstan bedöma<br />
risken för läckage som liten”, fyllde en <strong>av</strong> de<br />
ekonomliknande rådgivarna i och slog…<br />
Dessa förekomster blir svåra att fånga. Jag har lagt till ”att Sats” och<br />
”Sats” som möjliga högerkontexter men det kommer inte att räcka<br />
långt. Att hålla utkik efter citattecken är troligtvis en bättre lösning.<br />
Det enkla verbet ”fylla” kan mycket väl ta en NP som objekt.<br />
Exempel: ”han fyllde tanken i Emmaboda”. Inga sådana exempel<br />
hittades dock, där<strong>av</strong> inga restriktioner på inskottet.<br />
PV<br />
Restriktioner<br />
Anledning/exempel:<br />
lägga i<br />
ins ≠ NP<br />
Hon gillar att lägga näsan i blöt.<br />
Hon lade druvorna i skålen.<br />
PV<br />
Restriktioner<br />
Anledning/exempel:<br />
ta i<br />
ins ≠ NP<br />
Han tog hammaren i ett fast grepp.<br />
Jag har dock inte hittat något exempel <strong>av</strong> denna typ <strong>av</strong> mening i<br />
SUC.<br />
”NP” och ”med NP” förekommer bara som högerkontexter en gång<br />
vardera på tio möjliga. Av de resterande är de flesta adverbial <strong>av</strong><br />
vilka de flesta beskriver hur mycket någon tar i, t.ex. ”lite extra”.<br />
Detta exempel visar att det är viktigt att kunna känna igen<br />
adverbialen för att fånga <strong>partikelverb</strong>en, framför allt de intransitiva.<br />
Med<br />
PV INS-restr. HK<br />
få med ok intrans, trans, att Sats, NP, ej s, sig2<br />
vara med ok<br />
intrans, att VP, NP, om, på att Sats,<br />
på NP, när Sats, som NP, i NP, ej s<br />
hinna med ok intrans, trans, att VP, NP, s<br />
ha med ok trans, NP, ej s, sig2<br />
hänga med ok<br />
intrans, trans, på NP, när Sats, i NP,<br />
till NP, ej s<br />
gå med ok<br />
intrans, trans, NP, på NP, som NP, i NP,<br />
till NP, ej s<br />
följa med ej NP<br />
intrans, trans, NP, på NP, som NP, i NP,<br />
till NP, ej s<br />
komma med ok<br />
intrans, trans, NP, på NP, som NP, i NP, till NP,<br />
ej s<br />
finnas med ok intrans, på NP, som NP, i NP, vid NP, s<br />
hålla med ok intrans, trans, NP, om, s<br />
föra med ok trans, NP, s, sig2<br />
ta med ej NP trans, NP, s, sig2<br />
Tabell 18: Verb + med<br />
51
PV<br />
Restriktioner<br />
Anledning/exempel<br />
hänga med<br />
hk ≠ NP<br />
Han hängde med huvudet.<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
gå med<br />
(inga)<br />
Inte ett enda exempel som talar för att det finns någon anledning att<br />
utesluta NP som hk.<br />
följa med<br />
ins ≠ NP, hk ≠ strömmen<br />
Följ honom med röda tröjan.<br />
Det är bara att följa med strömmen.<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
komma med<br />
hk ≠ NP<br />
Jag kom med honom till New York<br />
Jag kom med planet till New York<br />
Jag kom med barnen till dagis kl. 10.<br />
De två första meningarna kan läsas på två sätt, med eller utan<br />
konnektiv betoning. Det finns dock bara ett exempel på ”komma<br />
med” + NP i SUC: ”det kom med en bit”. Jag tar dock det säkra<br />
före det osäkra och förbjuder NP i högerkontexten.<br />
PV<br />
hålla med<br />
Restriktioner<br />
hk ≠ NP men NP + att/om är ok.<br />
Anledning/exempel Jag höll med handen på motorhuven .<br />
Jag höll med Kalle [att det var bra/om det].<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
vara med<br />
hk ≠ NP<br />
Jag vill vara med dig. (exempel i SUC saknas dock)<br />
PV<br />
ta med<br />
Restriktioner<br />
hk ≠ NP, ins ≠ NP<br />
Anledning/exempel Han tog med penseln uppe i vänstra hörnet. (inget exempel i<br />
SUC)<br />
Han tog med sig mat till festen.<br />
(<strong>partikelverb</strong>,<br />
refl.)<br />
Han tog tag med båda händerna.<br />
Inga exempel i SUC på adverbial som börjar med ”med” i samband<br />
med de berörda verben.<br />
52
Om<br />
PV INS-restr. HK<br />
tycka om ok intrans, trans, att Sats, att VP, NP, när Sats, ej s<br />
veta om ok intrans, trans, att Sats, NP, ej s, ej Sats<br />
vända om ok intrans, ej s, ej Sats<br />
bygga om ok intrans, trans, så att Sats, NP, till NP, s, ej Sats<br />
göra om ej NP, tvärt, helt intrans, trans, så att Sats, NP, till NP, s, sig2, ej Sats<br />
bry om - -<br />
tala om ej NP trans, att Sats, att VP, NP, för NP, hur Sats, när Sats, s<br />
se om ok trans, NP, s, sig2, ej Sats<br />
Tabell 19: Verb + om<br />
PV<br />
Restriktioner<br />
Kommentar<br />
tycka om<br />
(inga)<br />
Egentligen behövs restriktioner för ”tycka om”. Här behövs t.ex.<br />
begränsning <strong>av</strong> vänsterkontexten, nämligen att ”vad” inte får<br />
förekomma före (eventuellt subjekt) och verb:<br />
Vad tycker du om honom?<br />
Vad jag tycker om honom?<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
veta om<br />
hk ≠ sats, ins ≠ att<br />
Jag vet inte om jag tror på det här.<br />
Jag visste att om jag ville lyckas var jag tvungen att …<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
vända om, bygga om<br />
hk ≠ sats<br />
Jag vänder om jag blir trött. Jag bygger om vädret blir bra.<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
göra om<br />
hk ≠ sats, ins ≠NP, helt, tvärt<br />
Det skulle jag själv göra om jag var arbetsgivare.<br />
Han gjorde turer (runt) om i världen/om kvällarna.<br />
Facket och (s) gör helt/tvärt om och satsar på småföretagarna.<br />
”Helt” och ”tvärt” är adverb men jag vill inte utesluta hela<br />
ordklassen då förbudet inte skulle släppa igenom det mycket vanliga<br />
inte.<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
bry om<br />
(inga)<br />
Vi bryr oss om dig.<br />
”bry om” förekommer endast i sin reflexiva form ”bry sig om”.<br />
Problemet är att ”bry” mycket väl kan betonas, det kan t.o.m. vara<br />
svårt för en människa att <strong>av</strong>göra vilken betoning som <strong>av</strong>ses. Detta<br />
gör att det är svårt att <strong>av</strong>göra vilka förekomster som är rätt taggade i<br />
SUC och vilka som inte är det. Det blir också svårt att <strong>av</strong>göra vilken<br />
betoning som är vanligast. Därför har ingen information om ”bry<br />
53
om” lagts in i lexikonet och <strong>partikelverb</strong>et kommer därmed inte att<br />
hanteras <strong>av</strong> <strong>detektering</strong>sprogrammet.<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
tala om<br />
ins ≠ NP<br />
Jag talade med pastorn om problemet.<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
se om<br />
hk ≠ Sats, ins ≠ att<br />
Efter några år skulle jag se om min inskrift fanns kvar.<br />
Jag såg att om han gjorde så skulle det bli fel.<br />
På<br />
PV INS-restr. HK<br />
komma på ej NP intrans, trans, att Sats, s, sig2<br />
passa på ok intrans, att VP, ej s<br />
hålla på ok intrans, att VP, med att, med NP, s<br />
se på ok intrans, hur Sats, när Sats, s<br />
stöta på ok trans, NP, ej s<br />
lägga på ej NP intrans, trans, NP, s, sig2<br />
ta på ok sig2<br />
dra på ok trans, s, sig2<br />
hälsa på ok trans, NP, hos NP, s<br />
sätta på ej NP trans, NP, s, sig2<br />
Tabell 20: Verb + på<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
komma på<br />
hk ≠ NP<br />
Vi kommer på kvällen<br />
Det är synd att utesluta NP då 14/22 tar NP som HK. Inget<br />
exempel i SUC på en sådan mening som ovan. Dock en vanlig<br />
konstruktion. De som tar ”att Sats” släpps dock igenom (3/22).<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
stöta på<br />
(inga)<br />
Han stötte på (flörtade med) Lena.<br />
Han stötte på (träffade) Lena.<br />
Syntaktiskt är det omöjligt att skilja dessa meningar åt. Jag har dock<br />
inga exempel på ”flörta”-varianten och den är dessutom mycket<br />
informell. Samtliga förekomster <strong>av</strong> <strong>partikelverb</strong>et (i rak ordföljd) tar<br />
NP som HK och det vore därför synd att utesluta den<br />
högerkontexten.<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
lägga på<br />
ins ≠ NP<br />
Vi lade nycklarna på bordet.<br />
Detta skulle egentligen kunna skötas med hjälp <strong>av</strong> regler. Om vi har<br />
en NP mellan verbet och partikeln måste det vara subjektet och då<br />
får det inte finnas någon NP innan verbet. Vid omvänd ordföljd,<br />
t.ex. ”Igår lade vi nycklarna på bordet” har vi två NP mellan verb<br />
54
och subjekt, detta kanske också skulle kunna ta bort med hjälp <strong>av</strong><br />
regler?<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
dra på<br />
hk ≠ NP<br />
Han drog på munnen.<br />
”Dra på ” är ett <strong>partikelverb</strong> som blir svårt att hantera. Dess enda<br />
tillåtna högerkontext är NP och den måste vi förbjuda p.g.a. <strong>av</strong> att<br />
det finns risk för ambiguiteter (han drog på motorn/huvan). Det<br />
finns dock endast ett exempel på detta (det med motorn). Övriga<br />
förekomster <strong>av</strong> ”dra på” är i den reflexiva konstruktionen ”dra på<br />
sig”.<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
hälsa på<br />
hk = (hemma) hos NP<br />
Han hälsade på sin mamma.<br />
När det gäller ”hälsa på” måste man vara försiktig då <strong>partikelverb</strong>et<br />
både kan betyda ”säga hej” och ”besöka” utan att det blir någon<br />
syntaktisk skillnad. Man kan dock vara säker på att det är<br />
<strong>partikelverb</strong>et som <strong>av</strong>ses om vi har högerkontexten ”hemma hos<br />
ngn”.<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
sätta på<br />
ins ≠ NP<br />
Han sätter kastrullen på spisen.<br />
55
Bort<br />
PV INS-restr. HK<br />
gå bort ok intrans, med NP, mot NP, på NP, till NP, från NP, ej s, sig2<br />
glömma bort ok intrans, trans, att Sats, att VP, NP, när Sats, hur Sats, s, sig2<br />
få bort ok trans, NP, s<br />
ta bort ok trans, NP, s, sig1<br />
Tabell 21: Verb + bort<br />
Fram<br />
PV INS-restr. HK<br />
komma fram ok<br />
intrans, att Sats, med NP, mot NP, hur Sats, som NP,<br />
i NP, vid NP, till NP, från NP, ur NP, ej s<br />
gå fram ej NP intrans, mot NP, i NP, till NP, ej s<br />
nå fram ok intrans, i NP, till NP, ej s<br />
växa fram ok intrans, NP, på NP, som NP, i NP, ur NP, ej s<br />
få fram ok trans, NP, s<br />
träda fram ok intrans, på NP, som NP, i NP, till NP, ej s<br />
dra fram ok intrans, trans, NP, mot NP, på NP,som NP, över NP, s<br />
föra fram ok trans, att Sats, NP, s<br />
lyfta fram ok trans, NP, s<br />
lägga fram ok trans, NP, s<br />
plocka fram ok trans, NP, s<br />
sträcka fram ok trans, NP, s<br />
ta fram ej NP trans, NP, s, sig1<br />
Tabell 22: Verb + fram<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
gå fram<br />
ins ≠ NP, ins ≠ ab<br />
Han gick den sista kilometern fram till sjukhuset.<br />
Hon började sedan långsamt gå trottoaren fram.<br />
Han gick rakt fram utan att se sig om.<br />
Han gick längre/längst fram för att se bättre.<br />
Däremot så godkänns alltid satsadverben ”inte” och ”aldrig”.<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
ta fram<br />
ins ≠ NP<br />
Hon tog ett steg fram mot honom.<br />
Ihop<br />
56
PV INS-restr. HK<br />
hänga ihop ok intrans, med NP, ej s<br />
hålla ihop ok intrans, trans, NP, s<br />
slå ihop ok intrans, trans, NP, sig1, sig2<br />
dra ihop ok trans, NP, sig2<br />
Tabell 23: Verb + ihop<br />
In<br />
PV INS-restr. HK<br />
falla in ok<br />
intrans, att VP, mot NP, på NP, i NP, till NP,<br />
från NP, ej s, sig1<br />
titta in ok<br />
intrans, med NP, mot NP, på NP, i NP,<br />
till NP, från NP, hos NP, ej s<br />
träda in ok intrans, med NP, på NP, i NP, ej s<br />
komma in ok<br />
intrans, med NP, på NP, som NP, i NP,<br />
vid NP, till NP, från NP, ej s<br />
kliva in ok<br />
intrans, mot NP, på NP, i NP, till NP,<br />
från NP, ej s<br />
stiga in ok<br />
intrans, mot NP, på NP, i NP, till NP,<br />
från NP, ej s<br />
få in ok trans, NP, ej s, sig2<br />
passa in ok intrans, trans, NP, på NP, i NP, s<br />
flytta in ok<br />
intrans, trans, NP, på NP, i NP, till NP,<br />
hos NP, s, sig2<br />
köra in ok intrans, trans, NP, på NP, i NP, till NP, s<br />
tränga in ok intrans, trans, NP, på NP, i NP, till NP, s<br />
gå in ok, ej ab<br />
intrans, trans, NP, på NP, som NP, i NP,<br />
till NP, från NP, för NP, för att NP, ej s<br />
dra in ok intrans, trans, NP, s<br />
lämna in ok intrans, trans, NP, s<br />
sätta in ok intrans, trans, NP, s, sig 1<br />
ta in ej NP trans, NP, på NP, s, sig1<br />
betala in ok trans, NP, s<br />
föra in ok trans, NP, s<br />
samla in ok trans, NP, s<br />
släppa in ok trans, NP, s<br />
ställa in ok trans, NP, s, sig1, sig2<br />
dela in ok trans, NP, s, sig2<br />
köpa in ok trans, NP, s, sig2<br />
lägga in ok trans, NP, s, sig2<br />
bjuda in ok trans, NP, till NP, s, sig2<br />
Tabell 24: Verb + in<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
betala in<br />
hk ≠ ”natura”<br />
Många skatter och <strong>av</strong>gifter betalades in natura.<br />
(Sådan restriktion är än så länge ej möjlig att göra).<br />
57
PV<br />
Restriktioner<br />
Anledning/exempel<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
ta in<br />
ins ≠ NP<br />
Han tog ett beslutsamt steg in i rummet.<br />
Han tog bilen in till stan.<br />
gå in<br />
ins ≠ ab (dock godkänns diverse satsadverbial)<br />
Han gick in på scenen.<br />
Han gick genast in på scenen.<br />
58
Till<br />
PV INS-restr. HK<br />
se till ej NP intrans, trans, att Sats, så att Sats, att VP, s<br />
hjälpa till ej NP intrans, att VP, med att, med NP, ej s<br />
komma till ej NP, ab intrans, för att VP, ej s<br />
stanna till ej NP intrans, för att VP, ej s<br />
vara till ej NP intrans, för NP, för att NP, för att VP, ej s, sig2<br />
ställa till ej NP intrans, trans, NP, med NP, ej s<br />
hålla till ej NP intrans, på NP, i NP, vid NP, ej s<br />
gå till ej NP intrans, så att Sats, ej s<br />
säga till ej NP intrans, trans, att Sats, NP, om, hur Sats, när Sats, s<br />
lägga till ej NP intrans, trans, att Sats, NP, s, sig1+med<br />
dra till ej NP intrans, trans, med NP, med att, s<br />
slå till ej NP intrans, trans, NP, mot NP, på NP, när Sats, med NP, s<br />
räcka till ej NP, länge intrans, åt NP, för NP, för att NP, ej s<br />
känna till ej NP trans, att Sats, NP, hur Sats, när Sats, s<br />
ta till ej NP trans, NP, i NP, s<br />
rätta till ej NP trans, NP, s<br />
Tabell 25: Verb + till<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
Kommentar<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
komma till<br />
ins ≠ NP, ab (dock godkänns diverse satsadverbial)<br />
Det kom en smäll till bakifrån.<br />
Det kom ofta och snabbt till hotfulla situationer.<br />
Att inskottet inte får innehålla något adverb innebär att ”komma illa till”<br />
och ”komma fram till” utesluts. Dessa två borde också tas om hand.<br />
räcka till<br />
ins ≠ NP, länge<br />
Hon kan inte räcka länge till.<br />
59
Upp<br />
PV INS-restr. HK<br />
stiga upp ej NP, AL intrans, från NP, mot NP, ur NP, ej s<br />
växa upp ej AL<br />
intrans, med NP, på NP, som NP,<br />
i NP, ej s<br />
ge upp ej AL intrans, NP, ej s, sig1<br />
gå upp ej NP, AL<br />
intrans, NP, för , mot NP, på NP,<br />
i NP, till NP, från NP, ej s<br />
göra upp ej AL intrans, trans, NP, med NP, om, s<br />
sticka upp ej AL intrans, trans, NP, på NP, i NP, ur NP, s<br />
hoppa upp ej NP, AL<br />
intrans, på NP, i NP, från NP,<br />
ur NP, ej s<br />
komma upp ej AL<br />
intrans, på NP, i NP, till NP, från NP,<br />
ur NP, ej s, sig2<br />
dyka upp ej AL intrans, på NP, som NP, i NP, ej s<br />
titta upp ej AL intrans, på NP, till NP, från NP, ej s<br />
stanna upp ej AL intrans, på NP, vid NP, s<br />
se upp ej AL<br />
intrans, så att Sats, med NP, för, mot<br />
NP, på NP, i NP, till NP, från NP, ej s<br />
bryta upp ej AL intrans, trans, från NP, s<br />
skjuta upp ej AL<br />
intrans, trans, NP, från NP, ur NP, s,<br />
sig2<br />
ställa upp ej AL<br />
intrans, trans, NP, med NP, för, på NP,<br />
som NP, i NP, till NP, s, sig2<br />
låsa upp ej AL intrans, trans, NP, s<br />
lösa upp ej AL intrans, trans, NP, s<br />
ringa upp ej AL intrans, trans, NP, s<br />
äta upp ej AL intrans, trans, NP, s, sig2<br />
leva upp ej AL intrans, trans, NP, till NP, s<br />
ta upp ej AL trans, att Sats, NP, hur Sats, s<br />
visa upp ej AL trans, att Sats, NP, s, sig2<br />
plocka upp ej AL trans, NP, efter mig/sig, s<br />
få upp ej AL trans, NP, ej s<br />
följa upp ej AL trans, NP, hur Sats, s<br />
bära upp ej AL trans, NP, s<br />
dra upp ej AL trans, NP, s<br />
fånga upp ej AL trans, NP, s<br />
hänga upp ej AL trans, NP, s<br />
lyfta upp ej AL trans, NP, s<br />
måla upp ej AL trans, NP, s<br />
slå upp ej AL trans, NP, s<br />
bygga upp ej AL trans, NP, s, sig2<br />
dela upp ej AL trans, NP, s, sig2<br />
lägga upp ej AL trans, NP, s, sig2<br />
säga upp ej AL trans, NP, s, sig2<br />
sätta upp ej AL trans, NP, s, sig2<br />
Tabell 26: Verb + upp<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
stiga upp<br />
ins ≠ NP<br />
..ballonger som steg bortemot 30 kilometer upp i atmosfären.<br />
(bortemot = adverb = godkänt inskott)<br />
60
PV<br />
Restriktioner<br />
Anledning/exempel<br />
PV<br />
Restriktioner<br />
Kommentarer och exempel<br />
hoppa upp<br />
ins ≠ NP<br />
Jag hoppar minst en meter upp i luften.<br />
gå upp<br />
ins ≠ NP<br />
”gå upp” är svårast att hantera i denna grupp. Det verkar vara så att<br />
”gå” endast är vanligt verb framför ”upp” i två fall: 1) i betydelsen<br />
spatsera och vandra eller när man vill framhäva att man gick snarare<br />
än förflyttade sig på något annat sätt 2) i betydelsen ”sträcker sig”.<br />
Följande (förkortade) meningar från SUC får exemplifiera:<br />
Sedan går vi ut och går upp längs Odengatan. (<strong>partikelverb</strong><br />
möjligt)<br />
Karl gick vidare upp genom vägbankens gräs.<br />
De måste gå längre upp, i myrkanten.<br />
De hade gått Katarin<strong>av</strong>ägen upp, tätt omslingrade.<br />
Leden går via dalens högra sida upp över en skogklädd rygg.<br />
Från byggnaden går vägen brant upp till stationen.<br />
Dessa meningar talar för att utesluta adverbial som inskott och även<br />
som högerkontext. Som högerkontext skulle NP förbjudas. Vid<br />
jämförelse med <strong>partikelverb</strong>smeningarna fann jag att den första och<br />
sista restriktionen var rimlig, framför allt då NP som inskott<br />
överhuvudtaget är ovanligt. Att inte tillåta adverbial efter ”gå upp” är<br />
värre då <strong>partikelverb</strong>et är intransitivt. En preliminär lösning får bli att<br />
endast tillåta adverbial funna efter <strong>partikelverb</strong>. Dessa börjar med<br />
någon <strong>av</strong> följande ord: i, till. mot, från samt på.<br />
PV<br />
sätta upp<br />
Restriktioner<br />
ins ≠ högt, högre, högst<br />
Anledning/exempel Verkligheten satte också andra uppgifter högre upp på<br />
dagordningen.<br />
Utbildning är en fråga som klubbstyrelsen sätter högt upp på<br />
åtgärdslistan.<br />
61
Ut<br />
PV INS-restr. HK<br />
se ut<br />
ok<br />
intrans, att VP, mot NP, som NP, som om NP,<br />
över NP, genom NP, ej s<br />
råka ut ok intrans, för NP, för att Sats, ej s<br />
titta ut ok intrans, genom NP, över NP<br />
stå ut ok intrans, med NP, med att Sats, ej s<br />
komma ut ok<br />
intrans, med NP, på NP, som NP, i NP, till NP,<br />
från NP, ur NP, ej s<br />
få ut ok trans, NP, ej s<br />
sträcka ut ok intrans, NP, s, sig2<br />
gå ut<br />
ej fullt<br />
intrans, på NP, på att Sats, som NP, i NP, till<br />
NP, från NP, över NP, genom NP, över NP, ej s<br />
bryta ut ok intrans, trans, NP, i NP, s, sig1<br />
hyra ut ok intrans, trans, NP, i NP, till NP, s<br />
slå ut ok intrans, trans, NP, med NP, i NP, s<br />
ställa ut ok intrans, trans, NP, på NP, i NP, s<br />
dra ut ej NP intrans, trans, NP, på NP, s<br />
skriva ut ok intrans, trans, NP, s<br />
räkna ut ok trans, att Sats, NP, hur Sats, när Sats, var Sats, s<br />
betala ut ok trans, NP, s<br />
bygga ut ok intrans, trans, NP, s<br />
dela ut ok trans, NP, s<br />
föra ut ok trans, NP, s<br />
lägga ut ok intrans, trans, NP, s<br />
lämna ut ok trans, NP, s<br />
skicka ut ok trans, NP, s<br />
släppa ut ok trans, NP, s<br />
sudda ut ok trans, NP, s<br />
sända ut ok trans, NP, s<br />
välja ut ok trans, NP, s<br />
ge ut ok trans, NP, s, sig1<br />
breda ut ok trans, NP, s, sig2<br />
ta ut ej NP trans, NP, s, sig2<br />
Tabell 27: Verb + ut<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
PV<br />
Restriktioner<br />
Anledning/exempel<br />
gå ut<br />
ins ≠ fullt<br />
Vi går på din linje fullt ut.<br />
dra ut<br />
ins ≠ NP<br />
Han drar cykelkärran ut från gården.<br />
ta ut<br />
ins ≠ NP<br />
Han tog bilen ut på landet.<br />
62