Anafora e Risoluzione - Linguistica dei corpora
Anafora e Risoluzione - Linguistica dei corpora
Anafora e Risoluzione - Linguistica dei corpora
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Rappresentazione dell’Informazione Semantica<br />
Lezione 6: <strong>Anafora</strong> e <strong>Risoluzione</strong><br />
Malvina Nissim<br />
malvina.nissim@unibo.it<br />
18 Febbraio 2009<br />
1
1 <strong>Anafora</strong><br />
<strong>Anafora</strong><br />
Paolo ha visto Giulia e l’ha salutata.<br />
• “l(a) = anafora (espressione anaforica)<br />
• “Giulia = antecedente<br />
• = referente<br />
anafora = strumento di coesione testuale<br />
(Halliday and Hasan 1976)<br />
Espressione anaforica: un’espressione linguistica (anafora) che fa riferimento ad un’entità<br />
(referente) precedentemente introdotta da un’altra espressione (antecedente)<br />
• Paolo ha chiamato Betta e le ha dato un appuntamento<br />
• Ho comprato “L’Espresso e all’interno del giornale ho trovato un articolo interessante<br />
• Paolo non è riuscito ad entrare in casa perché aveva dimenticato le chiavi<br />
• Dopo il viaggio a Mosca non credo riuscirò ad amare altre città<br />
• Al bar ho visto due persone. La donna era vestita di chiaro<br />
Anafore e Antecedenti<br />
Most Americans may have decided that John Kerry won the three debates against George<br />
Bush, but that does not necessarily mean they are going to vote for him, according to<br />
polls published yesterday which put the president back in the lead. (The Guardian)<br />
“him” chi?<br />
cerchiamo tra i sintagmi nominali precedenti...<br />
him = they? him = that? him = George Bush? him = three debates? him = John<br />
Kerry? him = most Americans?<br />
• him è un’anafora pronominale<br />
• John Kerry è l’antecedente corretto (correct)<br />
• three debates, George Bush, ... sono distractors
Anafore e Antecedenti<br />
Most Americans may have decided that John Kerry won the three debates against George<br />
Bush, but that does not necessarily mean they are going to vote for him, according to<br />
polls published yesterday which put the president back in the lead. (The Guardian)<br />
“the president” chi?<br />
the president: anafora a testa nominale piena George Bush: antecedente<br />
Tipi di “espressioni referenziali<br />
Jurafsky & Martin 2000, ch 18.1<br />
• sintagmi nominali indefiniti<br />
• sintagmi nominali definiti<br />
• pronomi<br />
• dimostrativi<br />
• “one anaphora”<br />
• “inferrables”<br />
• insiemi discontinui<br />
• generici<br />
diversi criteri:<br />
• sintattici<br />
• ricchezza lessicale (testa<br />
piena o meno, per esempio)<br />
• status dell’entità<br />
2 <strong>Risoluzione</strong><br />
Informazione necessaria alla risoluzione<br />
• morfologica (numero/genere/caso)<br />
• sintattica (posizioni accessibili o inaccessibili)<br />
• semantica<br />
• pragmatica<br />
2
2.1 Centering Theory<br />
Centering Theory<br />
• Grosz, Joshi and Weinstein, 1986, 1995<br />
• modella la coerenza del discorso a livello locale<br />
– cosa accade allo scorrere da una frase all’altra<br />
– predice quali entità saranno più salienti<br />
– non modella la struttura globale del discorso<br />
• definisce la coerenza testuale come una stima dello sforzo necessario a comprendere il testo<br />
un sistema di regole e vincoli che governano la relazione tra il contenuto del discorso e alcune<br />
delle scelte linguistiche fatte dai partecipanti al discorso:<br />
• scelta della struttura sintattica<br />
• tipo di espressione referenziale (nome proprio, sintagma (in)definito, etc.)<br />
nel momento in cui una persona legge/sente una frase:<br />
• fa uno sforzo cognitivo per interpretarne le espressioni<br />
• integra il significato della frase con quello della frase precedente<br />
• crea delle aspettative su ciò che potrebbe seguire<br />
Principi<br />
• visione dinamica del discorso: una frase è una transizione da uno stato (input) ad un<br />
altro (output); esistono diversi tipi di transizioni che indicano diversi gradi di coerenza<br />
testuale<br />
• il concetto di stato<br />
– determina quali entità sono coinvolte: i centri di attenzione<br />
– rappresenta il potenziale anaforico della frase<br />
– cattura la salienza/importanza relativa delle varie entità nel discorso<br />
• i centri: entità (semantiche) che collegano una frase all’altra; ciascuno stato include un<br />
backward-looking center e una lista di forward-looking centers<br />
3
Backward-looking center<br />
• un referente del discorso<br />
• un link alla frase precedente<br />
• l’entità più saliente di cui si parla nella frase precedente e nella frase corrente<br />
• Cb(U n ): il backward-looking center della frase “n (U n )<br />
Il Cb della frase U n è connesso ad uno <strong>dei</strong> Cf (forward-looking centers) di U n−1 (frase precedente)<br />
Il Cb della frase U n è l’elemento di rango più alto in Cf (U n−1 ) che è realizzato anche in U n<br />
Forward-looking centers<br />
• una lista di referenti (espressioni linguistiche)<br />
• Cf(U n ): lista di tutti i referenti nella frase n<br />
• lista ordinata secondo un criterio di salienza (rappresentata dalla funzione grammaticale)<br />
subject > object(s) > other<br />
NB: preferred center (Cp) = elemento di rango più alto nella lista Cf. Ci si aspetta che nella<br />
frase successiva si parli ancora di Cp<br />
Esempio<br />
Terry is really difficult sometimes. Cf={Terry}, Cb=?<br />
Yesterday he was excited about trying out his new sailboat. Cf={Terry,sailboat}, Cb=Terry<br />
He wanted Tony to join him in a sailing expedition. Cf={Terry, Tony, expedition}, Cb=Terry<br />
He called him at 6am. Cf={Terry,Tony}, Cb=Terry<br />
Tony was sick and furious at being woken up so early. Cf={Tony}, Cb=Tony<br />
Le transizioni<br />
Le transizioni sono classificate a seconda del cambiamento<br />
Continue • Bw-looking center è invariato (Cb(U n−1 )=Cb(U n ))<br />
• Bw-looking center è anche il Cp della nuova frase (Cb(U n )=Cp(U n ))<br />
Retain • Bw-looking center è invariato (Cb(U n−1 )=Cb(U n ))<br />
• Bw-looking center non è più nel rango più alto (Cb(U n−1 ) ≠ Cp(U n ))<br />
Smooth shift • il nuovo Cb (U n ) è diverso dal vecchio Cb (U n−1 ) (Cb(U n−1 ) ≠ Cb(U n ))<br />
• il Cb corrisponde al Cp (Cb(U n )=Cp(U n ))<br />
Rough shift • il nuovo Cb è diverso dal vecchio Cb (Cb(U n−1 ) ≠ Cb(U n ))<br />
• il nuovo Cb non è più al rango più alto (Cb(U n )≠Cp(U n ))<br />
4
Transizioni<br />
Cb(U n ) = Cb(U n−1 ) Cb(U n ) ≠ Cb(U n−1 )<br />
Cb(U n ) = Cp(U n ) continue smooth shift<br />
Cb(U n ) ≠ Cp(U n ) retain rough shift<br />
Terry is really difficult sometimes. Cf={Terry}, Cb=?, —<br />
He wanted Tony to join him in a sailing expedition. Cf={Terry, Tony, expedition}, Cb=Terry, continue<br />
He called him at 6am. Cf={Terry,Tony}, Cb=Terry, continue<br />
Tony told him to call again later. Cf={Tony,Terry}, Cb=Terry, retain<br />
Tony was sick and furious at being woken up so early. Cf={Tony}, Cb=Tony, smooth-shift<br />
Paula told Tony to get up. Cf={Paula,Tony}, Cb=Tony, rough-shift<br />
L’algoritmo<br />
1. CONSTRUCT<br />
• si costruiscono le possibili alternative per la risoluzione delle anafore<br />
• ciascuna alternativa mappa i pronomi nella frase alle entità del discorso, rispettando<br />
i vincoli di accordo<br />
• per ciascuna alternativa:<br />
– Cf(U n ) consiste di tutti i referenti <strong>dei</strong> sintagmi nominali nella frase<br />
– Cb(U n ) viene scelto in Cf(U n−1 )<br />
2. FILTER Le varie alternative che non obbediscono ai seguenti criteri devono essere scartate<br />
condition 1 se ci sono <strong>dei</strong> pronomi nella frase corrente, allora uno di questi deve essere<br />
il backward-looking center (“Rule 1)<br />
condition 2 Il backward-looking center deve essere fatto corrispondere all’entità della<br />
frase corrente che occupa il posto più alto tra i forward-looking centers della frase<br />
precedente<br />
condition 3 i vincoli sintattici devono essere rispettati<br />
3. CLASSIFY<br />
classificare ciascuna alternativa come uno <strong>dei</strong> possibili tipi di transizione:<br />
• continue<br />
• retain<br />
• smooth shift<br />
• rough shift<br />
4. SELECT<br />
scegliere l’alternativa migliore sulla base del rango delle transizioni:<br />
continue > retain > smooth shift > rough shift<br />
> = is preferred over<br />
5
Esempio<br />
1. Jane likes Mary.<br />
2. She often brings her flowers.<br />
3. She chats with the young woman for ages<br />
Domanda: quali sono gli antecedenti delle espressioni sottolineate?<br />
Cosa predice in merito la Centering Theory?<br />
(1) Jane likes Mary.<br />
1. Construct:<br />
2. Filter: x<br />
• CF(U1): {Jane, Mary}<br />
• CB(U1): NIL<br />
• CP(U1): Jane<br />
3. Classify: -<br />
4. Select: -<br />
(2) She often brings her flowers.<br />
1. Construct:<br />
• CF(U2): {Jane, Mary, flowers} or {Mary, Jane, flowers} or {Jane, Jane, flowers} or<br />
{Mary, Mary, flowers}<br />
• CB(U2): Jane or Mary<br />
• CP(U2): Jane or Mary<br />
2. Filter:<br />
• By (1): she or her refers to CB<br />
• By (2): CB(U2) is Jane<br />
• By (3): {Jane, Jane, flowers} & {Mary, Mary, flowers} are ruled out<br />
3. Classify:<br />
(a)<br />
(b)<br />
• CF(U2): {Jane, Mary, flowers}<br />
• CB(U2): Jane<br />
• CP(U2): Jane<br />
• So, CB(U2) ≠ CB(U1), CB(U2) = CP(U2)<br />
• i.e smooth shift<br />
• CF(U2): {Mary, Jane, flowers}<br />
• CB(U2): Jane<br />
6
• CP(U2): Mary<br />
• So, CB(U2) ≠ CB(U1), CB(U2) ≠ CP(U2)<br />
• i.e rough shift<br />
4. Select: smooth shift<br />
quindi:<br />
(1) Jane likes Mary<br />
(2) She often brings her flowers<br />
la CT dà come interpretazione di (2)<br />
“Jane often brings Mary flowers (she=Jane, her=Mary)<br />
(3) She chats with the young woman for ages<br />
1. Construct:<br />
• CF(U3): {Jane, Mary} or {Mary, Jane} or {Jane,Jane} or {Mary, Mary}<br />
• CB(U3): Jane or Mary or flowers or NIL<br />
• CP(U3): Jane or Mary<br />
2. Filter:<br />
• By (1): CB(U3) is Jane or Mary<br />
• By (2): CB(U3) is Jane<br />
• By (3): {Jane, Jane} & {Mary, Mary} are ruled out<br />
3. Classify:<br />
(a)<br />
(b)<br />
• CF(U3): {Jane, Mary}<br />
• CB(U3): Jane<br />
• CP(U3): Jane<br />
• So, CB(U3) = CB(U2), CB(U3) = CP(U3)<br />
• continue<br />
• CF(U3): {Mary, Jane}<br />
• CB(U3): Jane<br />
• CP(U3): Mary<br />
• So, CB(U3) = CB(U2), CB(U3) ≠ CP(U3)<br />
• retain<br />
4. Select: continue<br />
Quindi,<br />
(1) Jane likes Mary<br />
(2) She often brings her flowers = Jane often brings Mary flowers<br />
(3) She chats with the young woman for ages = Jane chats with Mary for ages<br />
7
2.2 Sintagmi anaforici a testa piena<br />
Sintagmi Anaforici a Testa Nominale Piena<br />
• coreferenza<br />
– antecedente e anafora fanno riferimento allo stesso oggetto<br />
• other-anafora<br />
– sintagma anaforico modificato da other o another<br />
– l’antecedente fornisce l’insieme complemento dell’anafora<br />
• bridging<br />
– sintagmi nominali anaforici (normalmente) introdotti dall’articolo definito<br />
– l’antecedente e’ legato all’anafora ma non tramite coreferenza, ad esempio tramite<br />
una relazione meronimica (parte-tutto)<br />
8