19.02.2014 Views

Anafora e Risoluzione - Linguistica dei corpora

Anafora e Risoluzione - Linguistica dei corpora

Anafora e Risoluzione - Linguistica dei corpora

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Rappresentazione dell’Informazione Semantica<br />

Lezione 6: <strong>Anafora</strong> e <strong>Risoluzione</strong><br />

Malvina Nissim<br />

malvina.nissim@unibo.it<br />

18 Febbraio 2009<br />

1


1 <strong>Anafora</strong><br />

<strong>Anafora</strong><br />

Paolo ha visto Giulia e l’ha salutata.<br />

• “l(a) = anafora (espressione anaforica)<br />

• “Giulia = antecedente<br />

• = referente<br />

anafora = strumento di coesione testuale<br />

(Halliday and Hasan 1976)<br />

Espressione anaforica: un’espressione linguistica (anafora) che fa riferimento ad un’entità<br />

(referente) precedentemente introdotta da un’altra espressione (antecedente)<br />

• Paolo ha chiamato Betta e le ha dato un appuntamento<br />

• Ho comprato “L’Espresso e all’interno del giornale ho trovato un articolo interessante<br />

• Paolo non è riuscito ad entrare in casa perché aveva dimenticato le chiavi<br />

• Dopo il viaggio a Mosca non credo riuscirò ad amare altre città<br />

• Al bar ho visto due persone. La donna era vestita di chiaro<br />

Anafore e Antecedenti<br />

Most Americans may have decided that John Kerry won the three debates against George<br />

Bush, but that does not necessarily mean they are going to vote for him, according to<br />

polls published yesterday which put the president back in the lead. (The Guardian)<br />

“him” chi?<br />

cerchiamo tra i sintagmi nominali precedenti...<br />

him = they? him = that? him = George Bush? him = three debates? him = John<br />

Kerry? him = most Americans?<br />

• him è un’anafora pronominale<br />

• John Kerry è l’antecedente corretto (correct)<br />

• three debates, George Bush, ... sono distractors


Anafore e Antecedenti<br />

Most Americans may have decided that John Kerry won the three debates against George<br />

Bush, but that does not necessarily mean they are going to vote for him, according to<br />

polls published yesterday which put the president back in the lead. (The Guardian)<br />

“the president” chi?<br />

the president: anafora a testa nominale piena George Bush: antecedente<br />

Tipi di “espressioni referenziali<br />

Jurafsky & Martin 2000, ch 18.1<br />

• sintagmi nominali indefiniti<br />

• sintagmi nominali definiti<br />

• pronomi<br />

• dimostrativi<br />

• “one anaphora”<br />

• “inferrables”<br />

• insiemi discontinui<br />

• generici<br />

diversi criteri:<br />

• sintattici<br />

• ricchezza lessicale (testa<br />

piena o meno, per esempio)<br />

• status dell’entità<br />

2 <strong>Risoluzione</strong><br />

Informazione necessaria alla risoluzione<br />

• morfologica (numero/genere/caso)<br />

• sintattica (posizioni accessibili o inaccessibili)<br />

• semantica<br />

• pragmatica<br />

2


2.1 Centering Theory<br />

Centering Theory<br />

• Grosz, Joshi and Weinstein, 1986, 1995<br />

• modella la coerenza del discorso a livello locale<br />

– cosa accade allo scorrere da una frase all’altra<br />

– predice quali entità saranno più salienti<br />

– non modella la struttura globale del discorso<br />

• definisce la coerenza testuale come una stima dello sforzo necessario a comprendere il testo<br />

un sistema di regole e vincoli che governano la relazione tra il contenuto del discorso e alcune<br />

delle scelte linguistiche fatte dai partecipanti al discorso:<br />

• scelta della struttura sintattica<br />

• tipo di espressione referenziale (nome proprio, sintagma (in)definito, etc.)<br />

nel momento in cui una persona legge/sente una frase:<br />

• fa uno sforzo cognitivo per interpretarne le espressioni<br />

• integra il significato della frase con quello della frase precedente<br />

• crea delle aspettative su ciò che potrebbe seguire<br />

Principi<br />

• visione dinamica del discorso: una frase è una transizione da uno stato (input) ad un<br />

altro (output); esistono diversi tipi di transizioni che indicano diversi gradi di coerenza<br />

testuale<br />

• il concetto di stato<br />

– determina quali entità sono coinvolte: i centri di attenzione<br />

– rappresenta il potenziale anaforico della frase<br />

– cattura la salienza/importanza relativa delle varie entità nel discorso<br />

• i centri: entità (semantiche) che collegano una frase all’altra; ciascuno stato include un<br />

backward-looking center e una lista di forward-looking centers<br />

3


Backward-looking center<br />

• un referente del discorso<br />

• un link alla frase precedente<br />

• l’entità più saliente di cui si parla nella frase precedente e nella frase corrente<br />

• Cb(U n ): il backward-looking center della frase “n (U n )<br />

Il Cb della frase U n è connesso ad uno <strong>dei</strong> Cf (forward-looking centers) di U n−1 (frase precedente)<br />

Il Cb della frase U n è l’elemento di rango più alto in Cf (U n−1 ) che è realizzato anche in U n<br />

Forward-looking centers<br />

• una lista di referenti (espressioni linguistiche)<br />

• Cf(U n ): lista di tutti i referenti nella frase n<br />

• lista ordinata secondo un criterio di salienza (rappresentata dalla funzione grammaticale)<br />

subject > object(s) > other<br />

NB: preferred center (Cp) = elemento di rango più alto nella lista Cf. Ci si aspetta che nella<br />

frase successiva si parli ancora di Cp<br />

Esempio<br />

Terry is really difficult sometimes. Cf={Terry}, Cb=?<br />

Yesterday he was excited about trying out his new sailboat. Cf={Terry,sailboat}, Cb=Terry<br />

He wanted Tony to join him in a sailing expedition. Cf={Terry, Tony, expedition}, Cb=Terry<br />

He called him at 6am. Cf={Terry,Tony}, Cb=Terry<br />

Tony was sick and furious at being woken up so early. Cf={Tony}, Cb=Tony<br />

Le transizioni<br />

Le transizioni sono classificate a seconda del cambiamento<br />

Continue • Bw-looking center è invariato (Cb(U n−1 )=Cb(U n ))<br />

• Bw-looking center è anche il Cp della nuova frase (Cb(U n )=Cp(U n ))<br />

Retain • Bw-looking center è invariato (Cb(U n−1 )=Cb(U n ))<br />

• Bw-looking center non è più nel rango più alto (Cb(U n−1 ) ≠ Cp(U n ))<br />

Smooth shift • il nuovo Cb (U n ) è diverso dal vecchio Cb (U n−1 ) (Cb(U n−1 ) ≠ Cb(U n ))<br />

• il Cb corrisponde al Cp (Cb(U n )=Cp(U n ))<br />

Rough shift • il nuovo Cb è diverso dal vecchio Cb (Cb(U n−1 ) ≠ Cb(U n ))<br />

• il nuovo Cb non è più al rango più alto (Cb(U n )≠Cp(U n ))<br />

4


Transizioni<br />

Cb(U n ) = Cb(U n−1 ) Cb(U n ) ≠ Cb(U n−1 )<br />

Cb(U n ) = Cp(U n ) continue smooth shift<br />

Cb(U n ) ≠ Cp(U n ) retain rough shift<br />

Terry is really difficult sometimes. Cf={Terry}, Cb=?, —<br />

He wanted Tony to join him in a sailing expedition. Cf={Terry, Tony, expedition}, Cb=Terry, continue<br />

He called him at 6am. Cf={Terry,Tony}, Cb=Terry, continue<br />

Tony told him to call again later. Cf={Tony,Terry}, Cb=Terry, retain<br />

Tony was sick and furious at being woken up so early. Cf={Tony}, Cb=Tony, smooth-shift<br />

Paula told Tony to get up. Cf={Paula,Tony}, Cb=Tony, rough-shift<br />

L’algoritmo<br />

1. CONSTRUCT<br />

• si costruiscono le possibili alternative per la risoluzione delle anafore<br />

• ciascuna alternativa mappa i pronomi nella frase alle entità del discorso, rispettando<br />

i vincoli di accordo<br />

• per ciascuna alternativa:<br />

– Cf(U n ) consiste di tutti i referenti <strong>dei</strong> sintagmi nominali nella frase<br />

– Cb(U n ) viene scelto in Cf(U n−1 )<br />

2. FILTER Le varie alternative che non obbediscono ai seguenti criteri devono essere scartate<br />

condition 1 se ci sono <strong>dei</strong> pronomi nella frase corrente, allora uno di questi deve essere<br />

il backward-looking center (“Rule 1)<br />

condition 2 Il backward-looking center deve essere fatto corrispondere all’entità della<br />

frase corrente che occupa il posto più alto tra i forward-looking centers della frase<br />

precedente<br />

condition 3 i vincoli sintattici devono essere rispettati<br />

3. CLASSIFY<br />

classificare ciascuna alternativa come uno <strong>dei</strong> possibili tipi di transizione:<br />

• continue<br />

• retain<br />

• smooth shift<br />

• rough shift<br />

4. SELECT<br />

scegliere l’alternativa migliore sulla base del rango delle transizioni:<br />

continue > retain > smooth shift > rough shift<br />

> = is preferred over<br />

5


Esempio<br />

1. Jane likes Mary.<br />

2. She often brings her flowers.<br />

3. She chats with the young woman for ages<br />

Domanda: quali sono gli antecedenti delle espressioni sottolineate?<br />

Cosa predice in merito la Centering Theory?<br />

(1) Jane likes Mary.<br />

1. Construct:<br />

2. Filter: x<br />

• CF(U1): {Jane, Mary}<br />

• CB(U1): NIL<br />

• CP(U1): Jane<br />

3. Classify: -<br />

4. Select: -<br />

(2) She often brings her flowers.<br />

1. Construct:<br />

• CF(U2): {Jane, Mary, flowers} or {Mary, Jane, flowers} or {Jane, Jane, flowers} or<br />

{Mary, Mary, flowers}<br />

• CB(U2): Jane or Mary<br />

• CP(U2): Jane or Mary<br />

2. Filter:<br />

• By (1): she or her refers to CB<br />

• By (2): CB(U2) is Jane<br />

• By (3): {Jane, Jane, flowers} & {Mary, Mary, flowers} are ruled out<br />

3. Classify:<br />

(a)<br />

(b)<br />

• CF(U2): {Jane, Mary, flowers}<br />

• CB(U2): Jane<br />

• CP(U2): Jane<br />

• So, CB(U2) ≠ CB(U1), CB(U2) = CP(U2)<br />

• i.e smooth shift<br />

• CF(U2): {Mary, Jane, flowers}<br />

• CB(U2): Jane<br />

6


• CP(U2): Mary<br />

• So, CB(U2) ≠ CB(U1), CB(U2) ≠ CP(U2)<br />

• i.e rough shift<br />

4. Select: smooth shift<br />

quindi:<br />

(1) Jane likes Mary<br />

(2) She often brings her flowers<br />

la CT dà come interpretazione di (2)<br />

“Jane often brings Mary flowers (she=Jane, her=Mary)<br />

(3) She chats with the young woman for ages<br />

1. Construct:<br />

• CF(U3): {Jane, Mary} or {Mary, Jane} or {Jane,Jane} or {Mary, Mary}<br />

• CB(U3): Jane or Mary or flowers or NIL<br />

• CP(U3): Jane or Mary<br />

2. Filter:<br />

• By (1): CB(U3) is Jane or Mary<br />

• By (2): CB(U3) is Jane<br />

• By (3): {Jane, Jane} & {Mary, Mary} are ruled out<br />

3. Classify:<br />

(a)<br />

(b)<br />

• CF(U3): {Jane, Mary}<br />

• CB(U3): Jane<br />

• CP(U3): Jane<br />

• So, CB(U3) = CB(U2), CB(U3) = CP(U3)<br />

• continue<br />

• CF(U3): {Mary, Jane}<br />

• CB(U3): Jane<br />

• CP(U3): Mary<br />

• So, CB(U3) = CB(U2), CB(U3) ≠ CP(U3)<br />

• retain<br />

4. Select: continue<br />

Quindi,<br />

(1) Jane likes Mary<br />

(2) She often brings her flowers = Jane often brings Mary flowers<br />

(3) She chats with the young woman for ages = Jane chats with Mary for ages<br />

7


2.2 Sintagmi anaforici a testa piena<br />

Sintagmi Anaforici a Testa Nominale Piena<br />

• coreferenza<br />

– antecedente e anafora fanno riferimento allo stesso oggetto<br />

• other-anafora<br />

– sintagma anaforico modificato da other o another<br />

– l’antecedente fornisce l’insieme complemento dell’anafora<br />

• bridging<br />

– sintagmi nominali anaforici (normalmente) introdotti dall’articolo definito<br />

– l’antecedente e’ legato all’anafora ma non tramite coreferenza, ad esempio tramite<br />

una relazione meronimica (parte-tutto)<br />

8

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!