13.07.2015 Views

STRUTTURE SINTATTICHE DALL'ANALISI COMPUTAZIONALE DI ...

STRUTTURE SINTATTICHE DALL'ANALISI COMPUTAZIONALE DI ...

STRUTTURE SINTATTICHE DALL'ANALISI COMPUTAZIONALE DI ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

ARCHITETTURA LIVELLO ITokenizzatoreFormePolirematicheMultiwords/PolywordsAnalisi MorfologicaLemmatizzazioneGuessingMorfologicoDatabase LinguisticiLessici Specialistici diAbbreviazioni e FormeDialettaliSeparazione inFrasiFig.1 Suite di Annotazione – Primo Livello: Tokenizzazione, Lessico eTaggingLa creazione del treebank vero e proprio corrisponde alle due ultimeoperazioni di Fig. 2 – Shallow Parsing e Mapping Funzionale (Delmonte 2000) –ed è quindi l’ultimo passo di un processo di analisi abbastanza lungo ed elaborato,durante il quale il testo iniziale viene completamente trasformato. L’analisiautomatica del parser viene poi passata alla verifica manuale e infine allacollazione da parte di un supervisore che è responsabile della eventualeunificazione delle “varianti” strutturali proposte dai diversi annotatori per unostesso tipo strutturale. Operazione questa molto delicata e in alcuni casi chepotrebbe richiedere la rielaborazione completa di porzioni non indifferenti delTreebank stesso, come è accaduto nel progetto SI-TAL per le strutturecomparative e quantificate, di cui discuteremo in §##.4

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!