13.07.2015 Views

Capitale intellettuale e amministrazioni pubbliche - Cultura in Cifre

Capitale intellettuale e amministrazioni pubbliche - Cultura in Cifre

Capitale intellettuale e amministrazioni pubbliche - Cultura in Cifre

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

CAPITALE INTELLETTUALE E AMMINISTRAZIONI PUBBLICHE84rapidamente crescendo e si sta manifestando <strong>in</strong> diversi modi, stimolatodall'esplosione della disponibilità di testo elettronico on-l<strong>in</strong>e che ha fattodiventare cruciale la possibilità di estrarre da esso dati, <strong>in</strong>formazioni econoscenza rilevante per scopi di bus<strong>in</strong>ess. Emerge, più <strong>in</strong> generale, daun lato, la necessità di strumenti <strong>in</strong> grado di <strong>in</strong>terrogare i documenti sullabase della semantica dei contenuti, <strong>in</strong> modo da catturare i concetti rilevantiche riguardano fatti di bus<strong>in</strong>ess descritti all'<strong>in</strong>terno del testo elettronico;dall'altro lato, di trattare le differenze di l<strong>in</strong>gua esistenti tra i diversipaesi (per esempio per la produzione contemporanea di report <strong>in</strong> l<strong>in</strong>guediverse), la quale fa crescere l'<strong>in</strong>teresse verso le traduzioni automatiche.Per soddisfare le necessità degli utenti occorrono algoritmiche potenti,<strong>in</strong> grado di riconoscere concetti all'<strong>in</strong>terno del testo elettronico e tali dapermettere di superare il collo di bottiglia che limita la gestione dellaconoscenza contenuta nei documenti elettronici. Infatti, trattare il l<strong>in</strong>guaggionaturale per via automatica, ai f<strong>in</strong>i della sua comprensione, èun'attività estremamente complessa che <strong>in</strong>clude una varietà di sottoattivitàf<strong>in</strong>alizzate alla trasformazione di un documento testuale <strong>in</strong> unastruttura trattabile per via automatica.Il primo passo di ogni task di natural language process<strong>in</strong>g è l'analisis<strong>in</strong>tattica che riguarda la determ<strong>in</strong>azione della struttura grammaticaledi una frase. Per fare questo esistono algoritmi <strong>in</strong> grado di operare ilpart-of-speech tagg<strong>in</strong>g (POS-tagg<strong>in</strong>g) attraverso il quale è possibiledef<strong>in</strong>ire normalmente il ruolo giocato, <strong>in</strong> una frase, da un term<strong>in</strong>e(nome, aggettivo, verbo, avverbio, eccetera). L'analisi s<strong>in</strong>tattica soffredell'ambiguità del l<strong>in</strong>guaggio naturale e della dipendenza del contestoche genera una complessità comb<strong>in</strong>atoria nel riconoscimento dellestrutture s<strong>in</strong>tattiche. Gli algoritmi più avanzati sono <strong>in</strong> grado di annotarecorrettamente il 95% di term<strong>in</strong>i presenti <strong>in</strong> un testo.Il secondo passo è l'analisi semantica nella quale è effettuata la disambiguazionedel senso di un term<strong>in</strong>e e il pars<strong>in</strong>g della semantica. Ladisambiguazione riguarda la scelta di uno dei possibili significati che unterm<strong>in</strong>e può avere all'<strong>in</strong>terno di una frase usando delle euristiche; il pars<strong>in</strong>gdella semantica consiste nell'identificazione di porzioni di frasiaventi un preciso significato mappato <strong>in</strong> apposite strutture formali checonsentono l'<strong>in</strong>terrogazione del testo usando l<strong>in</strong>guaggi ad hoc.Le tecniche di natural language process<strong>in</strong>g sono, <strong>in</strong>oltre, alla basedella mach<strong>in</strong>e-translation, che consiste nella applicazione di algoritmibasati su euristiche per la traduzione automatica da una l<strong>in</strong>gua adun'altra. Il problema della traduzione è legato alla capacità di disambiguarei significati dei term<strong>in</strong>i e risolvere la dipendenza dal contesto.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!