29.07.2013 Views

Come è avvenuto per l'espressione “ Società Industriale ...

Come è avvenuto per l'espressione “ Società Industriale ...

Come è avvenuto per l'espressione “ Società Industriale ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

TRIBUNALE DI NAPOLI<br />

NONA SEZIONE PENALE<br />

COLLEGIO <strong>“</strong>C”<br />

Presidente: Dott.ssa Maria Aschettino<br />

Proc. pen. No. 20491/09 R.G. (No. 1138/07 R.G. PM)<br />

c/ Fiume Gennaro + altri<br />

PERIZIA IN MATERIA DI COMPARAZIONE DI VOCI<br />

RELAZIONE TECNICA<br />

In data 22 Ottobre 2012 il Tribunale di Napoli conferiva incarico <strong>per</strong>itale ai<br />

sottoscritti Prof. Mirko Grimaldi, docente di Linguistica Generale alla<br />

Università del Salento (Lecce) e al Prof. Giuseppe Mastronardi, docente di<br />

Informatica Medica e Sicurezza Informatica al Politecnico di Bari,<br />

nell‟ambito del succitato procedimento in materia di confronto di voci.<br />

Ai Periti veniva formulato un quesito consistente nel<br />

<strong>“</strong>riconoscimento del soggetto parlante intervistato … della registrazione<br />

relativa all’audio del file video-audio comparso sul sito internet<br />

www.repubblica.it il 9 gennaio 2008 … quindi se una delle voci registrate<br />

può essere attribuita a quella dell’imputato Marco Nonno, previo esame della<br />

comparazione con altri file registrati, nei quali <strong>è</strong> indiscussa la partecipazione<br />

del Nonno come interlocutore e facciamo riferimento alle registrazioni<br />

dell’interrogatorio di garanzia … sia delle intercettazioni … trascrivere, con<br />

l’individuazione di tutti i soggetti interlocutori … in particolare se una delle<br />

voci dell’interlocutore <strong>è</strong> quella dell’imputato Nonno … di prelevare un<br />

saggio fonico ex novo sulla <strong>per</strong>sona dell’imputato (se ritenuto necessario)”.<br />

I Periti venivano autorizzati a ritirare sia dal Tribunale sia dalla Procura i<br />

supporti informatici contenenti le registrazioni da esaminare e mettere a<br />

confronto, nonché a prendere visione degli atti del giudizio presenti presso la<br />

Cancelleria del Tribunale, ad avvalersi del proprio mezzo di trasporto <strong>per</strong> i<br />

trasferimenti e di collaboratori esecutivi, due al massimo e concessi 60 giorni<br />

dall‟inizio delle o<strong>per</strong>azioni <strong>per</strong>itali che i Periti fissavano <strong>per</strong> il lunedì 29<br />

ottobre 2012 alle ore 9:30 presso il Dipartimento di Elettrotecnica ed<br />

Elettronica del Politecnico di Bari, sito in Bari alla Via Orabona n.4, a<br />

condizione di poter disporre <strong>per</strong> quella data di tutti i re<strong>per</strong>ti necessari<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi


all‟espletamento dell‟incarico. L‟udienza veniva rinviata al 16 gennaio 2013<br />

<strong>per</strong> l‟escussione dei Periti.<br />

I Periti, nel corso dell‟udienza di incarico, ottenevano il CD contenente il<br />

<strong>“</strong>File audio-video di repubblica.it” e formalizzavano in udienza richiesta al<br />

P.M., Dott. Antonello Ardituro, affinché fossero messe a loro disposizione<br />

anche le altre registrazioni (interrogatorio di garanzia, udienza del 14-02-2011<br />

e intercettazioni sull‟utenza in uso all‟imputato Marco Nonno).<br />

Tuttavia, solo in data 8 novembre 2012 si otteneva copia dei succitati<br />

re<strong>per</strong>ti tramite il C.T. del P.M., Ing. Roberto Porto, alla cui presenza si poté<br />

dare inizio alle o<strong>per</strong>azioni <strong>per</strong>itali con l‟esame dei re<strong>per</strong>ti e indicazione sulle<br />

metodiche da utilizzare (Allegato #1).<br />

Considerata, inoltre, la insistente richiesta del CTP, Ing. Andrea Paoloni, di<br />

far rilasciare un saggio fonico da parte dell‟imputato Marco Nonno, al fine di<br />

ottenere un riferimento inequivocabile e defedato da qualunque impurità<br />

sonora (sovrapposizione di voci e rumori di fondo), in data 17 dicembre 2012<br />

alle ore 14:30 si effettuò la registrazione del saggio fonico del suddetto<br />

imputato, in Bari presso lo studio del Prof. Mastronardi al Politecnico di Bari<br />

(Allegato #2). Ovviamente il testo del saggio <strong>è</strong> stato preventivamente<br />

predisposto sulla base dei contenuti della trascrizione dell‟intervista,<br />

migliorata, dai sottoscritti <strong>per</strong>iti, rispetto a quella già presente nel fascicolo<br />

processuale.<br />

I CTP delle rispettive parti sono stati costantemente informati delle varie<br />

fasi durante l‟espletamento delle o<strong>per</strong>azioni <strong>per</strong>itali.<br />

SEQUENZA DELLE FASI OPERATIVE<br />

1. selezione delle frasi da utilizzare <strong>per</strong> il confronto nei vari tracciati sonori;<br />

2. estrazione dei fonemi oggetto di confronto dalle suddette frasi;<br />

3. valutazione dei tracciati spettrografici e misura delle formanti (frequenze<br />

caratteristiche) dei parlatori, ottenuti con gli applicativi PRAAT e AR;<br />

4. confronto parametrico delle formanti e relative valutazioni mediante AR<br />

(Analisi Regressiva) in termini di scostamento medio <strong>per</strong>centuale;<br />

5. valutazione comparata, oggettiva e ripetibile, dei risultati.<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

2


ACCERTAMENTI ESPLETATI<br />

Appurato che i tracciati audio disponibili fossero sufficienti <strong>per</strong> numero di<br />

campioni estraibili e <strong>per</strong> idonea qualità sonora, risultando la dinamica del<br />

parlato, nelle parti utilizzabili, maggiore del rumore di almeno 10 dB, si <strong>è</strong><br />

potuto procedere con la successiva analisi comparativa.<br />

Alla presente relazione si allegano le tabelle dei fonemi analizzati con le<br />

ripetibili valutazioni metriche delle formanti, oggettivamente ottenute<br />

tramite il software PRAAT, rispettivamente relative alle vocali contenute nei<br />

fonemi delle voci analizzate. Il software AR, che richiede una consolidata<br />

es<strong>per</strong>ienza <strong>per</strong> l‟estrazione delle formanti, <strong>è</strong> stato invece utilizzato <strong>per</strong> le<br />

valutazioni comparative.<br />

Si allega pure una serie di stampe, che fanno parte integrante della<br />

presente relazione scritta, relative ai grafici comparativi ricavati dai fonemi<br />

selezionati, e relativi al confronto parametrico delle formanti di ciascuna<br />

delle voci analizzate. Ciascun grafico rappresenta l'andamento dei baricentri<br />

medi delle formanti relative alle singole vocali ritenute più sonore nei<br />

rispettivi saggi, e cio<strong>è</strong> la /a/, la /e/ e la /o/ pronunciate all'interno delle parole<br />

selezionate. Ogni grafico presenta anche gli scostamenti medi <strong>per</strong>centuali.<br />

Sono stati esclusi dal confronto i fonemi contenenti la vocale /u/, poiché<br />

iposonora e <strong>per</strong>ciò poco caratterizzante, mentre sono stati inseriti quelli<br />

contenenti la vocale /i/ che, pur essendo i<strong>per</strong>sonora e determini talvolta una<br />

elevata variazione intra-parlatore, <strong>è</strong> stata considerata determinante ai fini<br />

della comparazione.<br />

Si <strong>è</strong> ritenuto, preliminarmente, di mettere a confronto la voce attribuita a<br />

Marco Nonno in due telefonate prese a campione, tra quelle intercettate<br />

(rispettivamente citate come F24123-18461597-SPEECH-RAW-19424360 e<br />

F24123-18462438-SPEECH-RAW-19425680), al fine di testare la<br />

variabilità intra-parlatore della voce del suddetto riferita a colloqui<br />

spontanei, come possono essere quelli telefonici. Tale massima variabilità si<br />

<strong>è</strong> attestata entro il 14% come <strong>per</strong> la /a/, <strong>per</strong> arrivare fino al 14,6% <strong>per</strong> la<br />

vocale /i/ (variazione considerata fisiologica).<br />

Si <strong>è</strong>, infatti, ottenuto:<br />

• <strong>per</strong> la vocale /a/: 2.3 - 14.0% < 15% ( + )<br />

• <strong>per</strong> la vocale /e/: 3.6 - 12.3% < 15% ( + )<br />

• <strong>per</strong> la vocale /i/: 2.8 - 14.6% < 15% ( + )<br />

• <strong>per</strong> la vocale /o/: 1.7 - 8.7% < 10% ( + + ) OK<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

3


Mettendo insieme la campionatura delle intercettazioni e confrontando<br />

queste con la voce del saggio fonico, rilasciato al telefono dall‟imputato<br />

Marco Nonno, sono stati ottenuti i seguenti risultati:<br />

• <strong>per</strong> la vocale /a/: 3.6 - 13.6% < 15% ( + )<br />

• <strong>per</strong> la vocale /e/: 3.6 - 8.6% < 10% ( + + )<br />

• <strong>per</strong> la vocale /i/: 5.0 - 13.5% < 15% ( + )<br />

• <strong>per</strong> la vocale /o/: 1.8 - 8.2% < 10% ( + ) OK<br />

Questi indici, che evidenziano la piena compatibilità delle due voci messe<br />

a confronto (la voce delle intercettazioni <strong>è</strong> effettivamente corrispondente a<br />

quella dell‟imputato Marco Nonno), consentono di utilizzare indifferentemente<br />

una delle due campionature <strong>per</strong> i successivi confronti.<br />

A questo punto si <strong>è</strong> proceduto a mettere a confronto i campioni di voce<br />

dell‟Anonimo interlocutore dell‟intervista (file <strong>“</strong>Pianura”) con la voce<br />

dell‟imputato Marco Nonno presente nel saggio rilasciato al telefono.<br />

Si tratta dei segmenti vocalici il più possibile comuni utilizzati <strong>per</strong> estrarre<br />

le armoniche formanti dalle voci analizzate, al fine di evidenziare le<br />

caratteristiche sonore delle voci dei rispettivi parlatori.<br />

Sono stati ottenuti i seguenti risultati:<br />

• <strong>per</strong> la vocale /a/: 10.8 - 18.5% > 15% ( – )<br />

• <strong>per</strong> la vocale /e/: 6.4 - 9.4% < 10% ( + + )<br />

• <strong>per</strong> la vocale /i/: 7.1 - 24.0% > 20% ( – – )<br />

• <strong>per</strong> la vocale /o/: 5.6 - 10.2% ~ 10% ( + + ) KO<br />

Dal confronto tra la voce dell‟imputato Marco Nonno e quella<br />

dell‟Anonimo intervistato (file <strong>“</strong>Pianura”), nonostante fossero emerse<br />

significative analogie sui fonemi contenenti le vocali /e/ e /o/, <strong>è</strong> possibile<br />

solo esprimere una compatibilità parziale. In altri termini non <strong>è</strong> possibile<br />

formulare un giudizio di compatibilità semplice e tantomeno piena, essendo<br />

particolarmente divergenti, tra le due campionature, i fonemi contenenti la<br />

vocale /i/, nonostante siano emerse, nella rappresentazione formantica di<br />

questa vocale, numerose anomalie in corrispondenza dei valori della prima<br />

formante (F1), insolitamente su<strong>per</strong>iore ai 400 Hz.<br />

Analogo risultato <strong>è</strong> stato confermato dal confronto tra la voce<br />

dell‟imputato Marco Nonno, presente nelle intercettazioni, e quella<br />

dell‟Anonimo intervistato (file <strong>“</strong>Pianura”), in cui la divergenza sulla vocale<br />

/a/ <strong>è</strong> risultata maggiormente esaltata:<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

4


• <strong>per</strong> la vocale /a/: 4.4 - 20.5% > 20% ( – – )<br />

• <strong>per</strong> la vocale /e/: 2.7 - 4.4% < 5% ( + + + )<br />

• <strong>per</strong> la vocale /i/: 2.6 - 36.4% > 30% ( – – – )<br />

• <strong>per</strong> la vocale /o/: 5.8 - 7.0% < 10% ( + + ) KO<br />

A compendio della presente relazione tecnica si possono aggiungere<br />

alcune considerazioni in merito all‟analisi linguistica effettuata a più livelli<br />

sulle voci dell‟anonimo e dell‟imputato che, seppure soggettive, sono frutto<br />

di valutazione es<strong>per</strong>ta.<br />

Aspetti propriamente linguistici<br />

In linea generale, si <strong>è</strong> potuto rilevare che, da un punto di vista sociolinguistico,<br />

<strong>per</strong> quanto ci <strong>è</strong> dato osservare dal materiale a nostra<br />

disposizione, l‟Anonimo presenta una dialettofonia più marcata rispetto<br />

all‟imputato Marco Nonno. In altri termini, l‟espressione italiana<br />

dell‟anonimo, soprattutto a livello intonativo, <strong>è</strong> maggiormente influenzato<br />

dalla varietà dialettale nativa di quanto non lo sia quello dell‟imputato<br />

(ascoltato anche in un contesto naturale prima e dopo il prelievo del suo<br />

saggio fonico). Ciò porta a presumere un più alto livello di istruzione<br />

dell‟imputato.<br />

Aspetti legati alla fonazione<br />

A livello fonetico, analizzando attentamente la voce dell‟imputato Marco<br />

Nonno e quella dell‟Anonimo, emerge una <strong>per</strong>cepibile divergenza del timbro<br />

vocale, poiché, in linea di massima, si può attribuire un timbro „grave‟ alla<br />

voce dell‟Anonimo e un timbro „medio‟ alla voce del Nonno.<br />

La voce umana può essere, infatti, classificata in base a tre registri vocali:<br />

„alto‟, „medio‟ e „grave‟. Non appartenendo le due voci messe a confronto ai<br />

due registri vocali estremi, può succedere che la <strong>per</strong>cezione del registro<br />

„medio‟ sia a volte confuso con quello „grave‟, dal momento che il processo<br />

di fonazione non <strong>è</strong> stabile ma oscilla all‟interno di un „range‟ che può andare<br />

da un tono „medio‟ a uno „grave‟ e viceversa.<br />

Com‟<strong>è</strong> noto (cfr. Kent, 1997), il timbro della voce <strong>è</strong> dato dalla lunghezza<br />

delle corde vocali: quanto più sono lunghe tanto più il suono che producono<br />

<strong>è</strong> grave e scuro, viceversa quanto più sono piccole tanto più acuta sarà la<br />

voce. Un altro aspetto anatomico che contribuisce alla peculiarità timbrica di<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

5


una voce <strong>è</strong> la conformazione dell‟apparato fonatorio che ha la funzione di<br />

risuonatore, compresi i seni paranasali, che, essendo vuoti, fungono da<br />

anch‟essi da risuonatori. <strong>Come</strong> ogni strumento musicale, che ha risuonatori<br />

diversi, produce caratteristiche timbriche differenti, allo stesso modo<br />

l‟apparato fonatorio umano, diverso da soggetto a soggetto, produce voci<br />

diversificate da un punto di vista timbrico. Ciò <strong>è</strong> dovuto a un fatto<br />

anatomico, quindi non controllabile dal parlante, se non dopo lunghi e<br />

faticosi addestramenti mirati all‟uso professionale dell‟apparato fonatorio.<br />

Inoltre, da un analisi attenta della fonazione del Nonno si <strong>è</strong> potuto<br />

individuare una leggera, ma pur sempre presente, blesità nella produzione<br />

dei suoni /s/ e /z/ (disturbo della fonazione che deforma la pronuncia di<br />

alcune consonanti, sia in posizione iniziale che all‟interno di parola), come<br />

nelle parole „sito‟ e „illuminazione‟ rilevate nel saggio che, invece, non sono<br />

mai state <strong>per</strong>cepite nella fonazione dell‟anonimo.<br />

Bibliografia<br />

Kent R. D., (1997), The Speech Sciences, Singular Publishing, Group, San Diego-London.<br />

Trattasi, <strong>per</strong>tanto, di voci appartenenti a soggetti diversi, nonostante si<br />

evidenzino <strong>per</strong> le vocali /e/ e /o/ significative analogie, che non assumono<br />

specifica rilevanza, poiché da sole non consentono di formulare un positivo<br />

giudizio identificativo.<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

6


CONCLUSIONE<br />

Dall'osservazione delle valutazioni metriche e dei grafici prodotti al fine<br />

di confrontare la voce dell‟imputato Marco Nonno e quella dell‟Anonimo<br />

intervistato, nonostante fossero emerse significative analogie, in particolare<br />

<strong>per</strong> i fonemi contenenti le vocali /e/ e /o/, <strong>è</strong> possibile solo esprimere una<br />

compatibilità parziale. In altri termini non <strong>è</strong> possibile esprimere un<br />

giudizio di compatibilità semplice e tantomeno piena, essendo<br />

particolarmente divergenti, tra le due campionature, i fonemi contenenti la<br />

vocale /i/, che seppure fossero escluse <strong>per</strong> le citate anomalie di rilevazione<br />

sulla prima formante, sarebbero comunque confermate ai fini identificativi<br />

dalla più contenuta, ma evidente, divergenza ottenuta sui fonemi contenenti<br />

la vocale /a/.<br />

Trattasi, <strong>per</strong>tanto, di voci appartenenti a soggetti diversi, nonostante si<br />

evidenzino <strong>per</strong> le vocali /e/ e /o/ significative analogie, che non assumono<br />

specifica rilevanza, poiché da sole non consentono di formulare un positivo<br />

giudizio identificativo.<br />

Bari, 11 gennaio 2013<br />

i Periti<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

7


METODICA IMPIEGATA<br />

Le o<strong>per</strong>azioni <strong>per</strong>itali sono state eseguite, facendo uso di strumentazione<br />

idonea e impiegando il metodo parametrico, mediante i software PRAAT e AR,<br />

costituito da una procedura scientificamente corretta, specie in ambito<br />

giudiziario, <strong>per</strong> estrarre le caratteristiche delle voci dei parlatori (le formanti del<br />

parlato) e confrontare queste caratteristiche, riferite a diverse campionature.<br />

Il metodo parametrico consiste nella valutazione metrica delle frequenze<br />

caratteristiche dei parlatori messi a confronto, attraverso gli spettrogrammi delle<br />

armoniche formanti, o formogrammi (come riportato nella pubblicazione [1]).<br />

STRUMENTAZIONE IMPIEGATA<br />

La strumentazione utilizzata consiste in:<br />

computer Pentium IV 2.8 MHz <strong>per</strong> l'analisi, la visualizzazione e la stampa<br />

dei formogrammi dei segnali acustici acquisiti in forma numerica con<br />

frequenza di campionamento pari a 11025 Hz, al fine di ottimizzare la<br />

risoluzione in frequenza dei risultati calcolati su finestre di 4096 campioni;<br />

doppio filtro parametrico digitale TECHNICS Mod. DSP SH-GE90, <strong>per</strong><br />

migliorare la qualità d'ascolto delle registrazioni;<br />

impianto di amplificazione TECHNICS Mod. SU-VZ220, connesso anche<br />

al computer e dotato di cuffie dinamiche <strong>per</strong> l'ascolto;<br />

cuffia anti-noise SENNHEISER mod. HDC-451, usata <strong>per</strong> la trascrizione<br />

dei testi.<br />

SELEZIONE DEI FONEMI<br />

Si procede ad isolare i segmenti fonici più significativi e meglio utilizzabili<br />

<strong>per</strong> la comparazione, dopo aver preso in esame <strong>per</strong> ciascuno di essi il rapporto<br />

segnale/rumore (S/N). Tale parametro viene determinato analizzando i segmenti<br />

delle conversazioni, comprensivi delle pause caratterizzate da assenza di voce, e<br />

misurando il rapporto tra il livello medio di potenza dell'inviluppo del segnale<br />

vocale, e quello relativo alle pause. Tali misure portano a selezionare segmenti<br />

fonici con rapporto S/N maggiore di 10 dB.<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

8


Per quanto concerne i saggi fonici messi a confronto, si <strong>è</strong> soliti effettuare<br />

elaborazioni i cui risultati qualitativi, espressi dai grafici degli andamenti<br />

temporali dei segnali analizzati, mettono in luce le caratteristiche<br />

fondamentali delle registrazioni, al fine di valutare la loro usabilità.<br />

I fonemi selezionati vengono divisi in classi: ciascuna classe di fonemi <strong>è</strong><br />

appartenente alla voce di un unico soggetto analizzato e alla relativa vocale<br />

contenuto (es.: <strong>“</strong>Vocale /A/”).<br />

ANALISI COMPARATIVA<br />

Per la valutazione metrica, <strong>è</strong> necessario ottenere misure inequivocabili e<br />

ripetibili mediante l'analisi degli spettrogrammi, al fine di determinare<br />

numericamente le componenti armoniche fondamentali. Allo scopo di rendere<br />

maggiormente comprensibile il concetto di "componenti armoniche<br />

fondamentali", diventa necessaria ed opportuna una piccola premessa<br />

concernente alcuni elementi di acustica.<br />

Un'onda sonora, nella sua espressione più semplice, <strong>è</strong> generata dalla<br />

vibrazione longitudinale (nella direzione di propagazione) di particelle d'aria;<br />

esse cio<strong>è</strong> si trasmettono <strong>per</strong> compressione e rotazione. Il tipo più semplice di<br />

propagazione <strong>è</strong> quello sinusoidale; il suono così prodotto si indica come<br />

"suono puro".<br />

Il tempo occorrente <strong>per</strong> compiere un ciclo completo <strong>è</strong> chiamato "<strong>per</strong>iodo". I<br />

parametri che definiscono il suono puro sono: l'ampiezza massima di<br />

vibrazione, che esprime l'intensità del suono, ed il numero di <strong>per</strong>iodi completi<br />

che occorrono nell'intervallo di un secondo; quest'ultimo numero <strong>è</strong><br />

rappresentato dalla frequenza, che si misura in cicli al secondo o Hertz (Hz).<br />

La frequenza <strong>è</strong> quindi uno dei parametri fondamentali delle vibrazioni<br />

acustiche. Da questo punto di vista si possono definire una frequenza minima<br />

pari a circa 30 Hz, ed una massima pari a circa 18.000 Hz, che delimitano la<br />

gamma delle frequenze udibili; la gamma delle frequenze inferiori a 30 Hz <strong>è</strong><br />

quella degli infrasuoni, quella su<strong>per</strong>iore a 18.000 Hz <strong>è</strong> quella degli ultrasuoni.<br />

Il suono fondamentale che si produce nella glottide, grazie alle variazioni<br />

<strong>per</strong>iodiche della pressione dell'aria che passa tra le corde vocali, dà luogo,<br />

nelle cavità di risonanza, a numerose armoniche (fino a 11).<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

9


Le armoniche si dividono in gruppi di frequenze sonore "gravi" e "acute".<br />

Questi due gruppi concorrono a rappresentare le formanti del suono.<br />

Foneticamente, l'elemento più caratterizzante della voce umana <strong>è</strong><br />

rappresentato dalla componente armonica fondamentale o "pitch" che <strong>è</strong> la<br />

prima armonica significativa, ovvero la più bassa tra le diverse armoniche a<br />

più alta intensità sonora.<br />

Nell'eloquio normale ogni <strong>per</strong>sona mantiene la fondamentale entro una<br />

determinata gamma: più stretta <strong>per</strong> voci monotone, più ampie <strong>per</strong> voci<br />

melodiose. Una voce maschile bassa ha un pitch che scende anche al di sotto<br />

di 80 Hz; una voce maschile media <strong>è</strong> di circa 110 Hz; una voce maschile<br />

strillata su<strong>per</strong>a anche i 300 Hz. La voce femminile ha, invece, una frequenza<br />

fondamentale tipicamente più alta, da 150 a 280 Hz.<br />

Ovviamente le fasi concitate di un dialogo spontaneo possono far variare le<br />

componenti fondamentali di una voce, ma sempre entro certi limiti, ed <strong>è</strong> <strong>per</strong><br />

questo che <strong>è</strong> sempre possibile risalire alle armoniche formanti del tratto più<br />

sonoro di un fonema (la vocale).<br />

Dalla visualizzazione dei formogrammi, mediante AR o altro software, e<br />

dalla valutazione metrica dei singoli fonemi esaminati <strong>è</strong> possibile ricavare i<br />

valori caratteristici delle formanti così identificate: F0 (pitch o frequenza<br />

fondamentale), F1, F2, F3 rispettivamente <strong>per</strong> la prima, seconda e terza<br />

formante, ma anche F4 e F5, se visibili. Tali valori, corrispondenti alle<br />

porzioni di frequenze più stabili, vengono tabellati ed allegati alla relazione<br />

scritta (ne sono parte integrante).<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

10


Successivamente gli stessi valori vengono espressi in forma grafica<br />

riportando ciascuna formante in funzione della precedente [coordinate (x,y):<br />

(F0,F1) – (F1,F2) – (F2,F3) – etc.].<br />

In questo modo, sul piano delle formanti viene individuato <strong>per</strong> ciascun<br />

fonema un punto indicato a seconda del parlatore: cerchietto (° = voce di<br />

riferimento), quadratino (prima voce da confrontare), triangolo (seconda<br />

voce), asterisco (terza voce). Si ottiene, così, la valutazione dello scostamento<br />

medio <strong>per</strong>centuale tra i baricentri delle relative aree occupate dalle suddette<br />

nuvole di punti omogenei. Tali scostamenti, contrassegnati rispettivamente<br />

dai valori B1-B2-B3-etc, sono riportati sui grafici di confronto, in basso.<br />

Sugli stessi grafici viene tracciata la linea spezzata passante <strong>per</strong> i baricentri<br />

delle suddette aree, al fine di mettere in evidenza nel confronto l'andamento<br />

delle caratteristiche dei rispettivi parlatori.<br />

Quando i valori Bi risultano tutti minori del 5% sussiste una significativa<br />

analogia di fonazione, oltre il 5% l‟analogia <strong>è</strong> meno significativa, oltre il 10%<br />

l‟analogia diventa più lasca. Per valori molto maggiori del 15%, anche <strong>per</strong><br />

una sola vocale, sussiste una sicura divergenza di voce. Infatti, <strong>per</strong> la<br />

determinazione della compatibilità <strong>è</strong> necessario che tali valutazioni siano<br />

confermate <strong>per</strong> tutti i set di vocali messi a confronto.<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

11


E‟ comunque importante e opportuno non ignorare la scala comparativa di<br />

valutazione, a fini identificativi, definita e adottata già dal 1997 in Italia dal<br />

Servizio di Polizia Scientifica; essa si articola nei seguenti gradi di<br />

compatibilità:<br />

NON COMPATIBILITA’ o INCOMPATIBILITA’ – quando <strong>è</strong> presente<br />

almeno un elemento che <strong>per</strong>mette di escludere l‟identificazione;<br />

COMPATIBILITA’ PARZIALE – quando si riscontrano significativi<br />

elementi di similitudine, ma non <strong>è</strong> possibile rilevare caratteristiche che<br />

<strong>per</strong>mettano di <strong>per</strong>venire ad un giudizio di assoluta identificazione;<br />

COMPATIBILITA’ (SEMPLICE) – quando si riscontrano numerosi e<br />

significativi elementi di similitudine, ma non <strong>è</strong> possibile evidenziare<br />

caratteristiche individualizzanti tali da poter esprimere un giudizio di <strong>“</strong>piena<br />

compatibilità”;<br />

COMPATIBILITA’ TOTALE o PIENA COMPATIBILITA’ – quando<br />

si riscontrano numerosi e significativi elementi di similitudine e si<br />

evidenziano comuni caratteristiche individualizzanti.<br />

N.B. La parziale <strong>“</strong>compatibilità”, che può essere espressa anche attraverso una<br />

<strong>per</strong>centuale di attendibilità del confronto, non può da sola costituire<br />

grave indizio di colpevolezza; e <strong>per</strong>ò un siffatto giudizio <strong>è</strong> certamente<br />

idoneo a rafforzare l‟indizio costituito dal riconoscimento o<strong>per</strong>ato da un<br />

testimone; così come un giudizio di <strong>“</strong>incompatibilità” diminuisce o<br />

addirittura vanifica la portata di alcun altro elemento di prova.<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

12


Riferimenti Bibliografici:<br />

[1] Amoruso V., Mastronardi G.: Fonemi.cla: Classificazione di Fonemi <strong>per</strong> la Caratterizzazione<br />

del Parlatore mediante Formogramma, Fondazione Ugo Bordoni - Giornata di Studio su<br />

"Caratterizzazione del Parlatore", Roma 23-24 novembre 1995<br />

[2] Grimaldi M.: Aspetti pragmalinguistici, caratterizzazione del parlante e attività investigativa,<br />

Caratterizzazione del Parlatore, a cura di F. Fedi, A. Paoloni, Fondazione Ugo Bordoni,<br />

Roma, Vol. XXIII: 109-120; 1996<br />

[3] Stafford T., Webb M., Mente Locale, Apogeo Saggi 2005<br />

[4] Piaget J.; Psicologia della <strong>per</strong>cezione, Neewton Compton; 1973<br />

[5] Battisti C., Fonetica Generale, Hoepli 1938<br />

[6] Hardcastle W., Laver J., The handbook of phonetic sciences, Blackwell Pbl.Ltd. 1997<br />

[7] Eco U., Dire quasi la stessa cosa, Bompiani 2003<br />

[8] Paoloni A., Zavattaro D., Intercettazioni telefoniche e ambientali, Centro Scientifico Editore,<br />

2007<br />

[9] Bellucci P., A Onor del Vero, UTET 2002<br />

[10] Delogu C., Paoloni A., Ridolfi P., Vagges K., Intelligibility of speech produced by text to<br />

speech systems in good and thelephonic conditions, Acta Acustica Vol. 3 N°1 pp.89-96<br />

[11] Ibba G., Bianchi F.(1969), Studio preliminare <strong>per</strong> l’adattamento alla lingua italiana del<br />

metodo delle parole rimate nelle prove di comprensibilità, Rel FUB<br />

[12] Klevans R., Rodman R.D., Voice Recognition, Artech House-Norwood-MA, 1997<br />

[13] Lamei, Lori F., Formalizing Knowledge Used in Spectrogram Reading: Acoustic and<br />

Perceptual Evidence from Stops. MIT 1988<br />

[14] Mori L., Paoloni A., Sulla sociolinguistica forense: la costituzione di corpora vocali <strong>per</strong><br />

l’analisi della velocità di articolazione in italiano, Atti delle XIV Giornate del GFS, Viterbo, 4-6<br />

dicembre 2003<br />

[15] Bertinetto P.M., Magno Caldognetto E.. Ritmo e Intonazione, in A. Sobrero, Laterza Bari<br />

1993<br />

[16] Paoloni A., Il riconoscimento del parlante, n° 7/8 della rivista <strong>“</strong>Detective&Crime”, pp. 57-64<br />

(v. All.6); 1997<br />

[17] Paoloni A., De Sario N., Saverione B., La stima delle formanti nel riconoscimento del<br />

parlatore, Fondazione Ugo Bordoni, Roma<br />

[18] Paoloni A., Il riconoscimento del parlatore, Detective&Crime Magazine/Criminalistica – Le<br />

indagini fonetiche<br />

[19] Paoloni A., Note sul riconoscimento del parlante nelle applicazioni forensi con particolare<br />

riferimento al metodo parametrico IDEM, Rivista Italiana di Acustica, Vol. 27 n. 3-4/2003<br />

[20] Bruce E. Koenig, Selected Topics in Forensic Voice Identification, Crime Laboratory Digest,<br />

vol. 20, n. 4, pp. 78-81, 1993<br />

[21] Albano Leoni F., Maturi P., 1995, Manuale di Fonetica, La Nuova Italia Scientifica, Roma<br />

[22] Papçun G., Ladefoged P., Two Voiceprint Cases, UCLA. Working pa<strong>per</strong>s in Phonetics, 31,<br />

1976<br />

[23] Hollien H., The Acustics of Crime – The New Science of Forensic Phonetics, Plenum Press,<br />

New York, 1990<br />

[24] Lindh J., Handling the Voiceprint Issue, Dept. of Linguistics, Stockholm University,<br />

Proceedings FONETIK, 2004<br />

[25] Kersta L.J., Voiceprint Identification, Nature, vol. 196, pp. 1253-1257, 29 Dicembre 1962<br />

[26] MEDIA DUEMILA. Non confondere la biometrica con il <strong>“</strong>grande fratello”, n. 213, mensile di<br />

cultura informatica e ITC della collana <strong>“</strong>I quaderni di Tel<strong>è</strong>ma”, realizzata dalla Fondazione<br />

Ugo Bordoni, Roma, anno XXII - 11 Febbraio 2004<br />

[27] MEDIA DUEMILA. Segno di riconoscimento: la voce, supplemento al n. 250 della colla <strong>“</strong>I<br />

quaderni di Tel<strong>è</strong>ma”, realizzata dalla Fondazione Ugo Bordoni, Roma, Ottobre 2007<br />

[28] Tosi O. Voice Identification. Theory and Legal Applications, University Park Press, Baltimore<br />

1979<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

13


Descrizione del PRAAT<br />

(Software utilizzato <strong>per</strong> l’estrazione delle formanti dai file cut).<br />

PRAAT <strong>è</strong> il software attualmente più usato dalla comunità scientifica<br />

internazionale che di occupa di fonetica acustica ed analisi della voce. Il<br />

software, completamente gratuito, e con un codice open source, <strong>è</strong> stato<br />

sviluppato da Paul Boersma e David Weenink presso l‟università di Amsterdam<br />

(Department of Language and Literature of the Faculty of Humanities):<br />

Boersman, P., Weenink, D. (2011). <strong>“</strong>Praat: doing phonetics by computer<br />

(Version 5.3.38)” [Computer program]. (University of Amsterdam, Amsterdam,<br />

The Netherlands). Uno dei manuali più diffusi <strong>per</strong> PRAAT <strong>è</strong> stato sviluppato da<br />

Will Styler presso il Boulder Phonetics Lab nell‟Università di Colorado (USA):<br />

http://savethevowels.org/praat/.<br />

Una volta che si <strong>è</strong> ottenuta una registrazione audio, PRAAT consente di estrarre<br />

in modo immediato il sonogramma e lo spettrogramma correlati al segnale da<br />

cui partire <strong>per</strong> estrarre le formanti caratteristiche delle vocali e delle consonanti<br />

di linguaggi naturali (dalla F0 in poi), come si può vedere dalla Figura 1.<br />

Figura 1: finestra di editor.<br />

PRAAT effettua il calcolo su una finestra temporale di 50 ms, basta centrare<br />

interattivamente la porte sonora (preferibilmente vocale). Talvolta le vocali<br />

hanno una durata inferiore ai 50 ms e ciò può portare a infettare la valutazione<br />

introducendo le formanti della transizione consonantica. Pertanto, <strong>per</strong> la<br />

presente analisi, non sono state prese in considerazioni vocali la cui lunghezza<br />

risulta inferiore a 50 ms.<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

14


A dimostrazione dell’utilizzo internazionale di PRAAT <strong>per</strong> l’analisi<br />

acustica della voce si allega una bibliografia selezionata:<br />

1. Adank, P. (2003). Vowel Normalization: a <strong>per</strong>ceptual-acoustic study of Dutch vowels.<br />

Unpublished Ph.D. dissertation, University of Nijmegen, Nijmegen.<br />

2. Ee Ling, L., Grabe, E., & Nolan, F. (2000). Quantitative characterizations of speech rhythm:<br />

Syllable timing in Singapore English. Language and Speech, 43(3), 377-401.<br />

3. Evans, B. (2001). Dialect accommodation and the Northern Cities Shift. Unpublished Ph.D.<br />

dissertation, Michigan State University, East Lansing.<br />

4. Evans, B., & Preston, D. (2000). When being normal isn't nice. Pa<strong>per</strong> presented at the New Ways<br />

of Analyzing Variation 29 conference, Michigan State University, East Lansing.<br />

5. Gurijala, A., Deller, J., & Seadle, M. (2002). Watermarking through parametric modeling. Pa<strong>per</strong><br />

presented at the Proceedings of the International Conferences of Spoken Language Processing,<br />

Denver.<br />

6. Hume, E. V., & Johnson, K. (2001). The role of speech <strong>per</strong>ception in phonology. San Diego:<br />

Academic Press.<br />

7. Hunt, K. (1996, Aug 27). Sony revives MiniDisc in package deal. Los Angeles Times, p. 5:1.<br />

8. Ito, R. (2000). Diffusion of urban sound change: a case of the Northern Cities Shift. Unpublished<br />

Ph.D. dissertation, Michigan State University, East Lansing.<br />

9. Johnson, K. (2003). Acoustic and auditory phonetics (2nd ed.). Malden, MA: Blackwell Pub.<br />

10. Labov, W. (2001). Principles of linguistic change: social factors.Oxford: Blackwell.<br />

11. Labov, W. (2003). Plotnik 6.0.<br />

12. Paolillo, J. C. (2001). Variable rule analysis: using logistic regression in linguistic models of<br />

variation.Stanford, Calif.: CSLI: Cambridge.<br />

13. Paolillo, J. C. (2002). Analyzing linguistic variation: statistical models and methods.Stanford, CA:<br />

Center for the Study of Language and Information.<br />

14. Plichta, B. (2002). Best practices in the acquisition, processing, and analysis of acoustic speech<br />

signals. U. Penn Working Pa<strong>per</strong>s in Linguistics, 8.3.<br />

15. Plichta, B. (2004). Akustyk for Praat (Version 1.7.2). East Lansing: Michigan State University.<br />

16. Plichta, B., & Preston, D. (2004). The /ay/s Have It: The <strong>per</strong>ception of /ay/ as a North-South<br />

stereotype in US English. In T. Kristiansen, Coupland, Nikolas, Garrett, Pohlmann, K. C. (2000).<br />

Principles of Digital Audio (Fourth ed.). New York: McGraw-Hill.<br />

17. Preston, D., Ito, R., Evans, B., & Jones, J. (2000). Change on top of Change: Social and Regional<br />

Accommodation to the Northern Cities Chain Shift. In H. Bennis, Ryckeboer & J. Stroop (Eds.),<br />

De Toekomst van de Variatielinguitiek (special issue of Taal en Tongval to honor Dr. Jo Daan on<br />

her ninetieth birthday ed., pp. 61-86). Amsterdam: Meertens.<br />

18. Preston, D. R. (2003). Where are the Dialects of American English at Anyhow? Presidential<br />

address, American Dialect Society. American Speech, 78(3), 235-254.<br />

19. Purnell, T., & Koplin, L. (2003). Perceptual differences in source-filter characteristics of racially<br />

affiliated dialects of American English. Journal of the Acoustical Society of America, 113(4), 2328.<br />

20. Rakerd, B., & Plichta, B. (2003). More on <strong>per</strong>ceptions of /a/ fronting. Pa<strong>per</strong> presented at the<br />

NWAV 32, University of Pennsylvania.<br />

21. Thomas, E. (2000). Applying phonetic methods to language variation. American Speech, 75, 368-<br />

370.<br />

22. Thomas, E. (2002). Sociophonetic Applications of Speech Perception Ex<strong>per</strong>iments. American<br />

Speech, 77, 115-147.<br />

23. Weismer, G., & Berry, J. (2003). Effects of speaking rate on second formant trajectories of<br />

selected vocalic nuclei. Journal of the Acoustical Society of America, 113(6), 3362-3378.<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

15


TRIBUNALE DI NAPOLI<br />

NONA SEZIONE PENALE<br />

COLLEGIO <strong>“</strong>C”<br />

Presidente: Dott.ssa Maria Aschettino<br />

Proc. pen. No. 20491/09 R.G. (No. 1138/07 R.G. PM)<br />

c/ Fiume Gennaro + altri<br />

TRASCRIZIONE DELL’INTERVISTA<br />

dal file audio-video denominato <strong>“</strong>Pianura”<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

16


Si rilevano alcune differenze con la trascrizione depositata alla Procura<br />

Legenda: NM = voce presunta di <strong>“</strong>Nonno Marco”<br />

U2, U3 = voci maschili distinte<br />

< . > = tra parentesi angolari alcune note utili <strong>per</strong> la comprensione del testo.<br />

In nota a pi<strong>è</strong> di pagina sono inserite indicazioni di differenze tra il testo proposto e quello<br />

depositato agli atti dal CT della Procura (in cui mancano tra l‟altro indicazioni in merito a<br />

suoni e rumori di fondo).<br />

Inizio trascrizione<br />

--------------------------------<br />

00 min - 00 sec<br />

< in sottofondo si <strong>per</strong>cepiscono rumori di strada, come clacson, e un rumore ripetitivo, ciclico,<br />

associabile al volo di un elicottero ><br />

NM: Ci stringono su due fronti, da sotto e da sopra …<br />

U2: Aaah, ci string … <br />

NM: La migliore cosa dato che io faccio parte di guerriglia urbana … ascolta, bisognerebbe<br />

abbandonare il campo , andare tutti a casa , scendere di<br />

nuovo e assaltare le forze di polizia … tu devi dare disservizio 1 . Ci agge<br />

piià „e palate mo? 2 … sono stratega.<br />

Pigghia‟ „e palate mo! 3 Sono due fronti, ti schiacciano … … 4 mazzate, non devi dare a loro la possibilità di prendere le mazzate … ,<br />

c‟<strong>è</strong> la … quando vengono i camion li assalti.<br />

U2: ah, la notte <strong>è</strong> amica 5<br />

NM: la notte <strong>è</strong> ami 6 … Siamo i vampiri . Qua non c‟<strong>è</strong> camorra , dentro …<br />

noi ci battiamo <strong>per</strong> una causa, <strong>per</strong> un ideale, tu ce l‟hai un ideale? Noi ce l‟abbiamo 7 .<br />

Vivere. Violenza, violenza, fino all‟ultima sentenza.<br />

1 Nella trascrizione della Procura era: <strong>“</strong>il servizio”<br />

2 Era: <strong>“</strong>io devo prendere le palate ora…”<br />

3 Era: <strong>“</strong>piglio le palate ora…”<br />

4 Era: <strong>“</strong>succedono le”<br />

5 Era <strong>“</strong>a mia”<br />

6 Era <strong>“</strong><strong>è</strong> mia”<br />

7 Non presente nella trascrizione della Procura<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

17


NM: Aggregazione, disgregazione allo Stato. Stato di merda, c‟<strong>è</strong> corruzione … cio<strong>è</strong> <strong>per</strong><br />

difendere la cittadinanza, <strong>per</strong> aiutare …<br />

U2: P er solidarietà<br />

NM: La solidarietà …<br />

Pronto? Chi <strong>è</strong>?<br />

Stanno venendo 8 le forze di Polizia stanno cercando di stringere …<br />

ho già avvisa‟… 9 stanno cercando di stringere, di tamponare i due lati<br />

via . Stanno venendo, stanno tutti venendo, <strong>per</strong>ò non si<br />

capisce un corn‟…! 10 . Guardia di Fiananza,<br />

Polizia … sta 11 … stanno salendo verso qua. ma poi cercano di stringere <strong>per</strong> stringere, capito com‟<strong>è</strong>? <br />

--------------------------------<br />

01 min - 40 sec<br />

U2 o U3: Minchia 12<br />

NM: Secondo te <strong>è</strong> giusto?<br />

U2 o U3: a discarica, dopo quarant‟anni … 13<br />

NM: Non abbiamo illuminazione, non abbiamo non abbiamo condoni, non abbiamo<br />

un corno qua! Di nuovo la pattumiera d‟Italia Perché il Nord<br />

che ha scaricato qua <strong>per</strong> anni … hanno scaricato in queste zone qua …<br />

U2 o U3: eh!<br />

NM: Perché 14 questa immondizia e trovare i siti alternativi, te lo dico io . Qual <strong>è</strong> il sito alterna… . Te lo do io il sito alterna …<br />

. Dillo, se hai le <strong>“</strong>palle” <strong>è</strong> il corà… <br />

9 Era: <strong>“</strong><strong>per</strong>ciò ti sto”<br />

10 Era: cazzo<br />

11 Non presente nella trascrizione della Procura<br />

12 Nella trascrizione della Procura, la parola in oggetto <strong>è</strong> attribuita a NM<br />

13 Nella trascrizione della Procura, questo passaggio <strong>è</strong> un po‟ diverso e attribuito a NM<br />

14 Era: <strong>“</strong>nessuno - parola incomprensibile<strong>“</strong><br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

18


TRIBUNALE DI NAPOLI<br />

NONA SEZIONE PENALE<br />

COLLEGIO <strong>“</strong>C”<br />

Presidente: Dott.ssa Maria Aschettino<br />

Proc. pen. No. 20491/09 R.G. (No. 1138/07 R.G. PM)<br />

c/ Fiume Gennaro + altri<br />

SAGGIO FONICO DELLA VOCE<br />

DELL’IMPUTATO MARCO NONNO<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

19


Frasi ripetute dall’imputato Marco Nonno<br />

/a/<br />

La solidarietà cos‟<strong>è</strong>?<br />

Stanno salendo verso… qua!<br />

Guarda, arrivano dai due lati…<br />

Perché… hanno scaricato in queste zone qua <strong>per</strong> anni…<br />

Il Nord ha scaricato qua come una pattumiera d‟Italia<br />

Bisogna trovare siti alternativi<br />

Te lo dico io qual <strong>è</strong> il sito alternativo!<br />

Qua bisogna avere le palle e il coraggio!<br />

/e/<br />

L‟ideale <strong>è</strong> vivere!<br />

Guarda, stanno venendo!<br />

Ma poi, qui, cercano di stringere da tutte le parti…<br />

Secondo te <strong>è</strong> giusto?<br />

Perché, qua, bisogna abbandonare il campo…<br />

/i/<br />

Non basta vivere, bisogna lottare…<br />

Però, non si capisce nulla qua…<br />

Le forze di Polizia stanno cercando di stringere<br />

Questa immondizia ci ha riempito tutti qua…<br />

Perché qui… bisogna trovare siti alternativi…<br />

Dillo, se hai le palle e il coraggio… dillo…<br />

/o/<br />

Però… ascoltami… dobbiamo spiegare cosa sta succedendo qua…<br />

Stanno tutti venendo… qui non si capisce un corno!<br />

Ma secondo te, <strong>è</strong> giusto?<br />

Ma poi, non abbiamo illuminazione, non abbiamo condoni, non abbiamo un<br />

corno!<br />

Perché il Nord ha scaricato qui <strong>per</strong> anni!<br />

Dillo ora, dillo… e facciamola finita!<br />

A – E – I – O – U<br />

AAA – EEE – III – OOO – UUU<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

20


TRIBUNALE DI NAPOLI<br />

NONA SEZIONE PENALE<br />

COLLEGIO <strong>“</strong>C”<br />

Presidente: Dott.ssa Maria Aschettino<br />

Proc. pen. No. 20491/09 R.G. (No. 1138/07 R.G. PM)<br />

c/ Fiume Gennaro + altri<br />

TABELLE E GRAFICI<br />

OTTENUTI DAI<br />

FONEMI ANALIZZATI<br />

E MESSI A CONFRONTO<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

21


F24123-18461597-SPEECH-RAW-19424360_CUT_MN<br />

[ F0, F1, F2, F3, F4, F5 ]<br />

Nome:"A da F24123-1597"<br />

Fonemi:<br />

"scus-a-mi": [134,533,1216,2323,0,0]<br />

"m-a-le": [147,601,1286,1886,0,0]<br />

"st-a-i": [122,652,1403,2747,0,0]<br />

"disc-a-ric": [160,632,1499,2213,0,0]<br />

"l-à-": [167,662,1319,2976,0,0]<br />

"v-a-bbùen": [160,653,1288,2909,0,0]<br />

"preoccup-a-re": [139,667,1248,2447,0,0]<br />

Nome:"E da F24123-1597"<br />

Fonemi:<br />

"t-e-lefono": [149,468,1702,2122,0,0]<br />

"-e-": [168,535,1587,2987,0,0]<br />

"b-e-ne": [175,496,1863,2725,0,0]<br />

"s-e-ra": [179,401,1635,3196,0,0]<br />

"v-e-ne": [183,529,1704,2415,0,0]<br />

"-e-h": [170,446,2006,2621,0,0]<br />

"ok-e-i": [112,507,1800,2479,0,0]<br />

Nome:"I da F24123-1597"<br />

Fonemi:<br />

"ch-i-": [126,392,1958,3491,0,0]<br />

"scusam-i-": [138,438,1808,2989,0,0]<br />

"cap-i-to": [150,350,2002,3180,0,0]<br />

"cap-ì-": [173,371,2181,2658,0,0]<br />

"oke-i-": [112,433,2390,3076,0,0]<br />

Nome:"O da F24123-1597"<br />

Fonemi:<br />

"pr-o-nto": [203,611,1033,2348,0,0]<br />

"telef-o-no": [141,542,1185,1986,0,0]<br />

"telefon-o-": [144,572,1280,2121,0,0]<br />

"n-o-": [147,582,1039,2160,0,0]<br />

"stat-o-": [151,536,1081,2097,0,0]<br />

"s-o-": [193,518, 914,2563,0,0]<br />

"-o-kei": [128,637,1038,3111,0,0]<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

22


F24123-18462438-SPEECH-RAW-19425680_CUT_MN<br />

[ F0, F1, F2, F3, F4, F5 ]<br />

Nome:"A da F24123-2438"<br />

Fonemi:<br />

"st-a-notte": [217,645,1283,2317,0,0]<br />

"st-a-to": [169,650,1313,2304,0,0]<br />

"m-a-le": [207,676,1251,2505,0,0]<br />

"m-a-le": [189,806,1304,2494,0,0]<br />

"quell-a-": [219,663,1436,2435,0,0]<br />

"dell-a-": [201,747,1385,2791,0,0]<br />

"disc-a-rica": [140,788,1509,2317,0,0]<br />

Nome:"E da F24123-2438"<br />

Fonemi:<br />

"stanott-e-": [191,535,1445,2540,0,0]<br />

"mal-e-": [161,497,1892,2414,0,0]<br />

"-e-": [167,479,1925,2536,0,0]<br />

"ad-e-sso": [143,512,1909,2362,0,0]<br />

"d-e-lla": [210,620,1685,2511,0,0]<br />

"-e-sci": [137,556,1936,2301,0,0]<br />

"ok-e-i": [231,613,1630,1967,0,0]<br />

Nome:"I da F24123-2438"<br />

Fonemi:<br />

"d-i-scarica": [194,409,1931,2455,0,0]<br />

"d-i-scarica": [138,414,2191,3036,0,0]<br />

"s-ì-": [129,263,1855,2515,0,0]<br />

"motor-i-no": [145,304,2174,2641,0,0]<br />

Nome:"O da F24123-2438"<br />

Fonemi:<br />

"pr-o-nto": [177,587, 946,2729,0,0]<br />

"s-ò-": [181,541, 970,2108,0,0]<br />

"stat-o-": [183,542,1081,2308,0,0]<br />

"n-o-": [217,698,1101,2443,0,0]<br />

"adess-o-": [198,600,1026,2136,0,0]<br />

"andand-o-": [244,600,1225,2153,0,0]<br />

"r-o-tonda": [245,522,1120,2256,0,0]<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

23


Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

24


SAGGIO_MARCO_NONNO_TELEFONO_CUT<br />

[ F0, F1, F2, F3, F4, F5 ]<br />

Nome:"A da Saggio al Telefono"<br />

Fonemi:<br />

"solid-a-rietà": [122,758,1475,2577,0,0]<br />

"st-a-nno": [143,743,1360,2540,0,0]<br />

"qu-a-": [115,720,1139,2555,0,0]<br />

"d-a-": [165,664,1294,2482,0,0]<br />

"l-a-ti": [113,799,1335,2488,0,0]<br />

"sc-a-ricato": [157,649,1315,2220,0,0]<br />

"sc-a-ricato": [159,774,1468,2579,0,0]<br />

"-a-nni": [141,877,1489,2643,0,0]<br />

"sc-a-ricato": [156,723,1529,2827,0,0]<br />

"sc-a-ricato": [159,739,1520,2657,0,0]<br />

"It-a-lia": [109,798,1358,2165,0,0]<br />

"trov-a-re": [203,773,1465,2370,0,0]<br />

"-a-lternativi": [141,706,1356,2715,0,0]<br />

"-a-lternativo": [118,667,1493,2696,0,0]<br />

"qu-a-": [188,724,1242,2441,0,0]<br />

"p-a-lle": [215,878,1320,2705,0,0]<br />

"cor-a-ggio": [112,777,1432,2458,0,0]<br />

"st-a-nno": [200,825,1376,2784,0,0]<br />

"p-a-rti": [119,817,1347,2541,0,0]<br />

"qu-a-": [149,823,1242,2450,0,0]<br />

"b-a-sta": [171,794,1323,2564,0,0]<br />

"lott-a-re": [104,761,1369,2627,0,0]<br />

"qu-a-": [110,687,1093,2447,0,0]<br />

"st-a-nno": [171,794,1323,2765,0,0]<br />

"cerc-a-ndo": [190,830,1465,2652,0,0]<br />

"qu-a-": [108,723,1112,2299,0,0]<br />

"trov-a-re": [163,653,1476,2446,0,0]<br />

"-a-lternativi": [142,699,1559,2652,0,0]<br />

"p-a-lle": [145,742,1306,2415,0,0]<br />

"cor-a-ggio": [115,750,1407,2547,0,0]<br />

"spieg-a-re": [104,784,1577,2619,0,0]<br />

"qu-a-": [103,677,1133,2533,0,0]<br />

"sc-a-ricato": [155,692,1532,2310,0,0]<br />

"sc-a-ricato": [165,724,1467,2399,0,0]<br />

"-a-nni": [176,872,1547,2577,0,0]<br />

"-a-": [172,977,1449,2855,0,0]<br />

"-a-": [184,903,1456,2959,0,0]<br />

Nome:"E da Saggio al Telefono"<br />

Fonemi:<br />

"cos'-<strong>è</strong>-": [118,627,1616,2549,0,0]<br />

"sal-e-ndo": [198,619,1831,2648,0,0]<br />

"p-e-rch<strong>è</strong>": [156,469,1526,2435,0,0]<br />

"t-e-": [169,614,1653,2516,0,0]<br />

"viv-e-re": [117,620,1603,2586,0,0]<br />

"viv-e-re": [112,630,1680,2557,0,0]<br />

"c-e-rcano": [168,518,1669,2422,0,0]<br />

"t-e-": [121,424,1406,2624,0,0]<br />

"p-e-rch<strong>è</strong>": [183,447,1936,2399,0,0]<br />

"viv-e-re": [112,627,1647,2625,0,0]<br />

"viv-e-re": [115,602,1627,2598,0,0]<br />

"string-e-re": [117,527,1658,2526,0,0]<br />

"string-e-re": [112,573,1677,2497,0,0]<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

25


"p-e-rch<strong>è</strong>": [171,421,1712,2369,0,0]<br />

"succ-e-dendo": [162,524,1553,2513,0,0]<br />

"succ-e-dendo": [119,505,1832,2752,0,0]<br />

"v-e-nendo": [169,596,1646,2357,0,0]<br />

"v-e-nendo": [117,602,1969,2733,0,0]<br />

"t-e-": [125,479,1577,2607,0,0]<br />

"-e-": [162,562,1859,2850,0,0]<br />

"-e-": [186,594,1683,2391,0,0]<br />

Nome:"I da Saggio al Telefono"<br />

Fonemi:<br />

"arr-i-vano": [195,421,1875,2621,0,0]<br />

"s-i-ti": [204,475,1860,2496,0,0]<br />

"alternat-i-vi": [110,366,2131,2896,0,0]<br />

"alternat-i-vo": [110,399,1833,2842,0,0]<br />

"v-i-vere": [174,373,2242,2907,0,0]<br />

"v-i-vere": [120,413,1894,2926,0,0]<br />

"pol-i-zia": [203,479,1716,2640,0,0]<br />

"-i-mmondizia": [162,380,2080,2993,0,0]<br />

"qu-i-": [150,385,1961,2786,0,0]<br />

"s-i-ti": [201,453,1968,2641,0,0]<br />

"alternat-i-vi": [117,446,2065,2905,0,0]<br />

"d-i-llo": [218,494,2172,2797,0,0]<br />

"d-i-llo": [170,378,2161,2731,0,0]<br />

"cap-i-sce": [190,434,1810,2605,0,0]<br />

"d-i-llo": [206,459,1920,2549,0,0]<br />

"d-i-llo": [204,466,1761,2667,0,0]<br />

"f-i-nita": [112,441,2247,2767,0,0]<br />

"-i-": [166,356,1874,2912,0,0]<br />

"-i-": [190,429,1779,2924,0,0]<br />

Nome:"O da Saggio al Telefono"<br />

Fonemi:<br />

"z-o-ne": [184,695,1172,2500,0,0]<br />

"n-o-rd": [168,654,1117,2279,0,0]<br />

"giust-o-": [143,638,1061,2533,0,0]<br />

"<strong>per</strong>-ò-": [185,648,1084,2059,0,0]<br />

"f-o-rze": [213,685,1015,2752,0,0]<br />

"dill-o-": [143,543,1222,2111,0,0]<br />

"dill-o-": [110,670,1156,2230,0,0]<br />

"<strong>per</strong>-ò-": [182,669, 977,2388,0,0]<br />

"c-o-sa": [205,623,1084,2725,0,0]<br />

"c-o-rno": [124,555, 914,2481,0,0]<br />

"sec-o-ndo": [204,638,1069,2120,0,0]<br />

"giust-o-": [144,654,1061,2236,0,0]<br />

"c-o-ndoni": [108,524, 957,2432,0,0]<br />

"c-o-rno": [126,553, 893,2310,0,0]<br />

"n-o-rd": [167,641,1103,2330,0,0]<br />

"dill-o-": [142,466,1037,2342,0,0]<br />

"-o-": [214,685, 929,2288,0,0]<br />

"-o-": [209,683,1043,2322,0,0]<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

26


Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

27


VOCE_ANONIMO_INTERVISTA_PIANURA_CUT<br />

[ F0, F1, F2, F3, F4, F5 ]<br />

Nome:"A da Pianura_Cut"<br />

Fonemi:<br />

Nome:"A da Pianura_Cut"<br />

Fonemi:<br />

"solid-a-rietà": [135,692,1718,2293,0,0]<br />

"st-a-": [190,697,1523,2337,0,0]<br />

"sc-a-ricato": [132,581,1472,1999,0,0]<br />

"-a-nni": [151,726,1250,2322,0,0]<br />

"sc-a-ricato": [136,546,1931,3075,0,0]<br />

"altern-a-tivi": [139,642,1836,3231,0,0]<br />

"p-a-lle": [ 71,706,1856,2501,0,0]<br />

"cor-à-": [164,748,1573,2122,0,0]<br />

Nome:"E da Pianura_Cut"<br />

Fonemi:<br />

"viv-e-re": [107,538,1909,2592,0,0]<br />

"v-e-nendo": [154,621,1620,2441,0,0]<br />

"c-e-rcano": [234,497,1664,2489,0,0]<br />

"t-e-": [142,435,1819,2594,0,0]<br />

"p-e-rch<strong>è</strong>": [144,466,2216,2616,0,0]<br />

Nome:"I da Pianura_Cut"<br />

Fonemi:<br />

"v-i-vere": [113,588,2346,3085,0,0]<br />

"cap-i-sce": [230,546,2068,2647,0,0]<br />

"pol-i-zia": [220,561,2166,2942,0,0]<br />

"-i-mmondizia": [116,515,2102,3130,0,0]<br />

"d-i-llo": [180,485,1968,2618,0,0]<br />

<strong>“</strong>s-i-ti”: [182,547,2284,2908,0,0]<br />

Nome:"O da Pianura_Cut"<br />

Fonemi:<br />

"<strong>per</strong>-ò-": [145,594,1418,2477,0,0]<br />

"c-o-rn...": [158,636,1376,2467,0,0]<br />

"sec-o-ndo": [152,494,1001,2266,0,0]<br />

"c-o-ndoni": [135,581, 993,2449,0,0]<br />

"c-o-rno": [187,569,1335,2570,0,0]<br />

"n-o-rd": [145,626, 958,2513,0,0]<br />

"z-o-ne": [156,552, 859,2335,0,0]<br />

"dill-o-": [111,565,1276,2468,0,0]<br />

Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

28


Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

29


Prof. Mirko Grimaldi Prof. Giuseppe Mastronardi<br />

30

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!