Conception des modÃ¨les d'observation audio temps rÃ©el Ã l ... - atiam

More documents

Recommendations

Info

6 Pré-requisFenêtre de signalCalcul des descripteursModèle d’observationValeurs des descripteursClassificationDistribution de probabilitésHMMAlignementFIG. 1.3 – Rôle du modèle d’observationL’approche par apprentissage statistique possède un avantage non négligeablepour le domaine du traitement du signal musical : elle permet deconstruire une connaissance à partir d’une expertise humaine. L’expertise résidedans la base d’échantillons sonores préalablement segmentés manuellement,sur laquelle un modèle algorithmique (le classifieur) est entraîné.Les concepts musicaux sont difficiles à formaliser sous la forme d’équationsportant sur le signal. Aussi, dans le cadre d’un modèle d’observation audio,il est intéressant de disposer d’algorithmes capables d’apprendre à partird’exemples.1.4 Descripteurs audioDifférents types de descripteurs audioLe nombre croissant de descripteurs audio a fait naître un besoin de pouvoircatégoriser ceux-ci. Nous retiendrons la taxonomie de G. Peeters [23],qui se base sur les représentations du signal à partir desquelles sont calculésles descripteurs.Tout d’abord, nous pouvons catégoriser les descripteurs suivant la duréede l’échantillon sonore pour laquelle ils sont valides :– Descripteurs globaux - Ce sont des descripteurs calculés pour l’ensembledu signal. Par exemple, le temps d’attaque (attack time), qui estle temps nécessaire pour que le signal atteigne son intensité maximale.– Descripteurs instantanés - Ce sont des descripteurs calculés sur desfenêtres temporelles (généralement recouvrantes).À l’intérieur de chaque classe de descripteurs, nous pouvons catégoriserles descripteurs selon le type de représentation(s) du signal utilisée(s) pourextraire ceux-ci à partir du signal :
1.4 Descripteurs audio 7– Descripteurs temporels (globaux ou instantanés) Ils sont calculés àpartir de la forme de l’onde ou de l’énergie du signal : temps d’attaque,Temporal Decrease, Temporal Centroid, Effective Duration, Zero-crossingrate, Cross-correlation.– Descripteurs spectraux (instantanés) Ils sont calculés à partir de laSTFT (Short Time Fourier Transform) du signal : Spectral Centroid, Spread,Skewness, Kurtosis, Slope, Decrease, Roll-off point, variation.– Descripteurs harmoniques (instantanés) Ils sont calculés à partir d’unmodèle harmonique du signal : Fréquence fondamentale, Noisiness,Odd-to-Even Harmonic Ratio, Tristimulus, Deviation, Centroid, Spread,Skewness, Kurtosis, Slope, Decrease, Roll-off point, Variation– Descripteurs perceptuels (instantanés) Ils sont calculés en utilisant unmodèle perceptif de l’audition humaine : MFCC, DMFCC, DDMFCC,Loudness, Specific Loudness, Sharpness, Spread, Roughness.Quelques descripteurs classiques pour l’analyse du signal musicalZero Crossing Rate (ZCR) Ce descripteur est la fréquence de passage parzéro du signal sur la fenêtre étudiée. Il est simple à calculer et constitueun bon discriminant pour beaucoup de problèmes de classification d’échantillonssonores.Mel Frequency Cepstral Coefficients (MFCC) Le cepstre d’un signal réelx(t) est une transformation de ce signal du domaine temporel vers un autredomaine temporel, celui des quéfrences. Le cepstre est défini comme étant lerésultat de la transformée de Fourier inverse appliquée au logarithme de latransformée de Fourier du signal :C(τ) = C(x(t)) = FT −1 (log 10 (FT(x(t))))Par application du logarithme, la source (ex : la corde d’une guitare) et lafonction de transfert associée au conduit (ex : l’ensemble de la caisse de laguitare) peuvent être séparés. Ce principe a trouvé sa première applicationdans le traitement de la parole, et il est très utilisé pour le traitement du signalmusical. Les MFCC’s sont les coefficients cepstraux, exprimés dans l’échelle(perceptive) de Mel.Fréquence fondamentale Étant donné l’importance des hauteurs dans lescompositions, la fréquence fondamentale est un descripteur important pourl’utilisation d’algorithmes d’apprentissage dans la segmentation de flux musical.Elle est calculée sur des fenêtre se recouvrant, pour lesquelles une fréquencefondamentale instantanée est extraite.Descripteurs audio et temps-réelLes applications temps-réel imposent deux contraintes fortes sur les systèmesde segmentation basés sur des algorithmes de classification. D’unepart, les descripteurs globaux ne sont pas utilisables car par définition, ils
Page 1: Université Pierre & Marie Curie, P
Page 5: AbstractMusical interaction between
Page 8 and 9: viii
Page 10 and 11: xTABLE DES MATIÈRES5 Discussion et
Page 12 and 13: stage. Celles-ci mettent en exergue
Page 14 and 15: 4 Pré-requisindépendamment l’un
Page 18 and 19: 8 Pré-requissont calculés à part
Page 20 and 21: 10 Sélection de descripteursà la
Page 22 and 23: 12 Sélection de descripteursSi les
Page 24 and 25: 14 Sélection de descripteursclasse
Page 26 and 27: 16 Sélection de descripteurset l
Page 28 and 29: 18 Sélection de descripteursFIG. 2
Page 30 and 31: 20 Sélection de descripteurs et ca
Page 38 and 39: 28 Expérimentationsune représenta
Page 40 and 41: 30 Expérimentations4.4 Première a
Page 42 and 43: 32 Expérimentationsvaleurs mesuré
Page 44 and 45: 34 Expérimentations181716Wrapper (
Page 46 and 47: 36 ExpérimentationsGain de perform
Page 48 and 49: 38 ExpérimentationsCoût de calcul
Page 50 and 51: 40 Expérimentations0.850.8Aire sou
Page 52 and 53: 42 Discussion et directions futures
Page 54 and 55: 44 Discussion et directions futures
Page 57: ConclusionDurant ce stage, nous avo
Page 60 and 61: [13] Isabelle Guyon, Steve Gunn, As
Page 63 and 64: Annexes
Page 65: Nom du descripteurNombre de dimensi
Page 69:
Liste des tableaux4.1 Erreur d’ap
show all

Conception des modÃ¨les d'observation audio temps rÃ©el Ã l ... - atiam

Create successful ePaper yourself

Delete template?

Save as template?