30.06.2013 Views

A l'écoute de sa voix en rééducation vocale - Florence Parmentier ...

A l'écoute de sa voix en rééducation vocale - Florence Parmentier ...

A l'écoute de sa voix en rééducation vocale - Florence Parmentier ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

A l’écoute <strong>de</strong> <strong>sa</strong> <strong>voix</strong> <strong>en</strong> <strong>rééducation</strong><br />

<strong>vocale</strong> : apports du spectrogramme ; étu<strong>de</strong><br />

<strong>de</strong> cas<br />

[[(83 signes (<strong>en</strong> comptant les espaces, 69 sinon, 15 mots) je me <strong>de</strong>man<strong>de</strong> si ça serait pas plutôt<br />

« étu<strong>de</strong> tous azimuts » ou « étu<strong>de</strong> préliminaire » plutôt que « étu<strong>de</strong> <strong>de</strong> cas »]]<br />

3.1. Le titre<br />

- une c<strong>en</strong>taine <strong>de</strong> signes<br />

- doit refléter précisém<strong>en</strong>t le cont<strong>en</strong>u du travail<br />

3.2. Le résumé<br />

- triple fonction : appel, information, docum<strong>en</strong>tation<br />

- doit décrire l’hypothèse <strong>de</strong> travail, exposer la méthodologie, indiquer les<br />

résultats les plus significatifs, comparer les résultats à l’hypothèse<br />

- écrit <strong>sa</strong>ns alinéa, <strong>en</strong> un seul paragraphe, <strong>sa</strong>ns figure ni tableau<br />

- 250 mots <strong>en</strong>viron, doit être traduit <strong>en</strong> anglais<br />

3.3. Les mots-clés<br />

- indisp<strong>en</strong><strong>sa</strong>bles pour les référ<strong>en</strong>ces docum<strong>en</strong>taires<br />

- <strong>en</strong>tre 5 et 7, classés par ordre <strong>de</strong> pertin<strong>en</strong>ce<br />

- doiv<strong>en</strong>t permettre <strong>de</strong> décrire le travail (<strong>de</strong>scripteurs)<br />

- <strong>de</strong> préfér<strong>en</strong>ce issus <strong>de</strong> thé<strong>sa</strong>urus <strong>de</strong> mots-clefs : MeSH (Medical Subjects<br />

Heading), In<strong>de</strong>x Medicus,...<br />

- traduits <strong>en</strong> anglais<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong>


Remerciem<strong>en</strong>ts<br />

I<strong>sa</strong>belle Marié-Bailly<br />

Claire Pillot-Loiseau<br />

Sylvain Lamesch<br />

Françoise Rivière (PEB) et autres bibliothèques<br />

Emmanuelle, Mathil<strong>de</strong>, et osteovox<br />

Valérie Gar<strong>de</strong>ux-Zanotti, Michèle Plana<br />

Nicole Oudin<br />

Marine Legrand<br />

(minuscule ?) / petits / grand<br />

I<strong>sa</strong>belle Retailleau et agapanthe<br />

Profs <strong>de</strong> chant<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong>


Sommaire<br />

Introduction ........................................................................................................................................... 1<br />

1 Assises théoriques .......................................................................................................................... 2<br />

1.1 dysphonie dysfonctionnelle et <strong>rééducation</strong> <strong>vocale</strong> ............................................................... 2<br />

1.2 Le spectrogramme ............................................................................................................... 11<br />

1.3 Spectrogramme et <strong>rééducation</strong> <strong>vocale</strong> : avantages et limites ............................................ 19<br />

2 Problématique .............................................................................................................................. 32<br />

3 Hypothèse(s) ................................................................................................................................ 33<br />

4 Méthodologie ............................................................................................................................... 34<br />

4.1 Matériel ................................................................................................................................ 34<br />

4.2 Métho<strong>de</strong> ............................................................................................................................... 36<br />

5 Analyse <strong>de</strong>s résultats.................................................................................................................... 51<br />

5.1 Auto-analyse : échelles visuelles analogiques ..................................................................... 51<br />

5.2 Evolution <strong>de</strong>s pati<strong>en</strong>ts protocole ......................................................................................... 66<br />

5.3 Comm<strong>en</strong>taires autour du spectrogramme .......................................................................... 73<br />

6 Discussion ..................................................................................................................................... 87<br />

6.1 Validation <strong>de</strong>s hypothèses <strong>de</strong> travail ................................................................................... 87<br />

6.2 Limites .................................................................................................................................. 94<br />

6.3 Perspectives ......................................................................................................................... 99<br />

Conclusion .......................................................................................................................................... 100<br />

Table <strong>de</strong>s matières ............................................................................................................................. 101<br />

bibliographie ...................................................................................................................................... 111<br />

glos<strong>sa</strong>ire ............................................................................................................................................. 120<br />

annexes .............................................................................................................................................. 122<br />

Classifications ................................................................................................................................. 122<br />

figures ............................................................................................................................................. 125<br />

Quelques résultats détaillés (VHI, qualificatifs), ............................................................................ 131<br />

Spectrogrammes tirés du site internet .......................................................................................... 135<br />

Script praat ..................................................................................................................................... 137<br />

Docum<strong>en</strong>ts du protocole (déroulem<strong>en</strong>t <strong>de</strong> l’exercice, feuilles <strong>de</strong> pas<strong>sa</strong>tion, feuilles <strong>de</strong> cotation du<br />

bilan vocal…) .................................................................................................................................. 138<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong>


Introduction<br />

La <strong>rééducation</strong> <strong>vocale</strong> <strong>de</strong>s dysphonies se donne pour objectif <strong>de</strong> redonner au pati<strong>en</strong>t un geste vocal<br />

efficace et confortable permettant une production <strong>sa</strong>tisfai<strong>sa</strong>nte.<br />

Le plus souv<strong>en</strong>t le thérapeute doit attirer l’att<strong>en</strong>tion du pati<strong>en</strong>t sur les différ<strong>en</strong>ts paramètres vocaux<br />

<strong>de</strong> ses productions (int<strong>en</strong>sité, hauteur, timbre, début <strong>de</strong> son …) afin que le pati<strong>en</strong>t pr<strong>en</strong>ne<br />

consci<strong>en</strong>ce <strong>de</strong> ses capacités et qu’il <strong>sa</strong>che adapter son geste à la fois grâce à son ress<strong>en</strong>ti intérieur et<br />

à ce qu’il perçoit <strong>de</strong> <strong>sa</strong> <strong>voix</strong>.<br />

Dans un contexte où les outils informatiques sont <strong>de</strong> plus <strong>en</strong> plus utilisés <strong>en</strong> orthophonie, nous nous<br />

proposons d’observer l’impact <strong>de</strong> l’utili<strong>sa</strong>tion du spectrogramme <strong>en</strong> temps réel <strong>en</strong> séance<br />

d’orthophonie, notamm<strong>en</strong>t <strong>en</strong> ce qui concerne la prise <strong>de</strong> consci<strong>en</strong>ce et l’auto-contrôle <strong>de</strong>s<br />

paramètres vocaux par le pati<strong>en</strong>t.<br />

Effectivem<strong>en</strong>t, le spectrogramme <strong>en</strong> temps réel matérialise par un feedback visuel à la fois<br />

l’int<strong>en</strong>sité, la hauteur, le timbre (au travers <strong>de</strong>s harmoniques), et permet d’objectiver instabilité,<br />

coup <strong>de</strong> glotte, forçage, souffle, prosodie, vibrato naturel, etc. Cette analyse peut être partagée<br />

avec le pati<strong>en</strong>t <strong>en</strong> séance, et constitue un bon complém<strong>en</strong>t aux évaluations subjectives. Quelle que<br />

soit l’approche rééducative choisie, l’outil permet <strong>de</strong> comparer <strong>de</strong>s productions, constater <strong>de</strong>s<br />

progrès, sout<strong>en</strong>ir l’intérêt et la motivation du pati<strong>en</strong>t pour la <strong>rééducation</strong>.<br />

Au travers d’une étu<strong>de</strong> <strong>de</strong> 4 cas, complétée par l’analyse statistique d’exercices d’auto-analyse dans<br />

une population plus large et par un recueil large <strong>de</strong> témoignages, nous étudierons l’impact d’un<br />

feedback auditif et visuel sur la prise <strong>de</strong> consci<strong>en</strong>ce <strong>de</strong>s paramètres vocaux (int<strong>en</strong>sité, hauteur,<br />

qualité <strong>de</strong> l’attaque, clarté et richesse du timbre, geste vocal). Nous nous intéresserons égalem<strong>en</strong>t<br />

aux impacts positifs permis par la visuali<strong>sa</strong>tion <strong>de</strong> <strong>sa</strong> propre <strong>voix</strong> sur l’image qu’a le pati<strong>en</strong>t <strong>de</strong> <strong>sa</strong><br />

<strong>voix</strong>, et sur la relation thérapeutique.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 1


1 Assises théoriques<br />

Après s’être intéressé à la dysphonie dysfonctionnelle, aux aspects multiples <strong>de</strong> la <strong>rééducation</strong><br />

<strong>vocale</strong> et aux différ<strong>en</strong>ts rétro-contrôles (feedbacks) existant pour la phonation et <strong>en</strong> <strong>rééducation</strong><br />

<strong>vocale</strong>, nous prés<strong>en</strong>terons l’outil constitué par le spectrogramme<br />

1.1 dysphonie dysfonctionnelle et <strong>rééducation</strong> <strong>vocale</strong><br />

Voyons d’abord <strong>en</strong> quoi la dysphonie dysfonctionnelle est liée au psychisme et souv<strong>en</strong>t à une<br />

mauvaise image <strong>de</strong> soi du pati<strong>en</strong>t. Dans ce cadre, nous décrirons d’une part les objectifs multiples<br />

d’une <strong>rééducation</strong> <strong>vocale</strong>. Nous nous intéresserons d’autre part au rétrocontrôle <strong>de</strong> façon<br />

théorique, puis au travers <strong>de</strong>s différ<strong>en</strong>ts feedbacks utilisés lors <strong>de</strong> la phonation, et particulièrem<strong>en</strong>t<br />

<strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong>.<br />

1.1.1 Dysphonie dysfonctionnelle et image <strong>de</strong> soi<br />

1.1.1.1 Définition<br />

« la dysphonie est une anomalie <strong>de</strong> la <strong>voix</strong> portant sur un ou plusieurs paramètres vocaux, la<br />

hauteur, l’int<strong>en</strong>sité ou le timbre » Dans les dysphonies dysfonctionnelles, il « existe une<br />

perturbation du geste vocal à l’origine du trouble, ou le pér<strong>en</strong>ni<strong>sa</strong>nt. Elles peuv<strong>en</strong>t être<br />

accompagnées ou pas d’une laryngopathie ». (Amy <strong>de</strong> la Bretèque, 2012, p. 130). « C’est à Le Huche<br />

que l’on doit le terme <strong>de</strong> dysfonctionnel qui doit être préféré à fonctionnel, car il traduit mieux<br />

l’utili<strong>sa</strong>tion défectueuse <strong>de</strong>s moy<strong>en</strong>s vocaux » (Remacle, 2009, p. 243)<br />

Les symptômes peuv<strong>en</strong>t concerner tous les paramètres vocaux. (Fugain, 1990, p. 101)<br />

- Le timbre peut être voilé, <strong>en</strong>roué, éraillé, rauque, sourd, étouffé…<br />

- La hauteur <strong>de</strong> la <strong>voix</strong> peut être aggravée ou au contraire trop aiguë, ou <strong>en</strong>core monotone<br />

- L’int<strong>en</strong>sité <strong>de</strong> la <strong>voix</strong> peut être trop faible<br />

1.1.1.2 Forçage vocal et psychisme<br />

Une dysphonie dysfonctionnelle provi<strong>en</strong>t d’une attitu<strong>de</strong> <strong>vocale</strong> défectueuse. Cette attitu<strong>de</strong> est<br />

apparue <strong>en</strong> réaction à <strong>de</strong>s modifications qui peuv<strong>en</strong>t être d’origine diverses (laryngite aiguë,<br />

intubation prolongée, hypoacousie, hypotonie générale…). « ces modifications directes ou indirectes<br />

peuv<strong>en</strong>t avoir disparu et laisser comme séquelle l’attitu<strong>de</strong> <strong>vocale</strong> défectueuse adoptée <strong>en</strong> réaction »<br />

(Remacle, 2009, p. 245). Une comp<strong>en</strong><strong>sa</strong>tion inadéquate du pati<strong>en</strong>t peut le faire <strong>en</strong>trer dans ce que<br />

Le Huche a appelé « Le cercle vicieux du forçage vocal ». Le geste vocal se modifie et <strong>de</strong>vi<strong>en</strong>t <strong>de</strong> plus<br />

<strong>en</strong> plus inefficace. Le modèle Hypo et Hyper <strong>de</strong> Gray et Roy décrit un comportem<strong>en</strong>t<br />

hyperfonctionnel chez le sujet prés<strong>en</strong>tant une dysphonie dysfonctionnelle. Le cercle vicieux du<br />

forçage vocal est décrit par Giovanni et Aumelas (Giovanni & Aumelas, 2004, p. 39), à la suite <strong>de</strong> Le<br />

Huche.<br />

Françoise Esti<strong>en</strong>ne précise : « Dans certains cas […], le dysfonctionnem<strong>en</strong>t est issu d’une attitu<strong>de</strong>,<br />

d’un comportem<strong>en</strong>t du sujet. Cette attitu<strong>de</strong> et ce comportem<strong>en</strong>t résult<strong>en</strong>t d’un système <strong>de</strong> valeurs,<br />

d’une représ<strong>en</strong>tation <strong>de</strong> soi-même. Cette façon d’être génère le geste vocal qui, à son tour, conforte<br />

l’attitu<strong>de</strong> du sujet et son système <strong>de</strong> valeurs.» (Esti<strong>en</strong>ne, 1998, p. 8)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 2


1.1.1.3 Dysphonie et mauvaise image <strong>de</strong> soi<br />

La <strong>voix</strong> reflète l’état émotionnel d’une personne, elle peut égalem<strong>en</strong>t révéler <strong>de</strong>s aspects <strong>de</strong> <strong>sa</strong><br />

personnalité 1 . Dans la littérature sci<strong>en</strong>tifique, la dysphonie est souv<strong>en</strong>t reliée à <strong>de</strong>s facteurs<br />

psychologiques 2 . (Deary, Wilson, Carding, & Mack<strong>en</strong>zie, 2003, p. 375a) Les pati<strong>en</strong>ts dysphoniques<br />

sont plus souv<strong>en</strong>t anxieux, dépressifs, ils ont une moins bonne qualité <strong>de</strong> vie. Lorsque la cause <strong>de</strong> la<br />

dysphonie est organique, comme lors d’une paralysie récurr<strong>en</strong>tielle, les pati<strong>en</strong>ts peuv<strong>en</strong>t égalem<strong>en</strong>t<br />

voir leur image <strong>de</strong> soi se détériorer suite à l’atteinte <strong>de</strong> leur fonction <strong>vocale</strong>. [[ref : Siupsinski<strong>en</strong>e<br />

2011, 281b à ajouter]]<br />

1.1.2 Rééducation <strong>vocale</strong><br />

1.1.2.1 Objectifs<br />

Selon une lecture <strong>de</strong>s <strong>en</strong>treti<strong>en</strong>s <strong>de</strong> l’<strong>en</strong>quête Kalliope, les orthophonistes pratiquant une<br />

<strong>rééducation</strong> <strong>vocale</strong> définiss<strong>en</strong>t une « belle <strong>voix</strong> » selon trois dim<strong>en</strong>sions : « selon <strong>de</strong>s paramètres<br />

mesurés objectivem<strong>en</strong>t et relevant <strong>de</strong> l’anatomie et <strong>de</strong> la physiologie », une <strong>voix</strong> « agréable à<br />

<strong>en</strong>t<strong>en</strong>dre <strong>en</strong> société » une <strong>voix</strong> « <strong>en</strong> harmonie avec l’être <strong>de</strong> la personne ». Ces trois dim<strong>en</strong>sions<br />

permett<strong>en</strong>t <strong>de</strong> dégager trois modèles <strong>de</strong> pratique. : « soin thérapeutique », « conformité sociale » et<br />

« cohér<strong>en</strong>ce <strong>de</strong> la personne » (Fortin, Guth, & Tain, 2007, p. 237)<br />

L’objectif d’une <strong>rééducation</strong> peut effectivem<strong>en</strong>t être mis <strong>en</strong> parallèle avec ce qu’on peut mesurer<br />

lors d’un bilan vocal. La <strong>rééducation</strong> <strong>vocale</strong> a classiquem<strong>en</strong>t pour objectifs :<br />

- d’améliorer les paramètres aéro-acoustiques (temps maximum <strong>de</strong> phonation, facteurs<br />

d’instabilité jitter et shimmer, fréqu<strong>en</strong>ce fondam<strong>en</strong>tale, dynamique d’int<strong>en</strong>sité, tessiture…),<br />

- d’améliorer le jugem<strong>en</strong>t perceptif, correspondant à l’impression subjective faite par une <strong>voix</strong><br />

sur un auditeur (l’échelle GRBAS est la plus utilisée)<br />

- <strong>de</strong> diminuer le handicap ress<strong>en</strong>ti par le sujet (l’échelle VHI est la plus utilisée)<br />

Selon Françoise Esti<strong>en</strong>ne , « l’objectif <strong>de</strong> la <strong>rééducation</strong> est d’<strong>en</strong>richir la <strong>voix</strong>, <strong>de</strong> lui restituer le<br />

maximum <strong>de</strong> ses pot<strong>en</strong>tialités <strong>en</strong> fonction du désir du sujet et <strong>de</strong> ses limites organiques […]. Ce n’est<br />

<strong>en</strong> aucun cas l’embriga<strong>de</strong>r dans un modèle préfabriqué. […] L’objectif thérapeutique va consister à<br />

<strong>en</strong>trer dans le vécu vocal <strong>de</strong> la personne avec <strong>sa</strong> conception <strong>de</strong> la <strong>voix</strong>, son système <strong>de</strong> valeurs pour<br />

lui proposer <strong>de</strong> l’élargir, <strong>de</strong> l’assouplir, <strong>de</strong> le revoir ou <strong>de</strong> le compléter <strong>en</strong> prés<strong>en</strong>tant la <strong>voix</strong> sous une<br />

forme concrète, accessible, un geste sur lequel on a prise et que l’on peut mo<strong>de</strong>ler ». (Esti<strong>en</strong>ne,<br />

1998, p. 9). Il s’agit ici plus précisém<strong>en</strong>t <strong>de</strong> donner au pati<strong>en</strong>t la possibilité <strong>de</strong> jouer avec <strong>sa</strong> <strong>voix</strong> et<br />

d’avoir par conséqu<strong>en</strong>t avec elle une relation apaisée.<br />

Plus profondém<strong>en</strong>t <strong>en</strong>core, constatant que « une <strong>voix</strong> qui va mieux est une porte d’<strong>en</strong>trée à un<br />

remaniem<strong>en</strong>t <strong>de</strong> toute la personne », et que d’autre part, « un état émotionnel négatif peut être<br />

causé et/ou <strong>en</strong>tret<strong>en</strong>u par un problème vocal », Françoise Esti<strong>en</strong>ne et Dominique Morsomme<br />

écriv<strong>en</strong>t que « l’objectif d’une <strong>rééducation</strong> peut être <strong>de</strong> travailler le geste vocal ce qui va <strong>en</strong>traîner<br />

1 Gre<strong>en</strong>, M Mathieson L (2001) The voice and its disor<strong>de</strong>rs. Whurr, London<br />

2 Wilson J.A., Deary I.J, Scott S et al. (1995) Functional dysphonia. Br. Med. J 311, 1039-1040<br />

Deary I.J, Scott S, Wilson I.M. et al (1997) Personality and psychological distress indysphonia. Br. J. Health Psychol. 2, 1-9<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 3


d’autres s<strong>en</strong><strong>sa</strong>tions et émotions et recadrer [la] façon <strong>de</strong> [se] percevoir et <strong>de</strong> percevoir [<strong>sa</strong>] <strong>voix</strong> [du<br />

pati<strong>en</strong>t] ».(Esti<strong>en</strong>ne & Morsomme, 2009, p. 267)<br />

Peut-être peut-on considérer, <strong>en</strong> orthophonie comme <strong>en</strong> musicothérapie, qu’« une ai<strong>de</strong> à un mieux<br />

être, à une meilleure gestion du handicap » est égalem<strong>en</strong>t un soin. (Blayac, B<strong>en</strong>sous<strong>sa</strong>n, & Marotin,<br />

2012, p. 149)<br />

1.1.2.2 Complém<strong>en</strong>tarité <strong>de</strong>s conceptions sci<strong>en</strong>tifiques et traditionnelles<br />

Comme le rapporte Caroline Leclerc, la profession d’orthophoniste et <strong>de</strong> phoniatre utilise <strong>de</strong>s<br />

modèles étiologico-thérapeutique à la fois ontologiques (investigation objective <strong>de</strong> l’anatomie et <strong>de</strong><br />

son fonctionnem<strong>en</strong>t physiologique) et fonctionnalistes (exploration du déséquilibre inhér<strong>en</strong>t au<br />

sujet) (Leclerc, 2007, pp. 107–108) « La pratique orthophonique <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> se fon<strong>de</strong> sur<br />

les <strong>sa</strong>voirs réc<strong>en</strong>ts <strong>de</strong> la biomé<strong>de</strong>cine, bénéficiant <strong>de</strong> surcroît <strong>de</strong> la légitimité du paradigme<br />

sci<strong>en</strong>tifique dans notre société » (Bergeras & Tain, 2007, p. 177) Cep<strong>en</strong>dant les orthophonistes<br />

désireux <strong>de</strong> redonner une <strong>voix</strong> qui soit <strong>en</strong> cohér<strong>en</strong>ce avec la personne recherch<strong>en</strong>t <strong>de</strong>s alternatives<br />

à la biomé<strong>de</strong>cine (Fortin et al., 2007, p. 238). Les <strong>sa</strong>voirs traditionnels, non médicaux et non<br />

sci<strong>en</strong>tifiques, rest<strong>en</strong>t incontournables : « la formation auprès <strong>de</strong> chanteurs, professeurs <strong>de</strong> chant,<br />

musicothérapeutes, spécialistes Fel<strong>de</strong>nkrais, professeurs <strong>de</strong> yoga, etc. représ<strong>en</strong>te <strong>en</strong>viron un quart<br />

<strong>de</strong>s stages <strong>de</strong> formation effectués par les orthophonistes » (Bergeras & Tain, 2007, p. 177).<br />

L’orthophoniste part<strong>en</strong>aire du mé<strong>de</strong>cin et du chirurgi<strong>en</strong><br />

« La dysphonie, et plus particulièrem<strong>en</strong>t la dysphonie dysfonctionnelle, est plurifactorielle. Pour la<br />

traiter, il faut donc lutter contre tous les facteurs pouvant la provoquer ou l’aggraver ». (Amy <strong>de</strong> la<br />

Bretèque, 2012, p. 132) B<strong>en</strong>oît Amy <strong>de</strong> la Bretèque rappelle donc que le rééducateur doit être le<br />

relai vers le mé<strong>de</strong>cin pour parv<strong>en</strong>ir à limiter les reflux gastro-oesophagi<strong>en</strong>, allergies respiratoires,<br />

troubles hormonaux, habitu<strong>de</strong>s toxiques, etc.. La phonochirurgie peut aussi s’avérer néces<strong>sa</strong>ire. On<br />

peut prévoir égalem<strong>en</strong>t d’autres thérapies : kinésithérapie, yoga, sophrologie, psychothérapie (Amy<br />

<strong>de</strong> la Bretèque, 2012, p. 130)<br />

La dim<strong>en</strong>sion psychologique<br />

La relation thérapeutique revêt, dans le cadre <strong>de</strong> la <strong>rééducation</strong> <strong>vocale</strong>, une dim<strong>en</strong>sion<br />

psychologique dont il est important <strong>de</strong> t<strong>en</strong>ir compte. La <strong>voix</strong> émise par le sujet joue un « rôle<br />

émin<strong>en</strong>t dans la constitution <strong>de</strong> la personnalité et parfois peut-être aussi dans <strong>sa</strong> désorgani<strong>sa</strong>tion.<br />

La pati<strong>en</strong>te Dysphonique ou aphonique, que <strong>de</strong>s causes organiques ai<strong>en</strong>t été ou non trouvées à son<br />

symptôme, va expérim<strong>en</strong>ter une <strong>de</strong>s situations les plus traumati<strong>sa</strong>ntes qui soit, il a perdu un li<strong>en</strong><br />

ess<strong>en</strong>tiel avec lui-même et avec le mon<strong>de</strong> qui l‘<strong>en</strong>toure. C’est dire l’intérêt d’une prise <strong>en</strong> charge<br />

globale <strong>de</strong> toute perturbation <strong>de</strong> l’émission <strong>vocale</strong> » (Chevrie-Muller, 1990, p. 64) Lorsqu’il propose<br />

neuf élém<strong>en</strong>ts ou principes <strong>de</strong> base afin <strong>de</strong> mesurer et comparer les traitem<strong>en</strong>ts orthophoniques,<br />

Philippe Dejonckere intitule le 4è élém<strong>en</strong>t «prise <strong>en</strong> charge psychologique» (Dejonckere, 2001, p.<br />

353) L’auteur note : « c’est l’individu dans <strong>sa</strong> totalité, et <strong>en</strong> particulier avec ses dim<strong>en</strong>sions<br />

psychologique et émotionnelle, qui <strong>de</strong>vra être assumé. La compo<strong>sa</strong>nte psychogène peut bi<strong>en</strong><br />

<strong>en</strong>t<strong>en</strong>du être primaire, mais elle peut aussi résulter <strong>de</strong> la perturbation sociale, professionnelle ou<br />

émotionnelle qu’occasionne par répercussion une affection primairem<strong>en</strong>t organique ».<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 4


Comme le précis<strong>en</strong>t certains auteurs, il est néces<strong>sa</strong>ire cep<strong>en</strong>dant que « l’orthophoniste ne soit pas<br />

pris pour un psychothérapeute, dont il n’a d’ailleurs pas la formation, bi<strong>en</strong> que ses qualités d’écoute<br />

et d’empathie soi<strong>en</strong>t à l’évi<strong>de</strong>nce fondam<strong>en</strong>tales pour assurer le succès <strong>de</strong> l’<strong>en</strong>treprise. » (Amy <strong>de</strong> la<br />

Bretèque, 2012, p. 133) Parfois c’est le travail sur la <strong>voix</strong> qui permet à la personne d’ « expérim<strong>en</strong>ter<br />

qu’elle peut quand même agir sur <strong>sa</strong> <strong>voix</strong> et que celle-ci est prête à changer » (Esti<strong>en</strong>ne &<br />

Morsomme, 2009, p. 267)<br />

Technique <strong>de</strong> <strong>rééducation</strong> orthophonique<br />

Selon B<strong>en</strong>oît Amy <strong>de</strong> la Bretèque notamm<strong>en</strong>t, « la <strong>rééducation</strong> soigne la <strong>voix</strong> plus que les cor<strong>de</strong>s »,<br />

et l’objectif est <strong>de</strong> trouver <strong>en</strong> premier lieu un bon accord pneumo-phonatoire, c’est-à-dire un<br />

équilibre aérodynamique qui permette une bonne vibration laryngée, puis un accord phonorésonantiel,<br />

qui <strong>en</strong>richisse le timbre <strong>de</strong> la <strong>voix</strong>.<br />

Dans le précis d’audiologie et <strong>de</strong> déglutition, Françoise Esti<strong>en</strong>ne et Dominique Morsomme<br />

propos<strong>en</strong>t un tour d’horizon <strong>de</strong> la littérature francophone et anglo-<strong>sa</strong>xonne sur le traitem<strong>en</strong>t<br />

orthophonique <strong>de</strong>s pathologies <strong>vocale</strong>s. (Esti<strong>en</strong>ne & Morsomme, 2009, pp. 258–261) Elles<br />

conclu<strong>en</strong>t : « Les ouvrages que nous avons relevés décriv<strong>en</strong>t minutieusem<strong>en</strong>t une série d’exercices<br />

très précis c<strong>en</strong>trés sur la posture, la respiration, la relaxation, l’<strong>en</strong>traînem<strong>en</strong>t vocal proprem<strong>en</strong>t dit,<br />

axé sur les divers paramètres <strong>de</strong> la <strong>voix</strong> : t<strong>en</strong>ue, hauteur, ét<strong>en</strong>due, timbre, mélodie… Les<br />

<strong>en</strong>traînem<strong>en</strong>ts sont effectués à partir <strong>de</strong> certaines consonnes et voyelles choisies <strong>en</strong> fonction <strong>de</strong> leur<br />

effet sur la mécanique <strong>vocale</strong>, exercices progressifs <strong>de</strong> comptage, lecture indirecte et directe, mise<br />

<strong>en</strong> situation, projection <strong>vocale</strong>, etc… Il y a donc une étonnante converg<strong>en</strong>ce <strong>en</strong>tre les auteurs <strong>de</strong><br />

langue française et anglo-<strong>sa</strong>xonne pour prés<strong>en</strong>ter une <strong>rééducation</strong> <strong>vocale</strong> comme un parcours<br />

minutieux, décortiqué, applicable dans les divers types <strong>de</strong> pathologies <strong>vocale</strong>s »<br />

1.1.2.3 Conclusion<br />

La <strong>rééducation</strong> <strong>vocale</strong> compr<strong>en</strong>d à la fois une partie technique et une partie plus psychologique<br />

s’intéres<strong>sa</strong>nt notamm<strong>en</strong>t à l’image <strong>de</strong> soi du pati<strong>en</strong>t. Notre travail va s’attacher à étudier les<br />

conséqu<strong>en</strong>ces objectives et subjectives <strong>de</strong> l’utili<strong>sa</strong>tion d’un outil <strong>de</strong> rétro-contrôle visuel : le<br />

spectrogramme. Voyons d’abord <strong>en</strong> quoi consiste le rétro-contrôle <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong>.<br />

1.1.3 Rétro-contrôle (feedback) <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong><br />

1.1.3.1 Définition <strong>de</strong> l’appr<strong>en</strong>tis<strong>sa</strong>ge par feedback<br />

Graham F. Welch (Welch, 1985, p. 3) rappelle que c’est Wi<strong>en</strong>er <strong>en</strong> 1948 3 qui appliqua au corps<br />

humain le modèle physique <strong>de</strong> rétro-contrôle appliqué habituellem<strong>en</strong>t aux machines.<br />

« dans la littérature traditionnelle sur l’acquisition d’habileté, le feedback correspond à l’information<br />

s<strong>en</strong>sorielle (auditive, visuelle, kinesthésique, etc.) que le sujet qui appr<strong>en</strong>d traite, relativem<strong>en</strong>t à <strong>sa</strong><br />

propre performance » (Verdolini & Krebs, 1999, p. 234) 4<br />

3 Wi<strong>en</strong>er,N. (1948). Cybernetics or Control and Communication in the Animal and the Machine. New York: Wiley<br />

4 “in the traditional skill-acquisition literature, feedback refers to s<strong>en</strong>sory information –auditory, visual, kinesthetic, and so<br />

forth- that learners process relative to their own performance”<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 5


Le terme <strong>de</strong> feedback désigne l’<strong>en</strong>semble du dispositif <strong>de</strong> régulation d’un système assurant une<br />

rétroaction. Ce système <strong>de</strong> régulation met <strong>en</strong> œuvre :<br />

- Une rétro-information (ou information <strong>de</strong> retour, feedback) : qui donne à un événem<strong>en</strong>t<br />

une valeur informationnelle. Pour cela cet événem<strong>en</strong>t doit être capté transmis et analysé. Il<br />

est soit d’origine interne (intéroceptive ou proprioceptive) soit d’origine externe<br />

(extéroceptive = KR = « Knowledge of result » = feedback externe)<br />

- Un rétro-contrôle : qui compare ce qui a été réalisé et ce qui était prévu<br />

- Une rétro-comman<strong>de</strong> (ou c<strong>en</strong>tre <strong>de</strong> décision) qui assure une correction <strong>en</strong> cas d’erreur.<br />

« Pour que l’acte réalisé soit conforme à son projet, il est néces<strong>sa</strong>ire que <strong>de</strong>s informations <strong>en</strong> retour<br />

(rétro-information) r<strong>en</strong>seign<strong>en</strong>t sur la qualité <strong>de</strong> son exécution (rétrocontrôle) et permett<strong>en</strong>t un<br />

ajustem<strong>en</strong>t (régulation) c’est-à-dire une correction (rétro-comman<strong>de</strong>) aboutis<strong>sa</strong>nt à la réali<strong>sa</strong>tion <strong>de</strong><br />

l’acte décidé (rétroaction) » (d’après andré, brugerolle, fraissinette) (Zon<strong>de</strong>r, 2002, pp. 18–19)<br />

le « knowledge of results » (=connais<strong>sa</strong>nce <strong>de</strong>s résultats = feedback externe) « correspond à<br />

l’information fournie à celui qui appr<strong>en</strong>d par une source externe, un professeur par exemple, à<br />

propos <strong>de</strong>s résultats <strong>de</strong> la production relativem<strong>en</strong>t à un certain but » 5 (Steinhauer & Grayhack, 2000,<br />

p. 137b).<br />

Deux modalités <strong>de</strong> connais<strong>sa</strong>nce <strong>de</strong>s résultats doiv<strong>en</strong>t être associées pour permettre un<br />

appr<strong>en</strong>tis<strong>sa</strong>ge : le feedback d’action permettant <strong>de</strong> modifier l’action <strong>en</strong> cours, et le feedback<br />

terminal ou d’appr<strong>en</strong>tis<strong>sa</strong>ge indiquant les modifications <strong>de</strong>vant interv<strong>en</strong>ir lors <strong>de</strong>s actions futures.<br />

(in Zon<strong>de</strong>r, 2002, p. 19)<br />

1.1.3.2 Trois phases <strong>de</strong> l’appr<strong>en</strong>tis<strong>sa</strong>ge moteur<br />

Selon Fitts et Postner 1967 6 (in Volin, 1999, pp. 242–243), l’appr<strong>en</strong>tis<strong>sa</strong>ge moteur connait trois<br />

phases qui se chevauch<strong>en</strong>t : la phase cognitive, la phase associative et la phase d’autonomi<strong>sa</strong>tion.<br />

- La phase cognitive est relativem<strong>en</strong>t brève et permet <strong>de</strong>s progrès importants dans la<br />

réali<strong>sa</strong>tion d’une tâche motrice. P<strong>en</strong>dant cette phase, le sujet utilise <strong>de</strong>s feedbacks pour<br />

analyser et compr<strong>en</strong>dre les différ<strong>en</strong>tes compo<strong>sa</strong>ntes <strong>de</strong> l’activité à appr<strong>en</strong>dre.<br />

- La phase associative <strong>de</strong>man<strong>de</strong> plus <strong>de</strong> temps. Durant la phase associative, les sujets font <strong>de</strong>s<br />

ajustem<strong>en</strong>ts fins et les erreurs diminu<strong>en</strong>t <strong>en</strong> fréqu<strong>en</strong>ce et <strong>en</strong> importance. Le sujet acquiert<br />

<strong>de</strong>s mécanismes internes <strong>de</strong> détection et <strong>de</strong> correction d’erreur qui remplac<strong>en</strong>t<br />

progressivem<strong>en</strong>t les élém<strong>en</strong>ts <strong>de</strong> feedback externe. Afin d’assurer un appr<strong>en</strong>tis<strong>sa</strong>ge à long<br />

terme qui ne soit pas dép<strong>en</strong>dant du feedback externe, il est important <strong>de</strong> le réduire<br />

progressivem<strong>en</strong>t 7 8 9 (in Volin, 1999, p. 243)<br />

5<br />

“Knowledge of results (KR) refers to information provi<strong>de</strong>d to the learner by an external source, such as a teacher, about<br />

performance results relative so some goal”<br />

6<br />

Fitts et Postner (1967) Human performance. Belmon, CA ;: Brooks/Cole<br />

7<br />

Schmidt et al 1990 optimizing summary knowledge of results for skill learning. Human Movem<strong>en</strong>t Sci<strong>en</strong>ce, 9, 325-348<br />

8<br />

Young & Schmidt 1992 augm<strong>en</strong>ted kinematic feedback for motor learning. Journal of motor behavior, 24(3), 261-273<br />

9<br />

Wulf et al 1993 reduced feedback frequ<strong>en</strong>cy <strong>en</strong>hances g<strong>en</strong>eralized motor program learning but not parameterization learning.<br />

Journal of experim<strong>en</strong>tal psychology: learning, memory, and cognition, 19(5), 1134-1150<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 6


- La phase d’autonomi<strong>sa</strong>tion est atteinte après <strong>de</strong> longues heures <strong>de</strong> pratique. L’att<strong>en</strong>tion<br />

consci<strong>en</strong>te n’est plus néces<strong>sa</strong>ire pour contrôler l’action et la corriger. Le sujet peut se<br />

conc<strong>en</strong>trer sur <strong>de</strong>s tâches <strong>de</strong> plus haut niveau.<br />

1.1.3.3 Particularité du rétro-contrôle pour la production <strong>vocale</strong><br />

Rétro-contrôles habituels pour la <strong>voix</strong><br />

S<strong>en</strong>soriel, proprioceptif, postural<br />

Des mécanorécepteurs laryngés donn<strong>en</strong>t aux c<strong>en</strong>tres corticaux <strong>de</strong>s informations sur l’état <strong>de</strong><br />

t<strong>en</strong>sion et la position <strong>de</strong>s différ<strong>en</strong>ts muscles et <strong>de</strong>s différ<strong>en</strong>tes articulations. « <strong>en</strong> cours <strong>de</strong><br />

phonation, ces informations permett<strong>en</strong>t les ajustem<strong>en</strong>ts instantanés nécessités par le mainti<strong>en</strong><br />

d’une configuration glottique donnée. D’autres arcs réflexes d’origine abdominale, thoracique,<br />

cervicale, linguale, etc. contribu<strong>en</strong>t probablem<strong>en</strong>t aux ajustem<strong>en</strong>ts perman<strong>en</strong>ts agis<strong>sa</strong>nt par<br />

feedback sur le larynx au cours <strong>de</strong> la phonation » (Giovanni, Robieux, & Santini, 2012, p. 16) Le<br />

feedback proprioceptif concerne ainsi la position <strong>de</strong>s principales structures du larynx, notamm<strong>en</strong>t la<br />

position <strong>de</strong>s plis vocaux et <strong>de</strong>s cartilages aryténoï<strong>de</strong>s, la position <strong>de</strong> la langue, du palais mou et <strong>de</strong>s<br />

lèvres. (Welch, 1985, p. 8)<br />

Larson et ses collègues ont étudié le comportem<strong>en</strong>t du larynx lorsqu’il était anesthésié, et ont<br />

conclu que les feedbacks auditif et somatos<strong>en</strong>soriels sont tous les <strong>de</strong>ux utilisés pour le contrôle <strong>de</strong><br />

la hauteur tonale (Larson, Altman, Liu, & Hain, 2008, p. 619a)<br />

Auditif : boucle audio-phonatoire<br />

« La <strong>voix</strong> est sous le contrôle <strong>de</strong>s c<strong>en</strong>tres auditifs comme le montre la <strong>voix</strong> perturbée et non modulée<br />

<strong>de</strong>s sourds profonds. Il existe probablem<strong>en</strong>t <strong>de</strong>s comman<strong>de</strong>s induites volontairem<strong>en</strong>t par les voies<br />

cortico-bulbaires <strong>en</strong> réponse aux informations acoustiques parv<strong>en</strong>ues jusqu’au cortex auditif <strong>de</strong><br />

même qu’un <strong>en</strong>semble <strong>de</strong> réflexes acoustico-laryngés » (Giovanni et al., 2012, p. 16)<br />

Citant Johan Sundberg (1987), Garyth Nair explique la différ<strong>en</strong>ce <strong>de</strong> perception auditive interne et<br />

externe par le fait que la conduction osseuse, par laquelle notre propre <strong>voix</strong> arrive à notre oreille,<br />

transmet moins bi<strong>en</strong> les hautes fréqu<strong>en</strong>ces que la conduction aéri<strong>en</strong>ne. 10 Il est rejoint <strong>en</strong> cela par<br />

Welch (Welch, 1985, p. 9) citant Békésy 11 , et par Verdolini et Krebs. (Verdolini & Krebs, 1999, p.<br />

234) On note qu’on peut augm<strong>en</strong>ter la perception externe d’un locuteur ou d’un chanteur à<br />

moindre frais <strong>en</strong> utili<strong>sa</strong>nt ses mains comme porte-<strong>voix</strong> <strong>en</strong>tre la bouche et l’oreille. Garyth Nair<br />

p<strong>en</strong>se que cette technique tronque et modifie le son arrivant à l’oreille, ; il cite pour <strong>sa</strong> part le<br />

système ARTF (Aural Real-Time Feedback) qui r<strong>en</strong>voit grâce à un micro et <strong>de</strong>s haut-parleurs la <strong>voix</strong><br />

du sujet à ses oreilles (Nair, 1999, pp. 66–67) ;<br />

Le feedback auditif, sous la forme d’<strong>en</strong>registrem<strong>en</strong>ts écoutés a posteriori est facilem<strong>en</strong>t accessible<br />

(Le Huche & Allali, 2001, p. 151), mais, n’étant pas <strong>en</strong> temps réel, il ne relève pas directem<strong>en</strong>t <strong>de</strong> la<br />

10 “the bone-conducted sound differs from the air-conducted sound in one important respect; at high frequ<strong>en</strong>cies, boneconduction<br />

is less effici<strong>en</strong>t than air-conduction, so that the received spectrum of a bone-conducted sound falls off toward higher<br />

frequ<strong>en</strong>cies at a 6 dB/octave faster rate than airborne sounds” (Sundberg 1987 p. 159 cite par Nair p.14)<br />

11 Békésy, G, von (1971); The Ear. In The biological Bases of Behaviour. London: Op<strong>en</strong> University Press, 93-105<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 7


oucle audio-phonatoire. Garyth Nair recomman<strong>de</strong>, pour les chanteurs, d’utiliser d’abord le « postperformance<br />

Aural feedback » avec un <strong>en</strong>registrem<strong>en</strong>t, ce qui permet d’affiner l’acuité <strong>de</strong> l’oreille<br />

<strong>de</strong> l’élève, et d’utiliser <strong>en</strong>suite le « aural real-time feedback », c’est-à-dire le retour instantané <strong>de</strong> la<br />

production <strong>vocale</strong> à l’oreille <strong>de</strong> l’élève, afin <strong>de</strong> réduire l’écart <strong>en</strong>tre ce que l’élève perçoit et ce qui<br />

est émis à l’extérieur. (Nair, 1999, p. 67)<br />

Feedback verbal<br />

Nous relevons ici <strong>de</strong>s remarques prov<strong>en</strong>ant <strong>de</strong> recherches conduites sur les leçons <strong>de</strong> chant, mais<br />

qui pour une gran<strong>de</strong> part s’appliqu<strong>en</strong>t égalem<strong>en</strong>t au feedback verbal fourni aux pati<strong>en</strong>ts<br />

dysphoniques et dysodiques par les orthophonistes.<br />

Selon Garyth Nair, la pédagogie <strong>vocale</strong> passe souv<strong>en</strong>t par la modéli<strong>sa</strong>tion par le professeur du geste<br />

et l’imitation par l’élève, et ce processus compr<strong>en</strong>d la plupart du temps <strong>de</strong>s comm<strong>en</strong>taires <strong>de</strong> la<br />

part du professeur qui « inclu<strong>en</strong>t <strong>de</strong>s indications sur l’amélioration <strong>de</strong> la production autant que sur<br />

les problèmes qui nécessit<strong>en</strong>t une correction […] ces comm<strong>en</strong>taires […] constitu<strong>en</strong>t un feedback dans<br />

le meilleur s<strong>en</strong>s du terme » 12 (Nair, 1999, p. 66)<br />

Donald G Miller souligne pour <strong>sa</strong> part que les termes utilisés lors <strong>de</strong>s leçons <strong>de</strong> chant manqu<strong>en</strong>t<br />

d’objectivité, et que l’expression <strong>de</strong>s impressions subjectives données par les perceptions du chant<br />

(proprioceptives et auditives) constitue un défi pour le langage 13 (Donald Gray Miller, 2008, p. 7).<br />

Selon Graham F. Welch et son équipe, citant une étu<strong>de</strong> <strong>de</strong> Callaghan <strong>en</strong> 1997, les termes <strong>de</strong>s<br />

professeurs <strong>de</strong> chant ne correspon<strong>de</strong>nt pas à une réalité physiologique ou acoustique, et cela peut<br />

conduire à <strong>de</strong> mauvaises informations durant une leçon <strong>de</strong> chant 14 . (in Welch, Howard, Himoni<strong>de</strong>s,<br />

& Brereton, 2005, p. 227)<br />

Imitation<br />

Le thérapeute ou le professeur <strong>de</strong> chant peut égalem<strong>en</strong>t r<strong>en</strong>voyer à la personne qu’il accompagne<br />

une image globale <strong>de</strong> son comportem<strong>en</strong>t vocal et du son qui <strong>en</strong> résulte <strong>en</strong> imitant ce que la<br />

personne vi<strong>en</strong>t <strong>de</strong> faire, év<strong>en</strong>tuellem<strong>en</strong>t <strong>en</strong> caricaturant pour que les traits dont il veut faire<br />

pr<strong>en</strong>dre consci<strong>en</strong>ce soit facilem<strong>en</strong>t i<strong>de</strong>ntifiables. (Le Huche & Allali, 2001, p. 151)<br />

Suppléer les feedbacks auditifs, proprioceptifs et verbaux<br />

On note avec Robert W. Bastian et Matthew J. Nagorsky qu’ « il est très difficile <strong>de</strong> modifier la<br />

production <strong>vocale</strong> quand les outils traditionnels utilisés pour produire <strong>de</strong>s changem<strong>en</strong>ts dans le<br />

comportem<strong>en</strong>t vocal, les feedbacks auditif et somesthésiques, ne sont pas bi<strong>en</strong> développés chez un<br />

pati<strong>en</strong>t donné » 15 (Bastian & Nagorsky, 1987, p. 1346a). Effectivem<strong>en</strong>t : « Parfois, il est impossible<br />

12 “such comm<strong>en</strong>ts inclu<strong>de</strong> indications about improved production as well as problems in need of correction. […] these<br />

statem<strong>en</strong>ts give stu<strong>de</strong>nts an external indication of the status of their progress, and, in the best s<strong>en</strong>se of the word, constitute<br />

feedback”<br />

13 “what the singer does and what the ear hears are experi<strong>en</strong>ced quite subjectively, and in ways that severely chall<strong>en</strong>ge the<br />

<strong>de</strong>scriptive powers of language”<br />

14 Callaghan, J. (1997) The relationship betwe<strong>en</strong> sci<strong>en</strong>tific un<strong>de</strong>rstandings of voice and curr<strong>en</strong>t practice in the teaching of singing in<br />

Australia. Unpublished PhD thesis, University of Western Sydney, Nepean.<br />

15 “modifying vocal production can be very difficult wh<strong>en</strong> the traditional tools used to make changes in vocal behavior, auditory<br />

and somatos<strong>en</strong>sory feedbacks, ar not well <strong>de</strong>veloped in a giv<strong>en</strong> pati<strong>en</strong>t”<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 8


d’utiliser les systèmes s<strong>en</strong>soriels disponibles, il est alors néces<strong>sa</strong>ire <strong>de</strong> faire appel à un dispositif <strong>de</strong><br />

rétro-information externe capable <strong>de</strong> <strong>sa</strong>isir le phénomène à analyser. » André 1986 (in Zon<strong>de</strong>r,<br />

2002, p. 20).<br />

Garyth Nair théorise la pédagogie du chant <strong>en</strong> soulignant les limites <strong>de</strong> la métho<strong>de</strong> traditionnelle <strong>de</strong><br />

modèle et d’imitation. Pour lui, « les chanteurs r<strong>en</strong>contr<strong>en</strong>t <strong>de</strong>ux <strong>en</strong>traves majeures […] : pour la<br />

plus gran<strong>de</strong> partie, il n’y a pas d’<strong>en</strong>trée visuelle pour ai<strong>de</strong>r le processus d’appr<strong>en</strong>tis<strong>sa</strong>ge. La plupart<br />

<strong>de</strong>s comportem<strong>en</strong>ts cibles pour la musculature du chant sont internes […] la perception interne <strong>de</strong>s<br />

chanteurs <strong>de</strong> leur propre son est manifestem<strong>en</strong>t différ<strong>en</strong>t <strong>de</strong> la réalité perçue par les auditeurs » 16<br />

(Nair, 1999, pp. 13–14).<br />

Dans le modèle pédagogique standard <strong>de</strong>s cours <strong>de</strong> chant, « le professeur s’efforce <strong>de</strong> traduire la<br />

performance <strong>de</strong> l’élève, par exemple <strong>en</strong> transformant le geste musical <strong>de</strong> l’élève <strong>en</strong> langage, et<br />

l’élève s’efforce alors <strong>de</strong> traduire le feedback verbal et visuel <strong>de</strong> son professeur dans une<br />

performance musicale plus adaptée. Cela conduit à la possibilité d’une double mauvaise<br />

interprétation <strong>de</strong> l’information » 17 (David M Howard et al., 2007, p. 21a) (Welch et al., 2005, p. 227)<br />

Selon Verdolini et Krebs, l’analyse spectrale permet <strong>de</strong> régler le problème du feedback auditif, qui<br />

est mauvais lorsque l’élève s’écoute lui-même directem<strong>en</strong>t, et qui n’est pas suffi<strong>sa</strong>mm<strong>en</strong>t stable<br />

lorsque c’est un professeur qui le donne. L’analyse spectrale, elle, est fiable, reproductible, et<br />

extrêmem<strong>en</strong>t rapi<strong>de</strong>.(Verdolini & Krebs, 1999, pp. 235–236)<br />

Selon I<strong>sa</strong>belle Marié-Bailly, « l’écoute <strong>de</strong>s harmoniques du timbre <strong>de</strong> la <strong>voix</strong> permet l’optimi<strong>sa</strong>tion <strong>de</strong><br />

la perception s<strong>en</strong>sorielle et <strong>de</strong> l’émission du geste vocal, par une activation <strong>de</strong> la boucle<br />

audiophonatoire. Celle-ci est r<strong>en</strong>forcée par la visuali<strong>sa</strong>tion du spectre harmonique vocal sur le<br />

sonagramme proposé comme outil pédagogique et <strong>de</strong> <strong>rééducation</strong> <strong>de</strong> la <strong>voix</strong> parlée et chantée »<br />

(Marié-Bailly, 2004).<br />

Particularité <strong>de</strong> l’appr<strong>en</strong>tis<strong>sa</strong>ge vocal <strong>en</strong> tant que comportem<strong>en</strong>t moteur<br />

Bi<strong>en</strong> que la production <strong>vocale</strong> soit une forme <strong>de</strong> comportem<strong>en</strong>t moteur, Kimberly Steinhauer et<br />

Judith Preston Grayhack pos<strong>en</strong>t la question <strong>de</strong> la particularité du feedback (<strong>en</strong>traînem<strong>en</strong>t avec<br />

Knowledge Result) pour la production <strong>vocale</strong> (Steinhauer & Grayhack, 2000, p. 138b). Citant l’étu<strong>de</strong><br />

<strong>de</strong> Ferrand, les auteurs expliqu<strong>en</strong>t que celui-ci n’a pas obt<strong>en</strong>u d’effet d’appr<strong>en</strong>tis<strong>sa</strong>ge sur shimmer<br />

et jitter d’un /a/ t<strong>en</strong>u contrairem<strong>en</strong>t à ce qui est att<strong>en</strong>du pour <strong>de</strong>s tâches motrices classiques<br />

(Ferrand, 1995, p. 421),<br />

Dans leur étu<strong>de</strong> sur l’adhér<strong>en</strong>ce au traitem<strong>en</strong>t <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong>, Eva van Leer et ses collègues<br />

not<strong>en</strong>t que dans l’appr<strong>en</strong>tis<strong>sa</strong>ge <strong>de</strong> la technique <strong>vocale</strong>, le feedback est un point souv<strong>en</strong>t mis <strong>en</strong><br />

avant par les pati<strong>en</strong>ts. Selon certains participants, la production <strong>vocale</strong> est plus difficile à juger que<br />

16 “singers <strong>en</strong>counter two major impedim<strong>en</strong>ts […] : for the most part, there is no visual input to help the learning process. Most<br />

of the target behaviors for the singing musculature are internal […] singers(internal perception of their own sound is markedly<br />

differ<strong>en</strong>t from the external reality experi<strong>en</strong>ced by list<strong>en</strong>ers”<br />

17 “The teacher is <strong>en</strong>gaged in a psychological translation of the stu<strong>de</strong>nt’s performance, for example, by turning musical gestures<br />

into language, and the stu<strong>de</strong>nt is <strong>en</strong>gaged in a further translation of the teacher’s verbal and visual feedback into adapted<br />

singing performance. A dual possibility thereby exists for the misinterpretation of information”<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 9


d’autres tâches motrices comme appr<strong>en</strong>dre à faire du vélo ou faire du jogging par exemple. Cela<br />

<strong>de</strong>man<strong>de</strong> plus <strong>de</strong> conc<strong>en</strong>tration. De plus, les tâches <strong>vocale</strong>s <strong>de</strong>mandées sembl<strong>en</strong>t représ<strong>en</strong>ter un<br />

défi s<strong>en</strong>sori-moteur unique, et les objectifs <strong>de</strong>mandés dans les exercices vocaux sont difficiles à<br />

évaluer par rapport à d’autres programmes <strong>de</strong> <strong>sa</strong>nté (comme la réduction du nombre <strong>de</strong> cigarettes<br />

fumées, le poids perdu ou gagné, etc.) Les participants relèv<strong>en</strong>t que le fait <strong>de</strong> ne pas <strong>sa</strong>voir s’ils font<br />

bi<strong>en</strong> ou non les démotive <strong>de</strong> s’exercer chaque jour. Les pati<strong>en</strong>ts ont besoin d’un retour pour faire<br />

leurs exercices vocaux. (Van Leer & Connor, 2010, pp. 463b, 467a)<br />

1.1.3.4 feedback acoustique <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong><br />

Bastian et Nagorsky cit<strong>en</strong>t diverses étu<strong>de</strong>s montrant que <strong>de</strong>s outils électroniques <strong>de</strong> feedback sont<br />

d’un grand intérêt : un affichage <strong>de</strong> l’int<strong>en</strong>sité <strong>vocale</strong> pour les pati<strong>en</strong>ts parkinsonni<strong>en</strong>s 18 , pour le<br />

traitem<strong>en</strong>t <strong>de</strong>s nodules vocaux, polypes, ulcères 19 (in Bastian & Nagorsky, 1987, p. 1346a).<br />

On trouve égalem<strong>en</strong>t <strong>de</strong> nombreux dispositifs <strong>de</strong> visuali<strong>sa</strong>tion <strong>de</strong> la fréqu<strong>en</strong>ce fondam<strong>en</strong>tale,<br />

notamm<strong>en</strong>t le logiciel Sing & See développé par Callaghan et son équipe 20 21 22 (Wilson et al., 2007).<br />

Les différ<strong>en</strong>ts modules du SpeechViewer offr<strong>en</strong>t, dans les années 1990 une façon <strong>de</strong> jouer <strong>en</strong> temps<br />

réel avec les différ<strong>en</strong>ts paramètres <strong>de</strong> <strong>sa</strong> <strong>voix</strong> : l’amplitu<strong>de</strong>, le voisem<strong>en</strong>t, la fréqu<strong>en</strong>ce<br />

fondam<strong>en</strong>tale, les formants voyelliques. (Peloux, 1993, pp. 15–18)<br />

On peut citer d’autres logiciels <strong>de</strong> <strong>rééducation</strong> comme Dr Speech, Diana, PCLX, la suite LingWaves<br />

(Allemagne), le logiciel PreLingua (Rodríguez, Saz, & Lleida, 2012) , Vocalab… qui propos<strong>en</strong>t<br />

différ<strong>en</strong>tes sortes <strong>de</strong> visuali<strong>sa</strong>tions et d’actions à partir <strong>de</strong>s caractéristiques acoustiques <strong>de</strong> la<br />

production <strong>vocale</strong>. Plusieurs <strong>de</strong> ces logiciels sont <strong>de</strong>stinés à <strong>de</strong>s <strong>en</strong>fants prés<strong>en</strong>tant une surdité.<br />

1.1.3.5 Conclusion<br />

Toute production <strong>vocale</strong> est contrôlée par un système d’auto-régulation nécessitant <strong>de</strong>s feedbacks<br />

internes (proprioceptifs et audition par voie osseuse) comme externes (audition par voie aéri<strong>en</strong>ne).<br />

Ces feedbacks ne r<strong>en</strong>voi<strong>en</strong>t pas au locuteur une image exacte du son perçu par les auditeurs, et<br />

parfois ne sont pas fiables (<strong>en</strong> cas <strong>de</strong> douleur laryngée, <strong>de</strong> surdité par exemple). Les feedbacks<br />

habituels <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> (feedback verbal, imitation) peuv<strong>en</strong>t être utilem<strong>en</strong>t complétés par<br />

un outil rationali<strong>sa</strong>nt le son externe perçu. Contrairem<strong>en</strong>t aux autres outils prés<strong>en</strong>tés ci-<strong>de</strong>ssus, le<br />

spectrogramme fournit une image plus complète <strong>de</strong> ces données acoustiques.<br />

18 Rubow R and Swift A : A microcomputer-based waerable biofeedback <strong>de</strong>vice to improve transfer of treatm<strong>en</strong>t in parkinsonian<br />

dyartrhrie. JSHD, 50 :178-185, 1985<br />

19 Holbrook A Rolnick MI and Bailey, CQ : Tratm<strong>en</strong>t of vocal abuse disor<strong>de</strong>rs using a vocal int<strong>en</strong>sity controller. JSHR, 39 :298-303,<br />

1974<br />

20 Callaghan, J., Thorpe, W., & van Doorn, J. (2004). The sci<strong>en</strong>ce of singing and seeing. Confer<strong>en</strong>ce on Interdisciplinary Musicology<br />

(CIM04), Graz, Austria.<br />

21 Callaghan, J., Thorpe, W., van Doorn, J., & Wilson, P. (2003). Sing and see. In L.C.R. Yip, C.C.<br />

Leung, & W.T. Lau (Eds.), Curriculum innovation in music (pp. 75-80). Hong Kong: Departm<strong>en</strong>t of Creative Arts, The Hong Kong<br />

Institute of Education.<br />

22 Thorpe, C.W., Callaghan, J., & van Doorn, J. (1999). Visual feedback of acoustic voice features: New tools for the teaching of<br />

singing. Australian Voice, 5, 32-39.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 10


1.2 Le spectrogramme<br />

Après avoir expliqué ce qu’affiche un spectrogramme et donné <strong>de</strong>s clés <strong>de</strong> lecture <strong>de</strong> cette image,<br />

nous nous intéresserons aux utili<strong>sa</strong>tions du spectrogramme <strong>en</strong> tant que feedback visuel, telles<br />

qu’elles sont décrites dans la littérature.<br />

1.2.1 Prés<strong>en</strong>tation du spectrogramme<br />

Une brève définition <strong>de</strong> l’image spectrographique <strong>en</strong> terme d’acoustique sera suivie <strong>de</strong> clés <strong>de</strong><br />

lectures du spectrogramme pour la parole, le timbre et l’attaque.<br />

1.2.1.1 Notions d’acoustique<br />

Un son pur est décrit mathématiquem<strong>en</strong>t par une fonction sinusoïdale. C’est une fonction<br />

périodique, c’est-à-dire qui se répète dans le temps, caractérisée par son amplitu<strong>de</strong>, constante, et<br />

<strong>sa</strong> fréqu<strong>en</strong>ce. Selon l’analyse harmonique <strong>de</strong> Fourier, connue <strong>de</strong>puis 1822, tout son peut être<br />

décomposé <strong>en</strong> une somme <strong>de</strong> sons purs. « un phénomène périodique quelconque [se décompose]<br />

<strong>en</strong> une somme <strong>de</strong> sinusoï<strong>de</strong>s élém<strong>en</strong>taires (harmoniques), dont les fréqu<strong>en</strong>ces respectives sont <strong>de</strong>s<br />

multiples <strong>en</strong>tiers <strong>de</strong> la compo<strong>sa</strong>nte la plus grave appelée fondam<strong>en</strong>tal. […] Les compo<strong>sa</strong>ntes qui ne<br />

font pas partie <strong>de</strong> la série harmonique s’appell<strong>en</strong>t <strong>de</strong>s partiels» (Leipp, 2010, p. 25).<br />

Donald G Miller rappelle que la série harmonique correspond pour une fondam<strong>en</strong>tale à <strong>de</strong>s<br />

intervalles musicaux bi<strong>en</strong> définis (au moins pour les premières) : la première harmonique<br />

correspond à l’octave <strong>de</strong> la fondam<strong>en</strong>tale, la <strong>de</strong>uxième à la quinte au-<strong>de</strong>ssus, etc. (Donald Gray<br />

Miller, 2008, p. 7)<br />

Les spectrogramme à ban<strong>de</strong> étroite (45 Hz par exemple) permett<strong>en</strong>t <strong>de</strong> bi<strong>en</strong> visualiser les<br />

harmoniques, mais masqu<strong>en</strong>t certaines phénomènes très courts dans le temps, tandis que les<br />

spectrogramme à ban<strong>de</strong> large (300 Hz par exemple) reflèt<strong>en</strong>t mieux les phénomènes <strong>de</strong> la parole.<br />

(D. M. Howard, 2002, p. 498; Martin, 2008, p. 69). Dans notre étu<strong>de</strong>, nous nous intéresserons<br />

principalem<strong>en</strong>t au spectrogramme <strong>en</strong> ban<strong>de</strong> étroite, qui est mieux adapté pour l’étu<strong>de</strong> <strong>de</strong> la <strong>voix</strong>,<br />

tandis que le spectrogramme <strong>en</strong> ban<strong>de</strong> large est mieux adapté pour l’étu<strong>de</strong> <strong>de</strong> la parole.<br />

1.2.1.2 Définition<br />

« Un spectrogramme réalise une représ<strong>en</strong>tation <strong>en</strong> trois dim<strong>en</strong>sions : le temps sur l’axe horizontal, la<br />

fréqu<strong>en</strong>ce <strong>de</strong>s compo<strong>sa</strong>ntes harmoniques […] sur l’axe vertical et l’int<strong>en</strong>sité <strong>de</strong>s différ<strong>en</strong>tes<br />

compo<strong>sa</strong>ntes sur un axe perp<strong>en</strong>diculaire à la feuille, qui est <strong>en</strong>codée par le niveau <strong>de</strong> noir [ou <strong>de</strong>s<br />

codages couleur] » (Martin, 2008, p. 88) Le spectre est <strong>en</strong> <strong>de</strong>ux dim<strong>en</strong>sions (fréqu<strong>en</strong>ce / int<strong>en</strong>sité).<br />

Le spectrogramme, <strong>en</strong> ajoutant la variable temps, est un graphique <strong>en</strong> 3 dim<strong>en</strong>sions. (Nair, 1999, p.<br />

44)<br />

1.2.1.3 Lecture <strong>de</strong> spectrogramme : la parole<br />

Les caractéristiques <strong>de</strong> chacun <strong>de</strong>s mo<strong>de</strong>s <strong>de</strong> production <strong>de</strong> la parole sont visibles sur le<br />

spectrogramme et permett<strong>en</strong>t <strong>de</strong> repérer les phonèmes <strong>de</strong> la parole sur une image<br />

spectrographique, et ceci plus facilem<strong>en</strong>t si le spectrogramme est réalisé <strong>en</strong> ban<strong>de</strong> large. (Leipp,<br />

2010, p. 280; Martin, 2008, pp. 53–62)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 11


phonèmes<br />

Voyelles,<br />

liqui<strong>de</strong>s « l m<br />

n r » et<br />

na<strong>sa</strong>les « ng et<br />

ng »<br />

Fricatives<br />

Explosives =<br />

occlusives<br />

Phénomènes<br />

physiques<br />

Vibration <strong>de</strong>s cor<strong>de</strong>s<br />

<strong>vocale</strong>s et diverses<br />

configuration du<br />

tractus vocal<br />

Constriction dans le<br />

conduit vocal<br />

Fermeture temporaire<br />

du conduit vocal<br />

Non voisé<br />

Nuage correspondant au bruit <strong>de</strong><br />

friction<br />

Trait vertical correspondant au<br />

bruit d’explosion<br />

Voisé : vibration <strong>de</strong>s<br />

cor<strong>de</strong>s <strong>vocale</strong>s<br />

spectre <strong>de</strong> raies<br />

horizontales<br />

correspondant aux<br />

harmoniques<br />

D’autres mo<strong>de</strong>s <strong>de</strong> production sont possibles, comme les clics, mais non utilisées <strong>en</strong> Français. Les<br />

mo<strong>de</strong>s mixtes concern<strong>en</strong>t les consonnes voisées où les cor<strong>de</strong>s <strong>vocale</strong>s vibr<strong>en</strong>t alros que la langue<br />

produit une constriction dans le conduit vocal (fricatives voisées) ou qu’elle produit une explosion<br />

(occlusives voisées) : dans ce cas on observe sur le spectogramme à la fois les compo<strong>sa</strong>ntes<br />

caractéristiques <strong>de</strong> la consonne non voisée correspondante et un spectre <strong>de</strong> raies résultant du son<br />

émis par la vibration <strong>de</strong>s cor<strong>de</strong>s <strong>vocale</strong>s.<br />

Les différ<strong>en</strong>tes consonnes peuv<strong>en</strong>t être lues (dans une certaine mesure) sur le spectrogramme car<br />

le point d’articulation d’une consonne correspond à une distribution <strong>de</strong> l’amplitu<strong>de</strong> <strong>de</strong>s<br />

compo<strong>sa</strong>ntes du bruit. (Martin, 2008, p. 59). De même, les formants vocaliques dép<strong>en</strong><strong>de</strong>nt <strong>de</strong> la<br />

position <strong>de</strong>s articulateurs et permett<strong>en</strong>t d’i<strong>de</strong>ntifier une voyelle (voir timbre vocalique)<br />

1.2.1.4 Lecture <strong>de</strong> spectrogramme : le timbre<br />

Définition<br />

« Le timbre est la qualité permettant <strong>de</strong> distinguer un son parmi d’autres qui ont la même int<strong>en</strong>sité<br />

et la même hauteur » (Leipp, 2010, p. 149). Il est constitué du timbre vocalique qui détermine<br />

(lorsque c’est pertin<strong>en</strong>t) l’i<strong>de</strong>ntité <strong>de</strong> la voyelle <strong>en</strong>t<strong>en</strong>due, et le timbre extra-vocalique,<br />

correspondant à la couleur <strong>de</strong> la <strong>voix</strong>.<br />

Timbre vocalique<br />

Lorsqu’un locuteur émet une voyelle, il met ses plis vocaux <strong>en</strong> vibration. Le son source (débit d’air<br />

pulsé au niveau glottique), est modifié par le filtre constitué par le tractus vocal, qui atténue<br />

certaines fréqu<strong>en</strong>ces et <strong>en</strong> privilégie d’autres, selon la théorie <strong>de</strong> la résonance, <strong>de</strong> façon à r<strong>en</strong>focer<br />

les formants constitutifs <strong>de</strong> la voyelle. (Leipp, 2010; Donald Gray Miller, 2008, pp. 23–33) « Un<br />

formant est une résonance du tractus vocal. Les voyelles sont perçues et classifiées sur la base <strong>de</strong>s<br />

<strong>de</strong>ux formants les plus graves appelés F1 et F2 » (Giovanni et al., 2012, p. 14) « La position <strong>de</strong>s<br />

articulateurs impacte fortem<strong>en</strong>t les fréqu<strong>en</strong>ces et les largeurs <strong>de</strong> ban<strong>de</strong> <strong>de</strong>s résonances acoustiques<br />

du conduit vocal » (Heinrich, 2012, pp. 18–19)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 12


Les formants sont les barres horizontales plus int<strong>en</strong>ses visibles sur le spectrogramme. Elles<br />

correspon<strong>de</strong>nt aux ban<strong>de</strong>s <strong>de</strong> fréqu<strong>en</strong>ces mises <strong>en</strong> valeur par le conduit vocal, changeant selon la<br />

disposition <strong>de</strong>s articulateurs et définis<strong>sa</strong>nt une voyelle précise.<br />

Donald G Miller (Donald Gray Miller, 2008, p. 30) propose la visuali<strong>sa</strong>tion <strong>de</strong>s <strong>de</strong>ux premiers<br />

formants avec le spectrogramme. Scott McCoy con<strong>sa</strong>cre égalem<strong>en</strong>t un chapitre <strong>de</strong> son livre, <strong>de</strong>stiné<br />

aux chanteurs, aux règles <strong>de</strong> bases <strong>de</strong> phonétique et <strong>de</strong> formants vocaliques 23 24 (McCoy, 2004, pp.<br />

38–52; Welch et al., 2005, p. 232).<br />

Les harmoniques<br />

Lorsque le son émis est périodique, c’est-à-dire qu’il est émis sur une certaine hauteur tonale, ces<br />

différ<strong>en</strong>ts partiels sont <strong>de</strong>s multiples <strong>de</strong> <strong>sa</strong> fréqu<strong>en</strong>ce fondam<strong>en</strong>tale. Dans ce cas « la s<strong>en</strong><strong>sa</strong>tion <strong>de</strong><br />

timbre dép<strong>en</strong>d […] du nombre <strong>de</strong> compo<strong>sa</strong>ntes, <strong>de</strong> leur situation dans l’air audible, <strong>de</strong> leur<br />

« consonance » avec le fondam<strong>en</strong>tal et <strong>de</strong> leurs int<strong>en</strong>sités relatives. » (Leipp, 2010, pp. 150–154) Sur<br />

le spectrogramme, les harmoniques d’un son t<strong>en</strong>u sont représ<strong>en</strong>tées par <strong>de</strong>s traits horizontaux<br />

équidistants.<br />

Le bruit <strong>en</strong>tre les harmoniques<br />

Un son peut avoir une compo<strong>sa</strong>nte harmonique (périodique) à laquelle s’ajoute du bruit,<br />

apériodique. Le spectrogramme représ<strong>en</strong>te ce bruit suivant les fréqu<strong>en</strong>ces auxquelles il apparait,<br />

comme un nuage <strong>en</strong>tre les harmoniques. Cette distinction <strong>en</strong>tre bruit et harmonique est utilisée<br />

notamm<strong>en</strong>t par la classification <strong>de</strong>s <strong>voix</strong> dysphoniques <strong>de</strong> Yanagihara.<br />

Dans leur étu<strong>de</strong>, Wolfe et Steinfatt (Wolfe & Steinfatt, 1987, p. 238) conclu<strong>en</strong>t que le bruit<br />

spectrographique (évalué visuellem<strong>en</strong>t sur un spectrogramme) est le meilleur paramètre dans le<br />

cadre <strong>de</strong> leur étu<strong>de</strong> pour r<strong>en</strong>dre compte <strong>de</strong> la sévérité d’une dysphonie.<br />

La Société Europé<strong>en</strong>ne <strong>de</strong> Laryngologie note que la fiabilité <strong>de</strong>s mesures acoustiques chiffrées<br />

(comme le calcul <strong>de</strong> la fréqu<strong>en</strong>ce fondam<strong>en</strong>tale par exemple) baisse lorsque le signal vocal est<br />

apériodique, conti<strong>en</strong>t <strong>de</strong>s irrégularités, <strong>de</strong>s subharmoniques (« subharmonics ») ou <strong>de</strong>s<br />

modulations. Dans ce cas, Dejonckere et ses collègues conseill<strong>en</strong>t <strong>de</strong> contrôler visuellem<strong>en</strong>t le signal<br />

sur un spectrogramme. (Dejonckere et al., 2001, p. 80)<br />

La forme du spectrogramme peut révéler diverses impressions subjectives <strong>de</strong> la <strong>voix</strong>. Par exemple,<br />

Jan W.M.A.F. Martins et son équipe précis<strong>en</strong>t que le gra<strong>de</strong> G du GRBAS correspond à <strong>de</strong>s distorsions<br />

dans le spectrogramme. Les sous-harmoniques sont visibles égalem<strong>en</strong>t sur un spectrogramme, et<br />

sont caractéristiques d’une certaine raucité (R). Enfin, le souffle se prés<strong>en</strong>te sur le spectrogramme<br />

comme du bruit qui peut apparaître dans les hautes fréqu<strong>en</strong>ces, <strong>en</strong>tre les harmoniques ou à la<br />

23<br />

Mons<strong>en</strong> et Engebretson, the accuracy of formant frequ<strong>en</strong>cy measurem<strong>en</strong>ts : a comparison of spectrographic analysis and linear<br />

prediction, JSHR 1983 ; 26 ; 89-97<br />

24<br />

Miller, Sulter Schutte, Wolf comparison of vocal tract formants in singing and non-periodic phonation. Journal of voice 1997: 1:<br />

1-11)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 13


place <strong>de</strong>s harmoniques. Ces particularités sont visibles sur un spectrogramme à ban<strong>de</strong> étroite.<br />

(Dejonckere, 2006, p. 350; Mart<strong>en</strong>s, Versnel, & Dejonckere, 2007, p. 179a) 25<br />

Atsushi Yasui prés<strong>en</strong>te <strong>en</strong> 2004 un article donnant <strong>de</strong>s exemples d’analyse <strong>de</strong> troubles vocaux par le<br />

spectrogramme. (<strong>voix</strong> asthénique, <strong>voix</strong> rauque, serrée…) (Yasui, 2004, pp. 40–45).<br />

Classifications (voir <strong>en</strong> annexe)<br />

Yangihara, <strong>en</strong> 1967, utili<strong>sa</strong>nt la spectrographie <strong>en</strong> ban<strong>de</strong> étroite propose une classification <strong>de</strong>s<br />

tracés <strong>en</strong> 4 types, correspondant au <strong>de</strong>gré <strong>de</strong> raucité. (Yanagihara, 1967, p. 531)<br />

(Yanagihara, 1967, p. 535)<br />

En 1974, Cooper et son équipe utilis<strong>en</strong>t la classification <strong>de</strong> Yanagihara <strong>en</strong> ajoutant un Type 0<br />

indiquant une <strong>voix</strong> claire, et un type 0+ indiquant une trace d’éraillem<strong>en</strong>t, mais moins importante<br />

que dans le type I. L’étu<strong>de</strong> du <strong>de</strong>gré d’éraillem<strong>en</strong>t est faite sur <strong>de</strong>s voyelles t<strong>en</strong>ues uniquem<strong>en</strong>t ([a],<br />

[i] et [u]). (Cooper, 1974, p. 291)<br />

En 1984, Yumoto et ses collègues (Japon) ont utilisé s<strong>en</strong>siblem<strong>en</strong>t la même échelle pour juger <strong>de</strong><br />

l’éraillem<strong>en</strong>t à partir <strong>de</strong> spectrogrammes à ban<strong>de</strong> étroite. Ils y ont égalem<strong>en</strong>t ajouté un type 0 pour<br />

une phonation claire. (Yumoto, Sa<strong>sa</strong>ki, & Okamura, 1984, p. 3b). En 1987, Wolfe et Steinfatt<br />

réutilis<strong>en</strong>t la classification <strong>de</strong> Yanagihara, <strong>en</strong> ajoutant une première catégorie <strong>sa</strong>ns compo<strong>sa</strong>nte <strong>de</strong><br />

bruit. (Wolfe & Steinfatt, 1987, p. 233). De la même manière, Remacle et ses collègues <strong>en</strong> 1989<br />

propos<strong>en</strong>t une classification <strong>de</strong> 0 à 4 qui repr<strong>en</strong>d l’idée <strong>de</strong> Yanagihara.<br />

Les auteurs <strong>de</strong> Vocalab propos<strong>en</strong>t, <strong>de</strong> leur côté, une grille <strong>de</strong> lecture du spectrogramme (M<strong>en</strong>in-<br />

Sicard & Sicard, 2006), qui a inspiré les critères et la cotation utilisés dans un mémoire<br />

d’orthophonie, pour l’évaluation <strong>de</strong> la récupération <strong>de</strong> paralysies récurr<strong>en</strong>tielles (Espanol, 2011)<br />

Exemples <strong>en</strong> <strong>voix</strong> chantée<br />

Singing formant<br />

Le r<strong>en</strong>forcem<strong>en</strong>t <strong>de</strong>s harmoniques dans une zone autour <strong>de</strong>s 3000 Hz est caractéristique <strong>de</strong> la <strong>voix</strong><br />

du chanteur <strong>en</strong>traîné (Roure, 2005, p. 62). La prés<strong>en</strong>ce et la richesse du singing formant sont<br />

facilem<strong>en</strong>t i<strong>de</strong>ntifiables sur un spectrogramme. Pour mettre <strong>en</strong> évi<strong>de</strong>nce le singing formant <strong>en</strong><br />

25 Isshiki N, Yanagihara N, Morimoto M. Approach to the objective diagnosis of hoars<strong>en</strong>ess folia phoniatrica 1966 ; 18 : 393-400<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 14


pratique, Schutte et Donald Miller préconis<strong>en</strong>t d’observer un spectre moy<strong>en</strong>né alors qu’on émet<br />

une voyelle sur une quinte montée chromatiquem<strong>en</strong>t. (Donald Gray Miller, 2008, p. 37; D. Miller &<br />

Schutte, 1999a, p. 202)<br />

Voix soufflée<br />

Garyth Nair donne cet exemple pour la <strong>voix</strong> chantée. A partir d’un son d’une bonne qualité, l’ajout<br />

d’un souffle réduit le nombre d’harmoniques [[figure p.105]]<br />

Voix serrée<br />

Garyth Nair donne un exemple <strong>en</strong> <strong>voix</strong> chantée. Partant d’un son non serré, il « écrase » le son, et<br />

cela est particulièrem<strong>en</strong>t bi<strong>en</strong> visible sur le spectrogramme. Robert A. Volin utilise égalem<strong>en</strong>t la<br />

visuali<strong>sa</strong>tion spectrographique comme reflet <strong>de</strong> la clarté du timbre, (Volin, 1999, p. 254) [[figure 15-<br />

13 p.254]] Selon Fisher et ses collègues, <strong>en</strong> <strong>voix</strong> chantée, une <strong>voix</strong> serrée se traduit par <strong>de</strong>s<br />

harmoniques plus fortes <strong>en</strong>-<strong>de</strong>ssous <strong>de</strong> 500 Hz, <strong>sa</strong>ns augm<strong>en</strong>tation <strong>de</strong> la partie supérieure, qui<br />

constitue le singing formant. (Fisher, Kayes, & Reeve, 2003, p. 10)<br />

1.2.1.5 Lecture <strong>de</strong> spectrogramme : l’attaque<br />

L'attaque dure se traduit sur le spectrogramme par « une zone verticale sombre p<strong>en</strong>dant les<br />

premières millisecon<strong>de</strong>s <strong>de</strong> la phonation. Cette ban<strong>de</strong> sombre représ<strong>en</strong>te les vibrations chaotiques<br />

<strong>de</strong>s plis vocaux qui ont lieu jusqu'à ce que le larynx puisse pr<strong>en</strong>dre le mo<strong>de</strong> vibratoire désiré» (Nair,<br />

1999). L’attaque dure est plus forte et plus longue (plus <strong>de</strong> 160 ms.). L’explosion résultant <strong>de</strong> la<br />

fermeture <strong>vocale</strong> génère une instabilité <strong>de</strong> la voyelle. (Fisher et al., 2003, p. 8)<br />

L'attaque soufflée ("aspirate onset") se traduit sur le spectrogramme par « une forme <strong>de</strong> bruit,<br />

p<strong>en</strong>dant tout le mom<strong>en</strong>t que la glotte met pour se réduire afin <strong>de</strong> pouvoir comm<strong>en</strong>cer le son.» (Nair,<br />

1999) Pour ce qui concerne l'attaque "floue", elle se traduit par une accumulation l<strong>en</strong>te<br />

d'harmoniques sur le spectrogramme, avec un vibrato qui ne s'installe pas tout <strong>de</strong> suite.<br />

Pour Garyth Nair (Nair, 1999), le début <strong>de</strong> son équilibré est appelé "ASAI : articulatorsset/Abdominally<br />

Initiated ", et il est caractérisé sur le spectrogramme par un départ simultané <strong>de</strong><br />

toute les harmoniques du son. Le vibrato peut être prés<strong>en</strong>t dès le début, montrant que les muscles<br />

laryngés et pharyngés ne sont pas t<strong>en</strong>dus p<strong>en</strong>dant l'attaque. [[mettre la figure <strong>de</strong>s 3 attaques du<br />

site internet, ou celles <strong>de</strong> Nair, <strong>en</strong> annexe]]<br />

1.2.1.6 Conclusion<br />

Le spectrogramme est un outil intéres<strong>sa</strong>nt pour voir la <strong>voix</strong>. Il <strong>en</strong> représ<strong>en</strong>te <strong>de</strong> nombreux<br />

paramètres, et notamm<strong>en</strong>t, le timbre et l’attaque.<br />

1.2.2 Utili<strong>sa</strong>tion du spectrogramme <strong>en</strong> temps réel<br />

Il existe <strong>de</strong> nombreux domaines d’application du spectrogramme car il permet <strong>de</strong> compr<strong>en</strong>dre quels<br />

sont les paramètres acoustiques qui sont importants dans la production et la perception humaine.<br />

(Fisher et al., 2003, p. 2; David M Howard, 2005, p. 329)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 15


1.2.2.1 Formation <strong>vocale</strong> <strong>de</strong>s chanteurs<br />

Dans la droite ligne <strong>de</strong> Richard Miller et Sataloff, Garyth Nair se fixe comme objectif <strong>de</strong> démythifier<br />

le langage <strong>de</strong> la pédagogie <strong>vocale</strong> et <strong>de</strong> promouvoir l’utili<strong>sa</strong>tion d’outils informatisés pour servir <strong>de</strong><br />

feedback permettant d’accélérer le développem<strong>en</strong>t vocal <strong>de</strong>s chanteurs. (Nair, 1999, p. 12). Pour<br />

lui, le spectrogramme <strong>en</strong> temps réel constitue à la fois « un moy<strong>en</strong> d’accélérer le processus<br />

d’appr<strong>en</strong>tis<strong>sa</strong>ge du chant et un moy<strong>en</strong> pour ai<strong>de</strong>r les professeurs et les élèves à compr<strong>en</strong>dre mieux la<br />

sci<strong>en</strong>ce <strong>de</strong> la <strong>voix</strong>. » 26 . Scott McCoy (McCoy, 2004) et Donald G. Miller (Donald Gray Miller, 2008)<br />

publi<strong>en</strong>t égalem<strong>en</strong>t <strong>de</strong>s livres donnant aux professeurs <strong>de</strong> chant les compét<strong>en</strong>ces pour utiliser le<br />

spectrogramme. Gillyanne Kayes et Jeremy Fisher 27 prés<strong>en</strong>t<strong>en</strong>t par exemple un gui<strong>de</strong> <strong>de</strong> lecture <strong>de</strong>s<br />

spectrogrammes pour les professionnels <strong>de</strong> la <strong>voix</strong> dans leur prés<strong>en</strong>tation au PEVoC (Pan European<br />

Voice Confer<strong>en</strong>ce) <strong>en</strong> 2003. Cette visuali<strong>sa</strong>tion, préci<strong>sa</strong>nt les différ<strong>en</strong>tes qualités <strong>de</strong> la <strong>voix</strong>, est<br />

égalem<strong>en</strong>t proposé dans la métho<strong>de</strong> Jo Estill (Estill Voice Training), prés<strong>en</strong>tée par Kimberly M.<br />

Steinhauer et Cari M. Tellis 28<br />

L’expéri<strong>en</strong>ce <strong>de</strong> David M. Howard et ses collègues à Londres et York est particulièrem<strong>en</strong>t<br />

intéres<strong>sa</strong>nte. Elle a utilisé une méthodologie d’ « action research », mettant <strong>de</strong>ux professeurs <strong>de</strong><br />

chant et quatre élèves utili<strong>sa</strong>nt le spectrogramme <strong>en</strong> temps réel <strong>en</strong> position <strong>de</strong> chercheurs. Le<br />

projet VOXed , réalisé durant l’année scolaire 2003-2004 (Welch et al., 2005, pp. 232–233),<br />

démontre qu’un outil <strong>de</strong> feedback <strong>en</strong> temps réel facile d’accès, vali<strong>de</strong>, robuste et utile <strong>en</strong> cours <strong>de</strong><br />

chant est disponible. L’étu<strong>de</strong> s’intéresse égalem<strong>en</strong>t à l’impact <strong>de</strong> cet outil sur la pédagogie <strong>vocale</strong>.<br />

(David M Howard et al., 2007, p. 22)<br />

En France, Michel Hart écrit pour le Journal <strong>de</strong> l’AFPC <strong>de</strong>ux articles décrivant <strong>de</strong>s utili<strong>sa</strong>tions<br />

possibles du spectrogramme <strong>en</strong> cours <strong>de</strong> chant. (Hart, 2002a, 2002b) Il cite pour l’ariam [[définir]]<br />

<strong>en</strong> 2011 29 <strong>de</strong> nombreux professeurs <strong>de</strong> chant utili<strong>sa</strong>nt les nouvelles technologies. On y trouve<br />

notamm<strong>en</strong>t, <strong>en</strong> France, Allan Wright (the Vocalist, The Mo<strong>de</strong>rn Vocalist) professeur utili<strong>sa</strong>nt<br />

régulièrem<strong>en</strong>t le spectrogramme.<br />

En pratique, Nair et ses collègues donn<strong>en</strong>t <strong>de</strong>s indications sur la manière d’introduire le<br />

spectrogramme <strong>en</strong> leçon <strong>de</strong> chant (Nair, 1999, pp. 83–91). Le spectrogramme permet <strong>de</strong> travailler<br />

le timbre (Nair, 1999, p. 181), l’attaque (Nair, 1999, pp. 183–186), la respiration(Nair, 1999, p. 181),<br />

la justesse (Nair, 1999, pp. 129–132), la précision <strong>de</strong>s phonèmes (Nair, 1999, pp. 127–128, 155–<br />

156), la zone <strong>de</strong> pas<strong>sa</strong>ge (D. Miller & Schutte, 1999a, pp. 195–201; Nair, 1999, p. 170), le vibrato<br />

(Nair, 1999, p. 177), le singing formant.<br />

Une étu<strong>de</strong> <strong>de</strong> Anne-Maria Laukkan<strong>en</strong> et son équipe se propose d’étudier l’efficacité du biofeedback<br />

spectral (la visuali<strong>sa</strong>tion du spectre <strong>en</strong> temps réel) par rapport à un <strong>en</strong>traînem<strong>en</strong>t conv<strong>en</strong>tionnel.<br />

Elle conclut que le feedback visuel semble améliorer l’efficacité <strong>de</strong> l’<strong>en</strong>trainem<strong>en</strong>t vocal.<br />

(Laukkan<strong>en</strong>, Syrjä, Laitala, & Leino, 2004, p. 66)<br />

26<br />

“a means of speeding up the process of voice training and […] ameans of helping both teachers and stu<strong>de</strong>nts achive a greater<br />

un<strong>de</strong>rstanding of voice sci<strong>en</strong>ce”<br />

27<br />

http://www.vocalprocess.co.uk/training/training_computervoice.htm consulté le 25 janvier 2013<br />

28<br />

http://www.estillvoice.com/files/file/courses/Estill%20Voice%20Training%20Flyer_2012_MU.pdf consulté le 25 janvier 2013<br />

29<br />

http://www.ariam-idf.com/pdf/MichelHart-Ariam2011.pdf consulté le 25 janvier 2013<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 16


1.2.2.2 Langue étrangères et acc<strong>en</strong>t, prosodie<br />

Marie-Anna Laukkan<strong>en</strong> et ses collègues not<strong>en</strong>t que « le spectrographe et les analyseurs <strong>de</strong> spectres<br />

[…] ont été principalem<strong>en</strong>t utilisés dans l’<strong>en</strong>traînem<strong>en</strong>t <strong>de</strong> l’articulation » 30 31 (Laukkan<strong>en</strong> et al., 2004,<br />

p. 67b) En France, la possibilité <strong>de</strong> travail <strong>de</strong> la prononciation par un système <strong>de</strong> spectrogramme <strong>en</strong><br />

temps réel est égalem<strong>en</strong>t noté par Caza<strong>de</strong>. (Caza<strong>de</strong>, 2000, p. 20)<br />

A titre d’exemple, l’article <strong>de</strong> Pamela Pearson et ses collègues décrit l’utili<strong>sa</strong>tion du spectrogramme<br />

dans un protocole d’appr<strong>en</strong>tis<strong>sa</strong>ge par <strong>de</strong>s Vietnami<strong>en</strong>s <strong>de</strong>s débuts et fin <strong>de</strong> syllabes <strong>en</strong> anglais. Ils<br />

observ<strong>en</strong>t une amélioration <strong>de</strong> la prononciation ainsi que <strong>de</strong>s réactions positives à l’utili<strong>sa</strong>tion <strong>de</strong><br />

cette technique, autant <strong>de</strong> la part <strong>de</strong>s professeurs que <strong>de</strong> la part <strong>de</strong>s élèves. Lors <strong>de</strong> 6 séances <strong>de</strong> 30<br />

minutes, les élèves étai<strong>en</strong>t <strong>en</strong>traînés à reconnaître les compo<strong>sa</strong>ntes d’un spectrogramme d’un mot<br />

monosyllabique <strong>en</strong> Anglais, puis <strong>de</strong>vai<strong>en</strong>t reproduire au mieux ce mot à l’ai<strong>de</strong> d’un spectrogramme<br />

<strong>en</strong> temps réel. (Pearson, Pickering, & Da Silva, 2011, p. 172)<br />

Une utili<strong>sa</strong>tion <strong>de</strong>s modules graphiques du logiciel SpeechViewer II pour la <strong>rééducation</strong> <strong>de</strong> la<br />

prosodie est suggérée dans le mémoire d’Anne Bouquay et Pascale Beauch<strong>en</strong>e : « les modules<br />

graphiques <strong>en</strong>veloppe et fréqu<strong>en</strong>ce d’une part, signal et spectrogramme d’autre part, permett<strong>en</strong>t<br />

[…] d’apprécier les variations <strong>de</strong> fréqu<strong>en</strong>ce et d’amplitu<strong>de</strong> » (Beauch<strong>en</strong>e & Bouquay, 1994, p. 114)<br />

Garyth Nair explicite égalem<strong>en</strong>t comm<strong>en</strong>t on peut se servir du spectrogramme pour produire les<br />

voyelles non acc<strong>en</strong>tuées. (Nair, 1999, pp. 119–122).<br />

1.2.2.3 Surdité<br />

Pour Garyth Nair, la visuali<strong>sa</strong>tion <strong>de</strong>s voyelles sur le spectrogramme est une ai<strong>de</strong> précieuse pour<br />

l’appr<strong>en</strong>tis<strong>sa</strong>ge <strong>de</strong> la production <strong>de</strong>s voyelles, parce que leurs formants sont clairem<strong>en</strong>t visibles sur<br />

le spectre ou sur le spectrogramme. Cette constatation pour les chanteurs est transpo<strong>sa</strong>ble dans le<br />

cas <strong>de</strong>s surdités. Cep<strong>en</strong>dant, c’est le spectre <strong>en</strong> temps réel (visuali<strong>sa</strong>tion <strong>de</strong>s int<strong>en</strong>sités <strong>de</strong>s<br />

différ<strong>en</strong>tes fréqu<strong>en</strong>ces) qui est le plus efficace, et non le spectrogramme (visuali<strong>sa</strong>tion <strong>de</strong>s<br />

int<strong>en</strong>sités <strong>de</strong>s différ<strong>en</strong>tes fréqu<strong>en</strong>ces, <strong>en</strong> fonction du temps). Il repr<strong>en</strong>d l’idée <strong>de</strong> Donad Miller <strong>en</strong><br />

recommandant la production <strong>de</strong>s formants à partir du registre fry afin <strong>de</strong> visualiser plus nettem<strong>en</strong>t<br />

les formants vocaliques. (D. Miller & Schutte, 1999a, pp. 194, 208; Nair, 1999, pp. 98–99). La même<br />

chose est possible pour les consonnes, notamm<strong>en</strong>t pour les consonnes fricatives, par la visuali<strong>sa</strong>tion<br />

d’un modèle et la reproduction <strong>de</strong>s hauteurs <strong>de</strong>s compo<strong>sa</strong>ntes spectrales du bruit. (Nair, 1999, pp.<br />

164–165)<br />

Pour M. Maulet, « la visuali<strong>sa</strong>tion immédiate <strong>de</strong> son articulation offre au pati<strong>en</strong>t <strong>de</strong>s points <strong>de</strong><br />

repères très efficaces qui vont lui permettre d'améliorer rapi<strong>de</strong>m<strong>en</strong>t ses réali<strong>sa</strong>tions » (Maulet, 1997,<br />

p. 84).<br />

30 “sound spectrograph and spectrum analyzers […] have mainly be<strong>en</strong> used in articulation training”<br />

31 Neri A., Cucchiarini C., Strik H. & Boves L. (2002) The pedagogy–technology interface in computer assisted pronunciation<br />

training. Computer Assisted Language Learning 15, 441–467. [[est-ce un spectrogramme ?]]<br />

Hirata Y. (2004) Computer assisted pronunciation training for native English speakers learning Japanese pitch and duration<br />

contrasts. Computer Assisted Language Learning 17, 357–376. [[même question]]<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 17


En es<strong>sa</strong>yant <strong>de</strong> reproduire un spectre donné dans le speechViewer, les sujets travaill<strong>en</strong>t la précision<br />

articulatoire.(Peloux, 1993, p. 18).<br />

1.2.2.4 Dy<strong>sa</strong>rthrie<br />

Robert A. Volin fait un parallèle <strong>en</strong>tre l’appr<strong>en</strong>tis<strong>sa</strong>ge du chant et la <strong>rééducation</strong> <strong>de</strong> la dy<strong>sa</strong>rthrie.<br />

Selon lui, le fait que les fonctions <strong>de</strong> la parole automatisées interfèr<strong>en</strong>t avec l’acquisition <strong>de</strong><br />

nouveaux modèle et le fait que les pati<strong>en</strong>ts ne perçoiv<strong>en</strong>t pas leur propre <strong>voix</strong> comme les autres<br />

l’<strong>en</strong>t<strong>en</strong><strong>de</strong>nt à l’extérieur donn<strong>en</strong>t à la <strong>rééducation</strong> les mêmes défis qu’à l’appr<strong>en</strong>tis<strong>sa</strong>ge du chant.<br />

(Volin, 1999, p. 242)<br />

Volin décrit l’utili<strong>sa</strong>tion d’un logiciel d’analyse spectrale <strong>en</strong> temps réel pour améliorer la précision<br />

<strong>de</strong> l’articulation (Volin, 1999, pp. 246–250) : le spectrogramme peut égalem<strong>en</strong>t être utilisé pour le<br />

contrôle <strong>de</strong> la longueur d’une phrase (Volin, 1999, p. 250). Ce même auteur suggère égalem<strong>en</strong>t<br />

qu’on peut utiliser cet outil pour <strong>de</strong>man<strong>de</strong>r un contrôle <strong>de</strong> l’int<strong>en</strong>sité <strong>vocale</strong>, un contrôle<br />

prosodique <strong>de</strong> la hauteur fondam<strong>en</strong>tale. (Volin, 1999, pp. 250–253)<br />

Comme le décriv<strong>en</strong>t Anne Bouquay et Pascale Beauch<strong>en</strong>e dans leur mémoire d’orthophonie <strong>en</strong><br />

1994, les modules graphiques du logiciel SpeechViewer II peuv<strong>en</strong>t être utilisés dans le cadre <strong>de</strong><br />

<strong>rééducation</strong> <strong>de</strong> dy<strong>sa</strong>rthries post-traumatiques. Dans leur travail, elles ont utilisé ces modules avec<br />

pour objectif <strong>de</strong> réduire le temps <strong>de</strong> production d’une phrase (coordination pneumophonique et<br />

débit). Le module signal et spectrogramme « permet […] <strong>de</strong> montrer au pati<strong>en</strong>t à quel <strong>en</strong>droit <strong>de</strong> la<br />

phrase il doit repr<strong>en</strong>dre son souffle ou au contraire accélérer son débit » (Beauch<strong>en</strong>e & Bouquay,<br />

1994, p. 90) « Nous pouvons donc montrer au sujet <strong>de</strong> manière objective ce qu’il doit s’efforcer <strong>de</strong><br />

modifier » , notamm<strong>en</strong>t <strong>en</strong> terme <strong>de</strong> prolongem<strong>en</strong>t <strong>de</strong> phonème ou <strong>de</strong> pause inappropriée.<br />

1.2.2.5 Réeducation <strong>vocale</strong><br />

Verdolini et Krebs affirm<strong>en</strong>t que « l’habitu<strong>de</strong> <strong>de</strong> l’efficacité <strong>de</strong> l’utili<strong>sa</strong>tion <strong>de</strong>s outils <strong>de</strong> biofeedback<br />

dans les <strong>rééducation</strong>s physiques fournit un précé<strong>de</strong>nt pour l’utili<strong>sa</strong>tion d’outils similaires, comme<br />

l’analyse spectrale, dans la pédagogie <strong>vocale</strong>. » 32 (Verdolini & Krebs, 1999, p. 239)<br />

En 1993, Valérie Peloux décrit une utili<strong>sa</strong>tion <strong>de</strong>s modules du SpeechViewer et notamm<strong>en</strong>t <strong>de</strong> son<br />

module graphique « spectre » dans le cadre <strong>de</strong> l’évaluation et <strong>de</strong> la <strong>rééducation</strong> <strong>vocale</strong> (Peloux,<br />

1993, pp. 45–47). L’utili<strong>sa</strong>tion du module spectre reste cep<strong>en</strong>dant anecdotique. Caroline Coudière<br />

repr<strong>en</strong>d les conclusions <strong>de</strong> C. Routier et A.S. Vanleys : « Suite à un questionnaire soumis à 175<br />

orthophonistes <strong>en</strong> libéral <strong>de</strong> la région Nord-Pas <strong>de</strong> Calais, C.Routier 33 concluait que l’analyse<br />

spectrale était une ai<strong>de</strong> appréciable lors du bilan vocal, pour distinguer les problèmes <strong>de</strong> hauteur et<br />

<strong>de</strong> placem<strong>en</strong>t vocal <strong>de</strong>s troubles du timbre » (Coudière, 2003, p. 125). Cep<strong>en</strong>dant elle ajoute que<br />

« la visuali<strong>sa</strong>tion spectrale serait […] plus importante <strong>en</strong> <strong>rééducation</strong>, où elle peut servir <strong>de</strong> support<br />

et <strong>de</strong> moy<strong>en</strong> <strong>de</strong> contrôle <strong>de</strong> la production <strong>vocale</strong>, que l’analyse précise <strong>de</strong>s différ<strong>en</strong>ts paramètres<br />

vocaux, utile <strong>en</strong> bilan » (Coudière, 2003, p. 156) :<br />

32<br />

“The routine successful use of biofeedback tools in physical therapy provi<strong>de</strong>s prece<strong>de</strong>nt for the use of similar tools such as the<br />

spectral analyzer in voice pedagogy”<br />

33<br />

C. Routier et A.S.Vanleys, Analyse objective <strong>de</strong>s troubles <strong>de</strong> la <strong>voix</strong> chez l’adulte, apport au niveau <strong>de</strong> la <strong>rééducation</strong><br />

orthophonique, Lille, 1993<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 18


Le mémoire <strong>de</strong> Caroline Coudière liste <strong>de</strong> nombreux domaines où la visuali<strong>sa</strong>tion spectrale peut<br />

permettre un feedback intéres<strong>sa</strong>nt : (Coudière, 2003, p. 82)<br />

- Timbre (visuali<strong>sa</strong>tion <strong>de</strong> l’<strong>en</strong>richissem<strong>en</strong>t harmonique, investissem<strong>en</strong>t <strong>de</strong>s cavités <strong>de</strong><br />

résonance..)<br />

- Respiration (notion <strong>de</strong> durée, t<strong>en</strong>ue du souti<strong>en</strong>, s<strong>en</strong>sibili<strong>sa</strong>tion aux pauses inspiratoires) et<br />

attaque (coups <strong>de</strong> glotte)<br />

- Hauteur (éducation <strong>de</strong> l’oreille, s<strong>en</strong>sibili<strong>sa</strong>tion à la prosodie, maîtrise et stabilité <strong>de</strong> la<br />

hauteur <strong>de</strong> la <strong>voix</strong>)<br />

- Int<strong>en</strong>sité (éducation <strong>de</strong> l’oreille, levée <strong>de</strong>s inhibitions, maîtrise <strong>de</strong> la dynamique <strong>vocale</strong> et <strong>de</strong><br />

la stabilité <strong>en</strong> int<strong>en</strong>sité)<br />

Volin utilise l’image spectrographique pour travailler sur la clarté du timbre. (Volin, 1999, p. 254). Il<br />

propose égalem<strong>en</strong>t divers exercices avec le spectrogramme pour réduire l’hyperfonction <strong>vocale</strong> et<br />

l’attaque <strong>en</strong> coup <strong>de</strong> glotte (Volin, 1999, pp. 254–256) :<br />

1.2.2.6 Conclusion<br />

Les auteurs décriv<strong>en</strong>t <strong>de</strong> nombreuses applications du spectrogramme. Voyons <strong>en</strong> détail quels<br />

avantages et quelles limites ces auteurs décriv<strong>en</strong>t pour une utili<strong>sa</strong>tion <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong>.<br />

1.3 Spectrogramme et <strong>rééducation</strong> <strong>vocale</strong> : avantages et limites<br />

Nous repr<strong>en</strong>ons dans cette partie les avantages et limites citées pour la <strong>rééducation</strong> <strong>vocale</strong>, mais<br />

égalem<strong>en</strong>t au travers <strong>de</strong>s autres situations où le spectrogramme est utilisé, lorsque les remarques<br />

qui sont faites nous sembl<strong>en</strong>t pouvoir être facilem<strong>en</strong>t transpo<strong>sa</strong>bles au contexte d’une <strong>rééducation</strong><br />

<strong>vocale</strong>.<br />

1.3.1 Avantages<br />

Dans l’étu<strong>de</strong> m<strong>en</strong>ée par D. M. Howard et ses collègues, les professeurs <strong>de</strong> chant comme les élèves<br />

ont été très <strong>en</strong>thousiastes, ils ont même été surpris <strong>de</strong> découvrir tout le pot<strong>en</strong>tiel <strong>de</strong> l’outil<br />

technologique. (D. M. Howard et al., 2004, p. 142). Plusieurs étu<strong>de</strong>s soulign<strong>en</strong>t effectivem<strong>en</strong>t les<br />

aspects positifs <strong>de</strong> cet outil, dans les divers domaines où il est utilisé.<br />

Caroline Coudière conclut son mémoire <strong>en</strong> di<strong>sa</strong>nt que « le spectre est un outil particulièrem<strong>en</strong>t<br />

intéres<strong>sa</strong>nt dans la prise <strong>en</strong> charge <strong>de</strong> la <strong>voix</strong>. En effet, il apporte <strong>de</strong>s données objectives et une<br />

visuali<strong>sa</strong>tion <strong>de</strong> l’évolution <strong>de</strong> la production <strong>vocale</strong> qui, malgré <strong>de</strong>s difficultés d’interprétation,<br />

serv<strong>en</strong>t l’orthophoniste et son pati<strong>en</strong>t » (Coudière, 2003, p. 155)<br />

1.3.1.1 Prise <strong>de</strong> consci<strong>en</strong>ce<br />

importance <strong>de</strong> la prise <strong>de</strong> consci<strong>en</strong>ce <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong><br />

L’auto-contrôle <strong>de</strong> la <strong>voix</strong> passe par une prise <strong>de</strong> consci<strong>en</strong>ce : selon David M. Howard et son équipe,<br />

« la thérapie a notamm<strong>en</strong>t pour but d’augm<strong>en</strong>ter la consci<strong>en</strong>ce du locuteur <strong>de</strong> <strong>sa</strong> <strong>voix</strong> à la fois <strong>de</strong><br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 19


façon proprioceptive et auditive, afin <strong>de</strong> permettre l’auto-contrôle » 34 [self-monitoring] (David M.<br />

Howard, Abberton, & Fourcin, 2012, p. 9a)<br />

Jocelyne Sarfati indique qu’une ou plusieurs séances peuv<strong>en</strong>t être con<strong>sa</strong>crées à l’analyse d’un<br />

<strong>en</strong>registrem<strong>en</strong>t que le pati<strong>en</strong>t réalise <strong>de</strong> préfér<strong>en</strong>ce <strong>en</strong> situation professionnelle mettant <strong>en</strong><br />

évi<strong>de</strong>nce ses difficultés <strong>vocale</strong>s. Ce travail est décisif dans le s<strong>en</strong>s où il permet une analyse du<br />

comportem<strong>en</strong>t vocal et une modification <strong>de</strong> l’ « image sonore » qu’a le pati<strong>en</strong>t <strong>de</strong> lui-même(Sarfati,<br />

1998, pp. 53–54)<br />

De même, les grilles détaillées d’auto-analyse <strong>de</strong> la <strong>voix</strong> proposées au début d’une <strong>rééducation</strong> ont<br />

notamm<strong>en</strong>t pour finalité <strong>de</strong> r<strong>en</strong>dre la personne consci<strong>en</strong>te <strong>de</strong> son geste (Esti<strong>en</strong>ne, 1998, p. 92).<br />

« analyser son geste vocal » <strong>en</strong> détail (Amy <strong>de</strong> la Bretèque, 2012, p. 132) et « pr<strong>en</strong>dre contact » avec<br />

ses s<strong>en</strong><strong>sa</strong>tions proprioceptives <strong>en</strong> les « tradui<strong>sa</strong>nt avec finesse » (Roch, 2001, p. 61), sont considérés<br />

par certains auteurs comme les premiers objectifs <strong>de</strong> la <strong>rééducation</strong>.<br />

Apport du spectrogramme<br />

L’analyse <strong>de</strong>s réponses au questionnaires <strong>de</strong> Caroline Coudière (Coudière, 2003, p. 146) permet <strong>de</strong><br />

dire que « Pour 69% <strong>de</strong>s orthophonistes [interrogées], [la visuali<strong>sa</strong>tion spectrographique] permet<br />

[pour le pati<strong>en</strong>t] une meilleure prise <strong>de</strong> consci<strong>en</strong>ce <strong>de</strong> ses progrès. Trois orthophonistes ajout<strong>en</strong>t que<br />

cette meilleure prise <strong>de</strong> consci<strong>en</strong>ce intéresse aussi les paramètres vocaux, leur mécanisme et leur<br />

maîtrise, notamm<strong>en</strong>t <strong>en</strong> ce qui concerne la hauteur et ses modulations »<br />

Garyth Nair cite notamm<strong>en</strong>t le spectrogramme comme un outil idéal pour la prise <strong>de</strong> consci<strong>en</strong>ce du<br />

chanteur <strong>de</strong> certains problèmes <strong>de</strong> justesse pour les attaques sur <strong>de</strong>s consonnes voisées ou <strong>de</strong><br />

manque <strong>de</strong> souti<strong>en</strong> <strong>en</strong> fin <strong>de</strong> phrase (Nair, 1999, pp. 159, 161)<br />

Cep<strong>en</strong>dant Lorsque Caroline Coudière cite les limites <strong>de</strong> l’utili<strong>sa</strong>tion <strong>de</strong>s outils informatiques <strong>en</strong><br />

orthophonie, elle précise qu’« il faut t<strong>en</strong>ir compte <strong>de</strong>s réactions du pati<strong>en</strong>t. Certains se s<strong>en</strong>t<strong>en</strong>t<br />

véritablem<strong>en</strong>t mal à l’aise avec cet outil, et peuv<strong>en</strong>t le rejeter, ou craindre <strong>de</strong> se retrouver trop<br />

brutalem<strong>en</strong>t confronté à l’objectivation <strong>de</strong> leurs difficultés » (Coudière, 2003, p. 62)<br />

Caza<strong>de</strong> exprime la visuali<strong>sa</strong>tion par le spectrogramme comme une mise à distance néces<strong>sa</strong>ire : « Il<br />

faut reconnaître que l'affichage <strong>de</strong> courbes sonores permet <strong>de</strong> prés<strong>en</strong>ter <strong>de</strong> façon visible et non<br />

subjective (avec la supériorité d'impact que le visuel a sur le sonore pour beaucoup) une<br />

transcription du problème que l'appr<strong>en</strong>ant r<strong>en</strong>contre dans son travail d'approche <strong>de</strong> la production<br />

orale, processus mal maîtrisé dans notre société […] Cet affichage lui offre la possibilité, d'une<br />

certaine manière, <strong>de</strong> transformer la production orale <strong>en</strong> un objet-symbole permettant à <strong>sa</strong><br />

s<strong>en</strong>sibilité autant s<strong>en</strong>sorielle qu'intellectuelle <strong>de</strong> comm<strong>en</strong>cer à avoir prise sur lui : le premier pas pour<br />

pouvoir <strong>en</strong>vi<strong>sa</strong>ger <strong>de</strong> progresser » (Caza<strong>de</strong>, 2000, p. 14)<br />

34 “a major goal in therapy is to increase the speaker’s awar<strong>en</strong>ess of his/her voice both proprioceptively and auditorily to <strong>en</strong>able<br />

self-monitoring”<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 20


1.3.1.2 Motivation<br />

Dans le cadre d’une amélioration <strong>de</strong> la prononciation <strong>de</strong> l’Anglais, Pamela Pearson et son équipe<br />

not<strong>en</strong>t que le feedback visuel a un effet sur la motivation <strong>de</strong>s sujets : le spectrogramme permet aux<br />

élèves <strong>de</strong> constater l’écart <strong>en</strong>tre leur production et ce qui est att<strong>en</strong>du. Les professeurs appréci<strong>en</strong>t<br />

<strong>de</strong> ne pas avoir à donner <strong>de</strong> feedback verbal négatif mais une cible visuelle positive. (Pearson et al.,<br />

2011, p. 174)<br />

Selon Caroline Coudière, « le feedback visuel est un média non négligeable, malgré ses limites, dans<br />

le travail sur la <strong>voix</strong> et ses paramètres. Il permet une prise <strong>de</strong> consci<strong>en</strong>ce qui ne peut se faire sur une<br />

simple écoute, une objectivation <strong>de</strong> l’évolution, une visuali<strong>sa</strong>tion du but à atteindre, et ainsi un<br />

souti<strong>en</strong> à la motivation. » (Coudière, 2003, p. 113). « 65% <strong>de</strong>s orthophonistes not<strong>en</strong>t un regain <strong>de</strong><br />

motivation chez certains <strong>de</strong> leurs pati<strong>en</strong>ts, lorsque le logiciel est utilisé <strong>en</strong> milieu ou fin <strong>de</strong><br />

<strong>rééducation</strong>. Certains observ<strong>en</strong>t, non pas un regain, mais une motivation qui transparait au cours <strong>de</strong><br />

l’utili<strong>sa</strong>tion du logiciel » (Coudière, 2003, p. 144) « La moitié <strong>de</strong>s orthophonistes interrogés<br />

p<strong>en</strong>s<strong>en</strong>t que cet outil agit sur la motivation du pati<strong>en</strong>t » (Coudière, 2003, p. 147)<br />

Dans le cadre <strong>de</strong> la <strong>rééducation</strong> <strong>de</strong> la dy<strong>sa</strong>rthrie post-traumatique, « le fait d’avoir un objectif visuel<br />

(augm<strong>en</strong>ter son débit pour que tout l’échantillon <strong>de</strong> parole s’inscrive dans un cadre) est motivant<br />

pour le pati<strong>en</strong>t. » (Beauch<strong>en</strong>e & Bouquay, 1994, p. 111)<br />

Dans le cadre <strong>de</strong> la <strong>rééducation</strong> d’<strong>en</strong>fant sourds, M. Maulet précise que « toutes les possibilités<br />

d’analyse décrites précé<strong>de</strong>mm<strong>en</strong>t, loin d’être fastidieuses pour le pati<strong>en</strong>t, lui procur<strong>en</strong>t un plaisir<br />

nouveau, une motivation réelle dans son appropriation l<strong>en</strong>te et difficile <strong>de</strong> la parole » (Maulet, 1997,<br />

p. 86)<br />

L’étu<strong>de</strong> <strong>de</strong> Laukkan<strong>en</strong> a pour objectif d’améliorer le singing formant chez <strong>de</strong>s acteurs <strong>en</strong> utili<strong>sa</strong>nt un<br />

feedback <strong>en</strong> temps réel constitué <strong>de</strong> l’analyse spectrale. Les auteurs not<strong>en</strong>t que les sujets ont<br />

trouvé que « s’exercer avec le feedback visuel était intéres<strong>sa</strong>nt et que <strong>sa</strong> nature concrète était<br />

motivante » 35 . A l’inverse, un sujet du groupe contrôle, dont la qualité <strong>vocale</strong> a empiré p<strong>en</strong>dant<br />

l’expéri<strong>en</strong>ce, « s’est plaint qu’ils n’avai<strong>en</strong>t aucune idée clair du but <strong>de</strong>s exercices » 36 , <strong>sa</strong> sélectivité<br />

auditive semblant insuffi<strong>sa</strong>nte (Laukkan<strong>en</strong> et al., 2004, p. 69)<br />

1.3.1.3 Autonomi<strong>sa</strong>tion<br />

Selon Françoise Esti<strong>en</strong>ne, l’efficacité d’un traitem<strong>en</strong>t sur la <strong>voix</strong> suppose l’autonomie <strong>de</strong> la personne<br />

traitée. Ses critères permettant d’évaluer l’efficacité d’une thérapie compr<strong>en</strong>n<strong>en</strong>t notamm<strong>en</strong>t : « la<br />

personne est capable d’évaluer ces moy<strong>en</strong>s et <strong>de</strong> les ajuster ». « la personne vérifie <strong>sa</strong> propre<br />

influ<strong>en</strong>ce sur les résultats, est consci<strong>en</strong>te <strong>de</strong> ce qu’elle fait, <strong>de</strong>s stratégies qu’elle emploie » (Esti<strong>en</strong>ne,<br />

2001, p. 39) L’auteur p<strong>en</strong>se que l’invitation à l’autonomie <strong>de</strong>s pati<strong>en</strong>ts permet l’intégration du geste<br />

vocal plus rapi<strong>de</strong>m<strong>en</strong>t lors d’une thérapie <strong>vocale</strong>. Dans cette optique, le thérapeute doit « résister<br />

35<br />

“According to the subjects’ comm<strong>en</strong>ts, exercising with visual feedback was interesting and its concrete nature was reported<br />

to be motivating”<br />

36<br />

“on the other hand, the subject in the control group whose voice was evaluated to be clearly worse after training,<br />

complained that he had not had any clear i<strong>de</strong>a of the goal of the exercises”<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 21


au charme du pouvoir, <strong>de</strong> la toute puis<strong>sa</strong>nce et <strong>de</strong> la dép<strong>en</strong>dance ; […] accepter la critique, le refus<br />

comme l’approbation » (Esti<strong>en</strong>ne, 1998, p. 185)<br />

Dans la cadre du biofeedback (électromyographie), les auteurs soulign<strong>en</strong>t que le sujet « participe<br />

activem<strong>en</strong>t à <strong>sa</strong> propre <strong>rééducation</strong> et passe sur le plan relationnel d’une situation <strong>de</strong> dép<strong>en</strong>dance et<br />

<strong>de</strong> passivité à une autonomie, à un contrôle, qui constitu<strong>en</strong>t <strong>en</strong> fait le terme souhaité <strong>de</strong> toute<br />

<strong>rééducation</strong> » (Laurans => Blanc 1976) in Zon<strong>de</strong>r p.22<br />

Dans ce domaine, Donald G. Miller p<strong>en</strong>se que le spectrogramme donne une certaine autonomie à<br />

l’élève : « il peut arriver que l’élève soit dans une meilleure position que le professeur pour évaluer<br />

les progrès techniques, et même pour juger <strong>de</strong> la désirabilité <strong>de</strong>s interv<strong>en</strong>tions du professeur sur la<br />

technique <strong>vocale</strong> » 37 (Donald Gray Miller, 2008, p. 107) David M. Howard rapporte « qu’<strong>en</strong> outre, les<br />

étudiants peuv<strong>en</strong>t souv<strong>en</strong>t utiliser la technologie p<strong>en</strong>dant les exercices <strong>en</strong>tre les leçons » 38 (David M<br />

Howard, 2005, p. 329)<br />

1.3.1.4 Enrichissem<strong>en</strong>t <strong>de</strong> compét<strong>en</strong>ces, diversification du travail orthophonique<br />

On note que certaines étu<strong>de</strong>s ont montré que la pédagogie du chant était peu docum<strong>en</strong>tée <strong>de</strong><br />

façon sci<strong>en</strong>tifique 39 40 (in Welch et al., 2005, p. 226). La vulgari<strong>sa</strong>tion <strong>de</strong>s notions d’acoustiques pour<br />

les professeurs <strong>de</strong> chants par McCoy et Garyth Nair est <strong>sa</strong>luée dans l’article (Barnes-Burroughs, Lan,<br />

Edwards, & Archambeault, 2008, p. 590). La visuali<strong>sa</strong>tion spectrographique donne au professeur <strong>de</strong><br />

chant l’opportunité d’introduire <strong>de</strong>s notions d’anatomie, <strong>de</strong> physiologie et <strong>de</strong> concepts physiques<br />

<strong>de</strong> base. (Nair, 1999, pp. 7, 69)<br />

La situation <strong>en</strong> orthophonie est différ<strong>en</strong>te, l’anatomie, la physiologie, les spectrogrammes et la<br />

phonétique sont <strong>en</strong>seignés <strong>en</strong> école d’orthophonie. L’utili<strong>sa</strong>tion d’un spectrogramme <strong>en</strong> temps réel<br />

<strong>en</strong> <strong>rééducation</strong> donne aux orthophonistes l’occasion d’<strong>en</strong>richir leur pratique.<br />

Caroline Coudière note que « le spectre […] va aussi objectiver les progrès réalisés par le pati<strong>en</strong>t et<br />

pour l’orthophoniste, lui permettre <strong>de</strong> diversifier son travail et la conforter dans <strong>sa</strong> compét<strong>en</strong>ce »<br />

(Coudière, 2003, p. 83)<br />

1.3.1.5 Conclusion<br />

L’utili<strong>sa</strong>tion du spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> est décrite comme pouvant favoriser la prise<br />

<strong>de</strong> consci<strong>en</strong>ce <strong>de</strong>s paramètres <strong>de</strong> la <strong>voix</strong>, la motivation et l’autonomi<strong>sa</strong>tion du pati<strong>en</strong>t. Quelles sont<br />

cep<strong>en</strong>dant les limites <strong>de</strong> cette utili<strong>sa</strong>tion ?<br />

37 “it can happ<strong>en</strong> that the pupil will be in a better position than the teacher to assess technical progress, and ev<strong>en</strong> to judge the<br />

<strong>de</strong>sirability of the teacher’s interv<strong>en</strong>tions in vocal technique”<br />

38 “Systems such as these provi<strong>de</strong> quantitative real-time visual feedback during lessons, and in addition, stu<strong>de</strong>nts are oft<strong>en</strong> able<br />

to make use of the technology during their interv<strong>en</strong>ing practice time”<br />

39 Mitchell, H. F & K<strong>en</strong>ny, D.T. (2004) The impact of ‘op<strong>en</strong> throat’ technique on vibrato rate, ext<strong>en</strong>t and the onset of classical<br />

singing, logopedics Phoniatrics Voicology, 29(4), 171-182<br />

40 Mitchell, H. F, K<strong>en</strong>ny, D.T. , Ryan, M. & Davis, P. J. (2003) Defining ‘op<strong>en</strong> throat’ through cont<strong>en</strong>t analysis of experts’<br />

pedagogical practices, Logopedics Phoniatrics Vocology, 28(4), 167-180<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 22


1.3.2 Limites <strong>de</strong> l’analyse spectrographique<br />

1.3.2.1 Fiabilité <strong>de</strong> l’image<br />

Yumoto et ses collègues p<strong>en</strong>s<strong>en</strong>t que le rapport signal sur bruit est plus adapté à la pratique<br />

clinique. Parmi les divers inconvéni<strong>en</strong>ts <strong>de</strong> la classification spectrographique <strong>de</strong> Yanagihara ils<br />

not<strong>en</strong>t qu’ « <strong>en</strong> ajustant certains paramètres du spectrogramme, l’aspect nuageux <strong>de</strong> l’ombre <strong>en</strong>tre<br />

les harmoniques peut être modifié. Au contraire, pour mesurer le rapport signal sur bruit l’ordinateur<br />

traite automatiquem<strong>en</strong>t l’on<strong>de</strong> acoustique <strong>de</strong> l’extrait phonatoire. » 41 (Yumoto et al., 1984, p. 5)<br />

De même certains auteurs not<strong>en</strong>t que « beaucoup d’analyseurs <strong>de</strong> spectre nécessit<strong>en</strong>t <strong>de</strong>s réglages<br />

qui vont déterminer la façon dont l’échantillon va être analysé. La forme, la prés<strong>en</strong>tation du<br />

spectrogramme, l’amplification <strong>de</strong> certains phénomènes aux dép<strong>en</strong>s d’autres, vari<strong>en</strong>t <strong>en</strong> fonction <strong>de</strong><br />

ces réglages et donc <strong>de</strong>s choix <strong>de</strong> l’examinateur » (in Remacle & Morsomme, 2009, p. 129) 42<br />

Atsushi Yasui indique que le spectrogramme ne permet pas <strong>de</strong> quantification exacte, et ne peut pas<br />

remplacer l’observation directe du larynx. (Yasui, 2004, pp. 40–45).<br />

Enfin la fiabilité <strong>de</strong> l’analyse dép<strong>en</strong>d égalem<strong>en</strong>t d’autres paramètres, comme par exemple la<br />

distance du microphone à la bouche et <strong>de</strong> son angle. (Verdolini & Krebs, 1999, pp. 236–238)<br />

1.3.2.2 Complém<strong>en</strong>tarité <strong>de</strong>s approches classiques et du feedback visuel<br />

« Le biofeedback n’est pas une panacée. […] Ce qui est réellem<strong>en</strong>t une panacée, c’est le pouvoir<br />

inscrit dans l’être humain <strong>de</strong> s’auto-réguler, <strong>de</strong> s’auto-guérir, <strong>de</strong> se rééquilibrer constamm<strong>en</strong>t. Le<br />

biofeedback par lui-même ne fait ri<strong>en</strong> à l’individu, il n’est qu’un instrum<strong>en</strong>t qui permet <strong>de</strong> mettre à<br />

profit ce pot<strong>en</strong>tiel » (in Zon<strong>de</strong>r, 2002, p. 18) (rémond 1994) « le biofeedback n’a <strong>de</strong> valeur que s’il est<br />

choisi comme traitem<strong>en</strong>t <strong>en</strong> connais<strong>sa</strong>nce <strong>de</strong> cause, et associé <strong>sa</strong>ns exclusive à tout autre traitem<strong>en</strong>t<br />

jugé néces<strong>sa</strong>ire » minaire 1985 in zon<strong>de</strong>r p.21<br />

Le thérapeute <strong>de</strong> la <strong>voix</strong> gar<strong>de</strong> toute <strong>sa</strong> place dans la <strong>rééducation</strong> <strong>vocale</strong> : « l’oreille humaine<br />

<strong>en</strong>trainée est bi<strong>en</strong> plus performante pour ai<strong>de</strong>r un élève <strong>en</strong> chant qu’un ordinateur ne pourra jamais<br />

l’être » 43 , même si les s<strong>en</strong><strong>sa</strong>tions subjectives <strong>de</strong> l’oreille humaine ne sont pas faciles à partager.<br />

Selon Garyth Nair, l’outil informatique permettant d’analyser finem<strong>en</strong>t les compo<strong>sa</strong>ntes <strong>de</strong> chaque<br />

son nécessite <strong>de</strong> toute façon une interprétation humaine pour corréler ce qui est affiché à ce qui<br />

est <strong>en</strong>t<strong>en</strong>du et pour déci<strong>de</strong>r ce que doit faire l’élève. Il n’est donc pas question <strong>de</strong> remplacer<br />

l’humain par une machine. De même, Donald G. Miller précise que les outils informatiques ne sont<br />

pas là pour remplacer le professeur, mais pour lui donner <strong>de</strong>s informations supplém<strong>en</strong>taires.<br />

(Donald Gray Miller, 2008, p. 35)<br />

41 “di<strong>sa</strong>dvantages in the spectrographic classification as noted below: […]<br />

- Cloudiness of the shadow betwe<strong>en</strong> harmonics could be modified to some ext<strong>en</strong>t by adjusting controls of the sound spectrograph<br />

(e.g., "mark level" and "dynamic range"). In contrast, in or<strong>de</strong>r to measure the H/N ratio a computer automatically processes the<br />

acoustic wave of the phonatory <strong>sa</strong>mple”<br />

42 Bak<strong>en</strong> R.J. (1987) : Clinical measurem<strong>en</strong>t of speech and voice . London : Taylor & Francis LTD.<br />

43 “the trained human ear is far better equipped to help a voice stu<strong>de</strong>nt that any computer could ever be”<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 23


Les résultats objectifs délivrés par un appareil <strong>de</strong> feedback doiv<strong>en</strong>t impérativem<strong>en</strong>t être prés<strong>en</strong>tés<br />

<strong>de</strong> façon positive par le thérapeute. La motivation dép<strong>en</strong>d du comportem<strong>en</strong>t du thérapeute à cet<br />

égard, <strong>de</strong> la qualité <strong>de</strong> la rétro-information et <strong>de</strong>s résultats obt<strong>en</strong>us [[André ]]<br />

Le spectrogramme nécessite d’être interprété avec pru<strong>de</strong>nce, sinon on risque <strong>de</strong> mal l’interpréter.<br />

D.M. Howard a con<strong>sa</strong>cré un article <strong>en</strong> 2002 sur ce sujet, pointant le fait que le spectrogramme ne<br />

peut être précis à la fois dans le domaine temporel et dans le domaine fréqu<strong>en</strong>tiel, et qu’<strong>en</strong><br />

conséqu<strong>en</strong>ce, il ne peut r<strong>en</strong>dre compte <strong>de</strong> toutes les subtilités du son perçues par une oreille<br />

humaine(D. M. Howard, 2002, p. 500). Les professeurs <strong>de</strong> chant mett<strong>en</strong>t souv<strong>en</strong>t <strong>en</strong> gar<strong>de</strong> contre<br />

l’utili<strong>sa</strong>tion du spectrogramme <strong>sa</strong>ns supervision, les élèves pouvant ne pas compr<strong>en</strong>dre <strong>en</strong>tièrem<strong>en</strong>t<br />

ce qu’ils y voi<strong>en</strong>t.(Hoppe, Sadakata, & De<strong>sa</strong>in, 2006, p. 312b)<br />

« si le logiciel permet un travail autonome <strong>de</strong> l’appr<strong>en</strong>ant, le rôle <strong>de</strong> l’<strong>en</strong>seignant n’<strong>en</strong> est pas moins<br />

exclu. Ce <strong>de</strong>rnier va pouvoir s’appuyer sur les difficultés objectivées par le logiciel pour am<strong>en</strong>er<br />

l’appr<strong>en</strong>ant à porter un regard auto-évaluatif sur son discours oral. Le professeur a <strong>en</strong> charge <strong>de</strong><br />

préciser et <strong>de</strong> compléter le feedback r<strong>en</strong>du par les courbes, qui va lui permettre d’individualiser<br />

concrètem<strong>en</strong>t son discours » (Coudière, 2003, p. 110)<br />

La qualité du professeur <strong>de</strong> chant rési<strong>de</strong> égalem<strong>en</strong>t dans la relation <strong>en</strong>tret<strong>en</strong>ue avec l’élève, et la<br />

façon d’<strong>en</strong>tret<strong>en</strong>ir judicieusem<strong>en</strong>t la confiance <strong>en</strong> soi <strong>de</strong> celui-ci. (Donald Gray Miller, 2008, p. 106).<br />

Le professeur <strong>de</strong> chant apporte égalem<strong>en</strong>t <strong>de</strong>s compét<strong>en</strong>ces qui n’ont pas à proprem<strong>en</strong>t parler <strong>de</strong><br />

rapport avec la production acoustique : (D. M. Howard et al., 2004, p. 143) On fera facilem<strong>en</strong>t le<br />

parallèle avec l’orthophoniste dont le rôle est égalem<strong>en</strong>t <strong>de</strong> conforter le pati<strong>en</strong>t dans ses diverses<br />

situations <strong>de</strong> communication, travailler la pragmatique, redonner confiance <strong>en</strong> soi, donner <strong>de</strong>s<br />

conseils d’hygiène <strong>vocale</strong>, la relaxation, la posture, la respiration, etc.<br />

Dans le cadre d’un travail avec ce feedback visuel, il est très important que l’orthophoniste prés<strong>en</strong>te<br />

les images spectrographiques obt<strong>en</strong>ues <strong>de</strong> façon positives, voire ludique, pour maint<strong>en</strong>ir l’intérêt et<br />

la motivation du pati<strong>en</strong>t à <strong>sa</strong> <strong>rééducation</strong>. Dans le questionnaire aux orthophonistes <strong>de</strong> Caroline<br />

Coudière, « plusieurs personnes ont […] pondéré leur utili<strong>sa</strong>tion <strong>de</strong>s données du logiciel <strong>en</strong> relevant<br />

le fait <strong>de</strong> <strong>de</strong>voir toujours repr<strong>en</strong>dre avec le pati<strong>en</strong>t les différ<strong>en</strong>ts résultats et <strong>de</strong> les relativiser. »<br />

(Coudière, 2003, p. 134). Le thérapeute <strong>de</strong> la <strong>voix</strong> joue égalem<strong>en</strong>t un rôle actif avec le pati<strong>en</strong>t<br />

pour le transfert <strong>de</strong> ce feedback visuel sur les s<strong>en</strong><strong>sa</strong>tions acoustiques et proprioceptives.<br />

1.3.2.3 Pertin<strong>en</strong>ce <strong>de</strong> l’information donnée par le spectrogramme<br />

Dans la <strong>rééducation</strong> par biofeedback, les auteurs not<strong>en</strong>t généralem<strong>en</strong>t que le rétro-contrôle doit<br />

être retransmis <strong>de</strong> manière précise, claire et attrayante. La prés<strong>en</strong>tation <strong>de</strong> ces informations doit<br />

revêtir une valeur <strong>de</strong> <strong>sa</strong>nction et comporter une charge émotionnelle à <strong>de</strong>s fins <strong>de</strong> motivation. (in<br />

Zon<strong>de</strong>r, 2002, p. 20). David M. Howard rappelle que les applications technologiques « représ<strong>en</strong>t<strong>en</strong>t<br />

un grand pot<strong>en</strong>tiel <strong>de</strong> bénéfices s’ils sont faciles à utiliser par les non spécialistes et si l’information<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 24


qu’ils fourniss<strong>en</strong>t est complètem<strong>en</strong>t comprise, qu’elle a du s<strong>en</strong>s, qu’elle est vali<strong>de</strong> et utile ». 44 (David<br />

M Howard, 2005, p. 329).<br />

Donald G. Miller p<strong>en</strong>se que « le spectrogramme est l’image la plus susceptible <strong>de</strong> paraître familière<br />

au lecteur moy<strong>en</strong> » 45 , parmi les images <strong>en</strong> temps réel proposées par vocevista (spectrogramme,<br />

spectre, électroglottographe, signal auditif, forme d’on<strong>de</strong>) (Donald Gray Miller, 2008, p. 15)<br />

L’utili<strong>sa</strong>tion du spectrogramme ne permet pas une telle simplicité. Certes l’affichage offert par le<br />

spectrogramme « a l’avantage <strong>de</strong> fournir un feedback qui ne se cont<strong>en</strong>te pas d’être binaire (la <strong>voix</strong><br />

est soit bonne soit non) mais qui a une forme. Le locuteur peut voir où se situe la difficulté dans son<br />

énoncé » 46 (David M. Howard et al., 2012, p. 9b) mais cela se fait au détrim<strong>en</strong>t d’une utili<strong>sa</strong>tion<br />

simple <strong>de</strong> l’outil.<br />

Pour Callaghan et ses collègues, repris dans la revue <strong>de</strong> littérature <strong>de</strong> Hoppe et ses collèges, les<br />

professeurs <strong>de</strong> chant ont trouvé que le feedback visuel aurait dû être plus pertin<strong>en</strong>t musicalem<strong>en</strong>t.<br />

(Hoppe et al., 2006, p. 312a) David M. Howard souligne que le spectrogramme Gamma Tone évite<br />

<strong>de</strong>s confusions qui peuv<strong>en</strong>t apparaître avec les spectrogrammes traditionnels, qui ne ti<strong>en</strong>n<strong>en</strong>t pas<br />

compte <strong>de</strong> la perception humaine <strong>de</strong>s sons.<br />

1.3.2.4 Nécessité d’une formation spécifique<br />

L’étu<strong>de</strong> <strong>de</strong> Pat H. Wilson et ses collègues t<strong>en</strong>d à montrer que l’efficacité <strong>de</strong> la forme du feedback<br />

visuel (<strong>en</strong> l’occurr<strong>en</strong>ce graphique <strong>de</strong> la fréqu<strong>en</strong>ce fondam<strong>en</strong>tale vs visuali<strong>sa</strong>tion sur un clavier <strong>de</strong><br />

piano) dép<strong>en</strong>d <strong>de</strong>s capacités <strong>de</strong>s sujets à l’interpréter facilem<strong>en</strong>t.(Wilson et al., 2007, p. 7b; Wilson,<br />

Thorpe, & Callaghan, 2005, p. 9) Selon Garyth Nair, pour pouvoir utiliser le feedback visuel <strong>en</strong> temps<br />

réel (VRTF : Visual Real-time Feedback), les professeurs <strong>de</strong> chant doiv<strong>en</strong>t, notamm<strong>en</strong>t, <strong>sa</strong>voir<br />

reconnaître auditivem<strong>en</strong>t et visuellem<strong>en</strong>t une bonne et une mauvaise production <strong>vocale</strong>, et <strong>sa</strong>voir<br />

donner <strong>de</strong>s exercices pour r<strong>en</strong>forcer le comportem<strong>en</strong>t voulu et le r<strong>en</strong>dre habituel (Nair, 1999, p.<br />

68).<br />

Ainsi « l’analyse <strong>de</strong> spectre est <strong>en</strong>core jugée très complexe pour <strong>de</strong>s thérapeutes peu formés <strong>en</strong><br />

acoustique. […]raucité, fatigabilité, souffle[…] ne sont pas aisés à i<strong>de</strong>ntifier sur un spectre <strong>sa</strong>ns une<br />

formation spécifique » (Coudière, 2003, p. 152) De même, Sylvain Lamesch pointe qu’il est difficile<br />

au professeur <strong>de</strong> chant d’établir <strong>de</strong>s connections <strong>en</strong>tre la représ<strong>en</strong>tation du signal acoustique et ses<br />

propres représ<strong>en</strong>tations internes. (Lamesch, 2012, p. 64b) (Maulet, 1997, p. 86)<br />

Harm K. Schutte et Donald Miller confirm<strong>en</strong>t <strong>en</strong>core que la quantité d’information produite par le<br />

spectre <strong>en</strong> temps réel est importante. Selon eux cela explique la difficulté pour les professeurs <strong>de</strong><br />

chant d’interpréter l’information. « ceux qui pourrai<strong>en</strong>t profiter le mieux <strong>de</strong> son utili<strong>sa</strong>tion n’ont pas<br />

su [jusqu’ici] quoi rechercher dans cette surabondance d’information » 47 . Selon eux, cet état <strong>de</strong> fait<br />

44 ”our experi<strong>en</strong>ce suggests that technological applications are of greatest pot<strong>en</strong>tial b<strong>en</strong>efit if they are easy to use by nonspecialists<br />

and provi<strong>de</strong> information that is readily un<strong>de</strong>rstood, meaningful, valid and useful.”<br />

45 “Of the displays used in Vocevista, the sound spectrogram is likely to be the most familiar to the average rea<strong>de</strong>r”<br />

46 “This sort of display has the advantage of providing feedback – knowledge of results – that is not simply binary (the voice is<br />

either good or not) but feedback that is patterned. The speaker can see where in the utterance the difficulty occurs”<br />

47 “those who could be profiting most from its use have not known what to look for in the glut of information”<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 25


provi<strong>en</strong>t du manque <strong>de</strong> vocabulaire commun <strong>en</strong>tre les professionnels <strong>de</strong> la <strong>voix</strong> et les acoustici<strong>en</strong>s.<br />

(D. Miller & Schutte, 1999a, p. 207). Pour Garyth Nair, si l’on introduit doucem<strong>en</strong>t la nouvelle<br />

technologie <strong>en</strong> comm<strong>en</strong>çant par les concepts <strong>de</strong> base, les professionnels <strong>de</strong> la <strong>voix</strong> pourront passer<br />

outre la peur que la technologie révèle l’incomplétu<strong>de</strong> <strong>de</strong> leurs connais<strong>sa</strong>nces. (Nair, 1999, pp. 6–9)<br />

Lors <strong>de</strong> l’expéri<strong>en</strong>ce VOXed, les professeurs <strong>de</strong> chant ont utilisé préfér<strong>en</strong>tiellem<strong>en</strong>t le<br />

spectrogramme <strong>en</strong> temps réel, qui est le plus complexe <strong>de</strong>s affichages proposés dans le logiciel. La<br />

plupart <strong>de</strong>s interprétations <strong>de</strong>s professeurs étai<strong>en</strong>t donc basées sur une approche holistique plutôt<br />

que sur une analyse <strong>de</strong>s détails. Ainsi la « surabondance <strong>de</strong>s informations » <strong>de</strong>s images affichées n’a<br />

pas gêné les professeurs <strong>de</strong> chant dans le cadre <strong>de</strong> cette étu<strong>de</strong>, ceux-ci s’appuyant sur leurs<br />

connais<strong>sa</strong>nces pour interpréter les images. (David M Howard et al., 2007, p. 31)<br />

L’utili<strong>sa</strong>tion <strong>de</strong> l’outil, <strong>en</strong> elle-même, peut constituer un début <strong>de</strong> formation : « Pour<br />

l’orthophoniste, la meilleure compréh<strong>en</strong>sion <strong>de</strong>s paramètres acoustiques et leur maîtrise serai<strong>en</strong>t<br />

dues au fait <strong>de</strong> voir l’évolution du spectre simultaném<strong>en</strong>t aux modifications du geste ou <strong>de</strong> la<br />

production <strong>vocale</strong>. […] En effet, on peut imaginer que le manque <strong>de</strong> formation est pallié par les<br />

expéri<strong>en</strong>ces empiriques» (Coudière, 2003, p. 155)<br />

1.3.2.5 Conclusion<br />

L’utili<strong>sa</strong>tion du spectrogramme peut être ress<strong>en</strong>tie comme manquant <strong>de</strong> fiabilité du fait <strong>de</strong>s<br />

réglages informatiques, d’aspects techniques comme le placem<strong>en</strong>t du micro, et du fait <strong>de</strong> son<br />

apport qualitatif plutôt que quantitatif. Le spectrogramme reste un outil qui ne remplace pas les<br />

approches classiques, et qui fournit un nombre d’informations importantes qu’il est important <strong>de</strong><br />

<strong>sa</strong>voir déco<strong>de</strong>r. Ces limites peuv<strong>en</strong>t être contournées <strong>en</strong> pr<strong>en</strong>ant les précautions néces<strong>sa</strong>ires.<br />

1.3.3 Aspects ambival<strong>en</strong>ts<br />

1.3.3.1 Conc<strong>en</strong>tration et charge cognitive<br />

Pat H. Wilson et ses collègues mett<strong>en</strong>t <strong>en</strong> avant une revue <strong>de</strong> littérature m<strong>en</strong>ée par Wulf et Prinz 48 ,<br />

concluant que « l’efficacité avec laquelle les habilités motrices sont acquises peut être diminuée si le<br />

sujet fait trop att<strong>en</strong>tion à <strong>sa</strong> performance […] <strong>de</strong>man<strong>de</strong>r au sujet <strong>de</strong> maint<strong>en</strong>ir son att<strong>en</strong>tion à<br />

l’extérieur plutôt que <strong>de</strong> p<strong>en</strong>ser à <strong>sa</strong> propre performance et <strong>sa</strong> prise <strong>de</strong> consci<strong>en</strong>ce <strong>de</strong> ses<br />

mouvem<strong>en</strong>ts permet une acquisition d’habilités optimale» 49 . Selon les auteurs, cela sous-<strong>en</strong>t<strong>en</strong>d que<br />

« l’appr<strong>en</strong>tis<strong>sa</strong>ge est plus facile quand il y a une plus gran<strong>de</strong> distance physique <strong>en</strong>tre le cours et<br />

l’effet produit par la tâche » 50. (Wilson et al., 2005)<br />

Le cas <strong>de</strong> la production <strong>vocale</strong> reste ambigüe, cep<strong>en</strong>dant on peut considérer que le son produit par<br />

le geste vocal est un phénomène extérieur, notamm<strong>en</strong>t lorsqu’il est perçu par l’interlocuteur. De ce<br />

48<br />

Wulf, G., & Prinz, W. (2001). Directing att<strong>en</strong>tion to movem<strong>en</strong>t effects <strong>en</strong>hances learning: A review. sychonomic Bulletin &<br />

Review, 8, (4) , 648 - 660 .<br />

49<br />

“the effectiv<strong>en</strong>ess with which motor skills are acquired may be adversely affected if the learner pays too much att<strong>en</strong>tion to<br />

her/his performance […]instructing the learner to maintain an external focus, rather than think about their own performance<br />

and maintain self-awar<strong>en</strong>ess of their movem<strong>en</strong>ts, yiel<strong>de</strong>d optimal skills acquisition”<br />

50<br />

“Wulf and Prinz add that a consequ<strong>en</strong>ce of this observation is that motor skills learning is further <strong>en</strong>hanced wh<strong>en</strong> there is a<br />

greater physical distance betwe<strong>en</strong> the body and the effect produced by its task.”<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 26


point <strong>de</strong> vue, David Hoppe et ses collègues déduis<strong>en</strong>t que « le feedback visuel <strong>de</strong>s performances<br />

chantées dirigé vers les mouvem<strong>en</strong>ts du sujet (c’est-à-dire le conduit vocal) peut être moins efficace<br />

que le feedback visuel sur la sortie acoustique (c’est-à-dire une information spectrale <strong>en</strong> temps<br />

réel » 51 (Hoppe et al., 2006, p. 316a). De ce point <strong>de</strong> vue le feedback visuel serait alors préférable au<br />

feedback proprioceptif <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong>.<br />

« L’utili<strong>sa</strong>tion du logiciel favorise pour […]70% [<strong>de</strong>s orthophonistes interrogés] la conc<strong>en</strong>tration <strong>de</strong>s<br />

pati<strong>en</strong>ts au cours <strong>de</strong>s exercices sur ordinateur par rapport aux mêmes effectués <strong>sa</strong>ns le support <strong>de</strong> la<br />

visuali<strong>sa</strong>tion ». (Coudière, 2003, p. 144) Welch et ses collègues rapport<strong>en</strong>t égalem<strong>en</strong>t que les<br />

images fournies par le spectrogramme permett<strong>en</strong>t « <strong>de</strong> cibler l’att<strong>en</strong>tion <strong>de</strong> leur élèves sur la façon<br />

dont ces figures pouvai<strong>en</strong>t être manipulées systématiquem<strong>en</strong>t » 52 (Welch et al., 2005, p. 242). Cette<br />

référ<strong>en</strong>ce commune à un objet visuel, que l’on peut cadrer et délimiter, favorise la conc<strong>en</strong>tration.<br />

Pour I<strong>sa</strong>belle Marié (Marié Bailly, 2004, p. 51), la visuali<strong>sa</strong>tion spectrographique a un impact positif<br />

sur la conc<strong>en</strong>tration et la prés<strong>en</strong>ce à soi.<br />

Cep<strong>en</strong>dant, dans l’étu<strong>de</strong> <strong>de</strong> Howard et ses collègues, les étudiants ont trouvé parfois que le<br />

feedback visuel les empêchai<strong>en</strong>t <strong>de</strong> se conc<strong>en</strong>trer sur quelque chose <strong>de</strong> plus utile (la partition, le<br />

professeur, l’accompagnateur). (D. M. Howard et al., 2004, p. 143). Il convi<strong>en</strong>t donc <strong>de</strong> trouver le<br />

bon équilibre <strong>en</strong>tre les différ<strong>en</strong>ts outils suivant les objectifs du travail <strong>en</strong> <strong>rééducation</strong>.<br />

1.3.3.2 Nécessité du temps réel<br />

Le feedback externe <strong>en</strong> temps réel doit faire le li<strong>en</strong> <strong>en</strong>tre ce qui est <strong>en</strong>t<strong>en</strong>du et ress<strong>en</strong>ti, qui sont les<br />

s<strong>en</strong><strong>sa</strong>tions sur lesquelles doit se faire un appr<strong>en</strong>tis<strong>sa</strong>ge durable et autonome. Dans un<br />

appr<strong>en</strong>tis<strong>sa</strong>ge avec rétro-contrôle, pour que le conditionnem<strong>en</strong>t soit opérant, il est néces<strong>sa</strong>ire que<br />

le r<strong>en</strong>forcem<strong>en</strong>t soit délivré aussi rapi<strong>de</strong>m<strong>en</strong>t que possible. On voit ici tout l’intérêt du temps réel<br />

[[André]] Selon M Dutel 53 , cité par Caroline Coudière, l’efficacité d’un feedback visuel repose<br />

notamm<strong>en</strong>t sur « une quasi-simultanéité <strong>de</strong> l’affichage visuel correspondant au signal sonore pour<br />

un véritable « feedback visuel <strong>de</strong> suppléance » », (Coudière, 2003, pp. 103–104)<br />

Selon Graham F. Welch, le feedback auditif seul n’est pas suffi<strong>sa</strong>nt dans le chant, notamm<strong>en</strong>t pour<br />

la justesse : « il n’est pas possible <strong>de</strong> « voir » si la réponse chantée est adéquate, puisque le stimulus<br />

et la réponse sont séparés dans le temps » 54 (Welch, 1985, p. 11) Si l’on <strong>de</strong>man<strong>de</strong> à un sujet <strong>de</strong><br />

reproduire un modèle, il est indisp<strong>en</strong><strong>sa</strong>ble qu’il se rappelle du modèle après avoir produit l’imitation<br />

afin <strong>de</strong> pouvoir comparer ce qu’il a fait et ce qui était <strong>de</strong>mandé. David M. Howard et ses collègues<br />

(David M Howard et al., 2007, p. 21b–22a) cit<strong>en</strong>t un article <strong>de</strong> Welch <strong>en</strong> 1985 : dans le cas habituel,<br />

l’élève produit quelque chose, att<strong>en</strong>d le feedback externe du professeur, puis recomm<strong>en</strong>ce. Un<br />

51<br />

“VFB on singing performance that is directed to one’s own movem<strong>en</strong>ts (e.g. the vocal tract) may be less effective than VFB on<br />

the acoustical output (e.g. real-time spectral information).”<br />

52<br />

“Both teachers t<strong>en</strong><strong>de</strong>d to treat the on-scre<strong>en</strong> information as visual patterns associated with particular vocal behaviours in<br />

or<strong>de</strong>r to focus their stu<strong>de</strong>nts att<strong>en</strong>tion on how these patterns could be manipulated systematically”<br />

53<br />

M.M. Dutel, P. Labaeye, M. Lamotte, SAVANE : système d’ai<strong>de</strong> visuelle aux non-<strong>en</strong>t<strong>en</strong>dants, première expérim<strong>en</strong>tation d’une<br />

approche <strong>vocale</strong>, avril 1985 (source : Mme Dutel)<br />

54<br />

“it is not possible to “see” if the sung reponse is accurate, as the stimulus and response happ<strong>en</strong> and are separated over time”<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 27


intérêt majeur du feedback visuel <strong>en</strong> temps réel est <strong>de</strong> fournir le feedback externe p<strong>en</strong>dant la<br />

production <strong>de</strong> l’élève.<br />

Sylvain Lamesch note égalem<strong>en</strong>t que « l’élève n’arrive pas néces<strong>sa</strong>irem<strong>en</strong>t à i<strong>de</strong>ntifier le même<br />

indice que son professeur ». et que, <strong>de</strong> plus, « la plupart du temps, [le professeur] donne son<br />

comm<strong>en</strong>taire une fois le geste vocal effectué », ce qui induit un « retard <strong>en</strong>tre le comm<strong>en</strong>taire du<br />

professeur et le ress<strong>en</strong>ti <strong>de</strong> l’élève » (Lamesch, 2012, p. 63b–34a)<br />

Graham F. Welch explicite <strong>en</strong> 1985 l’intérêt du temps réel dans l’appr<strong>en</strong>tis<strong>sa</strong>ge <strong>de</strong> la justesse dans<br />

le chant. le groupe d’<strong>en</strong>fant bénéficiant <strong>de</strong> feedback visuel <strong>en</strong> temps réel a amélioré la justesse <strong>de</strong><br />

son chant par rapport à l’autre groupe bénéficiant d’un feedback verbal habituel. (in Welch et al.,<br />

2005, p. 228)<br />

Pour Harm K. Schutte et D. Miller, la possibilité <strong>de</strong> voir la composition <strong>de</strong> la <strong>voix</strong> <strong>en</strong> temps réel<br />

permet <strong>de</strong> « faire le pont <strong>en</strong>tre la théorie et la pratique » 55 . L’intérêt est <strong>de</strong> pouvoir connecter les<br />

trois élém<strong>en</strong>ts : affichage acoustique, son perçu, production du son. (D. Miller & Schutte, 1999a, p.<br />

207). Ces auteurs mett<strong>en</strong>t <strong>en</strong> évi<strong>de</strong>nce l’intérêt <strong>de</strong> la visuali<strong>sa</strong>tion lors <strong>de</strong> la recherche <strong>de</strong> la zone <strong>de</strong><br />

pas<strong>sa</strong>ge par exemple, : « le fait d’explorer visuellem<strong>en</strong>t [ses modifications lorsqu’on change <strong>de</strong><br />

registre] peut contribuer à la prise <strong>de</strong> consci<strong>en</strong>ce <strong>de</strong> la « s<strong>en</strong><strong>sa</strong>tion » <strong>de</strong> ses modifications » 56<br />

Cep<strong>en</strong>dant le feedback fourni par le spectrogramme n’est pas immédiat : l’affichage <strong>de</strong><br />

l’information nécessite <strong>en</strong>tre 40 et 10 ms, et le système s<strong>en</strong>sitif humain <strong>de</strong>man<strong>de</strong> <strong>en</strong>core 200 ms<br />

pour pouvoir <strong>en</strong> t<strong>en</strong>ir compte. Ainsi on observe un décalage d’un quart <strong>de</strong> secon<strong>de</strong> à une <strong>de</strong>misecon<strong>de</strong>.<br />

Dans certains cas, cela est bi<strong>en</strong> supérieur à la durée <strong>de</strong>s phénomènes à observer, c’est<br />

pourquoi Verdolini et Krebs considèr<strong>en</strong>t dans ces cas précis que le spectrogramme ne constitue pas<br />

un « biofeedback » (ce qui suppose <strong>de</strong>s corrections on-line), mais un « knowledge of<br />

results » (feedback externe différé) (Verdolini & Krebs, 1999, pp. 236–238)<br />

1.3.3.3 Analyse fine <strong>de</strong> <strong>sa</strong> production <strong>vocale</strong><br />

Selon Verdolini et Krebs, l’appr<strong>en</strong>tis<strong>sa</strong>ge du chant nécessite <strong>de</strong>s processus l<strong>en</strong>ts pour consci<strong>en</strong>tiser<br />

les mécanismes du chant afin d’empêcher les automatismes <strong>de</strong> la <strong>voix</strong> parlée <strong>de</strong> pr<strong>en</strong>dre le <strong>de</strong>ssus<br />

dans la production <strong>de</strong> l’élève. Dans ce cadre, les auteurs p<strong>en</strong>s<strong>en</strong>t que l’observation <strong>de</strong> la <strong>voix</strong> à<br />

partir d’une analyse spectrale permet l’attitu<strong>de</strong> cognitive adéquate pour l’appr<strong>en</strong>tis<strong>sa</strong>ge du chant.<br />

(Verdolini & Krebs, 1999, p. 235)<br />

De même, lors <strong>de</strong> la <strong>rééducation</strong>, Françoise Esti<strong>en</strong>ne préconise parfois <strong>de</strong> <strong>de</strong>man<strong>de</strong>r au pati<strong>en</strong>t ce<br />

qu’il p<strong>en</strong>se <strong>de</strong> ce qu’il vi<strong>en</strong>t d’émettre. Par exemple : « on invite la personne à dire un /a/ sur le<br />

fondam<strong>en</strong>tal […] On interroge <strong>en</strong>suite la personne sur ce qu’elle p<strong>en</strong>se <strong>de</strong> ce ton là ».(Esti<strong>en</strong>ne,<br />

1998, p. 119) Il s’agit ici égalem<strong>en</strong>t <strong>de</strong> décortiquer au plus fin le geste vocal et son résultat.<br />

Cep<strong>en</strong>dant, pour Françoise Esti<strong>en</strong>ne, l’étape finale d’une <strong>rééducation</strong> reste <strong>de</strong> faire oublier le<br />

fonctionnem<strong>en</strong>t <strong>de</strong> la <strong>voix</strong> au pati<strong>en</strong>t : « une <strong>voix</strong> qui se fait ignorer est le meilleur garant <strong>de</strong> son bon<br />

fonctionnem<strong>en</strong>t et <strong>de</strong> <strong>sa</strong> bonne <strong>sa</strong>nté »(Esti<strong>en</strong>ne, 1998, p. 117)<br />

55 “real-time spectrum analysis provi<strong>de</strong>s a bridge betwe<strong>en</strong> theory and practice, allowing both aspects to gain”<br />

56 “the process of exploring these visually can also contribute to one’s awar<strong>en</strong>ess of the “feel” of the changes”<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 28


1.3.3.4 li<strong>en</strong> avec les feedbacks auditifs et proprioceptifs<br />

La fascination <strong>de</strong> pouvoir faire le li<strong>en</strong> <strong>en</strong>tre ce qu’on <strong>en</strong>t<strong>en</strong>d et l’information donnée par<br />

l’ordinateur fait partie <strong>de</strong>s réactions <strong>de</strong>s professeurs <strong>de</strong> chant lors <strong>de</strong> l’introduction du<br />

spectrogramme. (Nair, 1999, p. 17) Cep<strong>en</strong>dant selon Donald G. Miller, « l’obstacle le plus important<br />

pour introduire le feedback d’analyse spectrale dans la pratique <strong>de</strong>s cours <strong>de</strong> chant a été la difficulté<br />

<strong>de</strong> le relier avec la perception ordinaire » 57 .<br />

Lorsque ce li<strong>en</strong> n’est pas établi, « une utili<strong>sa</strong>tion trop systématique et inappropriée <strong>de</strong>s contrôles<br />

visuels […] peut induire « <strong>de</strong>s forçages ou une tonicité excessive » (Manteau, 2004, p. 66; Romand,<br />

1999), comme le note égalem<strong>en</strong>t Caroline Coudière dans les résultats <strong>de</strong> son <strong>en</strong>quête auprès<br />

d’orthophonistes. (Coudière, 2003, p. 134) « Le r<strong>en</strong>forcem<strong>en</strong>t <strong>de</strong>s perceptions kinesthésiques au<br />

moy<strong>en</strong> du feedback visuel est efficace pour 46% <strong>de</strong>s orthophonistes [interrogés], mais il est loin<br />

d’être évi<strong>de</strong>nt pour les autres. » (Coudière, 2003, p. 147). De même, M. Maulet constate « que les<br />

risques <strong>de</strong> forçage vocal ou d'interprétation erronée <strong>de</strong>s courbes <strong>de</strong>meur<strong>en</strong>t importants » (Maulet,<br />

1997, p. 86)<br />

Jean-Blaise Roch insiste particulièrem<strong>en</strong>t sur le retour kinesthésique du geste vocal, qui est pour lui<br />

la seule manière pour le pati<strong>en</strong>t d’être « aux manettes <strong>de</strong> comman<strong>de</strong>m<strong>en</strong>t ». Selon cet auteur, le<br />

retour auditif seul ne permet pas <strong>de</strong> changer le son émis, et seul le retour kinesthésique permet <strong>de</strong><br />

gui<strong>de</strong>r le son. (Roch, 2001, pp. 62–63)<br />

La mémoire implicite, qui joue un rôle important dans l’automati<strong>sa</strong>tion <strong>de</strong>s appr<strong>en</strong>tis<strong>sa</strong>ges, est très<br />

dép<strong>en</strong>dante <strong>de</strong> la modalité d’acquisition <strong>de</strong>s connais<strong>sa</strong>nces. « Les comportem<strong>en</strong>ts <strong>en</strong>trainés dans<br />

une modalité (visuelle) ne se transfèr<strong>en</strong>t pas néces<strong>sa</strong>irem<strong>en</strong>t complètem<strong>en</strong>t dans une modalité<br />

différ<strong>en</strong>te (auditive et kinesthésique par exemple) […] cep<strong>en</strong>dant nous reconnaissons que les<br />

habiletés moteur sont souv<strong>en</strong>t <strong>en</strong>seignées avec succès dans le domaine <strong>de</strong> la réhabilitation physique<br />

<strong>en</strong> utili<strong>sa</strong>nt <strong>de</strong>s biofeedback visuels et auditifs» 58 Il <strong>de</strong>vi<strong>en</strong>t donc très important, après un temps<br />

d’<strong>en</strong>traînem<strong>en</strong>t avec le feedback visuel, <strong>de</strong> r<strong>en</strong>forcer les acquisitions <strong>sa</strong>ns le feedback visuel<br />

(« withdrawal trials »). Les <strong>de</strong>ux types <strong>de</strong> feedback doiv<strong>en</strong>t s’alterner. (Verdolini & Krebs, 1999, pp.<br />

236–238)<br />

1.3.3.5 Nécessité <strong>de</strong> retirer progressivem<strong>en</strong>t le feedback<br />

Selon Robert A. Volin, le spectrogramme est utile dans la phase cognitive d’appr<strong>en</strong>tis<strong>sa</strong>ge d’un<br />

nouveau geste (Volin, 1999, p. 243). Il permet <strong>de</strong> r<strong>en</strong>dre visible <strong>de</strong>s comportem<strong>en</strong>ts et donc <strong>de</strong><br />

pouvoir agir <strong>de</strong>ssus 59 . Afin <strong>de</strong> ne pas utiliser constamm<strong>en</strong>t le feedback, il est facile <strong>de</strong> tourner<br />

l’écran pour retirer le feedback visuel. Après un certain nombre d’occurr<strong>en</strong>ces consécutives<br />

57<br />

“a more important obstacle to incorporating feedback from spectrum analysis into practical voice instruction has be<strong>en</strong> the<br />

difficulty in relating it to ordinary perception”<br />

58<br />

“behaviors trained in one modality (visual, for example) do not neces<strong>sa</strong>rily transfer completely to a differ<strong>en</strong>t modality<br />

(auditory-kinesthetic, for example). […] We do recongnize, however, that motor skills are oft<strong>en</strong> successfully taught in physical<br />

rehabilitation using visual and auditory biofeedback”<br />

Kreb & Behr 1994 [Biofeedback. In S.B. o’sullivan & T.J. Schmitz (Eds). PHysical rehabilitation : assesm<strong>en</strong>t and treatm<strong>en</strong>t<br />

procedures. New York : F.A. Davis]<br />

59<br />

Basmajian 1982 : Clinical use of biofeedback in rehabilitation. Psychosomatics, 23(1), 67-69 (in Volin, 1999, p. 243)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 29


correctes <strong>sa</strong>ns le feedback, on montre au sujet un <strong>en</strong>registrem<strong>en</strong>t <strong>de</strong> ses performances sur l’écran ;<br />

cela constitue le « post-trial knowledge of result » qui r<strong>en</strong>force la représ<strong>en</strong>tation interne du sujet et<br />

permet <strong>de</strong> l’appr<strong>en</strong>dre à long terme. Le feedback est retiré progressivem<strong>en</strong>t par le pratici<strong>en</strong> <strong>en</strong><br />

fonction <strong>de</strong> du <strong>de</strong>gré <strong>de</strong> réussite du sujet. (Volin, 1999, p. 244) Cela permet <strong>de</strong> pr<strong>en</strong>dre <strong>de</strong>s repères<br />

proprioceptifs et auditifs et <strong>de</strong> r<strong>en</strong>dre le geste automatique(Donald Gray Miller, 2008, p. 105; Nair,<br />

1999, p. 69).<br />

1.3.3.6 Objectivité / subjectivité<br />

Evaluation et confirmation <strong>de</strong> l’intérêt <strong>de</strong> la <strong>rééducation</strong><br />

Garyth Nair p<strong>en</strong>se que l’outil informatique objective l’efficacité <strong>de</strong> l’<strong>en</strong>seignem<strong>en</strong>t d’un professeur.<br />

(Nair, 1999, p. 20) En cela il est rejoint par Donald Miller et Harm K Schutte qui p<strong>en</strong>s<strong>en</strong>t que le<br />

feedback visuel objectif permet d’évaluer les affirmations <strong>de</strong>s professeurs <strong>de</strong> chant à propos <strong>de</strong> la<br />

technique <strong>vocale</strong>, qui, <strong>en</strong> temps normal, ne peuv<strong>en</strong>t pas être prouvées. (D. Miller & Schutte, 1999a,<br />

p. 210)<br />

« Le caractère objectif et indubitable <strong>de</strong>s résultats affichés sur l’écran permet aux orthophonistes<br />

d’avoir un moy<strong>en</strong> <strong>de</strong> convaincre <strong>de</strong> l’efficacité <strong>de</strong> tel geste, d’affirmer un progrès <strong>sa</strong>ns que le pati<strong>en</strong>t<br />

ne puisse remettre <strong>en</strong> cause son jugem<strong>en</strong>t. Cela permet aussi <strong>de</strong> conforter l’assurance<br />

professionnelle du thérapeute qui y trouve un justificatif à <strong>sa</strong> démarche et une preuve <strong>de</strong> son<br />

efficacité. » (Coudière, 2003, p. 155)<br />

Feedback verbal facilité<br />

Le spectrogramme peut être utilisé <strong>en</strong> temps réel p<strong>en</strong>dant la réali<strong>sa</strong>tion, mais égalem<strong>en</strong>t être<br />

observé après la réali<strong>sa</strong>tion, afin <strong>de</strong> discuter sur ses qualités <strong>de</strong> façon rétrospective. Ces différ<strong>en</strong>tes<br />

utili<strong>sa</strong>tions ont été observées lors <strong>de</strong> l’expéri<strong>en</strong>ce VOXed (David M Howard et al., 2007, p. 30b).<br />

« l’utili<strong>sa</strong>tion <strong>de</strong> la technologie multimedia permet <strong>de</strong> capturer chaque mom<strong>en</strong>t du comportem<strong>en</strong>t<br />

<strong>de</strong> l’élève et <strong>de</strong> le figer dans le temps. Cela facilite la possibilité <strong>de</strong> faire correspondre la<br />

compréh<strong>en</strong>sion <strong>de</strong> la cible d’un professeur […] et la compréh<strong>en</strong>sion personnelle d’un élève […] dans<br />

notre étu<strong>de</strong> […] le feedback technologique a fourni un c<strong>en</strong>tre d’att<strong>en</strong>tion externe commun et stable<br />

sur lequel baser les interactions» 60 (Welch et al., 2005, pp. 242–243)<br />

Selon Garyth Nair, la possibilité d’objectiver <strong>de</strong>s phénomènes acoustiques auparavant perçus<br />

subjectivem<strong>en</strong>t, permet aux professeurs <strong>de</strong> chant <strong>de</strong> communiquer plus facilem<strong>en</strong>t avec les<br />

collègues à ce sujet. Cela est selon lui effectivem<strong>en</strong>t ress<strong>en</strong>ti par les professeurs <strong>de</strong> chant lors <strong>de</strong><br />

l’introduction du spectrogramme (Nair, 1999, p. 17) « En signalant les preuves sur l’écran qui<br />

représ<strong>en</strong>t<strong>en</strong>t l’amélioration <strong>de</strong> la technique <strong>vocale</strong>, le professeur gagne un puis<strong>sa</strong>nt complém<strong>en</strong>t<br />

dans le processus <strong>de</strong> r<strong>en</strong>forcem<strong>en</strong>t positif <strong>de</strong>s améliorations continues » 61 . (Nair, 1999, p. 19) Pour<br />

cet auteur, les élèves ne perçoiv<strong>en</strong>t pas toujours ce que les professeurs veul<strong>en</strong>t leur faire <strong>en</strong>t<strong>en</strong>dre<br />

60 “the application of multimedia technology allows any particular mom<strong>en</strong>t of the stu<strong>de</strong>nt‘s singing behavior to be captured and<br />

‘froz<strong>en</strong>’ in time. This facilitates the possibility of a better relative match betwe<strong>en</strong> a teacher’s target un<strong>de</strong>rstanding […] and the<br />

personal un<strong>de</strong>rstanding of an individual stu<strong>de</strong>nt. […] In the pres<strong>en</strong>t study […] the feedback technology provi<strong>de</strong>d a stable<br />

external and shared focus on which to base [the] interactions of the participants”<br />

61 “by pointing out evi<strong>de</strong>nce on the monitor that repres<strong>en</strong>t improvem<strong>en</strong>ts in technique, the teacher gains a power ful adjunct in<br />

the process of positively reinforcing continued growth”<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 30


pour pouvoir le corriger. Le feedback objectif fourni par l’ordinateur permet <strong>de</strong> r<strong>en</strong>dre visible les<br />

subtilités du son, dont on ne peut plus p<strong>en</strong>ser qu’elles sont simplem<strong>en</strong>t imaginées par l’auditeur. Le<br />

fait <strong>de</strong> pouvoir les i<strong>de</strong>ntifier est un premier pas vers une explication <strong>de</strong> leur production par le geste<br />

vocal. (Nair, 1999, pp. 159, 161)<br />

Le fait <strong>de</strong> donner la possibilité d’échanger sur un support visuel ai<strong>de</strong> l’étudiant à mieux pr<strong>en</strong>dre<br />

consci<strong>en</strong>ce du feedback verbal <strong>de</strong> son professeur. (Welch et al., 2005, p. 243). Effectivem<strong>en</strong>t,<br />

l’étu<strong>de</strong> <strong>de</strong> Callaghan et ses collègues rapporte que les élèves « ont ress<strong>en</strong>ti que le feedback visuel a<br />

amélioré leur compréh<strong>en</strong>sion <strong>de</strong> la production désirée du modèle cible qu’ils étai<strong>en</strong>t am<strong>en</strong>és à<br />

imiter, puisque le feedback était immédiat et non équivoque » 62 (Hoppe et al., 2006, p. 312b).<br />

L’interprétation reste subjective<br />

Cep<strong>en</strong>dant la notion <strong>de</strong> qualité <strong>de</strong> <strong>voix</strong> est une notion complexe, et <strong>en</strong> ce s<strong>en</strong>s la validité <strong>de</strong> l’image<br />

spectrographique est à remettre <strong>en</strong> question. L’interprétation <strong>de</strong> l’image est très importante. Il<br />

n’existe pas aujourd’hui <strong>de</strong> technique permettant <strong>de</strong> faire une corrélation directe <strong>en</strong>tre l’image<br />

spectrographique et la position <strong>de</strong> la langue ou la vibration <strong>de</strong>s plis vocaux. (Verdolini & Krebs,<br />

1999, pp. 236–238)<br />

1.3.3.7 Conclusion<br />

Les auteurs décriv<strong>en</strong>t <strong>de</strong>s aspects ambival<strong>en</strong>ts <strong>de</strong> l’utili<strong>sa</strong>tion <strong>de</strong> l’outil spectrographique <strong>en</strong><br />

<strong>rééducation</strong> <strong>vocale</strong>. Il convi<strong>en</strong>t pour le thérapeute <strong>de</strong> trouver un juste équilibre afin <strong>de</strong> permettre<br />

aux pati<strong>en</strong>ts <strong>de</strong> se conc<strong>en</strong>trer <strong>sa</strong>ns arriver à une surcharge cognitive, <strong>de</strong> connaître à la fois les<br />

apports et les limites du temps réel, <strong>de</strong> tirer profit <strong>de</strong> l’analyse fine <strong>de</strong> la production <strong>vocale</strong> <strong>sa</strong>ns<br />

mettre <strong>en</strong> danger la spontanéité <strong>de</strong> la parole, <strong>de</strong> faire les li<strong>en</strong>s <strong>en</strong>tre les feedbacks auditifs et<br />

proprioceptives, <strong>de</strong> gérer la nécessité <strong>de</strong> se détacher <strong>de</strong> l’outil et les possibilités d’objectivation à<br />

partir d’une interprétation subjective.<br />

62 “the VFB improved their un<strong>de</strong>rstanding of the <strong>de</strong>sired outcome of the target mo<strong>de</strong>l that they were required to imitate, as the<br />

feedback was immediate and unambiguous”<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 31


2 Problématique<br />

Toute production <strong>vocale</strong> est contrôlée par un système d’auto-régulation nécessitant <strong>de</strong>s feedbacks<br />

internes comme externes (audition par voie aéri<strong>en</strong>ne), qu’il est parfois néces<strong>sa</strong>ire <strong>de</strong> r<strong>en</strong>forcer par<br />

<strong>de</strong>s feedbacks externes r<strong>en</strong>voyant une image <strong>de</strong> <strong>sa</strong> propre <strong>voix</strong> au pati<strong>en</strong>t.<br />

Le spectrogramme est un outil intéres<strong>sa</strong>nt pour voir la <strong>voix</strong>. Il <strong>en</strong> représ<strong>en</strong>te <strong>de</strong> nombreux<br />

paramètres, et notamm<strong>en</strong>t, le timbre et l’attaque. L’utili<strong>sa</strong>tion du spectrogramme <strong>en</strong> <strong>rééducation</strong><br />

<strong>vocale</strong> est décrite comme pouvant favoriser la prise <strong>de</strong> consci<strong>en</strong>ce <strong>de</strong>s paramètres <strong>de</strong> la <strong>voix</strong>, la<br />

motivation et l’autonomi<strong>sa</strong>tion du pati<strong>en</strong>t. Le spectrogramme reste cep<strong>en</strong>dant un outil qui ne<br />

remplace pas les approches classiques, et qui fournit un nombre d’informations importantes qu’il<br />

est important <strong>de</strong> <strong>sa</strong>voir déco<strong>de</strong>r. Il convi<strong>en</strong>t pour le thérapeute <strong>de</strong> trouver un juste équilibre dans<br />

l’utili<strong>sa</strong>tion <strong>de</strong> cet outil afin <strong>de</strong> permettre aux pati<strong>en</strong>ts et à la relation thérapeutique d’<strong>en</strong> tirer le<br />

meilleur profit.<br />

Les pati<strong>en</strong>ts dysphoniques ont souv<strong>en</strong>t une mauvaise image <strong>de</strong> leur <strong>voix</strong> et d’eux-même. La<br />

<strong>rééducation</strong> <strong>vocale</strong> compr<strong>en</strong>d à la fois une partie technique et une partie plus psychologique<br />

s’intéres<strong>sa</strong>nt notamm<strong>en</strong>t à restaurer l’image <strong>de</strong> soi du pati<strong>en</strong>t.<br />

Notre travail va s’attacher à étudier les conséqu<strong>en</strong>ces objectives et subjectives <strong>de</strong> l’utili<strong>sa</strong>tion du<br />

spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong>. Dans quelle mesure le spectrogramme permet aux pati<strong>en</strong>ts<br />

<strong>de</strong> modifier l’image <strong>de</strong> leur propre <strong>voix</strong> ?<br />

Le spectrogramme, utilisé <strong>en</strong> parallèle avec un feedback auditif (réécoute <strong>de</strong> <strong>sa</strong> propre <strong>voix</strong>)<br />

permet-il une meilleure prise <strong>de</strong> consci<strong>en</strong>ce <strong>de</strong> ses paramètres vocaux ? Dans ce cas, est-ce<br />

suffi<strong>sa</strong>nt pour améliorer égalem<strong>en</strong>t l’auto-contrôle <strong>de</strong> ces paramètres ? Comm<strong>en</strong>t le<br />

spectrogramme modifie la relation du pati<strong>en</strong>t à <strong>sa</strong> propre <strong>voix</strong> ? L’utili<strong>sa</strong>tion du spectrogramme a-til<br />

un impact bénéfique sur la relation thérapeutique ?<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 32


3 Hypothèse(s)<br />

L’utili<strong>sa</strong>tion du spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> revêt <strong>de</strong>ux aspects : l’utili<strong>sa</strong>tion <strong>en</strong> temps<br />

réel d’une part, et la réécoute d’extraits vocaux <strong>en</strong> visuali<strong>sa</strong>nt le spectrogramme. En li<strong>en</strong> avec un<br />

feedback auditif, le feedback visuel constitué par le spectrogramme permet :<br />

- une meilleure prise <strong>de</strong> consci<strong>en</strong>ce <strong>de</strong>s paramètres <strong>de</strong> la <strong>voix</strong> <strong>de</strong> la part du pati<strong>en</strong>t (int<strong>en</strong>sité,<br />

hauteur, richesse <strong>en</strong> harmonique…) (hypothèse 1)<br />

- un meilleur auto-contrôle <strong>de</strong> ses paramètres (hypothèse 2)<br />

- la construction par le pati<strong>en</strong>t d’une image positive <strong>de</strong> <strong>sa</strong> propre <strong>voix</strong> : (hypothèse 3)<br />

- un impact positif sur la relation thérapeutique (hypothèse 4)<br />

Pour chacune <strong>de</strong> ses hypothèses, on cherche égalem<strong>en</strong>t à préciser la part du feedback visuel<br />

(spectrogramme) et du feedback auditif (réécoute <strong>de</strong> <strong>sa</strong> <strong>voix</strong>).<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 33


4 Méthodologie<br />

4.1 Matériel<br />

4.1.1 Prés<strong>en</strong>tation générale<br />

Dans cette étu<strong>de</strong>, nous avons observé l’utili<strong>sa</strong>tion du spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> dans<br />

diverses situations :<br />

- En séance au cabinet <strong>de</strong> phoniatrie d’i<strong>sa</strong>belle Marié-Bailly au CHR d’Orléans.<br />

- En autonomie pour les pati<strong>en</strong>ts d’I<strong>sa</strong>belle Marié-Bailly qui avai<strong>en</strong>t téléchargé le logiciel et<br />

pour lesquels étai<strong>en</strong>t mis à disposition un site internet didacticiel<br />

- Au sein d’un protocole m<strong>en</strong>é pour quatre pati<strong>en</strong>tes où les séances étai<strong>en</strong>t conduites par<br />

Flor<strong>en</strong>ce Parm<strong>en</strong>tier<br />

En outre, un exercice d’auto-analyse a été conçu afin d’évaluer plus précisém<strong>en</strong>t les effets <strong>de</strong> la<br />

visuali<strong>sa</strong>tion du spectrogramme sur la prise <strong>de</strong> consci<strong>en</strong>ce par les pati<strong>en</strong>ts <strong>de</strong> différ<strong>en</strong>ts paramètres<br />

<strong>de</strong> leur <strong>voix</strong>. Cet exercice a été proposé aux pati<strong>en</strong>ts du protocole (groupe « pati<strong>en</strong>ts protocole ») et<br />

aux pati<strong>en</strong>ts d’I<strong>sa</strong>belle Marié-Bailly (« pati<strong>en</strong>ts hors protocole ») lors <strong>de</strong> leurs séances, <strong>en</strong> prés<strong>en</strong>ce<br />

<strong>de</strong> Flor<strong>en</strong>ce Parm<strong>en</strong>tier. On note qu’une pati<strong>en</strong>te du groupe « pati<strong>en</strong>ts hors protocole ») ne fai<strong>sa</strong>it<br />

pas partie <strong>de</strong>s pati<strong>en</strong>ts d’I<strong>sa</strong>belle Marié-Bailly et ses exercices ont été réalisés à son domicile.<br />

Le bilan vocal est analysé perceptivem<strong>en</strong>t par un jury d’écoute. Ce jury est égalem<strong>en</strong>t invité à<br />

refaire les exercices d’auto-analyse afin d’<strong>en</strong> constituer une évaluation perceptive. Les membres du<br />

jury d’écoute font le même exercice, sur les sons <strong>de</strong>s pati<strong>en</strong>ts, que chacun <strong>de</strong>s pati<strong>en</strong>ts ont fait sur<br />

leurs propres sons.<br />

4.1.2 Description <strong>de</strong>s populations<br />

4.1.2.1 Pati<strong>en</strong>ts protocole<br />

Généralités<br />

Dans un premier temps, ils ont été recherchés au sein <strong>de</strong>s pati<strong>en</strong>ts d’orthophonistes <strong>en</strong> libéral qui<br />

aurai<strong>en</strong>t accepté d’intégrer le protocole dans leur <strong>rééducation</strong>. Malgré <strong>de</strong>s contacts avec 7<br />

orthophonistes qui font régulièrem<strong>en</strong>t <strong>de</strong>s <strong>rééducation</strong>s <strong>vocale</strong>s, il n’a pas été possible <strong>de</strong> recruter<br />

<strong>de</strong>s pati<strong>en</strong>ts par ce biais, ni par l’intermédiaire d’un mes<strong>sa</strong>ge mis <strong>en</strong> évi<strong>de</strong>nce sur le forum<br />

orthomalin.<br />

Nous avons donc modifié le protocole pour recruter <strong>de</strong>s personnes <strong>en</strong> difficulté par rapport à leur<br />

<strong>voix</strong>, mais qui n’étai<strong>en</strong>t pas <strong>en</strong> <strong>rééducation</strong> orthophonique, et intéressées par un travail avec<br />

Flor<strong>en</strong>ce Parm<strong>en</strong>tier autour du spectrogramme. Ce recrutem<strong>en</strong>t induit un biais méthodologique<br />

important, et a conduit à une étu<strong>de</strong> <strong>de</strong> cas multiples. Toutes les pati<strong>en</strong>tes sont chanteuses. Elles<br />

répon<strong>de</strong>nt toutes « toujours » aux questions « la <strong>voix</strong> est un sujet qui m’intéresse » et « j’accor<strong>de</strong><br />

<strong>de</strong> l’importance à ma propre <strong>voix</strong> ».<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 34


La pati<strong>en</strong>te A<br />

A 55 ans, la pati<strong>en</strong>te A est professeur à temps partiel. Elle a diminué son activité pour <strong>de</strong>s raisons<br />

personnelles et notamm<strong>en</strong>t pour protéger <strong>sa</strong> <strong>voix</strong>. Sa <strong>voix</strong> <strong>de</strong>vi<strong>en</strong>t parfois un problème, 5% du<br />

temps sur une année. Elle n’est pas dans une pério<strong>de</strong> pathologique <strong>en</strong> ce mom<strong>en</strong>t, elle est mieux<br />

armée et plus vigilante. Elle travaille <strong>en</strong> parallèle une métho<strong>de</strong> respiratoire avec une orthophoniste.<br />

Elle a bénéficié précé<strong>de</strong>mm<strong>en</strong>t d’une <strong>rééducation</strong> orthophonique suite à <strong>de</strong>s nodules sur ses plis<br />

vocaux.<br />

La pati<strong>en</strong>te B<br />

A 30 ans, cette pati<strong>en</strong>te est professeur <strong>de</strong> chant, chanteuse <strong>de</strong> jazz et lyrique. Elle est très<br />

intéressée par la <strong>voix</strong> et les mécanismes <strong>de</strong> la phonation. Elle souffre d’une dysphonie spasmodique<br />

<strong>de</strong>puis 5 ans, dans le cadre d’un acci<strong>de</strong>nt <strong>de</strong> la voie publique qu’elle a subi il y a 7 ans, dont les<br />

traumatismes ont conduit à une opération du voile du palais. La dysphonie spasmodique s’<strong>en</strong>t<strong>en</strong>d<br />

beaucoup plus <strong>en</strong> <strong>voix</strong> parlée qu’<strong>en</strong> <strong>voix</strong> chantée, qui reste cep<strong>en</strong>dant fragile au niveau du pas<strong>sa</strong>ge<br />

<strong>de</strong> registre. Elle se soigne elle-même pour réussir à contrôler <strong>sa</strong> <strong>voix</strong>. Elle est sout<strong>en</strong>ue par un coach<br />

vocal et un ostéopathe certifié osteovox.<br />

La pati<strong>en</strong>te C<br />

A 31 ans, la pati<strong>en</strong>te C est journaliste <strong>de</strong> presse. Suite à un kyste intracordal et à <strong>de</strong>s nodules<br />

surajoutés à un sulcus, elle a subi une opération <strong>de</strong>s plis vocaux <strong>en</strong> juin 2007 suivis <strong>de</strong> 2 ans <strong>de</strong><br />

<strong>rééducation</strong>. Elle chante dans un chœur <strong>de</strong> chambre mais s’interdit les cours <strong>de</strong> chant du fait <strong>de</strong> son<br />

problème <strong>de</strong> <strong>voix</strong>.<br />

La pati<strong>en</strong>te D<br />

A 32 ans, la pati<strong>en</strong>te D a <strong>en</strong>tamé <strong>en</strong> septembre une reconversion vers les métiers du chant à<br />

l’American School. Elle est chanteuse <strong>de</strong> gospel. Très peu <strong>de</strong> temps après la r<strong>en</strong>trée, elle a souffert<br />

d’un coup <strong>de</strong> fouet laryngé. Elle n’a pas <strong>en</strong>trepris <strong>de</strong> <strong>rééducation</strong> orthophonique mais pr<strong>en</strong>d soin <strong>de</strong><br />

<strong>sa</strong> <strong>voix</strong> auprès d’un coach vocal.<br />

4.1.2.2 Pati<strong>en</strong>ts hors protocole<br />

Ce groupe compr<strong>en</strong>d initialem<strong>en</strong>t 6 hommes et 5 femmes. Les pati<strong>en</strong>ts hors protocole sont ceux qui<br />

fréqu<strong>en</strong>t<strong>en</strong>t le cabinet <strong>de</strong> phoniatrie d’I<strong>sa</strong>belle Marié-Bailly au CHR d’Orléans. Ils ont <strong>de</strong>s plaintes<br />

<strong>vocale</strong>s ou auditives. Les pathologies sont diverses : paralysie récur<strong>en</strong>tielle, dysphonie<br />

dysfonctionnelle, dy<strong>sa</strong>rthrie, hypophonie, hyperacousie, acouphènes, mue faussée, paralysie<br />

cérébrale. Une pati<strong>en</strong>te supplém<strong>en</strong>taire, souffrant d’un sulcus, a été incluses dans ce groupe : elle a<br />

eu <strong>de</strong>ux séances d’une heure avec Flor<strong>en</strong>ce Parm<strong>en</strong>tier. Le groupe compr<strong>en</strong>d donc finalem<strong>en</strong>t 6<br />

hommes et 6 femmes.<br />

4.1.2.3 Personnes répondant au questionnaire internet<br />

[[A ce jour]] 10 personnes ont répondu au questionnaire internet<br />

Toutes les pati<strong>en</strong>tes du protocole ont répondu au questionnaire internet, et 4 pati<strong>en</strong>ts hors<br />

protocole. Tous les pati<strong>en</strong>ts ont été invités à répondre au questionnaire internet, par <strong>de</strong>ux fois par<br />

mail.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 35


Le site internet ayant été prés<strong>en</strong>té égalem<strong>en</strong>t à <strong>de</strong>s ateliers vocaux organisés par I<strong>sa</strong>belle Marié-<br />

Bailly, leurs participants ont égalem<strong>en</strong>t été invité à répondre au questionnaire. Deux personnes<br />

l’ont fait, dont une étudiante <strong>en</strong> <strong>de</strong>uxième année d’orthophonie à Tours.<br />

4.1.2.4 Jury d’écoute<br />

Le jury d’écoute est constitué <strong>de</strong> 4 femmes, dont 2 juges expérim<strong>en</strong>tés (une phoniatre, une<br />

orthophoniste) et 2 orthophonistes plus débutantes. Ces 4 auditeurs étai<strong>en</strong>t préalablem<strong>en</strong>t formés<br />

à la lecture <strong>de</strong> spectrogramme.<br />

4.2 Métho<strong>de</strong><br />

4.2.1 Protocole<br />

4.2.1.1 Déroulem<strong>en</strong>t général<br />

Séance 1 Séance 2 Séance 3 Séance 4 Séance 5<br />

Bilan 1<br />

<strong>en</strong>treti<strong>en</strong> vocal<br />

er ex. SpectroSpectro-<br />

Bilan 2è<br />

gramme ex. gramme ex. vocal <strong>en</strong>treti<strong>en</strong><br />

A 20 nov 27 nov 8 jan 22 jan 5 fev<br />

B 3 <strong>de</strong>c 10 <strong>de</strong>c 17 <strong>de</strong>c 14 jan 4 fev<br />

C 27 <strong>de</strong>c 2 jan 3 jan 18 jan 21 jan 11 fev<br />

D 7 déc 4 jan 8 jan 22 jan 1 er fev<br />

Les r<strong>en</strong>contres ont eu lieu au domicile <strong>de</strong>s pati<strong>en</strong>ts selon leurs disponibilités. Pour la pati<strong>en</strong>te A<br />

cep<strong>en</strong>dant, les r<strong>en</strong>contres ont eu lieu le 20 et le 27 avec l’orthophoniste qui pr<strong>en</strong>ait <strong>en</strong> charge cette<br />

pati<strong>en</strong>te, par la suite Flor<strong>en</strong>ce Parm<strong>en</strong>tier a r<strong>en</strong>contré la pati<strong>en</strong>te à son domicile.<br />

1 er<br />

Les séances durai<strong>en</strong>t <strong>en</strong>viron une heure. Le découpage a été s<strong>en</strong>siblem<strong>en</strong>t différ<strong>en</strong>t pour la pati<strong>en</strong>te<br />

C, qui a fait 6 séances dont 2 plus courtes, pour <strong>de</strong>s raisons <strong>de</strong> disponibilité.<br />

4.2.1.2 Evaluation pré- et post- protocole<br />

L’évaluation pré- et post- protocole consiste <strong>en</strong> une évaluation subjective du handicap ress<strong>en</strong>ti, une<br />

évaluation objective et perceptive au travers d’un bilan vocal orthophonique. Il s’intéresse<br />

égalem<strong>en</strong>t, <strong>de</strong> façon moins classique, à la relation du pati<strong>en</strong>t à <strong>sa</strong> <strong>voix</strong>.<br />

Auto-évaluation du handicap ress<strong>en</strong>ti<br />

Les pati<strong>en</strong>tes ont répondu au VHI-10. Cette échelle a été élaborée par Ros<strong>en</strong> (Ros<strong>en</strong>, Lee, Osborne,<br />

Zullo, & Murry, 2004) à partir du VHI. Les auteurs ont <strong>de</strong>mandé à différ<strong>en</strong>ts spécialistes <strong>en</strong> <strong>voix</strong><br />

(phoniatres, orthophonistes, spécialistes <strong>en</strong> <strong>voix</strong> chantée) <strong>de</strong> relever les dix items qui leur<br />

parais<strong>sa</strong>i<strong>en</strong>t les plus pertin<strong>en</strong>ts. Leur étu<strong>de</strong> statistique ne montre pas <strong>de</strong> différ<strong>en</strong>ce significative<br />

<strong>en</strong>tre VHI et VHI-10. Le VHI-10 serait donc une bonne représ<strong>en</strong>tation du VHI (Morsomme &<br />

Esti<strong>en</strong>ne, 2006, p. 228)<br />

Après avoir testé <strong>de</strong>s pas<strong>sa</strong>tions du VHI au cabinet <strong>de</strong> phoniatrie d’I<strong>sa</strong>belle Marié-Bailly, nous avons<br />

préféré cette version au VHI complet car la pas<strong>sa</strong>tion <strong>en</strong> est plus rapi<strong>de</strong> (Giovanni & F<strong>en</strong>ollar, 2004,<br />

p. 60) et <strong>de</strong> ce fait moins pénible pour la personne lorsqu’elle touche du doigt son handicap.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 36<br />

2 ème<br />

3ème


Bilan vocal<br />

Après un <strong>en</strong>treti<strong>en</strong> anamestique (Esti<strong>en</strong>ne, 1998, p. 15), le bilan vocal compr<strong>en</strong>d divers<br />

<strong>en</strong>registrem<strong>en</strong>ts qui sont l’occasion d’observer le comportem<strong>en</strong>t vocal du pati<strong>en</strong>t (conduite<br />

respiratoire, posture, zones <strong>de</strong> t<strong>en</strong>sion) (Amy <strong>de</strong> la Bretèque, 2012, p. 137; Esti<strong>en</strong>ne & Piérart,<br />

2006, p. 238; Esti<strong>en</strong>ne, 1998, p. 90; Woi<strong>sa</strong>rd, 2004, p. 205).<br />

Les extraits vocaux <strong>de</strong>mandés sont les suivants :<br />

- un extrait d’un texte lu. Nous avons choisi la phrase « c’est une affaire intéres<strong>sa</strong>nte, qu’<strong>en</strong><br />

p<strong>en</strong>sez-vous, il faut la faire <strong>sa</strong>ns aucun délai », selon les recommandations <strong>de</strong> la Société<br />

Europé<strong>en</strong>ne <strong>de</strong> Laryngologie <strong>de</strong>mandant l’<strong>en</strong>registrem<strong>en</strong>t d’une phrase simple (Dejonckere<br />

et al., 2001, p. 78)<br />

- la <strong>voix</strong> d’appel<br />

- une sirène asc<strong>en</strong>dante<br />

- la réali<strong>sa</strong>tion <strong>de</strong> 3 attaques différ<strong>en</strong>tes : soufflée / équilibrée / dure<br />

- une dynamique d’int<strong>en</strong>sité (on <strong>de</strong>man<strong>de</strong> un son le moins fort possible puis le plus fort<br />

possible)<br />

- le Temps Maximum <strong>de</strong> Phonation (TMP) sur « a » et le rapport <strong>de</strong>s TMP z/s<br />

L’analyse perceptive reste la référ<strong>en</strong>ce dans un bilan vocal, notamm<strong>en</strong>t car la parole est produite<br />

pour être perçue et que cette approche est accessible à tout clinici<strong>en</strong> à un faible coût. (Ghio, 2012,<br />

p. 70) Les extraits « <strong>voix</strong> parlée », « <strong>voix</strong> d’appel » et « sirènes » ont permis la cotation du GRBASI<br />

par le jury d’écoute.<br />

L’échelle <strong>de</strong> classe <strong>en</strong> 4 points d’Hirano reste le « meilleur compromis méthodologique pour la<br />

communication <strong>de</strong>s informations concernant un pati<strong>en</strong>t » (Joana Revis, Galant,, & Minghelli, 2012,<br />

p. 62). Nous avons voulu ét<strong>en</strong>dre cette échelle <strong>en</strong> 7 niveaux (0 / 0,5 / 1 / 1,5 / 2 / 2,5 / 3)<br />

notamm<strong>en</strong>t pour augm<strong>en</strong>ter la précision <strong>de</strong> l’évaluation <strong>de</strong>s dysphonies légères<br />

Terme Signification Définition<br />

G Gra<strong>de</strong><br />

Gra<strong>de</strong> global<br />

<strong>de</strong> dysphonie<br />

R Rough Raucité<br />

B Breathy<br />

Caractère<br />

soufflé<br />

A Asth<strong>en</strong>ic Asthénie<br />

S Strained Forçage<br />

Impression globale du <strong>de</strong>gré d’anormalité <strong>de</strong> la <strong>voix</strong><br />

Impression d’irrégularité <strong>de</strong>s vibrations <strong>de</strong> la cor<strong>de</strong> <strong>vocale</strong> qui<br />

correspond aux fluctuations irrégulières <strong>de</strong> la F0 et/ou à l’amplitu<strong>de</strong><br />

du son glottique<br />

Impression d’une fuite d’air assez importante à travers les cor<strong>de</strong>s<br />

<strong>vocale</strong>s, relative à <strong>de</strong>s turbul<strong>en</strong>ces<br />

Manque <strong>de</strong> puis<strong>sa</strong>nce <strong>de</strong> la <strong>voix</strong> relatif à une int<strong>en</strong>sité faible du son<br />

et/ou un manque <strong>de</strong>s harmoniques élevés<br />

Impression d’un état hyperfonctionnel <strong>de</strong> phonation relatif à une F0<br />

anormalem<strong>en</strong>t haute (bruit dans les hautes fréqu<strong>en</strong>ces et/ou richesse<br />

<strong>en</strong> harmoniques dans les hautes fréqu<strong>en</strong>ces)<br />

(Joana Revis et al., 2012, p. 59)<br />

Les extraits « <strong>voix</strong> parlée » « <strong>voix</strong> d’appel », « sirènes » et « 3 attaques » ont fait l’objet d’une<br />

comparaison avant / après à l’aveugle dont l’objectif était <strong>de</strong> déterminer si la <strong>voix</strong> avait été modifiée<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 37


p<strong>en</strong>dant les séances du protocole. (feuilles <strong>de</strong> cotation <strong>en</strong> annexe). Les auditeurs du jury d’écoute<br />

ont eu accès aux <strong>en</strong>registrem<strong>en</strong>ts <strong>en</strong> .wav sur un site internet dédié. Les écoutes sont faites avec un<br />

casque fermé S<strong>en</strong>nheiser HD200.<br />

L’évaluation objective est réalisée grâce aux logiciels Praat (shimmer, jitter, NHR) sur l’extrait<br />

« attaque équilibrée » <strong>de</strong>s trois attaques <strong>de</strong>mandées, Audacity (mesure <strong>de</strong>s Temps Maximum <strong>de</strong><br />

Phonation) et VoceVista (mesure <strong>de</strong> l’ét<strong>en</strong>due <strong>vocale</strong>).<br />

Court questionnaire sur la relation à <strong>sa</strong> <strong>voix</strong><br />

Les sept questions sont inspirées <strong>de</strong> questionnaire <strong>de</strong> la bibliographie (Borel, 2002; Gillie, n.d.) et<br />

ont été quelque peu modifiées suite aux pré-tests effectués au cabinet <strong>de</strong> phoniatrie d’I<strong>sa</strong>belle<br />

Marié-Bailly afin d’éviter <strong>de</strong>s mal<strong>en</strong>t<strong>en</strong>dus. (par exemple « ma <strong>voix</strong> correspond à ce que je suis » est<br />

<strong>de</strong>v<strong>en</strong>u « ma <strong>voix</strong> correspond à ce que je suis aujourd’hui »).<br />

Entreti<strong>en</strong> semi-dirigé<br />

Pour Françoise Esti<strong>en</strong>ne, l’exam<strong>en</strong> orthophonique compr<strong>en</strong>d un ver<strong>sa</strong>nt s’intéres<strong>sa</strong>nt à « la <strong>voix</strong><br />

ress<strong>en</strong>tie du <strong>de</strong>dans ». Il a notamm<strong>en</strong>t pour objectif <strong>de</strong> « relever le système <strong>de</strong> valeurs <strong>de</strong> la<br />

personne <strong>en</strong> matière <strong>de</strong> <strong>voix</strong> <strong>en</strong> lui propo<strong>sa</strong>nt <strong>de</strong>s moy<strong>en</strong>s <strong>de</strong> préciser ses critères <strong>de</strong> référ<strong>en</strong>ce, <strong>sa</strong><br />

représ<strong>en</strong>tation <strong>de</strong> la <strong>voix</strong>, <strong>en</strong> évaluant ses ressources et ses lacunes ; vérifier ses connais<strong>sa</strong>nces au<br />

sujet <strong>de</strong> la <strong>voix</strong> […] préciser ce que la personne veut obt<strong>en</strong>ir et ce qu’elle croit <strong>de</strong>voir faire pour<br />

résoudre son problème vocal ». (Esti<strong>en</strong>ne, 1998, p. 14)<br />

Les questions <strong>de</strong> l’<strong>en</strong>treti<strong>en</strong> semi-dirigé ont été inspirées par différ<strong>en</strong>ts questionnaires s’intéres<strong>sa</strong>nt<br />

au ress<strong>en</strong>ti du pati<strong>en</strong>t par rapport à <strong>sa</strong> <strong>voix</strong> et à la prise <strong>de</strong> consci<strong>en</strong>ce (Aima<strong>de</strong>ddine & Kerlan, 2003;<br />

Cotelle, 1993; Coudière, 2003; Esti<strong>en</strong>ne, 1998; Rousseaux, 1989; van Leer & Connor, 2010). Elles ont<br />

été modifiées suites aux pré-tests au cabinet <strong>de</strong> phoniatrie d’I<strong>sa</strong>belle Marié-Bailly afin <strong>de</strong> clarifier les<br />

questions et l’adapter à un <strong>en</strong>treti<strong>en</strong> oral. Il a <strong>en</strong>suite égalem<strong>en</strong>t été réadapté lorsque le protocole<br />

s’est rec<strong>en</strong>tré sur <strong>de</strong>s pati<strong>en</strong>ts inclus dans l’étu<strong>de</strong> indép<strong>en</strong>damm<strong>en</strong>t d’un suivi orthophonique ou<br />

phoniatrique. (voir <strong>en</strong> annexe)<br />

Qualification <strong>de</strong> <strong>sa</strong> propre <strong>voix</strong> telle qu’elle est et telle qu’on voudrait qu’elle soit<br />

La liste d’adjectifs sur la <strong>voix</strong> est citée dans la thèse <strong>de</strong> Claire Gillie (Gillie, n.d.) comme donnée dans<br />

le Gui<strong>de</strong> <strong>de</strong> la Voix d’Ormezzano. (voir <strong>en</strong> annexe)<br />

4.2.1.3 Utili<strong>sa</strong>tion du spectrogramme<br />

La découverte du spectrogramme se fait à partir <strong>de</strong> sons t<strong>en</strong>us (ceux <strong>de</strong> l’exercice d’auto-analyse<br />

qui se déroule au début <strong>de</strong> la séance n°2). Ces sons simples permett<strong>en</strong>t d’introduire les différ<strong>en</strong>ts<br />

paramètres affichés : l’int<strong>en</strong>sité, les harmoniques, les attaques.<br />

Par la suite le spectrogramme est toujours affiché et reti<strong>en</strong>t l’att<strong>en</strong>tion du thérapeute et du pati<strong>en</strong>t.<br />

Nous suivons un programme <strong>de</strong> découverte du spectrogramme plutôt qu’un programme<br />

thérapeutique.<br />

Les questions posées autour du spectrogramme sont proches <strong>de</strong> celle que rapporte Garyth Nair<br />

pour les professeurs <strong>de</strong> chant : « est-ce que je peux refaire cette image avec ma propre <strong>voix</strong> ?<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 38


Qu’est-ce que je peux dire à mon élève pour faire que l’image et donc le son soi<strong>en</strong>t<br />

meilleur ? » (Nair, 1999, p. 19) On s’efforce donc d’être à la fois att<strong>en</strong>tif au spectrogramme et au<br />

comportem<strong>en</strong>t vocal du pati<strong>en</strong>t.<br />

4.2.1.4 Exercices proposés<br />

Ces exercices ont pour objectif la réduction du forçage et l’amélioration <strong>de</strong> la <strong>voix</strong>, mais égalem<strong>en</strong>t<br />

la prise <strong>de</strong> consci<strong>en</strong>ce <strong>de</strong>s différ<strong>en</strong>ts paramètres <strong>de</strong> la <strong>voix</strong>, et leur visuali<strong>sa</strong>tion sur le<br />

spectrogramme.<br />

Nous avons choisi <strong>de</strong> privilégier les exercices ayant pour matériel <strong>de</strong>s phonèmes t<strong>en</strong>us (recto tono).<br />

En effet, ces exercices sont souv<strong>en</strong>t utilisés <strong>en</strong> <strong>rééducation</strong>, et <strong>de</strong> plus ils permett<strong>en</strong>t plus<br />

facilem<strong>en</strong>t qu’un matériel plus complexe (parole continue par exemple) d’appr<strong>en</strong>dre à observer sur<br />

le spectrogramme les paramètres étudiés : attaque et timbre. De plus, « L’affichage<br />

spectrographique est plus intéres<strong>sa</strong>nt avec <strong>de</strong>s sons continus, comme les voyelles, les fricatives, et<br />

les semi-voyelles. Ces sons s’ét<strong>en</strong><strong>de</strong>nt sur une durée considérable, ils sont donc facilem<strong>en</strong>t<br />

représ<strong>en</strong>té sur un écran et accessible pour un monitoring et un ajustem<strong>en</strong>t <strong>en</strong> temps réel » 63 (Volin,<br />

1999, p. 246)<br />

Certains <strong>de</strong> ces exercices sont cités dans la littérature pour leur intérêt spécifique que l’outil<br />

spectrographique leur apporte : alternance « s/ch », observation du spectre pour l’i<strong>de</strong>ntité <strong>de</strong> la<br />

voyelle (Nair, 1999, pp. 90, 100), ajustem<strong>en</strong>t du conduit vocal pour explorer les modifications <strong>de</strong>s<br />

formants (D. Miller & Schutte, 1999b, p. 209), distinction <strong>en</strong>tre consonnes voisées et non voisées,<br />

distinction <strong>en</strong>tre les consonnes fricatives selon leur point d’articulation (par exemple f/s/[[ch]] grâce<br />

aux différ<strong>en</strong>tes ban<strong>de</strong>s d’énergie mises <strong>en</strong> jeu dans le bruit <strong>en</strong>t<strong>en</strong>du et affiché sur l’écran. (Volin,<br />

1999, pp. 246–250), lecture <strong>de</strong>s formants à partir du fry (Donald G. Miller & Schutte, 1990, p. 330a)<br />

(D. Miller & Schutte, 1999a, p. 194; Donald G. Miller & Schutte, 1990, p. 330a; Donald Gray Miller,<br />

2008, p. 23). On propose égalem<strong>en</strong>t <strong>de</strong>s exercices plus spécifiques à la <strong>voix</strong> chantée, où le<br />

spectrogramme est indisp<strong>en</strong><strong>sa</strong>ble, comme l’adaptation phono-résonantielle (Heinrich, 2012, p. 27;<br />

Donald Gray Miller, 2008, pp. 96–105) et la visuali<strong>sa</strong>tion <strong>de</strong> l’impact du geste vocal sur le singing<br />

formant et la richesse harmonique (D. M. Howard et al., 2004, p. 140).<br />

D’autres pr<strong>en</strong>n<strong>en</strong>t leur source dans <strong>de</strong>s exercices classiques <strong>de</strong> <strong>rééducation</strong> orthophonique :<br />

coordination pneumophonique par la « sonori<strong>sa</strong>tion continue <strong>de</strong> consonnes fricatives », ou<br />

l’expiration flui<strong>de</strong> sonorisée dans une paille (Amy <strong>de</strong> la Bretèque, 2004; Joana Revis & Cayreyre,<br />

2004, p. 101; Sarfati, 1998, pp. 63–64), les exercices mettant <strong>en</strong> jeu le fry : « qui consiste à utiliser<br />

une pression sous-glottique minimale pour permettre un relâchem<strong>en</strong>t <strong>de</strong>s cor<strong>de</strong>s <strong>vocale</strong>s » (Esti<strong>en</strong>ne<br />

& Morsomme, 2009, p. 261), les différ<strong>en</strong>tes résonnances <strong>de</strong> la <strong>voix</strong> (Esti<strong>en</strong>ne, 1998, p. 119; Joana<br />

Revis & Cayreyre, 2004, p. 102), l’alternance <strong>de</strong> voyelles orales et na<strong>sa</strong>les (Esti<strong>en</strong>ne, 1998, p. 122),<br />

les transitions voyelliques s’inspirant du triangle vocalique (Esti<strong>en</strong>ne, 1998, p. 154; Fournier &<br />

Dupessey, 2001, p. 240; Klein-Dallant, 2001, p. 123).<br />

63 “spectrographic displays are most helpful with continuant sounds, such as vowels, fircatives, and gli<strong>de</strong>s. Because these sounds<br />

ext<strong>en</strong>d over a consi<strong>de</strong>rable duration, they are readily repres<strong>en</strong>ted on a scre<strong>en</strong> and are accessible for on-line monitoring and<br />

adjustm<strong>en</strong>t based on RTF”<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 39


La plupart <strong>de</strong>s exercices se bas<strong>en</strong>t sur la <strong>voix</strong> chantée. En effet, « l’<strong>en</strong>traînem<strong>en</strong>t vocal incluant<br />

systématiquem<strong>en</strong>t un travail <strong>en</strong> <strong>voix</strong> chantée est intéres<strong>sa</strong>nt, à plusieurs titres, <strong>en</strong> <strong>rééducation</strong><br />

comme <strong>en</strong> éducation :<br />

- à partir du même outil que pour la <strong>voix</strong> parlée, la <strong>voix</strong> chantée permet d’élargir les<br />

possibilités <strong>de</strong> la <strong>voix</strong> et l’image m<strong>en</strong>tale <strong>de</strong> celle-ci le champ vocal plus large et plus modulé<br />

favorise, <strong>en</strong> outre, le travail fin <strong>de</strong> la boucle audio-phonatoire ;<br />

- la découverte, la reproduction, l’<strong>en</strong>traînem<strong>en</strong>t, l’automati<strong>sa</strong>tion d’un nouveau geste sont<br />

plus faciles <strong>en</strong> <strong>voix</strong> chantée, car moins conditionnés par les habitu<strong>de</strong>s quotidi<strong>en</strong>nes ;<br />

- la <strong>voix</strong> chantée offre la possibilité <strong>de</strong> travailler précisém<strong>en</strong>t su <strong>de</strong>s difficultés particulières<br />

comme la pose du son, le vibrato…<br />

- pour le comédi<strong>en</strong>, <strong>en</strong>fin, […], c’est une opportunité d’adopter un « solfège » transpo<strong>sa</strong>ble à<br />

son support parlé, <strong>en</strong> <strong>de</strong>hors <strong>de</strong> la caractéri<strong>sa</strong>tion <strong>de</strong>s personnages qu’il interprète et <strong>de</strong>s<br />

techniques propres à cette maîtrise du jeu théâtral ».(Fournier & Dupessey, 2001, p. 244)<br />

Comme Volin le précise : «au fur et à mesure que le thérapeute se familiarise avec le programme <strong>en</strong><br />

l’utili<strong>sa</strong>nt <strong>en</strong> séance, la créativité spontanée qui est une part du processus thérapeutique fera<br />

immanquablem<strong>en</strong>t émerger d’autres métho<strong>de</strong>s et d’autres applications » 64 (Volin, 1999, p. 256)<br />

« On évite ainsi que le pati<strong>en</strong>t se considère comme fondam<strong>en</strong>talem<strong>en</strong>t maladroit ou incompét<strong>en</strong>t<br />

pour r<strong>en</strong>trer dans le rôle d’un sujet actif, voire créatif, vivant <strong>de</strong>s situations <strong>de</strong> découverte ». (Amy <strong>de</strong><br />

la Bretèque, 2012, p. 147).<br />

La découverte <strong>de</strong> l’outil spectrogramme est adaptée à chacun selon <strong>sa</strong> curiosité et son niveau <strong>de</strong><br />

connais<strong>sa</strong>nce et ne suit pas un protocole préétabli. (Zon<strong>de</strong>r, 2002, p. 38)<br />

Les exercices proposés étai<strong>en</strong>t différ<strong>en</strong>ciés suivant les pati<strong>en</strong>ts et proposés au fil <strong>de</strong>s séances selon<br />

les besoins et les découvertes du pati<strong>en</strong>t. Le tableau suivant reporte tous les types d’exercices pour<br />

lesquels <strong>de</strong>s <strong>en</strong>registrem<strong>en</strong>ts ont été faits [[pour avoir ce qui a été réellem<strong>en</strong>t fait il faut tout<br />

réécouter, ce que je n’ai pas <strong>en</strong>core fait, mais là clairem<strong>en</strong>t il y <strong>en</strong> manque]]. On note que la séance<br />

4 est <strong>en</strong>tièrem<strong>en</strong>t con<strong>sa</strong>cré au jeu avec le spectrogramme, tandis que les séances 2 et 3<br />

compr<strong>en</strong>n<strong>en</strong>t égalem<strong>en</strong>t l’exercice d’auto-évaluation, qui pr<strong>en</strong>d <strong>en</strong> moy<strong>en</strong>ne 20 minutes.<br />

Pole<br />

attaque<br />

et clarté<br />

du<br />

timbre<br />

consonnes<br />

voisées<br />

ch j, f v, s z<br />

ch j ou, f v o/u, s z i<br />

m n gn a<br />

s2,s3<br />

s3<br />

s2<br />

s2,s3<br />

s2<br />

s2<br />

s4<br />

s2,s3<br />

s2<br />

x<br />

x<br />

paille gouttes <strong>de</strong> son, ..<br />

x<br />

consonnes non<br />

voisées<br />

f s ch<br />

ch ch ch<br />

fi fa fé fu, pa pé, ti té ta, ka ké<br />

s3<br />

S4<br />

(s2)<br />

s2<br />

s2<br />

S3 x<br />

64 “As the clinician becomes familiar with the program by using it in therapy, other methods and other applications will<br />

undoubtedly spring from the natural creativity that is part of the therapeutic process”<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 40<br />

Pati<strong>en</strong>te A<br />

Pati<strong>en</strong>te B<br />

Pati<strong>en</strong>te C<br />

Pati<strong>en</strong>te D<br />

site internet


Pole<br />

richesse<br />

harmoni<br />

que<br />

attaques<br />

fry<br />

ki…<br />

s-i s-u, chi-i, ch-u<br />

s2 s2, s3 x<br />

Dure/ équilibré/soufflé S2,s3 S2 ? S2 ? s2,s3 x<br />

attaques piquées<br />

s3<br />

fry a s3 s3 s3, s4 s2,s3 x<br />

pouff d'air s3 S3<br />

(x)<br />

fry a o i, a o ou, i é a…<br />

a chuchoté / voisé<br />

s2 s4 S3, s4 x<br />

s3 s3<br />

sirène Sur une voyelle, j, bree ou paille s2 S2 , s3 s2 x<br />

Transitions voyelliques s4 S4 S4 S3, s4 x<br />

voyelles Transitions na<strong>sa</strong>les / orales<br />

s4 s4 S4 x<br />

Formant du chanteur<br />

s4<br />

Voix chanté<br />

Vibrato, serrage…<br />

extrait chanté s4 s4<br />

s3<br />

s4<br />

S4<br />

s4<br />

4.2.1.5 Ress<strong>en</strong>ti face au spectrogramme<br />

Les comm<strong>en</strong>taires autour du spectrogramme sont recueillis :<br />

- lors du jeu <strong>de</strong> découverte du spectrogramme et <strong>de</strong>s exercices d’auto-analyse avec les<br />

pati<strong>en</strong>ts protocole et les pati<strong>en</strong>ts hors protocole [[<strong>sa</strong>uf que j’ai très peu dépouillé ça]]<br />

- par <strong>de</strong>s comm<strong>en</strong>taires écrits spontanés <strong>de</strong> <strong>de</strong>ux pati<strong>en</strong>ts hors protocole (pati<strong>en</strong>ts-pilote)<br />

- par l’<strong>en</strong>treti<strong>en</strong> post-traitem<strong>en</strong>t pour les pati<strong>en</strong>ts protocole, inspiré <strong>de</strong> l’étu<strong>de</strong> <strong>de</strong> Callaghan<br />

et ses collègues 65 (in Hoppe et al., 2006, p. 312a) (voir <strong>en</strong> annexe)<br />

- par le questionnaire internet qui a été proposé à tous (pati<strong>en</strong>ts protocole / hors protocole et<br />

personnes utili<strong>sa</strong>nt le spectrogramme <strong>en</strong> autonomie) (détaillé plus loin)<br />

Ils sont <strong>en</strong>suite dépouillés méthodiquem<strong>en</strong>t <strong>de</strong> façon à faire ressortir <strong>de</strong>s thématiques communes<br />

aux différ<strong>en</strong>ts comm<strong>en</strong>taires.<br />

4.2.2 Pati<strong>en</strong>ts <strong>en</strong> autonomie<br />

4.2.2.1 Site internet http://flor<strong>en</strong>ce.parm<strong>en</strong>tier.free.fr/acoustique/spectrogramme/<br />

Les exemples ont été construits à partir d’extraits vocaux personnels, <strong>de</strong>s extraits vocaux (Foisneau,<br />

Rie<strong>de</strong>l, Chevalier, & Decorte, 2003), <strong>de</strong>s extraits vocaux <strong>de</strong> Garyth Nair, <strong>de</strong>s synthèses <strong>de</strong> sons par<br />

John Pierce (Pierce, 1984).<br />

Chaque exemple montre l’image du spectrogramme, le plus souv<strong>en</strong>t <strong>de</strong> 0 à 4 kHz (jusqu’à 8kHz pour<br />

certains exercices le nécessitant). Lorsqu’on clique sur cette image, le son correspondant (<strong>en</strong> mp3)<br />

est <strong>en</strong>t<strong>en</strong>du et un curseur suit l’affichage du son sur le spectrogramme. Dans certains cas <strong>de</strong>s<br />

comm<strong>en</strong>taires s’affich<strong>en</strong>t sur l’image spectrographique à la fin <strong>de</strong> l’animation.<br />

65 Callaghan J., Thorpe W. & Van Doorn J. (2004) The sci<strong>en</strong>ce of singing and seeing. Proceedings of the Confer<strong>en</strong>ce on<br />

Interdisciplinary Musicology (CIM04), Graz, Australia, April 15–18.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 41


Cartographie du site :<br />

téléchargem<strong>en</strong>t et mo<strong>de</strong> d’emploi du logiciel vocevista.<br />

lecture <strong>de</strong><br />

spectrogramme<br />

Idées d’exercice<br />

(les exercices<br />

sont décrits et<br />

<strong>de</strong>s conseils<br />

sont donnés<br />

succincte-m<strong>en</strong>t)<br />

Attaque<br />

(début <strong>de</strong> son)<br />

Timbre<br />

curiosités<br />

Int<strong>en</strong>sité,<br />

hauteur<br />

Attaque<br />

(début <strong>de</strong> son)<br />

Timbre<br />

(richesse<br />

harmonique)<br />

Exemple <strong>de</strong> 3 attaques<br />

+ explications physiologiques sur le début du son et son li<strong>en</strong> avec<br />

les pathologies <strong>vocale</strong>s<br />

timbre <strong>de</strong> <strong>voix</strong> chanté, clair avec vibrato<br />

Timbre soufflé<br />

Timbre éraillé, irrégulier<br />

Son pur<br />

Construction d’une <strong>voix</strong> chantée harmonique par harmonique<br />

Différ<strong>en</strong>tes voyelles synthétisées (formant voyellique)<br />

Comparaison son pur du fondam<strong>en</strong>tal / son pur accompagné <strong>de</strong><br />

ses harmoniques<br />

Comparaison partiels multiples ou non <strong>de</strong> la fondam<strong>en</strong>tale<br />

Une cloche<br />

Synthèses <strong>de</strong> sons musicaux<br />

Li<strong>en</strong> <strong>en</strong>tre harmoniques et int<strong>en</strong>sité (volume)<br />

Les sirènes =<br />

modification <strong>de</strong> la<br />

hauteur<br />

Alternance fricative<br />

sour<strong>de</strong> / sonore<br />

Constrictive gui<strong>de</strong><br />

Son dans la paille<br />

« j »<br />

« a »<br />

« s / z »<br />

Son dans la paille<br />

« ch / j »<br />

« Ch j ou »<br />

« s z i »<br />

Reproduire 3 attaques<br />

Pouff d’air, Fry sur a puis a voisé<br />

Fry alterné avec son voisé Homme<br />

Femme<br />

Château <strong>de</strong>s voyelles« o u L<strong>en</strong>t et grave<br />

i u o »<br />

Rapi<strong>de</strong>, un peu plus aigu<br />

Att<strong>en</strong>tion aux<br />

« s / ch »<br />

compo<strong>sa</strong>ntes aigues dans<br />

les consonnes<br />

« ch-i » « ch-ou »<br />

Enrichissem<strong>en</strong>t <strong>de</strong>s harmoniques<br />

Alternance voyelles<br />

orales / na<strong>sa</strong>les<br />

« a /an »<br />

« o /on »<br />

« è / in »<br />

« A é i é a » (femme)<br />

Mise <strong>en</strong> évi<strong>de</strong>nce <strong>de</strong>s<br />

formants <strong>en</strong> fry<br />

« a/o » Homme / femme<br />

Banque <strong>de</strong> son<br />

Femme /<br />

homme<br />

Sévérité <strong>de</strong> la dysphonie<br />

Richesse <strong>en</strong> harmonique<br />

Timbre clair / altéré / très altéré<br />

Timbre riche / pauvre / très pauvre<br />

Le site internet a été proposé aux pati<strong>en</strong>tes du protocole à la fin <strong>de</strong> la séance 4, et à tous les<br />

pati<strong>en</strong>ts hors protocole. En outre il est accessible <strong>de</strong>puis les moteurs <strong>de</strong> recherche (d’après les<br />

statistiques PhpMyVisites <strong>de</strong> free, <strong>en</strong>tre le 6 février et le 10 avril, 10 visiteurs ont trouvé le site suite<br />

à une recherche sur Google, sur les 161 visites du site)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 42


4.2.2.2 Questionnaire internet<br />

Le questionnaire (<strong>en</strong> annexe) a été construit selon les recommandations <strong>de</strong> construction <strong>de</strong><br />

questionnaire (Py, 2010, p. 36; Singly, 2008, pp. 64–84), afin d’éviter les doubles questions, être<br />

att<strong>en</strong>tif aux connotations subjectives <strong>de</strong>s qualificatifs employés, d’établir un équilibre <strong>en</strong>tre les<br />

modalités positives et les modalités négatives, ne pas utiliser <strong>de</strong> négation, etc.<br />

Il repr<strong>en</strong>d certaines idées du questionnaire sur les outils informatiques du mémoire <strong>de</strong> Caroline<br />

Coudière (Coudière, 2003) ; il a été guidé par les <strong>en</strong>treti<strong>en</strong>s <strong>de</strong> fin <strong>de</strong> protocole. Les questions sont<br />

parfois redondantes afin <strong>de</strong> juger <strong>de</strong> la cohér<strong>en</strong>ce <strong>de</strong>s réponses. Il favorise l’expression personnelle<br />

notamm<strong>en</strong>t par la possibilité <strong>de</strong> s’exprimer librem<strong>en</strong>t après chaque groupe <strong>de</strong> questions. Il propose<br />

<strong>de</strong>s échelles d’accord où il faut répondre si l’on est « tout à fait d’accord », « plutôt d’accord », « ne<br />

<strong>sa</strong>is pas », « plutôt pas d’accord » ou « pas d’accord du tout » à certaines affirmations.<br />

Le questionnaire compr<strong>en</strong>d une première partie permettant <strong>de</strong> situer la personne qui répond<br />

(expéri<strong>en</strong>ce avec le spectrogramme <strong>en</strong> terme <strong>de</strong> connais<strong>sa</strong>nce et d’utili<strong>sa</strong>tion, utili<strong>sa</strong>tion <strong>de</strong> la <strong>voix</strong><br />

chantée, problèmes <strong>de</strong> <strong>voix</strong>), puis <strong>de</strong>s questions précises sur :<br />

- l’image spectrographique et les s<strong>en</strong><strong>sa</strong>tions auditives et proprioceptives<br />

- les paramètres vocaux que le spectrogramme permet d’observer (attaque, richesse du<br />

timbre, parole)<br />

- les gênes qui peuv<strong>en</strong>t être induites par l’u<strong>sa</strong>ge du spectrogramme dans le comportem<strong>en</strong>t<br />

vocal (posture, respiration, geste vocal…) et l’intérêt ou non du temps réel<br />

- les utili<strong>sa</strong>tions du spectrogramme : analyse <strong>de</strong> la <strong>voix</strong>, preuve objective, amusem<strong>en</strong>t. Envie<br />

d’utili<strong>sa</strong>tion, avec un orthophoniste ou un professeur <strong>de</strong> chant<br />

- l’utili<strong>sa</strong>tion du spectrogramme <strong>en</strong> autonomie et l’utili<strong>sa</strong>tion du site internet<br />

4.2.3 Exercice d’auto-analyse<br />

4.2.3.1 Description <strong>de</strong> l’exercice d’auto-analyse<br />

Principe <strong>de</strong> l’exercice<br />

Les pati<strong>en</strong>ts sont invités à porter att<strong>en</strong>tion à diverses caractéristiques <strong>de</strong> leur <strong>voix</strong> (int<strong>en</strong>sité,<br />

hauteur, attaque soufflée / dure, clarté du timbre, richesse du timbre, comportem<strong>en</strong>t vocal (=<br />

geste)) lorsqu’ils émett<strong>en</strong>t <strong>de</strong>ux /a/ d’int<strong>en</strong>sité différ<strong>en</strong>te. Le premier objectif est <strong>de</strong> <strong>sa</strong>voir<br />

retranscrire après-coup sur les échelles visuelles analogiques <strong>de</strong> la feuille d’auto-évaluation ce<br />

qu’on a ress<strong>en</strong>ti et <strong>en</strong>t<strong>en</strong>du. La consigne compr<strong>en</strong>d égalem<strong>en</strong>t l’objectif secondaire <strong>de</strong> faire <strong>de</strong>ux<br />

sons d’int<strong>en</strong>sités différ<strong>en</strong>tes qui soi<strong>en</strong>t sur la même hauteur, avec une attaque la plus équilibrée<br />

possible, un son le plus clair et riche possible, et un comportem<strong>en</strong>t vocal adapté.<br />

La voyelle /a/ a été choisie notamm<strong>en</strong>t parce que d’après Yanagihara (Yanagihara, 1967, pp. 532–<br />

533), les voyelles /a/, /e/[[ouvert]] et /i/ permett<strong>en</strong>t mieux <strong>de</strong> faire apparaître les caractéristiques<br />

<strong>de</strong> la dysphonie sur le spectrogramme.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 43


Les pati<strong>en</strong>ts doiv<strong>en</strong>t coter leurs <strong>de</strong>ux sons consécutifs sur chacune <strong>de</strong>s échelles visuelles<br />

analogiques, une première fois grâce au feedback interne (proprioception) et <strong>de</strong>s feedback externes<br />

limité (écoute <strong>en</strong> temps réel), une <strong>de</strong>uxième fois avec un feedback externe, auditif et visuel.<br />

Pour les pati<strong>en</strong>ts hors protocole, ce feedback externe est toujours constitué du spectrogramme<br />

(feedback visuel) <strong>en</strong> plus du feedback auditif (réécoute <strong>de</strong> <strong>sa</strong> <strong>voix</strong>). Pour les pati<strong>en</strong>ts du protocole,<br />

<strong>en</strong> revanche, la première pas<strong>sa</strong>tion <strong>de</strong> cet exercice a lieu juste après le début du protocole, donc<br />

avant qu’ils ne connaiss<strong>en</strong>t le spectrogramme. Le feedback additionnel consiste uniquem<strong>en</strong>t <strong>en</strong> la<br />

réécoute <strong>de</strong> <strong>sa</strong> <strong>voix</strong>.<br />

L’exercice d’auto-analyse effectué ici par les pati<strong>en</strong>ts leur <strong>de</strong>man<strong>de</strong> justem<strong>en</strong>t <strong>de</strong> porter att<strong>en</strong>tion à<br />

leur geste vocal lorsqu’il s’agit <strong>de</strong> « faire plus fort ». L’exercice consistant à porter att<strong>en</strong>tion à <strong>sa</strong><br />

qualité <strong>vocale</strong> dans les conditions les plus difficiles : un /a/ t<strong>en</strong>u, <strong>en</strong>registré, dans <strong>de</strong>s conditions <strong>de</strong><br />

stress, et où l’on <strong>de</strong>man<strong>de</strong> <strong>de</strong> faire plus fort <strong>sa</strong>ns pouvoir s’ai<strong>de</strong>r d’un changem<strong>en</strong>t <strong>de</strong> hauteur <strong>de</strong> la<br />

<strong>voix</strong>.<br />

Intérêt <strong>de</strong> l’exercice<br />

D’après Françoise Esti<strong>en</strong>ne « une bonne <strong>voix</strong> est capable d’émettre <strong>de</strong>s sons <strong>sa</strong>ns fatigue et avec<br />

qualité à <strong>de</strong>s int<strong>en</strong>sités très faibles (pianissimo) et très fortes (fortissimo) allant jusqu’au cri. Elle est<br />

capable <strong>de</strong> passer d’une int<strong>en</strong>sité à l’autre (contraste) <strong>en</strong> un laps <strong>de</strong> temps très court <strong>en</strong> émettant<br />

<strong>de</strong>s sons <strong>de</strong> qualité »(Esti<strong>en</strong>ne, 1998, p. 57). C’est ce que cet exercice t<strong>en</strong>d à travailler. En outre<br />

l’exercice est difficile et fait dans <strong>de</strong>s conditions très contraignantes (notamm<strong>en</strong>t <strong>de</strong> temps : il faut<br />

que les 2 /a/ soi<strong>en</strong>t visibles sur une f<strong>en</strong>être <strong>de</strong> spectrogramme <strong>de</strong> 6 secon<strong>de</strong>s). Le pati<strong>en</strong>t est mis <strong>en</strong><br />

difficulté, l’intérêt <strong>de</strong> l’exercice résidant alors non plus dans la bonne réali<strong>sa</strong>tion <strong>de</strong> l’exercice, mais<br />

dans la qualité <strong>de</strong> son att<strong>en</strong>tion à <strong>sa</strong> propre <strong>voix</strong>.<br />

Plusieurs étu<strong>de</strong>s montr<strong>en</strong>t que les pati<strong>en</strong>ts ayant une dysphonie anci<strong>en</strong>ne ont une mauvaise<br />

connais<strong>sa</strong>nce <strong>de</strong> leur <strong>voix</strong> (Berman et coll Laryngoscope 2004 VHI in (Lescarmontier, 2012, p. 22)),<br />

et une qualité <strong>de</strong> perception musicale amoindrie, <strong>en</strong> terme <strong>de</strong> « hauteur tonale, <strong>de</strong> rythme,<br />

d’int<strong>en</strong>sité et <strong>de</strong> timbre » (Juli<strong>en</strong>, 2009, p. 30)<br />

Philippe Dejonckere (Dejonckere, 2001, p. 354) indique que le travail <strong>de</strong> discrimination auditive<br />

constitue un pré-requis néces<strong>sa</strong>ire à la bonne efficacité <strong>de</strong>s exercices. Nous p<strong>en</strong>sons que ce travail<br />

n’est pas seulem<strong>en</strong>t un préalable mais qu’il est intéres<strong>sa</strong>nt d’affiner la perception du pati<strong>en</strong>t tout au<br />

long du travail orthophonique.<br />

On note qu’une auto-évaluation, adaptée <strong>de</strong>s échelles <strong>de</strong> douleur, <strong>de</strong> l’effort fourni pour produire<br />

un certain résultat vocal (une certaine hauteur, une certaine qualité <strong>de</strong> <strong>voix</strong> et un type d’attaque) a<br />

été utilisée par Kimberly Steinhauer et ses collègues : le Borg Category-Ratio Scale (CR10) 66<br />

(Steinhauer, Grayhack, Smiley-Oy<strong>en</strong>, Shaiman, & McNeil, 2004, p. 435a). On rapproche cette<br />

métho<strong>de</strong> avec notre <strong>de</strong>rnière échelle d’auto-évaluation (comportem<strong>en</strong>t vocal adapté / inadapté)<br />

66 Borg G. Borg’s Perceived Exertion and Pain Scales. Champaign, IL: Human Kinetics; 1998<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 44


Dans leur proposition d’un protocole basique d’évaluation <strong>de</strong>s <strong>voix</strong> pathologiques, La Société<br />

Europé<strong>en</strong>ne <strong>de</strong> Laryngologie propose <strong>de</strong> faire émettre plusieurs /a/ t<strong>en</strong>us à une hauteur et une<br />

int<strong>en</strong>sité confortables, puis un /a/ légèrem<strong>en</strong>t plus fort afin d’évaluer les év<strong>en</strong>tuels changem<strong>en</strong>ts<br />

dans la qualité <strong>de</strong> la <strong>voix</strong> 67 . Cette proposition s’approche du matériel que nous utilisons.<br />

(Dejonckere et al., 2001, p. 78)<br />

Echelles visuelles analogiques (voir <strong>en</strong> annexe)<br />

Dans les années 1990 sont apparues les échelles visuelles analogiques. Ce sont <strong>de</strong>s échelles où l’on<br />

appréh<strong>en</strong><strong>de</strong> la variable à mesurer <strong>de</strong> façon visuelle, spatiale ; elles ont été adaptées <strong>de</strong>s métho<strong>de</strong>s<br />

<strong>de</strong> mesure utilisées dans les étu<strong>de</strong>s réalisées <strong>en</strong> psychologie. Selon Bele, les échelles visuelles<br />

analogiques (échelle continue) sont <strong>de</strong>v<strong>en</strong>ues les échelles les plus utilisées pour l’évaluation<br />

perceptive <strong>de</strong> la qualité <strong>vocale</strong>” 68 (Bele, 2005, p. 556a)<br />

« L’auditeur porte son évaluation sur une droite <strong>de</strong> 10 cm par une marque. La note attribuée à la<br />

<strong>voix</strong> correspond à la mesure chiffrée <strong>en</strong> cm <strong>en</strong>tre le 0 et la croix. Cette échelle combine les avantages<br />

<strong>de</strong> l’échelle ouverte (finesse d’évaluation) et d’une échelle <strong>de</strong> classe (les valeurs sont standardisées<br />

puisque l’échelle est <strong>de</strong> dim<strong>en</strong>sion prédéfinie, ainsi que l’unité <strong>de</strong> mesure. Il s’agit donc d’une échelle<br />

semi-ouverte » (Joana Revis et al., 2012, p. 61; Joana Revis, 2004, p. 74).<br />

Les échelles utilisées pour le protocole mesur<strong>en</strong>t toutes 10 cm et les extrêmes sont nommés. Nous<br />

nous sommes inspirés notamm<strong>en</strong>t <strong>de</strong> l’étu<strong>de</strong> <strong>de</strong> Bele. (Bele, 2005, p. 572)<br />

Nom <strong>de</strong> l’échelle Extrémité gauche Point c<strong>en</strong>tal Extrémité droite<br />

Int<strong>en</strong>sité Faible Forte<br />

Hauteur Grave Aigu<br />

Attaque Soufflée Equilibrée dure<br />

Clarté du timbre Timbre altéré Timbre clair<br />

Richesse du timbre<br />

Peu d’harmoniques<br />

Beaucoup<br />

d’harmoniques<br />

Comportem<strong>en</strong>t vocal Inadapté adapté<br />

Des qualifications libres (impression générale, attaque, timbre et comportem<strong>en</strong>t vocal) sont<br />

égalem<strong>en</strong>t <strong>en</strong>couragées.<br />

La mesure <strong>de</strong>s attaques évaluées comme soufflées est faites à partir du 0 (équilibré), <strong>en</strong> négatif.<br />

Cette façon pour le pati<strong>en</strong>t <strong>de</strong> juger <strong>de</strong> la clarté <strong>de</strong> son timbre sur une échelle visuelle analogique<br />

est utilisée notamm<strong>en</strong>t dans le protocole basique <strong>de</strong> la Société Europé<strong>en</strong>ne <strong>de</strong> Laryngologie, où le<br />

pati<strong>en</strong>t note son impression sur la qualité <strong>de</strong> <strong>sa</strong> <strong>voix</strong> sur une échelle visuelle analogique (Dejonckere<br />

et al., 2001, p. 81; Remacle & Morsomme, 2009, p. 130).<br />

67 “/a:/ at (spontaneous) comfortable pitch/loudness, recor<strong>de</strong>d three times to evaluate variability of quality – /a:/ slightly<br />

lou<strong>de</strong>r, to evaluate the possible change in quality and the slope of the regression line: frequ<strong>en</strong>cy / sound pressure level “<br />

68 “The VAS (continuous scale) has become the most common scale for perceptual rating of voice quality”<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 45


Laur<strong>en</strong>ce Delacroix, Dominique Morsomme et Marc Remacle, pour l’autoévaluation dans le cas<br />

d’une paralysie récurr<strong>en</strong>tielle, cit<strong>en</strong>t une échelle visuelle analogique où le pati<strong>en</strong>t doit juger <strong>de</strong> <strong>sa</strong><br />

qualité <strong>de</strong> <strong>voix</strong> : « le pati<strong>en</strong>t doit se situer sur une ligne <strong>de</strong> dix c<strong>en</strong>timètres « comm<strong>en</strong>t considère-t-il<br />

<strong>sa</strong> <strong>voix</strong> ? » 0 étant une <strong>voix</strong> tout à fait mauvaise jusqu’à 10 où le pati<strong>en</strong>t trouve <strong>sa</strong> <strong>voix</strong> tout à fait<br />

bonne » (Delacroix, Morsomme, & Remacle, 2009, p. 426)<br />

Pour Kepster (1991) (in Joana Revis, 2004, p. 83) « il apparaît que la plupart <strong>de</strong>s auditeurs<br />

appliqu<strong>en</strong>t une stratégie d’écoute semblable <strong>en</strong> utili<strong>sa</strong>nt trois dim<strong>en</strong>sions principales : int<strong>en</strong>sité,<br />

fréqu<strong>en</strong>ce fondam<strong>en</strong>tale et perturbations ». Dans notre cas, les perturbations sont évaluées sur les<br />

échelles « attaque » et « clarté du timbre ». Nous avons ajouté les paramètres « richesse <strong>en</strong><br />

harmoniques » et « geste vocal ». Nous avons différ<strong>en</strong>cié le timbre <strong>en</strong> <strong>de</strong>ux échelles « clarté du<br />

timbre » et « richesse <strong>en</strong> harmonique » car, la plupart <strong>de</strong>s pati<strong>en</strong>ts inclus dans l’étu<strong>de</strong> ayant une<br />

dysphonie légère voire pas <strong>de</strong> dysphonie, l’échelle clarté seule n’était pas la plus pertin<strong>en</strong>te.<br />

Françoise Esti<strong>en</strong>ne propose au pati<strong>en</strong>t, lors <strong>de</strong> l’évaluation subjective <strong>de</strong> la <strong>voix</strong>, d’évaluer,<br />

notamm<strong>en</strong>t, la qualité <strong>de</strong> <strong>sa</strong> <strong>voix</strong>, selon une échelle discrète à 5 niveaux : (Esti<strong>en</strong>ne, 1998, p. 51), qui<br />

regroupe à la fois <strong>de</strong>s qualités <strong>de</strong> hauteur tonale (trop aiguë, trop grave), <strong>de</strong>s qualités <strong>de</strong> timbre<br />

(souffle, raucité, grésillem<strong>en</strong>t, nasonem<strong>en</strong>t, <strong>voix</strong> mal posée) et <strong>de</strong>s qualités <strong>de</strong> geste vocal (fatigue,<br />

s<strong>en</strong><strong>sa</strong>tions dé<strong>sa</strong>gréables). (Esti<strong>en</strong>ne, 1998, p. 51)<br />

Banque <strong>de</strong> sons<br />

Dans le but <strong>de</strong> contrôler les référ<strong>en</strong>ces <strong>de</strong>s pati<strong>en</strong>ts et du jury lors <strong>de</strong> leurs évaluations, nous<br />

proposons <strong>de</strong>s référ<strong>en</strong>ces <strong>vocale</strong>s (Kreiman, Gerratt, Kempster, Erman, & Berke, 1993). « un<br />

protocole d’ancrage auditif permet une amélioration pot<strong>en</strong>tiellem<strong>en</strong>t significative <strong>de</strong> la fiabilité <strong>de</strong>s<br />

évaluations perceptives <strong>de</strong> la <strong>voix</strong> dans les pratiques cliniques et expérim<strong>en</strong>tales » (Joana Revis,<br />

2004, pp. 86–87) En cela, nous nous sommes inspirés notamm<strong>en</strong>t <strong>de</strong> l’étu<strong>de</strong> <strong>de</strong> Wolfe et Steinfatt,<br />

dans laquelle 5 juges <strong>de</strong>vai<strong>en</strong>t évaluer 25 spectrogrammes selon une classification adaptée <strong>de</strong> celle<br />

<strong>de</strong> Yanagihara. Les 5 juges ont d’abord appris la classification par la prés<strong>en</strong>tation <strong>de</strong><br />

spectrogrammes modèles, qui continuai<strong>en</strong>t d’être utilisés comme référ<strong>en</strong>ce durant la tâche <strong>de</strong><br />

classification, d’une durée d’une heure <strong>en</strong>viron (Wolfe & Steinfatt, 1987, p. 233).<br />

Le protocole nécessite <strong>de</strong> faire <strong>en</strong>t<strong>en</strong>dre (et voir pour tous <strong>sa</strong>uf les pati<strong>en</strong>ts du protocole la<br />

première fois) <strong>de</strong>s sons qui constitu<strong>en</strong>t <strong>de</strong>s ancrages. Il y a 3 exemples pour chacune <strong>de</strong>s <strong>de</strong>ux<br />

échelles « clarté » et « richesse », décliné <strong>en</strong> une <strong>voix</strong> d’homme et une <strong>voix</strong> <strong>de</strong> femme, ce qui<br />

représ<strong>en</strong>te 12 sons dans la banque <strong>de</strong> son, disponible sur le site internet 69 . Les exemples pour la<br />

richesse du timbre ont été générés <strong>en</strong> filtrant les harmoniques aigus sur une <strong>voix</strong> chantée claire 70 .<br />

69 Les exemples <strong>de</strong> timbres altérés sont tirés <strong>de</strong>s extraits vocaux <strong>de</strong> «la <strong>voix</strong> dans tous ses états » (Foisneau, Rie<strong>de</strong>l, Chevalier, &<br />

Decorte, 2003). Nous avons extraits les /a/ t<strong>en</strong>us <strong>en</strong> <strong>voix</strong> medium, éliminé les <strong>en</strong>registrem<strong>en</strong>ts trop faible, <strong>sa</strong>turés, avec trop<br />

d’instabilité ou une trop gran<strong>de</strong> compo<strong>sa</strong>nte dy<strong>sa</strong>rthrique. Lorsque c’était néces<strong>sa</strong>ire, nous avons coupé les <strong>en</strong>registrem<strong>en</strong>ts à 5s<br />

avec un fondu <strong>de</strong> fermeture avec le logiciel Audacity. Tous les extraits ont été classés selon leur gra<strong>de</strong> <strong>de</strong> dysphonie <strong>de</strong> 0 à 3, pour<br />

les homes et pour les femmes, <strong>en</strong> écoutant le son et <strong>en</strong> regardant le spectrogramme. Une fois les <strong>en</strong>registrem<strong>en</strong>ts voulus choisis<br />

(note fondam<strong>en</strong>tale à peu près similaire et image spectrographique parlante), les <strong>en</strong>registrem<strong>en</strong>ts sont tous recalibrés à 74dB<br />

avec Praat et création <strong>de</strong> l’animation à partir <strong>de</strong> l’image spectrographique (vocevista)<br />

70 Extraits <strong>de</strong> <strong>voix</strong> normalisé avec Audacity, puis 4 fois le filtre passe bas : P<strong>en</strong>te <strong>de</strong> -6dB <strong>de</strong> 1000 à 2000 Hz pour le timbre pauvre<br />

<strong>en</strong> harmonique (femme), et 2 fois le filtre passe bas p<strong>en</strong>te -6dB <strong>de</strong> 400 à 1000 Hz pour le timbre très pauvre <strong>en</strong> harmonique<br />

(femme). Filtre passe bas p<strong>en</strong>te <strong>de</strong> -6dB dB <strong>de</strong> 300 à 9000Hz pour les hommes (appliqué 1 fois pour la <strong>voix</strong> pauvre <strong>en</strong> harmonique,<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 46


Chan et ses collègues conclu<strong>en</strong>t que les ancrages par <strong>de</strong>s extraits <strong>de</strong> <strong>voix</strong> synthétisés peuv<strong>en</strong>t être<br />

plus efficaces, pour les caractères souffle et raucité, que les extraits <strong>de</strong> <strong>voix</strong> naturelles (Chan & Yiu,<br />

2002). Cep<strong>en</strong>dant il s’avère que nos extraits synthétisés pour les ancrages <strong>de</strong> richesse <strong>vocale</strong> ne<br />

sont pas complètem<strong>en</strong>t <strong>sa</strong>tisfai<strong>sa</strong>nt au niveau perceptif. (Joana Revis, 2004, pp. 87–88)<br />

Conditions d’<strong>en</strong>registrem<strong>en</strong>t et d’écoute<br />

Le même matériel (micro serre-tête ME-3 S<strong>en</strong>nheiser, haut-parleur WM-Audio, carte son externe<br />

PureAudio USB d’Andrea) a été utilisé tout au long <strong>de</strong> l’étu<strong>de</strong> (<strong>sa</strong>uf une fois pour le pati<strong>en</strong>t D où on<br />

a utilisé les haut-parleurs <strong>de</strong> <strong>sa</strong> chaîne Haute Fidélité suite à un problème technique).<br />

Le micro serre-tête (comme proposé par Volin (Volin, 1999, p. 244) permet d’atténuer les effets du<br />

« filtrage par la <strong>sa</strong>lle », qui, d’après Emile Leipp, intervi<strong>en</strong>t dans la perception du timbre. (Leipp,<br />

2010, p. 156). Le micro utilisé doit être <strong>de</strong> bonne qualité (Ghio, 2012, p. 77). Il est recommandé aux<br />

Etats-Unis pour <strong>sa</strong> précision lorsqu’on l’utilise pour la reconnais<strong>sa</strong>nce <strong>vocale</strong>. On a égalem<strong>en</strong>t coupé<br />

toute correction d’int<strong>en</strong>sité induite par l’ordinateur ou la carte son (Martin, 2008, pp. 143–144;<br />

Volin, 1999, p. 244).<br />

Conditions <strong>de</strong> pas<strong>sa</strong>tion<br />

La fiche <strong>de</strong>s consignes est disponible <strong>en</strong> annexe. Des pré-tests ont été effectués <strong>en</strong> septembre et<br />

octobre 2012 au cabinet <strong>de</strong> phoniatrie d’I<strong>sa</strong>belle Marié-Bailly avant d’adapter les consignes et la<br />

feuille <strong>de</strong> pas<strong>sa</strong>tion.<br />

Condition <strong>de</strong> l’évaluation perceptive<br />

Les auditeurs du jury d’écoute ont eu accès aux sons <strong>en</strong> format wav sur un site internet dédié. Les<br />

écoutes sont faites avec un casque fermé S<strong>en</strong>nheiser HD200. Pour les auditeurs du jury d’écoute qui<br />

évalueront <strong>en</strong>suite tous les exercices, la première condition correspond à l’écoute <strong>de</strong>s <strong>de</strong>ux sons, la<br />

<strong>de</strong>uxième à l’ajout du spectrogramme à cette écoute.<br />

Les différ<strong>en</strong>ts exercices sont prés<strong>en</strong>tés dans un ordre aléatoire. Les auditeurs ont le loisir d’écouter<br />

les extraits autant qu’ils le désir<strong>en</strong>t. Ils font apparaître le spectrogramme <strong>en</strong> cliquant sur une partie<br />

<strong>de</strong> la page web pour passer à l’évaluation avec le feedback additionnel. Ils peuv<strong>en</strong>t alors réécouter<br />

l’extrait, ou non. Les auditeurs du jury d’écoute ont égalem<strong>en</strong>t l’accès libre à la banque <strong>de</strong> sons.<br />

4.2.3.2 Métho<strong>de</strong> d’analyse <strong>de</strong>s résultats <strong>de</strong> l’exercice d’auto-analyse<br />

Mesures / vérifications / recherche <strong>de</strong>s valeurs aberrantes.<br />

Toutes les séances sont <strong>en</strong>registrées sur un dictaphone numérique, et <strong>en</strong>suite séqu<strong>en</strong>cées (suivant<br />

qu’il s’agit d’un exercice d’auto-analyse, d’une séance d’<strong>en</strong>trainem<strong>en</strong>t, <strong>de</strong>s bilans vocaux ou <strong>de</strong>s<br />

<strong>en</strong>treti<strong>en</strong>s semi-dirigés. Cela a permis <strong>de</strong> préciser les mesures lorsque les marques sur les exercices<br />

d’auto-analyse étai<strong>en</strong>t ambiguës.<br />

Toutes les mesures ont été r<strong>en</strong>trées sous Excel. Après avoir calculé les différ<strong>en</strong>ces <strong>en</strong>tre <strong>de</strong>ux sons<br />

et les différ<strong>en</strong>ces induites par le feedback pour les <strong>de</strong>ux sons, les données ont été vérifiées <strong>en</strong><br />

et trois fois pour la <strong>voix</strong> très pauvre <strong>en</strong> harmonique.). Normali<strong>sa</strong>tion à 74 dB avec Praat et création <strong>de</strong> l’animation à partir <strong>de</strong><br />

l’image spectrographique (vocevista)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 47


mesurant ces écarts sur les feuilles <strong>de</strong> pas<strong>sa</strong>tion. De nombreuses erreurs ont été ainsi repérées<br />

(échange <strong>en</strong>tre <strong>de</strong>ux sons, <strong>en</strong>tre les <strong>de</strong>ux feedbacks, erreurs <strong>de</strong> mesure, erreurs <strong>de</strong> frappe). Seuls<br />

les occurr<strong>en</strong>ces où les <strong>de</strong>ux sons sont situés au même <strong>en</strong>droit et où le feedback ne modifie ri<strong>en</strong><br />

n’ont pas pu être vérifiés <strong>de</strong> cette manière. [[combi<strong>en</strong> ?]]<br />

Calcul du paramètre « qualité d’attaque »<br />

La qualité <strong>de</strong> l’attaque correspond à la valeur absolue <strong>de</strong> la mesure <strong>de</strong> l’attaque sur l’échelle<br />

bidirectionnelle soufflée / équilibrée / dure. Le 0 correspond à une attaque équilibrée, et la mesure<br />

<strong>en</strong> valeur absolue correspond à l’écart <strong>en</strong>tre l’attaque observée et une attaque équilibrée, l’attaque<br />

observée pouvant être indifféremm<strong>en</strong>t dure ou soufflée.<br />

Mesure objectives<br />

Tous les extraits vocaux <strong>de</strong>s exercices d’auto-analyse ont été découpés <strong>en</strong> 2 sons distincts avec<br />

Audacity. Nous avons écrit un script Praat (<strong>en</strong> annexe) afin <strong>de</strong> connaître les paramètres acoustiques<br />

correspondants : dB moy<strong>en</strong>, fréqu<strong>en</strong>ce fondam<strong>en</strong>tale moy<strong>en</strong>ne, jitter (instabilité à court terme <strong>de</strong><br />

la f0), shimmer (instabilité à court terme <strong>de</strong> l’amplitu<strong>de</strong>), HNR (Harmonic to Noise Ratio = rapport<br />

<strong>en</strong>tre l’énergie du bruit et l’énergie <strong>de</strong> l’on<strong>de</strong> moy<strong>en</strong>née), et différ<strong>en</strong>ce d’énergie dans la ban<strong>de</strong> <strong>de</strong><br />

fréqu<strong>en</strong>ce 60 Hz - 2000 Hz par rapport à la ban<strong>de</strong> <strong>de</strong> fréqu<strong>en</strong>ce 2000 Hz – 5000 Hz. Devant la<br />

complexité <strong>de</strong> l’objectivation <strong>de</strong> la qualité <strong>de</strong> l’attaque, et malgré la possibilité d’une métho<strong>de</strong> <strong>de</strong><br />

mesure [[20-80 <strong>de</strong> Revis (Roure, 2005, p. 97)] / krom cité par le mémoire attaque vocalique]], nous<br />

avons préféré r<strong>en</strong>oncer à mesurer objectivem<strong>en</strong>t la qualité <strong>de</strong> l’attaque.<br />

homogénéi<strong>sa</strong>tion <strong>de</strong>s évaluations du jury<br />

Nous avons c<strong>en</strong>tré les réponses <strong>de</strong>s auditeurs du jury <strong>de</strong> façon à ce que pour chaque paramètre, la<br />

moy<strong>en</strong>ne observée soit <strong>de</strong> 50 et l’écart-type <strong>de</strong> 25 quel que soit l’auditeur du jury d’écoute. Cette<br />

modification <strong>de</strong>s données harmonise les différ<strong>en</strong>tes évaluations subjectives<br />

L’échelle « attaque » étant bi-directionnelle, nous avons uniquem<strong>en</strong>t modifié les variables pour que<br />

chaque groupe <strong>de</strong> données ait l’écart type 25, <strong>sa</strong>ns modifier la moy<strong>en</strong>ne, <strong>de</strong> façon à ce que la valeur<br />

« 0 » gar<strong>de</strong> le s<strong>en</strong>s « attaque équilibrée ».<br />

Choix <strong>de</strong>s paramètres étudiés<br />

Pour les échelles int<strong>en</strong>sité et hauteur la différ<strong>en</strong>ce <strong>en</strong>tre les <strong>de</strong>ux valeurs est ret<strong>en</strong>ue comme la<br />

valeur la plus signifiante (plutôt que la valeur <strong>de</strong> chacun <strong>de</strong>s <strong>de</strong>ux sons) : effectivem<strong>en</strong>t la consigne<br />

est <strong>de</strong> faire la plus gran<strong>de</strong> différ<strong>en</strong>ce d’int<strong>en</strong>sité et la moins gran<strong>de</strong> différ<strong>en</strong>ce <strong>de</strong> hauteur. Pour les<br />

échelles qualité d’attaque, clarté, richesse et geste, la valeur brute est ret<strong>en</strong>ue comme la plus<br />

signifiante. Effectivem<strong>en</strong>t la consigne est <strong>de</strong> faire au maximum une attaque équilibrée, un son riche<br />

et clair et un geste adapté.<br />

Variables gratification / ai<strong>de</strong> / erreur / corrélation<br />

Gratification<br />

Il est plus gratifiant pour les pati<strong>en</strong>ts d’obt<strong>en</strong>ir une différ<strong>en</strong>ce d’int<strong>en</strong>sité plus gran<strong>de</strong>, une<br />

différ<strong>en</strong>ce <strong>de</strong> hauteur plus petite, une attaque plus proche <strong>de</strong> l’attaque équilibrée, une plus gran<strong>de</strong><br />

clarté, une plus gran<strong>de</strong> richesse, et un meilleur comportem<strong>en</strong>t vocal.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 48


Lorsque l’ajout du feedback change l’évaluation d’un paramètre, nous nous intéressons au fait qu’il<br />

la modifie <strong>de</strong> façon gratifiante pour le pati<strong>en</strong>t ou non. Nous avons construit avec Excel pour chaque<br />

échelle les variables « gratifiantes » et « dévalori<strong>sa</strong>ntes» <strong>en</strong> repr<strong>en</strong>ant la mesure <strong>de</strong> la différ<strong>en</strong>ce<br />

mesurée <strong>en</strong>tre les évaluations <strong>sa</strong>ns feedback additionnel et celles avec feedback additionnel.<br />

Chaque fois qu’une mesure <strong>de</strong> départ manque (il est arrivé qu’un pati<strong>en</strong>t ou un auditeur ne note<br />

ri<strong>en</strong> sur l’échelle visuelle analogique), il est important <strong>de</strong> neutraliser cette mesure, pour qu’elle ne<br />

s’appar<strong>en</strong>te pas à un « 0 », ce qui n’aurait pas <strong>de</strong> s<strong>en</strong>s, notamm<strong>en</strong>t lorsque la mesure sert pour<br />

calculer <strong>de</strong>s écarts.<br />

Les écarts <strong>en</strong> mm proposés dans les tableaux ci-après a été calculés <strong>en</strong> fai<strong>sa</strong>nt la moy<strong>en</strong>ne <strong>de</strong>s<br />

différ<strong>en</strong>ces <strong>en</strong>tre les variables gratifiantes et dévalori<strong>sa</strong>ntes Nous proposons égalem<strong>en</strong>t le<br />

pourc<strong>en</strong>tage d’occurr<strong>en</strong>ce pour lesquelles le feedback a modifié, dans un s<strong>en</strong>s ou dans l’autre, le<br />

paramètre mesuré.<br />

Erreur / ai<strong>de</strong><br />

Le même cheminem<strong>en</strong>t nous conduit à calculer le nombre <strong>de</strong> fois où le feedback ai<strong>de</strong> à s’approcher<br />

<strong>de</strong> l’évaluation <strong>de</strong>s auditeurs du jury d’écoute. Les mesures <strong>de</strong>s évaluations du jury d’écoute ont été<br />

harmonisées <strong>de</strong> façon à ce que la moy<strong>en</strong>ne et l’écart-type <strong>de</strong>s mesures <strong>de</strong>s évaluations <strong>de</strong> chaque<br />

auditeur du jury d’écoute soit la même (celle <strong>de</strong> l’<strong>en</strong>semble <strong>de</strong>s auditeurs du jury d’écoute), pour<br />

les échelles int<strong>en</strong>sité, hauteur, clarté, richesse et geste. Pour l’attaque et la qualité <strong>de</strong> l’attaque, afin<br />

<strong>de</strong> conserver le s<strong>en</strong>s <strong>de</strong> la valeur « 0 » (attaque équilibrée), nous avons harmonisé les mesures <strong>de</strong><br />

façons à ce que les écarts-type <strong>de</strong>s évaluations <strong>de</strong> chaque auditeur soit les mêmes.<br />

Les calculs ont été effectués avec les valeurs non harmonisées pour tous les pati<strong>en</strong>ts (il n’était pas<br />

possible <strong>de</strong> les harmoniser car il y a trop peu <strong>de</strong> pas<strong>sa</strong>tion par pati<strong>en</strong>t), et avec les valeurs<br />

harmonisées pour le jury. Nous avons préalablem<strong>en</strong>t calculé la médiane <strong>de</strong>s évaluations<br />

harmonisées du jury (évaluation avec feedback visuel).<br />

Résumé utili<strong>sa</strong>tion / gratification / ai<strong>de</strong> / erreur<br />

On évalue l’effet du feedback additionnel sur les plans<br />

- <strong>de</strong> l’utili<strong>sa</strong>tion : nombre <strong>de</strong> fois <strong>en</strong> % où le feedback induit un changem<strong>en</strong>t sur un au moins<br />

<strong>de</strong>s sons <strong>de</strong> l’échelle considérée<br />

- <strong>de</strong> la gratification (<strong>en</strong> positif) ou la pénali<strong>sa</strong>tion (<strong>en</strong> négatif) constatée <strong>en</strong>tre la condition <strong>sa</strong>ns<br />

avec avec feedback additionnel<br />

o <strong>en</strong> mm (moy<strong>en</strong>ne gratification - pénali<strong>sa</strong>tion)<br />

o <strong>en</strong> % (nombre <strong>de</strong> fois où le changem<strong>en</strong>t induit par le feedback additionnel va dans le<br />

s<strong>en</strong>s d’une gratification du pati<strong>en</strong>t sur le nombre total <strong>de</strong> fois où le feedback induit<br />

un changem<strong>en</strong>t)<br />

- <strong>de</strong> l’erreur : la moy<strong>en</strong>ne <strong>de</strong>s valeurs absolues <strong>de</strong>s écarts <strong>en</strong>tre l’évaluation du pati<strong>en</strong>t et la<br />

médiane <strong>de</strong>s évaluations <strong>de</strong>s auditeurs du jury d’écoute.<br />

- <strong>de</strong> l’ai<strong>de</strong> (<strong>en</strong> positif) ou la gêne (<strong>en</strong> négatif) constatée <strong>en</strong>tre la condition <strong>sa</strong>ns et avec<br />

feedback additionnel<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 49


o <strong>en</strong> mm (moy<strong>en</strong>ne ai<strong>de</strong> - gêne)<br />

o <strong>en</strong> % (nombre <strong>de</strong> fois où le changem<strong>en</strong>t induit par le feedback additionnel va dans le<br />

s<strong>en</strong>s <strong>de</strong> l’ai<strong>de</strong> sur le nombre total <strong>de</strong> fois où le feedback induit un changem<strong>en</strong>t)<br />

Corrélations<br />

On étudie égalem<strong>en</strong>t les modifications <strong>de</strong>s corrélations <strong>en</strong>tre les différ<strong>en</strong>ts paramètres lorsqu’on<br />

ajoute le feedback. Les modifications sont supposées significatives lorsque p < 0.05 (noté par *) et<br />

très significatives lorsque p < 0.01 (noté par **) dans les corrélations par paires.<br />

Nature du feedback additionnel et nombre <strong>de</strong> données<br />

L’ajout du feedback n’est pas toujours le même : pour les pati<strong>en</strong>ts <strong>en</strong> auto-évaluation, on ajoute les<br />

feedback auditif et visuels, <strong>sa</strong>uf pour la première pas<strong>sa</strong>tion <strong>de</strong>s pati<strong>en</strong>ts du protocole pour lesquels<br />

on ajoute uniquem<strong>en</strong>t le feedback auditif. Pour les auditeurs du jury d’écoute, la différ<strong>en</strong>ce<br />

observée correspond à ce que les auditeurs ont pu modifier lorsqu’ils observ<strong>en</strong>t le spectrogramme<br />

<strong>en</strong> plus d’écouter le son. Dans tous les cas, la différ<strong>en</strong>ce est due à un feedback externe additionnel :<br />

pour les pati<strong>en</strong>ts, son et spectrogramme, et pour les auditeurs du jury d’écoute, spectrogramme.<br />

Auditeurs du<br />

jury d’écoute<br />

Hors<br />

protocole<br />

Pati<strong>en</strong>ts<br />

protocole<br />

Sauf 1 ère<br />

1<br />

pas<strong>sa</strong>tion<br />

ère pas<strong>sa</strong>tion<br />

Condition feedback 1 (varia- Son <strong>en</strong>registré Son qui vi<strong>en</strong>t d’être produit (feedback interne)<br />

Condition feedback 2 bles)<br />

Son <strong>en</strong>registré et spectrogramme son <strong>en</strong>registré<br />

Nb <strong>de</strong> sons 262 224 38 22 16 8<br />

Nb <strong>de</strong> différ<strong>en</strong>ces <strong>de</strong><br />

131 112 19 11 8 4<br />

2 sons<br />

Rq : les moy<strong>en</strong>nes ont été faites <strong>sa</strong>ns corriger le poids respectif <strong>de</strong> chaque groupe : les données<br />

pour « tous » sont donc très dép<strong>en</strong>dantes <strong>de</strong>s données prov<strong>en</strong>ant du jury d’écoute (224 occurr<strong>en</strong>ce<br />

contre 38).De même le poids <strong>de</strong>s pati<strong>en</strong>ts hors protocole est s<strong>en</strong>siblem<strong>en</strong>t plus fort que celui <strong>de</strong>s<br />

pati<strong>en</strong>ts du protocole pour le total « pati<strong>en</strong>ts » (22 occurr<strong>en</strong>ces contre 16) Enfin, le nombre<br />

d’occurr<strong>en</strong>ce où l’on ajoute seulem<strong>en</strong>t le son est très faible (4 différ<strong>en</strong>ces <strong>de</strong> <strong>de</strong>ux sons), ce qui<br />

nous interdit <strong>de</strong> généraliser nos résultats.<br />

Fiabilité évaluations du jury d’écoute pour l’exercice d’auto-analyse<br />

Les fiabilités inter-juge et intra-juges sont mesurées par <strong>de</strong>s statistiques non paramètriques (rang<br />

signés <strong>de</strong> Wilcoxon) où l’on recherche une non significativité (p > 80% par exemple) <strong>de</strong><br />

l’indép<strong>en</strong>dance <strong>de</strong>s auditeurs. Pour avoir une idée <strong>de</strong> la fiabilité intra-juge, nous avons introduit<br />

dans la procédure d’écoute 5 <strong>en</strong>registrem<strong>en</strong>ts qui sont écoutés <strong>de</strong>ux fois. Nous comparons les<br />

évaluations <strong>de</strong>s <strong>de</strong>ux écoutes.<br />

L’effet d’appr<strong>en</strong>tis<strong>sa</strong>ge est évalué <strong>en</strong> mesurant la corrélation <strong>en</strong>tre les paramètres mesurés et le<br />

numéro <strong>de</strong> l’exercice.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 50


5 Analyse <strong>de</strong>s résultats<br />

5.1 Auto-analyse : échelles visuelles analogiques<br />

5.1.1 Utili<strong>sa</strong>tion <strong>de</strong>s échelles<br />

5.1.1.1 Distribution <strong>de</strong>s marques sur les échelles visuelles analogiques<br />

Nous nous intéressons ici aux évaluations toute condition <strong>de</strong> feedback confondues, avant la<br />

normali<strong>sa</strong>tion <strong>de</strong>s écarts par c<strong>en</strong>trali<strong>sa</strong>tion <strong>de</strong>s mesures <strong>de</strong>s évaluations du jury d’écoute.<br />

Remarque préliminaire : Un <strong>de</strong>s juges a noté l’échelle <strong>de</strong> la clarté non pas comme une échelle<br />

<strong>en</strong>tre timbre clair et timbre altéré, mais une échelle <strong>en</strong>tre timbre clair et timbre sourd, ce qui<br />

conduit à une très gran<strong>de</strong> corrélation <strong>en</strong>tre cette échelle et celle <strong>de</strong> la richesse (corrélation = 0,88<br />

au lieu <strong>de</strong> 0,38, 0,05 et 0,09 pour chacun <strong>de</strong>s autres auditeurs) par la suite nous avons neutralisé ses<br />

réponses afin <strong>de</strong> gar<strong>de</strong>r une échelle <strong>de</strong> clarté qui soit bi<strong>en</strong> distincte <strong>de</strong> celle <strong>de</strong> la richesse, puisque<br />

nous avons l’assurance que tous les pati<strong>en</strong>ts ont bi<strong>en</strong> fait la distinction, puisque les pas<strong>sa</strong>tions se<br />

fai<strong>sa</strong>i<strong>en</strong>t <strong>en</strong> notre prés<strong>en</strong>ce.<br />

- Int<strong>en</strong>sité : les pati<strong>en</strong>ts utilis<strong>en</strong>t globalem<strong>en</strong>t l’échelle d’int<strong>en</strong>sité sur une longueur plus<br />

importante du côté <strong>de</strong>s int<strong>en</strong>sités fortes. Cela est d’autant plus vrai pour les pati<strong>en</strong>ts hors<br />

protocole.<br />

- Hauteur : les pati<strong>en</strong>ts du protocole se distingu<strong>en</strong>t particulièrem<strong>en</strong>t <strong>en</strong> jugeant toujours leur<br />

hauteur <strong>de</strong> façon très compacte vers le milieu <strong>de</strong> l’échelle.<br />

- Qualité d’attaque : les pati<strong>en</strong>ts du protocole utilis<strong>en</strong>t l’échelle d’attaque plus souv<strong>en</strong>t avec<br />

<strong>de</strong> plus mauvaises qualité d’attaque<br />

- Clarté du timbre : les pati<strong>en</strong>ts hors protocole évalu<strong>en</strong>t la clarté <strong>de</strong> leur timbre <strong>en</strong> moy<strong>en</strong>ne<br />

un peu plus du côté « timbre altéré »<br />

- Richesse du timbre : globalem<strong>en</strong>t les pati<strong>en</strong>ts du protocole se sur-estim<strong>en</strong>t<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 51


- Geste : les pati<strong>en</strong>ts du protocole se surestim<strong>en</strong>t peut-être un peu, globalem<strong>en</strong>t (peut-être<br />

que cette évaluation meilleure correspond à une évaluation meilleure <strong>de</strong>s auditeurs du jury<br />

égalem<strong>en</strong>t pour cette population)<br />

Ce sont les pati<strong>en</strong>ts du protocole qui s’éloign<strong>en</strong>t le plus <strong>de</strong> la façon <strong>de</strong> s’évaluer du jury<br />

5.1.1.2 Corrélations <strong>en</strong>tre les différ<strong>en</strong>tes échelles (tous groupes confondus et tous feedbacks<br />

confondus)<br />

Corrélation clarté richesse int<strong>en</strong>sité<br />

clarté 0,27 p


Int<strong>en</strong>sité et hauteur sont très faiblem<strong>en</strong>t corrélées (0.14, p=0.0017**) au global alors qu’on aurait<br />

pu s’y att<strong>en</strong>dre.<br />

corrélation geste<br />

clarté<br />

richesse<br />

hauteur<br />

Mauvaise<br />

qualité<br />

d’attaque<br />

int<strong>en</strong>sité 0,06 p=0,16<br />

0,77 p


5 comparaisons<br />

a / b<br />

Valeurs brutes Valeurs c<strong>en</strong>trées<br />

Fb auditif<br />

Fb auditif et visuel<br />

Corrélation avec le<br />

numéro <strong>de</strong> pas<strong>sa</strong>tion<br />

(appr<strong>en</strong>tis<strong>sa</strong>ge)<br />

échelle p Z p z p Z Corr. p<br />

Différ<strong>en</strong>ce<br />

d’Int<strong>en</strong>sité<br />

0,3803 -0,877 0,4009 -0,840 0,9108 -0,112 -0.21 0.0017**<br />

Différ<strong>en</strong>ce <strong>de</strong><br />

hauteur<br />

0,8860 -0,140 0,8860 -0,140 0,7794 -0,280<br />

Attaque 0,5391 -0,614 0,4561 -0,745 0,9687 -0,039<br />

Mauvaise qualité<br />

d’ attaque<br />


Effet d’appr<strong>en</strong>tis<strong>sa</strong>ge<br />

Pour rechercher un effet d’appr<strong>en</strong>tis<strong>sa</strong>ge, nous mesurons les corrélations <strong>en</strong>tre les variables et le<br />

numéro <strong>de</strong> l’évaluation (elles sont passées dans l’ordre).<br />

- valeur absolue <strong>de</strong> l’attaque (corrélation -0.19, p


5.1.2.2 Fiabilité interjuge<br />

28 évaluations<br />

par 4 auditeurs<br />

(3 pour la<br />

clarté)<br />

Valeurs brutes Valeurs c<strong>en</strong>trées<br />

Feedback auditif<br />

Feedback<br />

auditif et visuel<br />

Kruskal-Wallis p H p H P H<br />

Différ<strong>en</strong>ce<br />

d’Int<strong>en</strong>sité<br />

0,2294 4,315 0,5471 2,124 0,620 1,750<br />

Différ<strong>en</strong>ce <strong>de</strong><br />

Hauteur<br />

0,2703 3,920 0,3148 3,547 0,3163 3,534<br />

Attaque


Qualité<br />

d’attaque<br />

3 % 0,5%<br />

Clarté 67 % 87 %<br />

Richesse 6 % 93 %<br />

Geste vocal 0 % 96 %<br />

L’ajout du feedback visuel n’améliore pas la fiabilité pour la<br />

différ<strong>en</strong>ce <strong>en</strong>tre <strong>de</strong>ux sons.<br />

L’ajout du feedback visuel n’améliore pas la fiabilité pour la<br />

différ<strong>en</strong>ce <strong>en</strong>tre <strong>de</strong>ux sons.<br />

5.1.3 Corrélation avec les critères acoustiques<br />

Le script Praat donne <strong>de</strong>s résultats parfois aberrants pour le jitter pour les extraits à faible int<strong>en</strong>sité,<br />

car il interprète <strong>de</strong>s parties du sil<strong>en</strong>ce avant et après le son t<strong>en</strong>u comme ayant une certaine<br />

périodicité. A défaut <strong>de</strong> pouvoir retraiter chacun <strong>de</strong>s sons manuellem<strong>en</strong>t, nous nous cont<strong>en</strong>tons <strong>de</strong><br />

ces résultats. Cela explique peut-être les difficultés à lier le jitter avec un <strong>de</strong>s paramètres subjectifs.<br />

5.1.4 Influ<strong>en</strong>ce <strong>de</strong> l’image sur la perception <strong>de</strong> la qualité <strong>de</strong> la réali<strong>sa</strong>tion<br />

5.1.4.1 Utili<strong>sa</strong>tion du feedback additionnel<br />

Généralités<br />

On mesure ici le nombre d’auto-évaluations où les pati<strong>en</strong>ts dans leur <strong>en</strong>semble (<strong>sa</strong>uf la première<br />

pas<strong>sa</strong>tion <strong>de</strong>s pati<strong>en</strong>ts du protocole, pour laquelle le spectrogramme n’est pas utilisé) ont modifié<br />

au moins un <strong>de</strong>s <strong>de</strong>ux sons sur les différ<strong>en</strong>tes échelles visuelles. Le feedback externe constitué du<br />

spectrogramme et du son amène à modifier plus <strong>de</strong> 7 fois sur 10 au moins un <strong>de</strong>s <strong>de</strong>ux sons pour<br />

l’échelle <strong>de</strong> clarté, et presque 7 fois sur 10 pour l’échelle <strong>de</strong> richesse. On note que ce pourc<strong>en</strong>tage<br />

est bi<strong>en</strong> plus élevé que pour la première pas<strong>sa</strong>tion <strong>de</strong>s pati<strong>en</strong>ts du protocole, qui, eux, modifi<strong>en</strong>t<br />

systématiquem<strong>en</strong>t l’attaque et le geste <strong>en</strong> ré<strong>en</strong>t<strong>en</strong>dant leur <strong>voix</strong>, mais la clarté et la richesse<br />

seulem<strong>en</strong>t dans 50% <strong>de</strong>s cas. On peut donc p<strong>en</strong>ser que c’est le spectrogramme qui donne <strong>de</strong>s<br />

informations pertin<strong>en</strong>tes aux pati<strong>en</strong>ts sur la clarté et la richesse <strong>de</strong> leur timbre.<br />

Un test rang <strong>de</strong> Wilcoxon <strong>en</strong>tre les données avant / après feedback nous permet égalem<strong>en</strong>t <strong>de</strong><br />

quantifier la significativité <strong>de</strong> l’indép<strong>en</strong>dance <strong>de</strong>s évaluations avant / après feedback. On recherche<br />

ici une indép<strong>en</strong>dance <strong>en</strong>tre les évaluations avant et après feedback, c’était à dire un p petit. (


le motif <strong>de</strong> remplis<strong>sa</strong>ge r<strong>en</strong>d compte <strong>de</strong> la significativité (valeur <strong>de</strong> p)<br />

<strong>de</strong>s différ<strong>en</strong>ces <strong>en</strong>tre les évaluations avec et <strong>sa</strong>ns feedback<br />

Dans 3 cas (27%) sur les 11, les pati<strong>en</strong>ts hors protocole n’ont pas pu évaluer la richesse <strong>de</strong> leur<br />

timbre avant le feedback auditif et visuel. Pour les 8 cas restants, le feedback est utilisé à 88% c’està-dire<br />

7 fois sur les 8. Au total, le feedback auditif et visuel apporte un gain 10 fois sur 11 (91%)<br />

Dans un cas sur les 8, une pati<strong>en</strong>te n’a pas évalué la clarté avant le feedback auditif et visuel, ce qui<br />

augm<strong>en</strong>te le nombre <strong>de</strong> cas où le feedback auditif et visuel modifie l’évaluation.<br />

Pour le feedback auditif et visuel, effet <strong>de</strong> l’appart<strong>en</strong>ance à un groupe (jury d’écoute, pati<strong>en</strong>ts<br />

hors protocole, pati<strong>en</strong>ts protocole)<br />

Les auditeurs du jury d’écoute se distingu<strong>en</strong>t par une beaucoup plus faible utili<strong>sa</strong>tion du<br />

spectrogramme pour modifier leurs évaluations sur l’échelle <strong>de</strong> la clarté, du geste et <strong>de</strong> la hauteur.<br />

En revanche ils l’utilis<strong>en</strong>t s<strong>en</strong>siblem<strong>en</strong>t plus pour l’échelle <strong>de</strong> l’int<strong>en</strong>sité.<br />

Les pati<strong>en</strong>ts hors protocole ont globalem<strong>en</strong>t plus modifié leurs évaluations. L’exercice était<br />

d’ailleurs <strong>en</strong> moy<strong>en</strong>ne beaucoup plus long pour ces pati<strong>en</strong>ts.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 58


5.1.4.2 Effet gratifiant du feedback additionnel<br />

Généralités<br />

Sur ce schéma, les effets gratifiants sont <strong>en</strong> positifs et les effets dévalori<strong>sa</strong>nts <strong>en</strong> négatif<br />

Effets dévalori<strong>sa</strong>nts (prise <strong>de</strong> consci<strong>en</strong>ce d’un défaut)<br />

Pour les pati<strong>en</strong>ts les modifications apportées à l’échelle « int<strong>en</strong>sité » s’éloign<strong>en</strong>t toujours <strong>de</strong><br />

l’objectif <strong>de</strong> l’exercice : après avoir p<strong>en</strong>sé avoir fait <strong>de</strong>s sons bi<strong>en</strong> différ<strong>en</strong>ciés <strong>en</strong> terme d’int<strong>en</strong>sité,<br />

les pati<strong>en</strong>ts révis<strong>en</strong>t leur jugem<strong>en</strong>t lorsqu’ils bénéfici<strong>en</strong>t du feedback (auditif et visuel). La hauteur<br />

égalem<strong>en</strong>t est modifiée, pour les pati<strong>en</strong>ts hors protocole, qui réalis<strong>en</strong>t égalem<strong>en</strong>t, <strong>en</strong> moy<strong>en</strong>ne, que<br />

leurs <strong>de</strong>ux sons ne sont pas toujours à la même hauteur, contrairem<strong>en</strong>t à l’objectif <strong>de</strong> l’exercice et<br />

ce qu’ils avai<strong>en</strong>t perçu <strong>sa</strong>ns feedback additionnel. Cet effet n’existe pas chez les pati<strong>en</strong>ts du<br />

protocole, qui ont un meilleur contrôle <strong>de</strong> leur <strong>voix</strong>.<br />

Effets gratifiants (prise <strong>de</strong> consci<strong>en</strong>ce d’une qualité, confiance <strong>en</strong> soi)<br />

Pour le feedback auditif et visuel, effet <strong>de</strong> l’appart<strong>en</strong>ance à un groupe (jury d’écoute, pati<strong>en</strong>ts<br />

hors protocole, pati<strong>en</strong>ts protocole)<br />

Dans tous les groupes, le feedback avec spectrogramme permet <strong>de</strong> juger <strong>de</strong> façon plus bi<strong>en</strong>veillante<br />

<strong>sa</strong> qualité d’attaque et dans une moindre mesure <strong>sa</strong> richesse du timbre. Pour les pati<strong>en</strong>ts hors<br />

protocole, la clarté et le geste sont impactés positivem<strong>en</strong>t égalem<strong>en</strong>t.<br />

Les auditeurs du jury d’écoute sont moins impactés par cet effet <strong>de</strong> gratification. On l’observe<br />

uniquem<strong>en</strong>t, dans une faible mesure, pour la richesse du timbre. On peut p<strong>en</strong>ser qu’ici le facteur<br />

personnel joue beaucoup dans le changem<strong>en</strong>t d’attitu<strong>de</strong> face à un son (Lescarmontier, 2012)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 59


Les comportem<strong>en</strong>ts <strong>de</strong>s pati<strong>en</strong>ts du protocole sont plus proches <strong>en</strong> moy<strong>en</strong>ne <strong>de</strong>s comportem<strong>en</strong>ts<br />

<strong>de</strong>s auditeurs du jury d’écoute que ceux <strong>de</strong>s pati<strong>en</strong>ts hors protocole.<br />

Différ<strong>en</strong>ce pour les pati<strong>en</strong>ts du protocole, <strong>en</strong>tre la première pas<strong>sa</strong>tion <strong>sa</strong>ns spectrogramme, et<br />

celles avec spectrogramme<br />

L’effet du feedback uniquem<strong>en</strong>t auditif est toujours <strong>en</strong> moy<strong>en</strong>ne dévalori<strong>sa</strong>nt, (<strong>sa</strong>uf pour la hauteur<br />

qui n’est jamais impactée par le feedback). Il est même systématiquem<strong>en</strong>t dévalori<strong>sa</strong>nt pour les<br />

échelles « int<strong>en</strong>sité » et « richesse ».<br />

La variable « richesse » est significativem<strong>en</strong>t modifiée lorsque le feedback additionnel est auditif et<br />

visuel plutôt que seulem<strong>en</strong>t auditif. Les pati<strong>en</strong>ts jug<strong>en</strong>t leur richesse <strong>de</strong> timbre meilleure alors que<br />

ce n’était pas le cas <strong>sa</strong>ns le spectrogramme. La qualité <strong>de</strong> l’attaque bénéficie égalem<strong>en</strong>t <strong>de</strong> ce<br />

mouvem<strong>en</strong>t vers une évaluation gratifiante.<br />

5.1.4.3 Ai<strong>de</strong> du feedback additionnel<br />

Le graphique ci-<strong>de</strong>ssous prés<strong>en</strong>te l’ai<strong>de</strong> (<strong>en</strong> positif) ou la gêne (<strong>en</strong> négatif) représ<strong>en</strong>tées par le<br />

feedback additionnel dans le cadre <strong>de</strong> la différ<strong>en</strong>ce <strong>de</strong> <strong>de</strong>ux sons pour l’int<strong>en</strong>sité et la hauteur, et<br />

pour les autres paramètres pour les sons eux-mêmes. Par définition, le feedback additionnel ai<strong>de</strong><br />

lorsque la modification apportée permet à la différ<strong>en</strong>ce <strong>de</strong>s <strong>de</strong>ux sons <strong>de</strong> se rapprocher <strong>de</strong> la<br />

différ<strong>en</strong>ce observée par les auditeurs du jury d’écoute, pour l’int<strong>en</strong>sité et la hauteur, ou lorsqu’il<br />

permet aux évaluations <strong>de</strong>s sons eux-mêmes d’être plus proches <strong>de</strong> le médiane <strong>de</strong> celles <strong>de</strong>s<br />

auditeurs du jury d’écoute.<br />

Jury Pati<strong>en</strong>ts hors protocoel Pati<strong>en</strong>ts protocole<br />

feedback auditif et visuel<br />

Pati<strong>en</strong>ts protocole<br />

feedback auditif<br />

En moy<strong>en</strong>ne, lorsque l’ajout du feedback auditif et visuel modifie les évaluations, il permet <strong>de</strong><br />

s’approcher <strong>de</strong> l’évaluation médiane (avec feedback visuel) <strong>de</strong>s auditeurs du jury d’écoute. Cela est<br />

particulièrem<strong>en</strong>t vrai pour la différ<strong>en</strong>ce d’int<strong>en</strong>sité, et, pour les pati<strong>en</strong>ts hors protocole, pour la<br />

différ<strong>en</strong>ce <strong>de</strong> hauteur, l’attaque (soufflé à dure) et dans une moindre mesure la clarté du timbre.<br />

Lorsque l’ajout du feedback auditif et visuel modifie les évaluations pour les pati<strong>en</strong>ts, il a plutôt<br />

comme conséqu<strong>en</strong>ce d’éloigner les évaluations <strong>de</strong>s pati<strong>en</strong>ts <strong>de</strong> l’évaluation <strong>de</strong>s auditeurs du jury<br />

d’écoute<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 60


La comparaison <strong>de</strong>s pas<strong>sa</strong>tions avec et <strong>sa</strong>ns spectrogramme pour les pati<strong>en</strong>ts du protocole t<strong>en</strong>d à<br />

montrer que c’est le spectrogramme qui permet d’évaluer plus justem<strong>en</strong>t la richesse du timbre. En<br />

revanche il est plutôt gênant pour la clarté du timbre et pour le geste.<br />

5.1.4.4 Mise <strong>en</strong> perspective erreurs / utili<strong>sa</strong>tion / ai<strong>de</strong> / gratification<br />

Richesse, clarté et qualité d’attaque<br />

Richesse du timbre<br />

Aidant ou gênant (notes<br />

brutes)<br />

Gratifiant ou<br />

dévalori<strong>sa</strong>nt<br />

mm % mm %<br />

Utili<strong>sa</strong>tion<br />

(modification <strong>de</strong> la<br />

différ<strong>en</strong>ce <strong>en</strong>tre<br />

<strong>de</strong>ux sons <strong>en</strong> %)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 61<br />

Erreurs fb1<br />

(notes brutes),<br />

<strong>en</strong> mm<br />

Jury 3,5 73% 2,1 64% 71%<br />

10,4<br />

pati<strong>en</strong>ts 1,1 64% 4,5 57% 69% => 84 %<br />

17,8<br />

Hors protocole -1,1 60% 8,2 60% 88% => 91%<br />

16,6<br />

Proto- Fb auditif et visuel 3,3 75% 0,7 50% 50%<br />

18,9<br />

cole Fback auditif -2,5 33% -14,6 50% 50%<br />

32,4<br />

Les pati<strong>en</strong>ts hors protocole ont <strong>en</strong> moy<strong>en</strong>ne davantage sous-évalué la richesse <strong>de</strong> leur timbre que<br />

les pati<strong>en</strong>ts du protocole. C’est pourquoi, <strong>en</strong> moy<strong>en</strong>ne, les feedback additionnels sont plus<br />

gratifiants que dans le cas <strong>de</strong>s pati<strong>en</strong>ts du protocole. Lorsqu’ils corrig<strong>en</strong>t leur évaluation, et même<br />

s’ils la corrig<strong>en</strong>t à la baisse, les pati<strong>en</strong>ts ont tous t<strong>en</strong>dance à s’accor<strong>de</strong>r une meilleure note que ce<br />

que les auditeurs du jury d’écoute évalu<strong>en</strong>t.


Clarté du timbre<br />

Aidant ou gênant<br />

(notes brutes)<br />

Gratifiant ou<br />

dévalori<strong>sa</strong>nt<br />

Mm % mm %<br />

Utili<strong>sa</strong>tion<br />

(modification <strong>de</strong> la<br />

différ<strong>en</strong>ce <strong>en</strong>tre <strong>de</strong>ux<br />

sons <strong>en</strong> %)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 62<br />

Erreurs fb1<br />

(notes brutes),<br />

<strong>en</strong> mm<br />

Jury 3,4 79% -0,2 40% 36%<br />

19,2<br />

pati<strong>en</strong>ts 3,7 57% 8,5 65% 74% => 89 %<br />

19,7<br />

Hors protocole 6,1 63% 17,6 81% 82% => 91 %<br />

22,7<br />

Proto- Fb auditif et visuel 0,4 43% -3,9 50% 63% => 75 %<br />

12,4<br />

cole Fback auditif 5,1 100% -0,1 0% 50%<br />

23,1<br />

L’effet est <strong>en</strong>core plus net pour la clarté du timbre Les pati<strong>en</strong>ts hors protocole utilis<strong>en</strong>t beaucoup le<br />

feedback pour corriger l’échelle clarté, et dans 63 % <strong>de</strong>s cas, la modification est gratifiante pour<br />

eux, avec une moy<strong>en</strong>ne <strong>de</strong> 17,6 mm vers un timbre peu altéré, qui est la plus gran<strong>de</strong> modification<br />

<strong>de</strong> cette échelle. La modification permet égalem<strong>en</strong>t à leurs évaluations <strong>de</strong> s’approcher <strong>de</strong> celles du<br />

jury d’écoute. Dans une moindre mesure, le feedback ai<strong>de</strong> les pati<strong>en</strong>ts du protocole à rev<strong>en</strong>ir au<br />

niveau du jury d’écoute. La différ<strong>en</strong>ce <strong>en</strong>tre ces <strong>de</strong>ux groupes provi<strong>en</strong>t surtout du fait que les<br />

pati<strong>en</strong>ts du protocole sur-estim<strong>en</strong>t <strong>en</strong> moy<strong>en</strong>ne beaucoup plus la clarté <strong>de</strong> leur timbre que les<br />

pati<strong>en</strong>ts hors protocole.<br />

Qualité d’attaque<br />

Jury<br />

pati<strong>en</strong>ts<br />

Hors protocole<br />

Proto- Fb auditif et visuel<br />

cole Fback auditif<br />

Aidant ou gênant<br />

(notes brutes)<br />

Gratifiant ou<br />

dévalori<strong>sa</strong>nt<br />

mm % mm %<br />

Utili<strong>sa</strong>tion<br />

(modification <strong>de</strong> la<br />

différ<strong>en</strong>ce <strong>en</strong>tre <strong>de</strong>ux<br />

sons <strong>en</strong> %)<br />

Erreurs fb1<br />

(notes brutes),<br />

<strong>en</strong> mm<br />

2,3 68%<br />

1,8 56% 50%<br />

9,7<br />

3,3 47%<br />

9,5 74% 58%<br />

19,4<br />

1,5 50 %<br />

12,4 92% 64%<br />

16,7<br />

5,8 43%<br />

5,6 43% 50%<br />

22,8<br />

-1,2 20%<br />

-1,9 20% 100%<br />

31,8<br />

Pour l’attaque, le même effet est <strong>de</strong> nouveau observé : les pati<strong>en</strong>ts hors protocole sur-estim<strong>en</strong>t la<br />

qualité <strong>de</strong> leur attaque lorsqu’ils utilis<strong>en</strong>t le feedback auditif et visuel par rapport aux évaluations<br />

<strong>de</strong>s auditeurs du jury d’écoute. Cet effet n’est pas retrouvé pour les pati<strong>en</strong>ts du protocole.


Différ<strong>en</strong>ce d’int<strong>en</strong>sité<br />

Aidant ou gênant<br />

(différ<strong>en</strong>ce)<br />

Gratifiant ou<br />

dévalori<strong>sa</strong>nt<br />

mm % mm %<br />

Utili<strong>sa</strong>tion<br />

(modification <strong>de</strong> la<br />

différ<strong>en</strong>ce <strong>en</strong>tre<br />

<strong>de</strong>ux sons <strong>en</strong> %)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 63<br />

Erreurs fb1<br />

(différ<strong>en</strong>ce),<br />

<strong>en</strong> mm<br />

50 % 42% 57%<br />

71 % 0% 47%<br />

75 % 0% 45%<br />

Jury<br />

0,5 -0,5 7,6<br />

pati<strong>en</strong>ts<br />

3,5 -11,1 16,3<br />

Hors protocole<br />

1,5 -13,5 18,4<br />

Proto- Fb auditif et visuel 6,2 67 % -7,7 0% 50%<br />

13,7<br />

cole Fback auditif -1,0 0% -4,0 0% 50%<br />

7,3<br />

On observe que systématiquem<strong>en</strong>t lorsqu’il est utilisé pour cette échelle (<strong>en</strong>viron une fois sur<br />

<strong>de</strong>ux), le feedback additionnel <strong>en</strong>traîne les pati<strong>en</strong>ts à estimer que les <strong>de</strong>ux sons qu’ils ont émis sont<br />

plus proches <strong>en</strong> int<strong>en</strong>sité qu’ils ne l’avai<strong>en</strong>t d’abord jugé. Le feedback auditif et visuel t<strong>en</strong>d à<br />

comp<strong>en</strong>ser l’erreur faite au départ, lorsque, juste après avoir réalisé l’exercice, les pati<strong>en</strong>ts p<strong>en</strong>s<strong>en</strong>t<br />

avoir réalisé <strong>de</strong>ux sons bi<strong>en</strong> distincts <strong>en</strong> terme d’int<strong>en</strong>sité, ce qui était <strong>de</strong>mandé. L’effet dévalori<strong>sa</strong>nt<br />

du feedback est le plus fort constaté parmi toutes les autres variables et tous groupes confondus.<br />

On note particulièrem<strong>en</strong>t une différ<strong>en</strong>ce dans l’erreur commise par les pati<strong>en</strong>ts (16,3 mm <strong>en</strong><br />

moy<strong>en</strong>ne pour la différ<strong>en</strong>ce <strong>en</strong>tre les sons) avant le feedback par rapport à l’erreur du jury (7,6 mm<br />

<strong>en</strong> moy<strong>en</strong>ne). Cela montre comme précé<strong>de</strong>mm<strong>en</strong>t que le fait d’<strong>en</strong>t<strong>en</strong>dre le son, pour les auditeurs<br />

du jury d’écoute, permet <strong>de</strong> bi<strong>en</strong> qualifier l’int<strong>en</strong>sité <strong>de</strong>s sons <strong>en</strong>t<strong>en</strong>dus.<br />

Geste<br />

Jury<br />

Aidant ou gênant<br />

(notes brutes)<br />

Gratifiant ou<br />

dévalori<strong>sa</strong>nt<br />

mm % mm %<br />

Utili<strong>sa</strong>tion<br />

(modification <strong>de</strong> la<br />

différ<strong>en</strong>ce <strong>en</strong>tre<br />

<strong>de</strong>ux sons <strong>en</strong> %)<br />

Erreurs fb1<br />

(notes brutes),<br />

<strong>en</strong> mm<br />

71% 44% 12%<br />

0,8 0,1 13,0<br />

pati<strong>en</strong>ts -2,3 38% 3,9 69% 37%<br />

13,7<br />

Hors protocole -1,5 43% 7,1 86% 36%<br />

17,6<br />

Proto- Fb auditif et visuel -3,4 33% -0,5 50% 38%<br />

8,9<br />

cole Fback auditif 8,2 80% -12,4 20% 100%<br />

28,7<br />

Les auditeurs du jury d’écoute ont globalem<strong>en</strong>t peu utilisé cette échelle. Les pati<strong>en</strong>ts l’ont utilisée<br />

d’avantage, mais la plupart du temps, la modification <strong>de</strong> l’évaluation les éloignait <strong>de</strong> l’évaluation<br />

<strong>de</strong>s auditeurs du jury d’écoute.<br />

L’effet positif pour le jury d’écoute est un effet <strong>de</strong> construction <strong>de</strong> la mesure (les auditeurs du jury<br />

d’écoute s’approch<strong>en</strong>t forcém<strong>en</strong>t, <strong>en</strong> moy<strong>en</strong>ne et pour les notes brutes, <strong>de</strong> la médiane <strong>de</strong>s<br />

auditeurs du jury d’écoute). En revanche, l’effet positif constaté pour les pati<strong>en</strong>ts du protocole<br />

lorsqu’ils n’utilis<strong>en</strong>t pas le spectrogramme (première pas<strong>sa</strong>tion) t<strong>en</strong>d à montrer que les pati<strong>en</strong>ts<br />

sont gênés par l’image pour juger au mieux <strong>de</strong> leur geste vocal. Cep<strong>en</strong>dant on peut nuancer cette<br />

hypothèse car pour la première pas<strong>sa</strong>tion l’erreur faite par les pati<strong>en</strong>ts (28,7 mm, c’est la plus<br />

gran<strong>de</strong> erreur constatée) est beaucoup plus importante que dans le cas où ils regar<strong>de</strong>nt le<br />

spectrogramme.


Différ<strong>en</strong>ce <strong>de</strong> hauteur<br />

Jury<br />

pati<strong>en</strong>ts<br />

Aidant ou gênant<br />

(différ<strong>en</strong>ce)<br />

Gratifiant ou<br />

dévalori<strong>sa</strong>nt<br />

mm % mm %<br />

Utili<strong>sa</strong>tion<br />

(modification <strong>de</strong> la<br />

différ<strong>en</strong>ce <strong>en</strong>tre <strong>de</strong>ux<br />

sons <strong>en</strong> %)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 64<br />

Erreurs fb1<br />

(différ<strong>en</strong>ce),<br />

<strong>en</strong> mm<br />

0,1 33%<br />

0,0 60% 4%<br />

7,0<br />

3,1 73%<br />

-1,0 43% 37%<br />

18,0<br />

Hors protocole 5,3 73% -1,7 43% 64%<br />

22,0<br />

Protocole Non utilisé 0%<br />

12,9<br />

Les pati<strong>en</strong>ts protocole n’ont jamais modifié leur évaluation <strong>de</strong> la hauteur. Les pati<strong>en</strong>ts protocole ont<br />

presque toujours émis <strong>de</strong>s sons à la même hauteur, les données ne sont donc pas pertin<strong>en</strong>tes ici.<br />

De même les auditeurs du jury d’écoute ont fait <strong>de</strong>s erreurs minimes à l’écoute, ce qui <strong>en</strong>traîne <strong>de</strong>s<br />

données difficilem<strong>en</strong>t exploitable <strong>en</strong> terme d’apport du spectrogramme.<br />

En revanche, les pati<strong>en</strong>ts hors protocole ont fait <strong>de</strong>s erreurs d’appréciation importantes (22 mm <strong>en</strong><br />

moy<strong>en</strong>ne), qui ont nécessité l’ai<strong>de</strong> du feedback, permettant <strong>de</strong> corriger <strong>en</strong> moy<strong>en</strong>ne 5,3 mm <strong>de</strong><br />

cette erreur.<br />

5.1.4.5 Corrélations <strong>en</strong>tre les évaluations <strong>de</strong>s différ<strong>en</strong>ts paramètres<br />

Le diagramme suivant prés<strong>en</strong>te les corrélation <strong>en</strong>tre les différ<strong>en</strong>ts paramètres, pour les auditeurs<br />

du jury d’écoute (<strong>en</strong> violet) et pour les pati<strong>en</strong>ts (<strong>en</strong> vert). Les « => » indiqu<strong>en</strong>t l’évolution <strong>de</strong> la<br />

corrélation <strong>en</strong>tre la première et la <strong>de</strong>uxième condition <strong>de</strong> feedback.<br />

Richesse et int<strong>en</strong>sité<br />

Le feedback externe abolit presque toutes les corrélations à la richesse du timbre, <strong>sa</strong>uf celle <strong>de</strong><br />

l’int<strong>en</strong>sité. Le feedback semble permettre aux pati<strong>en</strong>ts <strong>de</strong> distinguer ce qui relève <strong>de</strong> l’attaque <strong>de</strong> ce<br />

qui relève du son t<strong>en</strong>u, ce qui fait chuter la corrélation (0.41** à 0.28**) <strong>en</strong>tre richesse et attaque<br />

soufflé / dure. Le même effet s’observe dans la corrélation <strong>en</strong>tre richesse et clarté (0.77** <strong>sa</strong>ns<br />

feedback, aucun avec le feedback auditif et visuel). On suppose que le fait d’objectiver par l’image,<br />

d’une part la richesse et d’autre part la clarté, permet <strong>de</strong> dé-corréler ces <strong>de</strong>ux paramètres.


La corrélation <strong>en</strong>tre l’int<strong>en</strong>sité et la richesse du son s’explique par le fait qu’on visualise davantage<br />

d’harmoniques lorsque le son est fort, mais égalem<strong>en</strong>t parce qu’un son fort implique un quoti<strong>en</strong>t <strong>de</strong><br />

fermeture glottique augm<strong>en</strong>té, ce qui d’après Leipp augm<strong>en</strong>te le nombre d’harmoniques « plus le<br />

rapport <strong>en</strong>tre durée d’obturation et d’ouverture <strong>de</strong> la glotte est grand, plus le timbre comportera<br />

d’harmoniques » (Leipp, 2010, p. 283)<br />

Int<strong>en</strong>sité et attaque<br />

Les pati<strong>en</strong>ts ont plus t<strong>en</strong>dance à lier int<strong>en</strong>sité et l’attaque dure (0,68 **), au risque <strong>de</strong> les<br />

confondre. Le feedback auditif et visuel remet le niveau <strong>de</strong> la corrélation (0,50**) au niveau <strong>de</strong> celle<br />

<strong>de</strong>s auditeurs du jury d’écoute. (0,46**). En même temps, le feedback auditif et visuel r<strong>en</strong>d la<br />

corrélation significative et forte pour les pati<strong>en</strong>ts <strong>en</strong>tre une int<strong>en</strong>sité forte et une mauvaise qualité<br />

d’attaque (0,38**), ce qui, <strong>de</strong> nouveau, met la corrélation au niveau <strong>de</strong> celle <strong>de</strong>s auditeurs du jury<br />

d’écoute (0,35**)<br />

Int<strong>en</strong>sité et clarté<br />

Les données <strong>de</strong> la littérature lais<strong>sa</strong>i<strong>en</strong>t att<strong>en</strong>dre que le son fort serait plus difficile à produire que le<br />

son faible. Les auteurs décriv<strong>en</strong>t un quoti<strong>en</strong>t <strong>de</strong> fermeture glottique augm<strong>en</strong>té et un effort vocal<br />

plus important pour les sons d’int<strong>en</strong>sité forte (Dejonckere et al., 2001, p. 79; Giovanni & Aumelas,<br />

2004, pp. 34, 41). Le contraire a été observé dans notre étu<strong>de</strong> : l’exercice d’auto-analyse a été<br />

l’occasion par <strong>de</strong>ux fois d’une prise <strong>de</strong> consci<strong>en</strong>ce qu’il était plus facile d’émettre une <strong>voix</strong> claire à<br />

int<strong>en</strong>sité plus forte. De plus, on ne trouve pas <strong>de</strong> corrélation importante <strong>en</strong>tre les paramètres clarté<br />

et int<strong>en</strong>sité. (corrélation 0,11 p=0,02*)<br />

Clarté et hauteur<br />

Les pati<strong>en</strong>ts li<strong>en</strong>t beaucoup la clarté avec la hauteur (0.41**) avant <strong>de</strong> bénéficier d’un feedback<br />

auditif et visuel (0.28). Celui-ci modifie beaucoup leur jugem<strong>en</strong>t, et a t<strong>en</strong>dance à rapprocher leur<br />

comportem<strong>en</strong>t <strong>de</strong> celui <strong>de</strong>s auditeurs du jury d’écoute. On peut p<strong>en</strong>ser que c’est le feedback auditif<br />

ici qui joue le plus, <strong>en</strong> permettant aux pati<strong>en</strong>ts <strong>de</strong> pr<strong>en</strong>dre consci<strong>en</strong>ce <strong>de</strong> la hauteur du son qu’ils<br />

ont produit.<br />

Isolation <strong>de</strong> l’évaluation du geste<br />

Pour les pati<strong>en</strong>ts, le feedback externe fait beaucoup baisser la corrélation (<strong>de</strong> 0.71** à 0.41**)<br />

<strong>en</strong>tre le geste et la clarté. L’effet existe aussi chez les auditeurs du jury d’écoute, mais celui-ci gar<strong>de</strong><br />

tout <strong>de</strong> même une corrélation <strong>de</strong> 0,78**. Ici le feedback externe conduit les pati<strong>en</strong>ts à s’éloigner du<br />

comportem<strong>en</strong>t <strong>de</strong>s auditeurs du jury d’écoute.<br />

Pour tous les groupes, l’ajout du feedback fait perdre tout significativité <strong>de</strong> la corrélation <strong>en</strong>tre le<br />

geste et la richesse du timbre. L’effet le plus frappant est observé chez les pati<strong>en</strong>ts pour lesquels<br />

l’évaluation du geste avant feedback découle directem<strong>en</strong>t <strong>de</strong> celle <strong>de</strong> la richesse (corrélation 0,69**<br />

<strong>sa</strong>ns feedback, <strong>sa</strong>ns corrélation significative avec). Le fait <strong>de</strong> disposer <strong>de</strong>s feedbacks <strong>en</strong>traîne<br />

égalem<strong>en</strong>t une moins bonne corrélation <strong>en</strong>tre le geste et la clarté du timbre, pour les pati<strong>en</strong>ts<br />

(0.71** à 0.41**), et dans une moindre mesure pour les auditeurs du jury d’écoute. (0,85** à<br />

0,78**)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 65


5.1.4.6 Conclusion<br />

Les variables les plus impactées par un feedback auditif et visuel sont la richesse, la clarté, la qualité<br />

d’attaque. Ces différ<strong>en</strong>tes variables sont jugées plus finem<strong>en</strong>t indép<strong>en</strong>damm<strong>en</strong>t les unes <strong>de</strong>s<br />

autres. Les feedback auditifs et visuels rapproch<strong>en</strong>t les corrélations observées dans les variables<br />

évaluées par les pati<strong>en</strong>ts <strong>de</strong> celles observées dans les variables évaluées par les auditeurs du jury<br />

d’écoute.<br />

L’ajout <strong>de</strong>s feedbacks externes permet <strong>de</strong> se valoriser (pour la richesse du timbre, la qualité<br />

d’attaque pour tous les pati<strong>en</strong>ts, pour la clarté et le geste pour les pati<strong>en</strong>ts hors protocole). Quand<br />

ce n’est pas le cas (différ<strong>en</strong>ce d’int<strong>en</strong>sité et <strong>de</strong> hauteur), cela s’explique par une meilleure<br />

évaluation <strong>de</strong> ces paramètres, <strong>en</strong> particulier pour les pati<strong>en</strong>ts hors protocole.<br />

Aidant ou gênant Gratifiant ou dévalori<strong>sa</strong>nt<br />

Hors protocole Protocole Hors protocole protocole<br />

Différ<strong>en</strong>ce d’int<strong>en</strong>sité ++ + -- --<br />

Différ<strong>en</strong>ce <strong>de</strong> hauteur ++ 0 - 0<br />

Caractère (soufflé /<br />

+ (+)<br />

dure) <strong>de</strong> l’attaque<br />

Qualité <strong>de</strong> l’attaque (+) (+) ++ +<br />

Clarté 0 0 ++ -<br />

Richesse 0 0 + (+)<br />

Geste - -- ++ 0<br />

5.2 Evolution <strong>de</strong>s pati<strong>en</strong>ts protocole<br />

5.2.1 bilan vocal<br />

5.2.1.1 Evaluation objective<br />

Les graphiques prés<strong>en</strong>tant les résultats sont disponibles <strong>en</strong> annexe.<br />

Pati<strong>en</strong>te A Pati<strong>en</strong>te B Pati<strong>en</strong>te C Pati<strong>en</strong>te D<br />

Dynamique d’int<strong>en</strong>sité - -- -- -<br />

Et<strong>en</strong>due <strong>vocale</strong> ++ + + ++<br />

Jitter + + ++ +<br />

Shimmer 0 0 - -<br />

Rapport signal sur bruit 0 0 + +<br />

Evaluation du singing formant - + ++ +<br />

Rapport <strong>de</strong>s TMP z / s - 0 - -<br />

TMP sur /a/ - - + +<br />

(+ représ<strong>en</strong>te une amélioration du paramètre : par exemple, un jitter moindre, ou un TMP sur /a/ plus grand)<br />

L’évaluation post-protocole montre pour toutes les pati<strong>en</strong>tes une meilleure ét<strong>en</strong>due <strong>vocale</strong> et un<br />

jitter moins important. Le rapport signal sur bruit a une t<strong>en</strong>dance à l’amélioration. Cep<strong>en</strong>dant ces<br />

données sont contrebalancées par d’autres paramètres qui eux se détérior<strong>en</strong>t : dynamique<br />

d’int<strong>en</strong>sité, rapport z/s, shimmer. On note une augm<strong>en</strong>tation <strong>de</strong> la mesure du singing formant pour<br />

toutes les pati<strong>en</strong>tes <strong>sa</strong>uf la pati<strong>en</strong>te A, qui a pris une note beaucoup plus basse lors du bilan vocal<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 66


post-protocole, ce qui peut expliquer qu’elle fasse moins apparaître d’harmoniques dans la zone 2 –<br />

5 kHz. Pour l’ét<strong>en</strong>due <strong>vocale</strong>, on fait l’hypothèse que les conditions <strong>de</strong> pas<strong>sa</strong>tion (sirène<br />

asc<strong>en</strong>dante) influ<strong>en</strong>c<strong>en</strong>t les résultats dans le cadre <strong>de</strong> pati<strong>en</strong>tes chanteuses qui n’ont pas <strong>de</strong><br />

restriction <strong>de</strong> leur ét<strong>en</strong>due <strong>vocale</strong>. Il nous a semblé que le fait d’être plus <strong>en</strong> confiance la <strong>de</strong>uxième<br />

fois permettait d’atteindre <strong>de</strong>s notes plus aigues, que les pati<strong>en</strong>tes semblai<strong>en</strong>t ne pas se permettre<br />

la première fois.<br />

En conclusion, on observe un effet bénéfique du travail effectué lors du protocole, assez bi<strong>en</strong><br />

distribué selon les pati<strong>en</strong>tes, avec cep<strong>en</strong>dant <strong>de</strong>s résultats contrastés suivant les paramètres<br />

ret<strong>en</strong>us, et un bénéfice plus limité pour la pati<strong>en</strong>te A.<br />

5.2.1.2 Evaluation perceptive<br />

Accord<br />

interjuge <strong>de</strong><br />

Kruskall-Wallis<br />

Pati<strong>en</strong>t A Pati<strong>en</strong>t B Pati<strong>en</strong>t C Pati<strong>en</strong>t D<br />

Moy<strong>en</strong>ne Ecarttype<br />

Moy<strong>en</strong>ne Ecarttype<br />

Moy<strong>en</strong>ne Ecarttype<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 67<br />

Moy<strong>en</strong>ne Ecarttype<br />

p H<br />

G 0,6861 1,483 0,4 0,3 1,7 0,7 1 0,4 0,1 0,3<br />

R 0,5847 1,941 0,1 0,3 0 0 0,3 0,3 0 0<br />

B 0,6459 1,660 0,1 0,3 1,6 0,8 1 0,7 0,4 0,3<br />

A 0,7288 1,301 0 0 1,1 0,3 0,6 0,8 0 0<br />

S 0,5395 2,162 0,4 0,3 0,6 0,9 0,4 0,5 0 0<br />

I 0,3426 3,336 0,6 0,6 1,1 0,8 0,8 0,5 0,1 0,3<br />

« A l’heure actuelle, les résultats prés<strong>en</strong>tés dans a littérature font état d’<strong>en</strong>viron 75% <strong>de</strong><br />

reproductibilité intra-individuelle et 70% <strong>en</strong> interindividuel »(Joana Revis, 2004), ces résultats sont<br />

donc <strong>sa</strong>tisfai<strong>sa</strong>nts pour le Gra<strong>de</strong> G, le souffle B et l’asthénie A [[<strong>sa</strong>uf qu’il faudrait vraim<strong>en</strong>t calculer<br />

un Kappa, <strong>en</strong> rev<strong>en</strong>ant à une échelle à 4 gra<strong>de</strong>s]]<br />

Evaluation<br />

subjective<br />

<strong>de</strong>s progrès<br />

Accord interjuge<br />

(Kruskall-Wallis)<br />

Pati<strong>en</strong>t A Pati<strong>en</strong>t B Pati<strong>en</strong>t C Pati<strong>en</strong>t D<br />

Moy<strong>en</strong>ne <br />

Ecarttype <br />

Moy<strong>en</strong>ne <br />

Ecarttype <br />

Moy<strong>en</strong>ne <br />

Ecarttype <br />

Moy<strong>en</strong>ne <br />

Ecarttype<br />

p H<br />

Voix parlée 0,6263 1,748 -0,1 0,3 -0,3 0,5 -0,5 0,6 0 0,8<br />

Voix d’appel 0,5562 2,079 1,5 1 -0,3 0,5 1,1 0,9 1,3 1<br />

3 attaques 0,2714 3,910 0,5 1,3 -1,3 0,5 0,5 1 0,5 0,6<br />

Les évaluateurs ont été gênés par les conditions d’<strong>en</strong>registrem<strong>en</strong>t qui étai<strong>en</strong>t différ<strong>en</strong>tes d’un<br />

<strong>en</strong>registrem<strong>en</strong>t à l’autre. On ne note pas d’évolution significative. Les <strong>voix</strong> parlées ont été évaluées<br />

légèrem<strong>en</strong>t moins bi<strong>en</strong> <strong>en</strong> post-protocole et les 3 attaques plutôt mieux <strong>sa</strong>uf pour la pati<strong>en</strong>te B.<br />

Cep<strong>en</strong>dant, la <strong>voix</strong> d’appel plutôt améliorée <strong>en</strong> fin <strong>de</strong> protocole, et la pati<strong>en</strong>te D est<br />

systématiquem<strong>en</strong>t mieux notée <strong>en</strong> fin <strong>de</strong> protocole. On ne peut pas affirmer que ces observations<br />

résult<strong>en</strong>t directem<strong>en</strong>t et exclusivem<strong>en</strong>t <strong>de</strong> notre travail auprès <strong>de</strong>s pati<strong>en</strong>ts.<br />

5.2.2 Evolution <strong>de</strong> l’exercice d’auto-analyse<br />

Les mesures objectives (jitter / shimmer / rapport signal sur bruit), observées sur le son le plus fort<br />

<strong>de</strong> chaque exercice d’auto-évaluation, montr<strong>en</strong>t une évolution positive pour le paramètres<br />

« rapport signal sur bruit », qui augm<strong>en</strong>te 6 fois sur 8, et reste quasim<strong>en</strong>t constant une fois.


On ne trouve pas d’effet d’appr<strong>en</strong>tis<strong>sa</strong>ge vis-à-vis du spectrogramme. On ne trouve pas d’évolution<br />

systématique vers un exercice mieux réussi, ou <strong>de</strong>s sons plus adaptés. On ne trouve pas d’évolution<br />

systématique <strong>de</strong> l’erreur, ni l’ai<strong>de</strong> ni <strong>de</strong> la gratification, <strong>sa</strong>uf pour la variable « différ<strong>en</strong>ce<br />

d’int<strong>en</strong>sité », où la gratification augm<strong>en</strong>te quasim<strong>en</strong>t systématiquem<strong>en</strong>t<br />

-25,0<br />

-20,0<br />

-15,0<br />

-10,0<br />

-5,0<br />

0,0<br />

évolution <strong>de</strong> la gratification sur la différ<strong>en</strong>ce d'int<strong>en</strong>sité<br />

pati<strong>en</strong>te A pati<strong>en</strong>te B pati<strong>en</strong>te C pati<strong>en</strong>te D<br />

5.2.3 Modification <strong>de</strong> la façon <strong>de</strong> voir <strong>sa</strong> <strong>voix</strong><br />

auto-analyse 1<br />

auto-analyse 2<br />

auto-analyse 3<br />

5.2.3.1 Evolution <strong>de</strong>s questionnaires d’auto-évaluation<br />

A la première évaluation, c’est surtout la <strong>voix</strong> parlée qui a été évaluée, du fait notamm<strong>en</strong>t que<br />

certains auteurs comme Ros<strong>en</strong> et Murry (2000) not<strong>en</strong>t que le VHI n’est pas s<strong>en</strong>sible pour les sujets<br />

dysodiques (pour lesquels la plainte concerne la <strong>voix</strong> chantée). Ils relèv<strong>en</strong>t cinq items pertin<strong>en</strong>ts sur<br />

les tr<strong>en</strong>te.<br />

Après les séances du protocole et du fait que la population du protocole était au moins autant<br />

dysodique que dysphonique, il est apparu néces<strong>sa</strong>ire <strong>de</strong> faire une distinction <strong>en</strong>tre les <strong>de</strong>ux u<strong>sa</strong>ges.<br />

Avant Après<br />

Pati<strong>en</strong>te<br />

A<br />

VHI-10<br />

Relation à <strong>sa</strong> <strong>voix</strong><br />

% <strong>de</strong> <strong>sa</strong>tisfaction<br />

<strong>voix</strong> <strong>voix</strong> <strong>voix</strong><br />

parlée chantée parlée<br />

11 ? 6<br />

3<br />

80 %<br />

<strong>voix</strong><br />

chantée<br />

8<br />

4<br />

Les scores sont plutôt<br />

meilleurs pour le VHI-10,<br />

mais souv<strong>en</strong>t moins bons<br />

pour le questionnaire <strong>de</strong><br />

relation à <strong>sa</strong> <strong>voix</strong>.<br />

Pati<strong>en</strong>te<br />

B<br />

VHI-10<br />

Relation à <strong>sa</strong> <strong>voix</strong><br />

% <strong>de</strong> <strong>sa</strong>tisfaction<br />

21<br />

11<br />

40 %<br />

?<br />

10<br />

50 %<br />

15<br />

8<br />

50 %<br />

9<br />

5<br />

60 %<br />

En particulier les réponses<br />

« j’ai peur que ma <strong>voix</strong> me<br />

Pati<strong>en</strong>te<br />

C<br />

VHI-10<br />

Relation à <strong>sa</strong> <strong>voix</strong><br />

% <strong>de</strong> <strong>sa</strong>tisfaction<br />

25 ?<br />

6<br />

60 % (10 - 100)<br />

24<br />

8<br />

65 %<br />

?<br />

9<br />

trahisse » sont<br />

systématiquem<strong>en</strong>t moins<br />

bonnes à l’issue du protocole<br />

Pati<strong>en</strong>te<br />

D<br />

VHI-10<br />

Relation à <strong>sa</strong> <strong>voix</strong><br />

% <strong>de</strong> <strong>sa</strong>tisfaction 80 %<br />

2<br />

3<br />

65 %<br />

0<br />

2<br />

90 %<br />

5<br />

3<br />

78 %<br />

En revanche, 3 pati<strong>en</strong>tes sur 4 sont passées, pour l’affirmation « je dois forcer pour produire la<br />

<strong>voix</strong> » <strong>de</strong> « parfois » à « jamais », et 3 pati<strong>en</strong>tes sur 4 sont moins tracassées par leur problème <strong>de</strong><br />

<strong>voix</strong>. La quatrième (pati<strong>en</strong>te D) avait répondu avant le protocole qu’elle ne se tracas<strong>sa</strong>it jamais pour<br />

son problème <strong>de</strong> <strong>voix</strong>, elle a modifié son jugem<strong>en</strong>t après le traitem<strong>en</strong>t concernant la <strong>voix</strong> chantée.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 68


Cela s’explique par le fait qu’elle explore <strong>sa</strong> <strong>voix</strong> <strong>en</strong> ce mom<strong>en</strong>t <strong>de</strong> façon très précise du fait <strong>de</strong> son<br />

changem<strong>en</strong>t d’ori<strong>en</strong>tation professionnelle.<br />

La pati<strong>en</strong>te B est celle qui est la plus positive à l’issue du protocole. La pati<strong>en</strong>te C a <strong>de</strong>s résultats au<br />

questionnaire « relation à <strong>sa</strong> <strong>voix</strong> » bi<strong>en</strong> moins bons à l’issue du protocole, qui peuv<strong>en</strong>t être dus à<br />

un contexte personnel indép<strong>en</strong>dant <strong>de</strong> notre étu<strong>de</strong> au mom<strong>en</strong>t <strong>de</strong> l’évaluation <strong>de</strong> fin <strong>de</strong> protocole<br />

Les scores au VHI-10 et au questionnaire « relation à <strong>sa</strong> <strong>voix</strong> » sont cohér<strong>en</strong>ts : plus les pati<strong>en</strong>tes se<br />

s<strong>en</strong>t<strong>en</strong>t handicapées par leur <strong>voix</strong>, plus leur relation à leur <strong>voix</strong> est difficile (<strong>sa</strong>uf un échange avant le<br />

protocole <strong>en</strong>tre pati<strong>en</strong>te B et C) Le pourc<strong>en</strong>tage <strong>de</strong> <strong>sa</strong>tisfaction est corrélé négativem<strong>en</strong>t aux scores,<br />

<strong>sa</strong>uf pour la pati<strong>en</strong>te B qui se donne un pourc<strong>en</strong>tage <strong>de</strong> <strong>sa</strong>tisfaction relativem<strong>en</strong>t bas par rapport à<br />

ses scores aux questionnaires.<br />

5.2.3.2 Liste d’adjectifs<br />

Nous avons classé les adjectifs dans <strong>de</strong>s caractéristiques « positives » systématiquem<strong>en</strong>t si au moins<br />

un pati<strong>en</strong>t l’avait cité comme caractéristique souhaitée (« la <strong>voix</strong> que j’aimerais avoir »). Nous y<br />

avons ajouté les adjectifs suivant, qui n’avai<strong>en</strong>t pas été cités comme caractéristiques souhaitées,<br />

que nous avons considérés comme plutôt positives : « animée », « nuancée », « énergique »,<br />

« ferme », « brillante ». Les autres adjectifs (qui n’ont jamais été cités comme souhaitables pour la<br />

<strong>voix</strong>) ont été considérés comme négatifs, à l’exclusion <strong>de</strong>s termes suivants qui ont été considérés<br />

comme neutres : « grave », « moy<strong>en</strong>ne », « haute », « aigue », « <strong>de</strong> colorature », « <strong>de</strong> soprano »,<br />

qui correspon<strong>de</strong>nt à une <strong>de</strong>scription <strong>de</strong> tessiture, et <strong>de</strong> « humble », « métallique », « pointue »,<br />

« mordante », qui peuv<strong>en</strong>t être considérés alternativem<strong>en</strong>t comme positives ou négatives.<br />

On constate au global 33 caractéristiques qui, lorsqu’ils font l’objet d’un changem<strong>en</strong>t, sont toujours<br />

modifiés <strong>de</strong> façon positive (une caractéristique positive gagnée ou une caractéristique négative<br />

perdue), pour 14 caractéristiques qui, lorsqu’ils font l’objet d’un changem<strong>en</strong>t, sont toujours<br />

modifiées <strong>de</strong> façon négative (mouvem<strong>en</strong>t inverse). Les pati<strong>en</strong>ts ont donc une t<strong>en</strong>dance à accor<strong>de</strong>r à<br />

leur <strong>voix</strong>, après les séances, globalem<strong>en</strong>t plus <strong>de</strong> qualificatifs positifs et moins <strong>de</strong> qualificatifs<br />

négatifs.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 69


Lég<strong>en</strong><strong>de</strong> du tableau : Caractéristique citée par <strong>de</strong>ux, par trois / Pour les caractéristiques gagnées :<br />

souhaités par la personne qui l’a gagné, par au moins une autre personne<br />

Positive<br />

Négative<br />

Caractéristique gagnée Caractéristique perdue<br />

Energique, ron<strong>de</strong>,<br />

nuancée claire, douée,<br />

agréable, ample, riche,<br />

émouvante, assurée<br />

sonore, sucrée, chantée,<br />

régulière, ferme, forte,<br />

spontanée, animée,<br />

agitée, effrayante,<br />

<strong>sa</strong>ccadée, voilée, âpre<br />

Neutre métallique,<br />

Gaie, moelleuse, chau<strong>de</strong>,<br />

cares<strong>sa</strong>nte, attirante,<br />

belle, apai<strong>sa</strong>nte, douce,<br />

éclatante<br />

Atone, blanche, Insipi<strong>de</strong>,<br />

angoissée, chuchotée,<br />

discordante, étouffée,<br />

irrégulière, mielleuse,<br />

râpeuse, <strong>en</strong>rouée, mal<br />

posée, serrée, dé<strong>sa</strong>gréable<br />

grave, haute, moy<strong>en</strong>ne,<br />

mordante, pointue, humble<br />

Caractéristique<br />

gagnée par une<br />

personne et<br />

perdue par une<br />

autre<br />

puis<strong>sa</strong>nte,<br />

musicale, calme<br />

t<strong>en</strong>due<br />

Caractéristique<br />

inchangée<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 70<br />

brillante,<br />

chaleureuse,<br />

chantante, timbrée,<br />

résonnante, sexy,<br />

décidée, naturelle,<br />

poignante,<br />

mélodieuse<br />

éraillée, étranglée,<br />

faible, monotone,<br />

na<strong>sa</strong>le, plate,<br />

soufflée, spasmée,<br />

terne<br />

<strong>de</strong> soprano, aigüe,<br />

<strong>de</strong> colorature<br />

Le qualificatif « énergique » est le seul à faire l’objet d’un relatif cons<strong>en</strong>sus : il est cité après les<br />

séance comme caractéri<strong>sa</strong>nt leur propre <strong>voix</strong> par 3 pati<strong>en</strong>ts sur les 4, alors qu’aucun ne l’avait cité<br />

avant les séances, ni comme caractéri<strong>sa</strong>nt <strong>sa</strong> propre <strong>voix</strong> ni comme caractéri<strong>sa</strong>nt la <strong>voix</strong> qu’il<br />

aimerait avoir. On peut faire l’hypothèse que la visuali<strong>sa</strong>tion du spectrogramme comme répartition<br />

<strong>de</strong> l’énergie acoustique selon les fréqu<strong>en</strong>ces leur a donné une s<strong>en</strong>sibilité plus forte à l’adjectif<br />

« énergique ».<br />

On peut distinguer les différ<strong>en</strong>ts adjectifs selon leur nature<br />

Catégorie <strong>de</strong><br />

l’adjectif<br />

Changem<strong>en</strong>t positif Nombre Changem<strong>en</strong>t négatif Nombre<br />

Adjectif positif<br />

gagné<br />

Int<strong>en</strong>sité Forte, sonore<br />

Clarté et<br />

régularité du<br />

timbre<br />

Claire, régulière<br />

Adjectif<br />

négatif<br />

perdu<br />

chuchotée,<br />

étouffée<br />

Enrouée,<br />

serrée,<br />

irrégulière<br />

brut<br />

Importance<br />

relative<br />

Adjectif<br />

positif perdu<br />

Adjectif<br />

négatif<br />

gagné<br />

brut<br />

Importance<br />

relative<br />

4 12 % éclatante 1 7 %<br />

5 15 %<br />

Saccadée,<br />

voilée<br />

2 14 %


Richesse du<br />

timbre<br />

Geste<br />

Emotions<br />

Ron<strong>de</strong>, ample,<br />

riche,<br />

Assurée, douée,<br />

ferme,<br />

Agréable,<br />

émouvante,<br />

spontanée<br />

s<strong>en</strong><strong>sa</strong>tions Sucrée, ron<strong>de</strong><br />

autre<br />

Nuancée,<br />

animée,<br />

chantée,<br />

énergique<br />

Insipi<strong>de</strong>,<br />

atone,<br />

blanche<br />

6 18 % 0 0 %<br />

Mal posée 4 12 % Agitée 1 7 %<br />

Angoissée,<br />

discordante,<br />

dé<strong>sa</strong>gréable,<br />

attirante<br />

Moelleuse,<br />

râpeuse<br />

6 21 %<br />

4 9 %<br />

Gaie,<br />

attirante,<br />

apai<strong>sa</strong>nte<br />

Moelleuse,<br />

chau<strong>de</strong>,<br />

cares<strong>sa</strong>nte,<br />

belle, douce<br />

Effrayante 4 29 %<br />

âpre 6 43 %<br />

4 9 % 0 0 %<br />

On constate que 8 adjectifs positifs concernant les émotions et les s<strong>en</strong><strong>sa</strong>tions ont été perdus. En<br />

outre, 6 adjectifs négatifs concernant les émotions et les s<strong>en</strong><strong>sa</strong>tions n’ont pas été repris lors <strong>de</strong> la<br />

<strong>de</strong>uxième évaluation : le pôle « adjectifs perdus concernant les s<strong>en</strong><strong>sa</strong>tions et les émotions» explique<br />

57 % <strong>de</strong>s changem<strong>en</strong>ts négatifs et 18 % <strong>de</strong>s changem<strong>en</strong>ts positifs.<br />

A l’inverse, les 6 adjectifs concernant la richesse du timbre font toujours l’objet d’un changem<strong>en</strong>t<br />

positif, et ils <strong>en</strong> expliqu<strong>en</strong>t 18 %. On peut faire l’hypothèse, avec la réserve d’une étu<strong>de</strong> plus<br />

poussées pati<strong>en</strong>te par pati<strong>en</strong>te, que les séances proposées aux pati<strong>en</strong>ts ont pour effet<br />

- d’améliorer l’image qu’ont les pati<strong>en</strong>ts <strong>de</strong> leur propre <strong>voix</strong> sur le plan <strong>de</strong> la richesse du<br />

timbre<br />

- <strong>de</strong> faire perdre aux pati<strong>en</strong>ts une vision <strong>de</strong> leur <strong>voix</strong> plus axée sur les s<strong>en</strong><strong>sa</strong>tions et les<br />

émotions, moins technique<br />

- <strong>de</strong> détériorer l’image qu’ont les pati<strong>en</strong>ts <strong>de</strong> leur propre <strong>voix</strong> sur un plan moins technique.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 71


Nombre d’adjectifs cités pour<br />

« ma <strong>voix</strong> telle qu’elle est »<br />

(adjectifs « caractéri<strong>sa</strong>nts »)<br />

Positifs Négatifs<br />

Nombre d’adjectifs<br />

cités pour « la <strong>voix</strong><br />

que j’aimerais avoir »<br />

(adjectifs souhaités)<br />

Changem<strong>en</strong>ts<br />

positifs<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 72<br />

Changem<strong>en</strong>ts<br />

négatifs<br />

Avant Après Avant Après Avant Après<br />

Pati<strong>en</strong>t D 30 36 1 1 15 17 11 8<br />

Pati<strong>en</strong>t A 26 46 6 5 23 34 9 1<br />

Pati<strong>en</strong>t B 30 22 16 9 19 10 17 9<br />

Pati<strong>en</strong>t C 10 6 7 3 9 5 5 1<br />

total 42 19<br />

Le nombre <strong>de</strong> changem<strong>en</strong>ts positifs est calculé comme étant la somme du nombre d’adjectifs<br />

positifs non cités comme caractéri<strong>sa</strong>nt <strong>sa</strong> <strong>voix</strong> avant les séances et qui sont cités après les séances<br />

et du nombre d’adjectifs négatifs cités comme caractéri<strong>sa</strong>nt <strong>sa</strong> <strong>voix</strong> avant les séances et qui ne sont<br />

plus cités après les séances. Les changem<strong>en</strong>ts négatifs sont constitués <strong>de</strong>s modifications inverses.<br />

On constate :<br />

- Une diminution du rapport <strong>en</strong>tre le nombre d’adjectifs cités pour « ma <strong>voix</strong> telle qu’elle est »<br />

négatifs et le nombre d’adjectifs cités pour « ma <strong>voix</strong> telle qu’elle est » positifs : tous les<br />

pati<strong>en</strong>ts jug<strong>en</strong>t leur <strong>voix</strong> globalem<strong>en</strong>t plus positivem<strong>en</strong>t après les séances.<br />

- Une diminution du rapport <strong>en</strong>tre le nombre d’adjectifs cités pour « la <strong>voix</strong> que j’aimerais<br />

avoir » et nombre d’adjectifs cités pour « ma <strong>voix</strong> telle qu’elle est » positifs : les pati<strong>en</strong>ts<br />

exprim<strong>en</strong>t tous moins <strong>de</strong> « frustration » face à leur <strong>voix</strong> après les séances.<br />

La pati<strong>en</strong>te D est celui qui se montre la plus <strong>sa</strong>tisfaite <strong>de</strong> <strong>sa</strong> <strong>voix</strong>, suivi dans l’ordre (rapports négatifs<br />

/ positifs crois<strong>sa</strong>nts) par la pati<strong>en</strong>te A, la pati<strong>en</strong>te B et <strong>en</strong>fin la pati<strong>en</strong>te C qui est celle qui est la plus<br />

in<strong>sa</strong>tisfaite <strong>de</strong> <strong>sa</strong> <strong>voix</strong> : elle est la seul à donner plus d’adjectifs négatifs que positifs pour qualifier <strong>sa</strong><br />

<strong>voix</strong>. Cette hiérarchie <strong>en</strong>tre les pati<strong>en</strong>tes est celle qu’on retrouve aux scores au VHI-10. On constate<br />

égalem<strong>en</strong>t une t<strong>en</strong>dance à une corrélation <strong>en</strong>tre l’in<strong>sa</strong>tisfaction <strong>de</strong>s pati<strong>en</strong>ts et leur évolution plus<br />

forte vers plus <strong>de</strong> <strong>sa</strong>tisfaction.<br />

5.2.3.3 Conclusion<br />

Les questionnaires d’auto-évaluation sembl<strong>en</strong>t révéler <strong>de</strong> la part <strong>de</strong>s pati<strong>en</strong>ts une meilleure image<br />

<strong>de</strong> leur <strong>voix</strong> <strong>en</strong> fin <strong>de</strong> protocole.


5.3 Comm<strong>en</strong>taires autour du spectrogramme<br />

5.3.1 Impact sur le geste vocal<br />

5.3.1.1 s<strong>en</strong><strong>sa</strong>tions acoustiques et proprioceptives<br />

Réponses au questionnaire internet<br />

Les personnes ayant répondu au questionnaire répon<strong>de</strong>nt <strong>de</strong> façon plutôt homogènes (écart type<br />

0.7) concernant le fait que l’image spectrographique affine leurs s<strong>en</strong><strong>sa</strong>tions auditives et<br />

proprioceptives (<strong>en</strong>tre « plutôt d’accord » et « tout à fait d’accord »), s<strong>en</strong>siblem<strong>en</strong>t plus pour les<br />

s<strong>en</strong><strong>sa</strong>tions auditives. Ils sont moins catégoriques pour dire que le spectrogramme ne les coupe pas<br />

<strong>de</strong> leurs s<strong>en</strong><strong>sa</strong>tions auditives et proprioceptives (ils répon<strong>de</strong>nt <strong>en</strong> moy<strong>en</strong>ne <strong>en</strong>tre « je ne <strong>sa</strong>is pas »<br />

et « plutôt pas d’accord » aux questions « le spectrogramme vous coupe <strong>de</strong> vos s<strong>en</strong><strong>sa</strong>tions auditives<br />

/ s<strong>en</strong><strong>sa</strong>tion internes »). Au total, les personnes répondant au questionnaire p<strong>en</strong>ch<strong>en</strong>t vers le fait<br />

que le spectrogramme n’a pas d’influ<strong>en</strong>ce négative sur les s<strong>en</strong><strong>sa</strong>tions auditives et proprioceptives et<br />

permet <strong>de</strong> les affiner.<br />

possible focali<strong>sa</strong>tion sur l’image au détrim<strong>en</strong>t <strong>de</strong>s s<strong>en</strong><strong>sa</strong>tions<br />

les pati<strong>en</strong>ts ayant répondu au questionnaires précis<strong>en</strong>t parfois qu’ils ont été effectivem<strong>en</strong>t coupés<br />

<strong>de</strong> leurs s<strong>en</strong><strong>sa</strong>tions : « au départ mes yeux étant rivés sur le spectrogramme tout <strong>en</strong> monitorant ma<br />

<strong>voix</strong>, il m'était difficile <strong>de</strong> me conc<strong>en</strong>trer sur mes s<strong>en</strong><strong>sa</strong>tions, cela m'a même valu quelques fatigues<br />

<strong>vocale</strong>s. Il y a eu un temps d'adaptation », « Je trouve qu'effectivem<strong>en</strong>t, lorsque j'utilise le<br />

spectrogramme toute seule, je peux avoir t<strong>en</strong>dance à me focaliser sur le tracé produit, et plus sur ce<br />

que j'<strong>en</strong>t<strong>en</strong>ds » Ce pati<strong>en</strong>t sous-<strong>en</strong>t<strong>en</strong>d que le thérapeute l’ai<strong>de</strong>rait à rev<strong>en</strong>ir à ses s<strong>en</strong><strong>sa</strong>tions<br />

auditives. La pati<strong>en</strong>te A est plus pessimiste sur le rôle pot<strong>en</strong>tiel du thérapeute. Elle p<strong>en</strong>se que<br />

parfois l’outil spectrographique induit pour le thérapeute « quelque chose qui vi<strong>en</strong>t s’interposer par<br />

rapport à une att<strong>en</strong>tion à ce que je fais corporellem<strong>en</strong>t »<br />

La pati<strong>en</strong>te A n’arrive pas « être dans les <strong>de</strong>ux à la fois » et « préfère privilégier les s<strong>en</strong><strong>sa</strong>tions ».<br />

Pour les cas où elle se laisse déconc<strong>en</strong>trer par l’image spectrographique elle rapporte : «je ne <strong>sa</strong>vais<br />

pas ce que j’avais fait, donc ça m’intéres<strong>sa</strong>it moins. »<br />

La pati<strong>en</strong>te D relève aussi le cas <strong>de</strong>s transitions <strong>de</strong> voyelles où « [elle] arrivai[t] mieux <strong>en</strong> fermant les<br />

yeux <strong>en</strong> s<strong>en</strong>tant ce qui se passe chez moi plutôt qu’<strong>en</strong> regardant ». Toutefois ça ne l’empêche pas <strong>de</strong><br />

s’intéresser après coup à l’image : « Ça m’a aidée <strong>de</strong> voir l’histoire <strong>de</strong>s voyelles, <strong>de</strong>s pas<strong>sa</strong>ges é e u i<br />

etc, d’associer l’image sur le spectrogramme avec le son que je fai<strong>sa</strong>is »<br />

ouverture <strong>de</strong>s s<strong>en</strong><strong>sa</strong>tions auditives<br />

Pour la pati<strong>en</strong>te C : « visualiser ça donne une troisième dim<strong>en</strong>sion, ça ouvre les oreilles, c’est<br />

vraim<strong>en</strong>t intéres<strong>sa</strong>nt » « On <strong>en</strong>t<strong>en</strong>d différemm<strong>en</strong>t ce qu’on produit comme son, par exemple sur la<br />

qualité d’une attaque, et du coup on peut rectifier et on voit tout <strong>de</strong> suite ce que ça produit, sur ça et<br />

sur les harmoniques »<br />

Une pati<strong>en</strong>te écrit dans un témoignage écrit spontané : « VV [le specterogramme <strong>de</strong> VoceVista]<br />

m’ai<strong>de</strong> à affiner mon écoute »<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 73


ouverture <strong>de</strong>s s<strong>en</strong><strong>sa</strong>tions proprioceptives<br />

Certains pati<strong>en</strong>ts répondant au questionnaire internet font directem<strong>en</strong>t le li<strong>en</strong> <strong>en</strong>tre ce qu’ils voi<strong>en</strong>t<br />

sur le spectrogramme et <strong>de</strong>s paramètres internes : « Le spectrogramme m'est utile pour<br />

m'autocorriger. J'ai compris que ma mâchoire n'était pas assez dét<strong>en</strong>due et que j'actionnais trop <strong>de</strong><br />

muscles que néces<strong>sa</strong>ires pour l'articulation. », « je trouve que [le spectrogramme] ai<strong>de</strong> à ress<strong>en</strong>tir les<br />

s<strong>en</strong><strong>sa</strong>tions internes, car c'est <strong>en</strong> changeant ces <strong>de</strong>rnières qu'on modifie ce qui se passe sur l'écran »<br />

Ai<strong>de</strong> lorsque les s<strong>en</strong><strong>sa</strong>tions et l’audition interne sont perturbés<br />

La pati<strong>en</strong>te D p<strong>en</strong>se que « ça ai<strong>de</strong> pour les g<strong>en</strong>s qui n’ont peut-être pas une bonne proprioception ».<br />

La pati<strong>en</strong>te B estime avoir un ress<strong>en</strong>ti perturbé par la douleur qu’elle ress<strong>en</strong>t lors <strong>de</strong> ses émissions<br />

<strong>vocale</strong>s. « le spectrogramme me permet <strong>de</strong> rationaliser mes s<strong>en</strong><strong>sa</strong>tions et mon audition interne qui<br />

sont <strong>en</strong> décalage avec ce qui perçu par l'auditeur » « Ça permet d’avoir une expéri<strong>en</strong>ce sci<strong>en</strong>tifique<br />

<strong>de</strong> <strong>sa</strong> <strong>voix</strong>, ne plus être dans le ress<strong>en</strong>ti, parce que mon ress<strong>en</strong>ti est perturbé, il n’est pas fiable ».<br />

Effectivem<strong>en</strong>t, pour elle, « Le son ne reflète pas la douleur ou le mécanisme qui se bloque »<br />

Pour la pati<strong>en</strong>te B, le feedback auditif externe est néces<strong>sa</strong>ire : « Ce que j’<strong>en</strong>t<strong>en</strong>ds n’est pas ce que les<br />

autres <strong>en</strong>t<strong>en</strong><strong>de</strong>nt. » pour une prise <strong>de</strong> consci<strong>en</strong>ce gratifiante : « Ça a fait pr<strong>en</strong>dre consci<strong>en</strong>ce aussi<br />

que l’effort <strong>de</strong> lutte que j’avais interne ne s’<strong>en</strong>t<strong>en</strong>dait pas du tout dans le son (chanté <strong>en</strong> tout cas) »<br />

5.3.1.2 Temps réel<br />

Résultats du questionnaire<br />

Les résultats sont disparates pour la question du temps réel. En effet, chaque pati<strong>en</strong>t a <strong>de</strong>s<br />

réactions différ<strong>en</strong>tes <strong>de</strong>vant le fait que l’image s’affiche <strong>en</strong> même temps que l’on fait l’exercice. De<br />

plus, on fait l’hypothèse que la réponse peut être différ<strong>en</strong>te suivant les exercices. Les réponses ne<br />

sont pas toujours consistantes (certaines ne préfèr<strong>en</strong>t ni regar<strong>de</strong>r le spectrogramme <strong>en</strong> le temps<br />

réel, ni le regar<strong>de</strong>r après coup). On obti<strong>en</strong>t tout <strong>de</strong> même un très léger avantage pour le temps réel.<br />

Besoin <strong>de</strong> se conc<strong>en</strong>trer sur le geste vocal<br />

Ce besoin avait été pointé <strong>en</strong> séance et lors <strong>de</strong> l’<strong>en</strong>treti<strong>en</strong> <strong>de</strong> fin <strong>de</strong> protocole, dans le cadre <strong>de</strong> la<br />

gêne qui pouvait surv<strong>en</strong>ir du fait <strong>de</strong> l’affichage <strong>en</strong> temps réel du spectrogramme. A propos <strong>de</strong><br />

l’exercice <strong>de</strong> la sirène la pati<strong>en</strong>t C rapporte : « Ça me gênait <strong>de</strong> le voir, je ne pouvais plus me<br />

conc<strong>en</strong>trer sur le geste vocal »<br />

Besoin <strong>de</strong> liberté, pas <strong>de</strong> supervision<br />

En es<strong>sa</strong>yant <strong>de</strong> réaliser la sirène avec regardant le spectrogramme, la pati<strong>en</strong>te C lâche : « ça me fait<br />

peur <strong>de</strong> le voir » Elle rapporte <strong>en</strong>suite : « Le spectrogramme te met dans une forme <strong>de</strong> contrôle : tu<br />

contrôles *toi* et contrôle dans le s<strong>en</strong>s « supervision/superviseur ». Pour la sirène, et pour d’autres<br />

exercices, le ouhouh par exemple, je regardais pas le truc. Là pour le coup j’ai besoin <strong>de</strong> liberté, <strong>de</strong><br />

me lâcher, <strong>de</strong> me mettre <strong>en</strong> légèreté, <strong>de</strong> me mettre « ailleurs », la sirène, ou les ouhouh, du coup<br />

fallait pas que je le regar<strong>de</strong>, j’ai besoin <strong>de</strong> liberté, ça ça me mettait dans une forme <strong>de</strong> supervision et<br />

d’auto-contrôle ».<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 74


Temps réel plus utile sur <strong>de</strong>s phénomènes longs<br />

Pour la pati<strong>en</strong>te A, le temps réel serait utile sur <strong>de</strong>s sons t<strong>en</strong>us ou <strong>de</strong>s phrases musicales, mais pas<br />

sur l’attaque: « pour le problème <strong>de</strong> l’attaque, quand on le voit il est trop tard ». « Ça me<br />

déconc<strong>en</strong>trait <strong>de</strong> le regar<strong>de</strong>r à l’écran parce que <strong>de</strong> toutes façons c’est trop tard »<br />

Un pati<strong>en</strong>t précise dans le questionnaire internet : « Je préfère regar<strong>de</strong>r <strong>en</strong> même temps si je veux<br />

agir sur ma <strong>voix</strong> et après si c'est seulem<strong>en</strong>t pour me fier à mes s<strong>en</strong><strong>sa</strong>tions et vérifier si elles sont<br />

justes »<br />

intérêt du spectrogramme même après coup<br />

Même lorsque regar<strong>de</strong>r l’image <strong>en</strong> temps réel déconc<strong>en</strong>tre les pati<strong>en</strong>ts, le spectrogramme gar<strong>de</strong><br />

son intérêt car il permet <strong>de</strong> voir ce qui a été émis après coup. Tous les pati<strong>en</strong>ts du protocole le<br />

dis<strong>en</strong>t : pour la pati<strong>en</strong>te A, pour l’attaque, c’est tout <strong>de</strong> même « Intéres<strong>sa</strong>nt après-coup d’avoir<br />

confirmation qu’il y a un problème, mais pas <strong>en</strong> temps réel ». Pour la pati<strong>en</strong>te C, sur la sirène qu’elle<br />

ne parv<strong>en</strong>ait pas à effectuer <strong>en</strong> regardant le spectrogramme : « ça restait intéres<strong>sa</strong>nt <strong>de</strong> le voir<br />

après » Pour la pati<strong>en</strong>t D les difficultés dues au temps réel sont apparues dans l’exercice <strong>de</strong>s<br />

transitions <strong>en</strong>tre les voyelles. Après coup « ça m’a conforté dans le fait qu’il y avait quelque chose<br />

<strong>de</strong> spécial dans le son » On note que cette pati<strong>en</strong>t a justem<strong>en</strong>t cité <strong>en</strong> premier cet exercice <strong>de</strong><br />

transition <strong>en</strong>tre les voyelles comme un <strong>de</strong>s exercices les plus intéres<strong>sa</strong>nts. Cela montre que le<br />

spectrogramme peut tout à fait avoir un intérêt lorsqu’il n’est pas utilisé <strong>en</strong> temps réel.<br />

On note que la pati<strong>en</strong>te B ne rapporte aucune gêne et n’a jamais eu besoin <strong>de</strong> quitter le<br />

spectrogramme <strong>de</strong>s yeux pour réussir un exercice. On suppose que cela est lié au fait que cette<br />

pati<strong>en</strong>te a un très gros contrôle sur elle-même et une longue expéri<strong>en</strong>ce d’analyse <strong>de</strong> son geste<br />

vocal.<br />

5.3.1.3 Comportem<strong>en</strong>t vocal<br />

Résultats du questionnaire<br />

En moy<strong>en</strong>ne, les pati<strong>en</strong>ts p<strong>en</strong>s<strong>en</strong>t que l’utili<strong>sa</strong>tion du spectrogramme est gênant pour pr<strong>en</strong>dre une<br />

posture adaptée à l’émission <strong>vocale</strong>. Cep<strong>en</strong>dant cette opinion moy<strong>en</strong>ne est due à une minorité <strong>de</strong><br />

pati<strong>en</strong>t (1 « tout à fait d’accord » et 3 « plutôt d’accord ». La disparité observée pour la posture est<br />

<strong>en</strong>core plus marquée pour le geste vocal : 1 pati<strong>en</strong>t p<strong>en</strong>se que le spectrogramme ne le gêne pas du<br />

tout (« pas du tout d’accord »), et 4 p<strong>en</strong>s<strong>en</strong>t qu’il gêne un petit peu. (« plutôt d’accord »). Les<br />

pati<strong>en</strong>ts sont plus unanimes pour la respiration, di<strong>sa</strong>nt <strong>en</strong> moy<strong>en</strong>ne qu’ils sont « plutôt pas<br />

d’accord » avec le fait que le spectrogramme gêne la respiration. Une seule personne p<strong>en</strong>se que le<br />

spectrogramme peut gêner la respiration.<br />

Enfin, le fait <strong>de</strong> travailler <strong>de</strong>vant un écran est gênant pour cette même personne seulem<strong>en</strong>t, les<br />

autres étant <strong>en</strong> majorité « pas du tout d’accord » (4 pati<strong>en</strong>ts) ou « plutôt pas d’accord » (2 pati<strong>en</strong>ts)<br />

avec le fait que l’écran soit gênant.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 75


ordinateur et posture<br />

problème du micro<br />

Un pati<strong>en</strong>t répondant au questionnaire internet précise : « Le seul souci principal sur l'ordinateur,<br />

c'est la fixité du micro, qui oblige à ne pas trop bouger parce que sinon, je n'ai plus la même<br />

référ<strong>en</strong>ce par rapport à ce que j'ai pu faire juste avant. Pour éviter ça, je p<strong>en</strong>se qu'il suffit juste<br />

d'avoir un micro mobile, qui permettrait plus <strong>de</strong> souplesse »<br />

problème <strong>de</strong> la visuali<strong>sa</strong>tion sur un écran<br />

Durant les <strong>en</strong>treti<strong>en</strong>s post-protocole, la pati<strong>en</strong>te A a été la seule à pointer que « d’être là <strong>de</strong>vant<br />

l’écran et év<strong>en</strong>tuellem<strong>en</strong>t tordu, p<strong>en</strong>ché, c’est contradictoire. ». Ce pati<strong>en</strong>t confirme cette<br />

impression lors du questionnaire écrit, quelques semaines plus tard : « J'ai été très gênée par le fait<br />

d'utiliser le spectogramme sur un petit écran <strong>de</strong> portable, ce qui indui<strong>sa</strong>it une posture médiocre, peu<br />

propice à une bonne phonation. Il me semble que ce travail serait plus judicieux <strong>de</strong>vant un écran <strong>de</strong><br />

vidéoprojection ».<br />

La pati<strong>en</strong>te C le rejoint dans ce même questionnaire écrit : « Difficile <strong>de</strong> projeter la <strong>voix</strong> au loin<br />

lorsqu'on a un micro sur la bouche et un écran d'ordinateur juste <strong>de</strong>vant soi, Besoin plutôt <strong>de</strong><br />

regar<strong>de</strong>r au loin pour accompagner certains gestes vocaux <strong>de</strong> projection <strong>de</strong> la <strong>voix</strong> »<br />

prise <strong>de</strong> consci<strong>en</strong>ce d’un comportem<strong>en</strong>t qui modifie la phonation<br />

Une pati<strong>en</strong>te vue <strong>en</strong> <strong>de</strong>hors du protocole dit p<strong>en</strong>dant un exercice d’auto-analyse : « En réécoutant<br />

j’<strong>en</strong>t<strong>en</strong>ds que le début du <strong>de</strong>uxième est plus clair que le premier. C’est <strong>en</strong> <strong>en</strong>t<strong>en</strong>dant que je m’<strong>en</strong><br />

r<strong>en</strong>ds compte » Elle p<strong>en</strong>se que c’est uniquem<strong>en</strong>t le feedback auditif qui lui permet cette prise <strong>de</strong><br />

consci<strong>en</strong>ce.<br />

Pour la pati<strong>en</strong>te B le constat est le même mais elle l’attribue directem<strong>en</strong>t au spectrogramme : « On<br />

l’a vu avec le spectrogramme, parce que quand je me préparais à faire le son <strong>de</strong> façon sout<strong>en</strong>ue, il y<br />

avait beaucoup moins <strong>de</strong> spasmes [sous-<strong>en</strong>t<strong>en</strong>du : sur le spectrogramme], donc dans la vie <strong>de</strong> tous<br />

les jours il faut que je souti<strong>en</strong>ne beaucoup plus la <strong>voix</strong> pour minimiser la dysphonie ». Lorsqu’on lui<br />

<strong>de</strong>man<strong>de</strong> si elle <strong>en</strong> avait déjà consic<strong>en</strong>ce avant, elle répond « ça m’<strong>en</strong> fait pr<strong>en</strong>dre <strong>de</strong> plus <strong>en</strong> plus<br />

consci<strong>en</strong>ce » et que cela pourra la motiver davantage pour « changer ma façon <strong>de</strong> parler pour<br />

minimiser la dysphonie »<br />

5.3.2 intérêt particuliers <strong>de</strong> la visuali<strong>sa</strong>tion du spectrogramme<br />

5.3.2.1 Paramètres vocaux que le spectrogramme permet d’observer et d’améliorer<br />

Résultats du questionnaire<br />

Les personnes ayant répondu au questionnaire sont unanime pour dire que le spectrogramme<br />

permet d’observer <strong>de</strong>s paramètres vocaux (8 « tout à fait d’accord »). Cela est d’autant plus vrai<br />

pour la parole (introduite comme les « différ<strong>en</strong>ts sons émis par la parole (voyelles, consonnes) » (9<br />

« tout à fait d’accord ») et l’attaque (8 « tout à fait d’accord »), et reste tout à fait vrai pour le<br />

timbre (8 « tout à fait d’accord ») pour lequel on note tout <strong>de</strong> même que la pati<strong>en</strong>te A répond « je<br />

ne <strong>sa</strong>is pas ».<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 76


Les réponses sont beaucoup plus partagées concernant la possibilité d’améliorer les différ<strong>en</strong>ts<br />

paramètres. C’est le timbre qui parait le plus difficile à améliorer, puis l’attaque, puis les différ<strong>en</strong>ts<br />

sons émis par la parole, mais celle-ci avec une gran<strong>de</strong> disparité, la pati<strong>en</strong>te C étant la seule à avoir<br />

répondu « pas du tout d’accord ».<br />

En résumé, les personnes ayant répondu au questionnaire p<strong>en</strong>s<strong>en</strong>t que le spectrogramme peut<br />

permettre d’observer <strong>de</strong>s caractéristiques <strong>de</strong> leur <strong>voix</strong> ; ils sont partagés sur le fait que cela peut<br />

permettre <strong>de</strong> les améliorer, tout <strong>en</strong> restant globalem<strong>en</strong>t plutôt d’accord avec cette affirmation.<br />

C’est le timbre <strong>de</strong> la <strong>voix</strong> qui leur est le plus difficile à observer et à améliorer.<br />

impact <strong>de</strong> la visuali<strong>sa</strong>tion d’un timbre altéré<br />

possible image viol<strong>en</strong>te <strong>de</strong> la dysphonie<br />

Un pati<strong>en</strong>t donnant spontaném<strong>en</strong>t un témoignage écrit raconte : « le spectrogramme a été pour<br />

moi une révélation <strong>en</strong> ce s<strong>en</strong>s qu’il permet <strong>de</strong> tracer objectivem<strong>en</strong>t les défauts à combattre »<br />

Pour les pati<strong>en</strong>ts du protocole dysphoniques, le fait d’i<strong>de</strong>ntifier sur l’image les manifestations <strong>de</strong> la<br />

dysphonie a été un événem<strong>en</strong>t marquant. La pati<strong>en</strong>te B rapporte : « La première chose c’était<br />

d’i<strong>de</strong>ntifier le spasme ». « Au tout début c’était un peu pénible, notamm<strong>en</strong>t quand j’avais <strong>de</strong>s<br />

spasmes, mais si je le <strong>sa</strong>is qu’il y a une dysphonie spasmodique, mais c’était un peu douloureux au<br />

début d’être <strong>en</strong>core dans la prise <strong>de</strong> consci<strong>en</strong>ce que « oui, c’est là ».<br />

La pati<strong>en</strong>te C égalem<strong>en</strong>t rapporte que le spectrogramme lui a permis <strong>de</strong> voir « Les ruptures <strong>de</strong> son<br />

dont [elle est] victime» ainsi que « Le souffle qui vi<strong>en</strong>t se greffer dans la <strong>voix</strong> ». Cette pati<strong>en</strong>te<br />

n’hésite pas à m<strong>en</strong>tionner que cela l’a parfois « chagrinée » : « Déjà qu’on l’<strong>en</strong>t<strong>en</strong>d, mais <strong>en</strong> plus on<br />

le voit, ça marque bi<strong>en</strong> le truc, je p<strong>en</strong>se qu’il faut être un petit peu blindé. » Elle pose la question <strong>de</strong>s<br />

réactions qu’elle aurait pu avoir lorsqu’elle avait la <strong>voix</strong> « très très cassée » : « ça aurait été peutêtre<br />

un peu viol<strong>en</strong>t, au premier abord ». Cette agressivité <strong>de</strong> l’image r<strong>en</strong>voyée <strong>de</strong> soi-même par le<br />

spectrogramme est évi<strong>de</strong>mm<strong>en</strong>t à pr<strong>en</strong>dre <strong>en</strong> compte dans les thérapies <strong>vocale</strong>s. Lorsque nous lui<br />

suggérons qu’une <strong>voix</strong> même cassée peut toujours émettre <strong>de</strong>s sons du type « ff » par exemple ou<br />

observer <strong>de</strong>s harmoniques sur du souffle comme dans l’exercice « sss-i sss-ou », elle acquiesce :<br />

« Ça peut être une <strong>en</strong>trée <strong>en</strong> matière, pour quelqu’un qui a la <strong>voix</strong> très très cassée, très éraillée »<br />

intérêt majeur : pouvoir travailler <strong>de</strong>ssus<br />

Ce même pati<strong>en</strong>t C, à la question « qu’est-ce que ça fait <strong>de</strong> voir ses choses un peu négatives ? »,<br />

répond <strong>sa</strong>ns hésitation qu’ « on peut les corriger. On voit la rupture du son donc par exemple [sur les<br />

sièrnes. Ca] permet <strong>de</strong> rectifier le geste »<br />

La visuali<strong>sa</strong>tion a permis à la pati<strong>en</strong>te B d’i<strong>de</strong>ntifier <strong>de</strong>s situations où il y avait plus ou moins <strong>de</strong><br />

spasmes : « Sur la <strong>voix</strong> parlée, ce que ça m’a montré, c’est que quand je pr<strong>en</strong>ds avec une int<strong>en</strong>sité<br />

normale, il y a beaucoup plus <strong>de</strong> spasme, et dès que je pr<strong>en</strong>ds une <strong>voix</strong> un peu plus projetée [ça va<br />

mieux] »<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 77


Attaques facilem<strong>en</strong>t visualisées<br />

Dans les paramètres <strong>de</strong> la <strong>voix</strong> que le spectrogramme leur a permis <strong>de</strong> visualiser, Toutes les<br />

pati<strong>en</strong>tes du protocole cit<strong>en</strong>t les différ<strong>en</strong>ts types d’attaques. La pati<strong>en</strong>te D cite notamm<strong>en</strong>t<br />

l’exercice d’auto-analyse pour la visuali<strong>sa</strong>tion d’attaque <strong>en</strong> coup <strong>de</strong> glotte : «Ça m’a aidé à pr<strong>en</strong>dre<br />

consci<strong>en</strong>ce <strong>de</strong>s attaques » « ça le fait plus que ce que j’aurais p<strong>en</strong>sé, [je m’<strong>en</strong> r<strong>en</strong>ds compte] parce<br />

que je le vois et aussi parce que tu as attiré mon att<strong>en</strong>tion <strong>de</strong>ssus ». Elle ajoute : « Je trouve que pour<br />

les attaques c’est super clair, pour les g<strong>en</strong>s qui pourrai<strong>en</strong>t mal s<strong>en</strong>tir ou mal doser ça se voit »<br />

Phonétique<br />

Seule la pati<strong>en</strong>te A rappelle cet aspect du travail dans l’<strong>en</strong>treti<strong>en</strong> post-protocole : Elle « voi[t] bi<strong>en</strong><br />

que ça pr<strong>en</strong>d une autre réalité, c’est un peu plus palpable aussi » avec le spectrogramme.<br />

harmoniques<br />

la pati<strong>en</strong>te C rapporte : « [on a travaillé] La prise <strong>de</strong> consci<strong>en</strong>ce <strong>de</strong> la qualité du son sur les<br />

harmoniques, j’ai vraim<strong>en</strong>t découvert <strong>de</strong>s trucs ». La pati<strong>en</strong>te D p<strong>en</strong>se que « Pr<strong>en</strong>dre consci<strong>en</strong>ce <strong>de</strong>s<br />

résonateurs aussi c’est chouette »<br />

Le timbre vocalique et les possibilités d’accor<strong>de</strong>r les harmoniques avec une note chantée ont été<br />

cités par les pati<strong>en</strong>ts C et D comme <strong>de</strong>s paramètres <strong>de</strong> leur <strong>voix</strong> observés grâce au spectrogramme.<br />

Pati<strong>en</strong>t C : « [le fait qu’une note va sonner plus ou moins bi<strong>en</strong> selon la voyelle], Ça on le voit sur le<br />

spectrogramme : je l’<strong>en</strong>t<strong>en</strong>dais mais <strong>sa</strong>ns vraim<strong>en</strong>t compr<strong>en</strong>dre pourquoi ». Pati<strong>en</strong>t D : « je me<br />

rappelle que sur le mom<strong>en</strong>t j’avais trouvé ça génial »<br />

Pour la pati<strong>en</strong>te B, le singing formant, « c’est le truc qui intéresse le plus les chanteurs, c’est très<br />

narcissique : avoir <strong>de</strong>s harmoniques une <strong>voix</strong> timbrée, vibrante, résonante ». La pati<strong>en</strong>te D exprime à<br />

<strong>sa</strong> façon que cette notion parait un peu magique : « pour moi c’était même un truc d’ali<strong>en</strong> que moi<br />

j’avais pas, un truc <strong>de</strong> chanteur lyrique »<br />

La pati<strong>en</strong>te A relie directem<strong>en</strong>t l’image et la s<strong>en</strong><strong>sa</strong>tion auditive : « c'est confus, instinctif, c'est pas<br />

un truc que j'<strong>en</strong>t<strong>en</strong>ds clairem<strong>en</strong>t, donc c'est un peu mystérieux pour moi le fait qu'il y ait ces<br />

harmoniques qui apparaiss<strong>en</strong>t à l'image, par contre je peux le relier assez facilem<strong>en</strong>t au fait que je<br />

chante bi<strong>en</strong>, qu'il y a quelque chose dans le timbre qui me plait et que comme par ha<strong>sa</strong>rd, c'est à ce<br />

mom<strong>en</strong>t-là qu'il y a <strong>de</strong>s harmoniques »<br />

5.3.2.2 Moy<strong>en</strong> d’analyse sci<strong>en</strong>tifique d’étu<strong>de</strong> et <strong>de</strong> connais<strong>sa</strong>nce<br />

Moy<strong>en</strong> <strong>de</strong> <strong>sa</strong>tisfaire une soif <strong>de</strong> connais<strong>sa</strong>nce<br />

La pati<strong>en</strong>te D rapporte : « Moi je suis très curieuse <strong>de</strong> ce qui se passe, je suis frian<strong>de</strong> <strong>de</strong> « comm<strong>en</strong>t<br />

ça marche », <strong>de</strong> où ça va <strong>de</strong> « qu’est-ce qui se passe », donc ça c’est vrai que pour ça c’était<br />

vraim<strong>en</strong>t excell<strong>en</strong>t <strong>de</strong> voir tout ça. » « C’est génial parce que c’est le support <strong>de</strong> plein<br />

d’explications. »<br />

La pati<strong>en</strong>te B s’intéresse elle-aussi très précisém<strong>en</strong>t aux mécanismes <strong>de</strong> la <strong>voix</strong> chantée : « Ça a été<br />

un vrai plus, parce qu’aussi je fais partie <strong>de</strong>s chanteurs avancés, et ça me permet <strong>de</strong> mieux<br />

compr<strong>en</strong>dre les mécanismes que j’étudie »<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 78


Possbilité d’adopter un protocole <strong>de</strong> <strong>rééducation</strong> <strong>en</strong>courageant<br />

La pati<strong>en</strong>t B rapporte : « si je compr<strong>en</strong>ds, ça me permet <strong>de</strong> mieux adapter mon protocole <strong>de</strong><br />

<strong>rééducation</strong> ». Elle ajoute que le spectrogramme permet <strong>de</strong> « voir sci<strong>en</strong>tifiquem<strong>en</strong>t les différ<strong>en</strong>tes<br />

configurations <strong>vocale</strong>s pour le prof <strong>de</strong> chant ».<br />

Un pati<strong>en</strong>t répondant au questionnaire internet précise : « Le spectrogramme est un instrum<strong>en</strong>t très<br />

utile; je regrette, dans mon cas, ne pas avoir connu plus tôt ce support <strong>de</strong> travail. Cela m'aurait<br />

motivé à travailler plus sci<strong>en</strong>tifiquem<strong>en</strong>t donc <strong>en</strong>couragé ».<br />

Attirer l’att<strong>en</strong>tion sur une partie du son<br />

Pour la pati<strong>en</strong>te A, cette connais<strong>sa</strong>nce peut être intéres<strong>sa</strong>nte, mais pas toujours forcém<strong>en</strong>t utile.<br />

« ça m'intéresse intellectuellem<strong>en</strong>t, c'est intéres<strong>sa</strong>nt d'avoir une image <strong>de</strong> choses qu'on n'<strong>en</strong>t<strong>en</strong>d pas<br />

toujours ou qui sont un petit peu fines : voir qu'il s'est bi<strong>en</strong> passé un truc ». « ça peut attirer<br />

l’att<strong>en</strong>tion sur un truc bizarre, ti<strong>en</strong>s à quoi ça correspond au niveau auditif ? »<br />

Pour la pati<strong>en</strong>te D pour pouvoir améliorer un paramètre, il a d’abord fallu que le thérapeute attire<br />

l’att<strong>en</strong>tion <strong>de</strong>ssus : « c’est parce que je le vois et aussi parce que tu as attiré mon att<strong>en</strong>tion <strong>de</strong>ssus »<br />

« Tes explications ont attiré mon att<strong>en</strong>tion sur <strong>de</strong>s trucs et du coup je les ai comprises avec tes<br />

explications, et <strong>de</strong> voir aussi ça m’a bi<strong>en</strong> aidée. » et le spectrogramme permet <strong>de</strong> pointer<br />

précisém<strong>en</strong>t ce dont on veut parler dans le son.<br />

Intérêt intellectuel au détrim<strong>en</strong>t d’une utilité pour la <strong>voix</strong> ?<br />

L’intérêt intellectuel pour le fonctionnem<strong>en</strong>t <strong>de</strong> la <strong>voix</strong> n’est pas toujours partagé par les pati<strong>en</strong>ts.<br />

La pati<strong>en</strong>te A l’exprime ainsi : « Des fois vous êtes beaucoup r<strong>en</strong>tré dans les détails et je <strong>sa</strong>is pas si<br />

j’<strong>en</strong> avais tant besoin que ça, je ne compr<strong>en</strong>ais pas toujours pourquoi vous m’expliquiez tout ça alors<br />

que je p<strong>en</strong><strong>sa</strong>is que j’étais là plutôt pour que vous fassiez vos mesures, vos trucs, mais au bout d’un<br />

mom<strong>en</strong>t j’étais un peu perdue. »<br />

Elle p<strong>en</strong>se, <strong>en</strong> outre, que cette analyse sci<strong>en</strong>tifique du son émis n’ai<strong>de</strong> pas à travailler <strong>sa</strong> <strong>voix</strong> : « Si<br />

on es<strong>sa</strong>ye d'améliorer le son mais <strong>sa</strong>ns avoir consci<strong>en</strong>ce que ça vi<strong>en</strong>t du souffle on va être assez vite<br />

limité, on va être dans un critère un peu esthétique [pas adapté] »<br />

A ce sujet, une pati<strong>en</strong>te hors protocole fait un témoignage écrit spontané : « dans ce travail, je ne<br />

souhaite pas rester au niveau « sci<strong>en</strong>tifique » (« spectogramme », « formant » etc … tous ces mots<br />

techniques que je découvre ). le <strong>de</strong>ssin, comme la <strong>voix</strong>, le chant, utilis<strong>en</strong>t certes la technique, mais la<br />

dépass<strong>en</strong>t » Pour elle, le spectrogramme permet <strong>de</strong> « découvrir le <strong>de</strong>ssin <strong>de</strong>s voyelles, <strong>de</strong>s<br />

consonnes, <strong>de</strong>s syllabes, <strong>de</strong>s mots chantés ou parlés,; chargés <strong>de</strong> diverses émotions » « ils parl<strong>en</strong>t <strong>de</strong><br />

moi, <strong>de</strong> mon humanité ». On voit ici que l’aspect sci<strong>en</strong>tifique peut-être totalem<strong>en</strong>t dépassé, selon la<br />

s<strong>en</strong>sibilité <strong>de</strong>s pati<strong>en</strong>ts.<br />

5.3.2.3 Reflet objectif r<strong>en</strong>du positif par le thérapeute<br />

Reflet objectif<br />

Tous les pati<strong>en</strong>ts qui ont répondu au questionnaire p<strong>en</strong>s<strong>en</strong>t que le spectrogramme fournit la preuve<br />

objective <strong>de</strong> ce qu’ils avai<strong>en</strong>t remarqué sur leur <strong>voix</strong>. La pati<strong>en</strong>te B précise : « c’est plus palpable,<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 79


parce que la <strong>voix</strong> c’est quelque chose d’immatériel, d’impalpable. ». Pour elle l’image permet d’être<br />

<strong>en</strong> simultané et apporte plus d’objectivité, ce que l’<strong>en</strong>registrem<strong>en</strong>t seul ne réussit pas : « J’ai une<br />

grosse expéri<strong>en</strong>ce <strong>de</strong>s <strong>en</strong>registrem<strong>en</strong>ts, <strong>de</strong> m’<strong>en</strong>t<strong>en</strong>dre, mais l’image apporte peut-être <strong>en</strong>core plus :<br />

les <strong>de</strong>ux combinés font que j’ai plus t<strong>en</strong>dance à être objective par rapport à moi-même, que même<br />

d’avoir qu’un <strong>en</strong>registrem<strong>en</strong>t. Du fait aussi qu’on voit <strong>en</strong> simultané »<br />

Possibilité <strong>de</strong> mettre son problème <strong>de</strong> <strong>voix</strong> à distance, et dédramatiser<br />

la pati<strong>en</strong>te B p<strong>en</strong>se que « on n’est pas toujours objectif, on a t<strong>en</strong>dance, surtout quand on est face à<br />

une pathologie, à dramatiser, comme tous les pati<strong>en</strong>ts dans le mon<strong>de</strong> <strong>en</strong>tier. Même si on le dit pas »<br />

Elle p<strong>en</strong>se que « C’est moins dramati<strong>sa</strong>nt d’être objectif sur le souci ». Elle a ress<strong>en</strong>ti qu’ « Une<br />

partie <strong>de</strong>s difficultés, c’est pas qu’elle ne s’<strong>en</strong>t<strong>en</strong>d pas, mais qu’elle est moins dramatique que ce<br />

qu’[elle] s<strong>en</strong>[t] »<br />

La pati<strong>en</strong>te A la rejoint, <strong>en</strong> rapportant que l’image spectrographique « permet <strong>de</strong> se dire : ti<strong>en</strong>s<br />

finalem<strong>en</strong>t c'est pas si grave, c'est pas mal. : vérifier qu'on n'a pas la berlue, qu'on n'a pas rêvé. C'est<br />

intéres<strong>sa</strong>nt d'avoir confirmation <strong>de</strong> quelque chose qu'on <strong>en</strong>t<strong>en</strong>d ou pas »<br />

La pati<strong>en</strong>te D a pu s’affranchir d’un problème mineur qui avait pris <strong>de</strong> l’importance pour elle parce<br />

qu’elle ne compr<strong>en</strong>ait pas ce qui pouvait arriver. Le fait <strong>de</strong> voir <strong>en</strong> image ce point précis l’a rassuré,<br />

<strong>sa</strong>ns pourtant qu’on ait réglé le problème. « j’avais une copine qui m’avait dit t’as les /s/ qui siffl<strong>en</strong>t<br />

c’est la catastrophe. quand on a regardé, justem<strong>en</strong>t j’étais très étonnée parce qu’ils n’apparais<strong>sa</strong>i<strong>en</strong>t<br />

pas je p<strong>en</strong><strong>sa</strong>is que ça ferait krkrkrkr ou chais pas trop quoi, et donc là effectivem<strong>en</strong>t, j’ai vu qu’il n’y<br />

avait pas <strong>de</strong> problème dans le s<strong>en</strong>s où je p<strong>en</strong><strong>sa</strong>is. Je p<strong>en</strong><strong>sa</strong>is que c’était trop fort ou trop soufflé trop<br />

j’<strong>en</strong> <strong>sa</strong>is ri<strong>en</strong> et <strong>en</strong> fait finalem<strong>en</strong>t on les voit moins mais j’ai pas pris ça comme un gros problème je<br />

ne me suis pas attardée là-<strong>de</strong>ssus. » Apparemm<strong>en</strong>t c’est surtout son ignorance du problème exact<br />

et la raison pour laquelle un personne avait pointé ça chez elle qui la perturbait. Objectiver une<br />

différ<strong>en</strong>ce sur le spectrogramme a permis <strong>de</strong> ne plus considérer cette différ<strong>en</strong>ce comme un<br />

problème qu’il faudrait régler.<br />

Une pati<strong>en</strong>te hors protocole rapporte dans un témoignage spontané écrit : « VV [le spectrogramme<br />

<strong>de</strong> VoceVista] me permet <strong>de</strong> m’apprivoiser, <strong>de</strong> me regar<strong>de</strong>r, <strong>de</strong> m’écouter <strong>sa</strong>ns peur, avec humour<br />

quand je trouve que c’est moche ! » « Avant, je n’aimais pas écouter ma <strong>voix</strong> ; VV me permet <strong>de</strong><br />

l’apprivoiser »<br />

Possibilité d’observer l’évolution d’un travail<br />

La pati<strong>en</strong>te A ajoute : « y’a quelque chose d’assez rassurant aussi, y’a <strong>de</strong>s g<strong>en</strong>s qui peut-être ne se<br />

r<strong>en</strong><strong>de</strong>nt pas forcém<strong>en</strong>t compte qu’ils ont progressé, que oui, il y a <strong>de</strong>s harmoniques dans leur <strong>voix</strong>,<br />

c’est vrai que ça fait plaisir : « la preuve, c’est là », et on peut voir aussi l’évolution d’un travail »<br />

Le formant du chanteur est quelque chose <strong>de</strong> rassurant à objectiver pour la pati<strong>en</strong>te D,<br />

surtout dans le cadre <strong>de</strong> <strong>sa</strong> reconversion dans les métiers du chant : « Le formant du chanteur<br />

j’étais bi<strong>en</strong> cont<strong>en</strong>te <strong>de</strong> le voir, g<strong>en</strong>re, on te donne le tampon : « c’est bon, vous l’êtes, pffiou [au<br />

suivant]», ça c’est bi<strong>en</strong> rassurant »<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 80


Possibilité d’une relation apaisée avec le thérapeute<br />

La pati<strong>en</strong>te B p<strong>en</strong>se que le spectrogramme « permet une relation plus objective [avec le<br />

thérapeute], parce qu’il n’y a pas <strong>de</strong> ress<strong>en</strong>ti, y’a pas ce que vous avez <strong>en</strong>t<strong>en</strong>du et ce que moi<br />

j’<strong>en</strong>t<strong>en</strong>ds, il y a vraim<strong>en</strong>t une objectivité sci<strong>en</strong>tifique. »<br />

Pour elle, le spectrogramme permet d’accor<strong>de</strong>r les visions qu’ont les thérapeutes et les pati<strong>en</strong>ts <strong>de</strong><br />

la <strong>voix</strong> du pati<strong>en</strong>t, <strong>en</strong> objectivant le phénomène physique qui gêne effectivem<strong>en</strong>t le pati<strong>en</strong>t, ou <strong>en</strong><br />

permettant au contraire au pati<strong>en</strong>t <strong>de</strong> s’affranchir d’un ress<strong>en</strong>ti négatif <strong>en</strong> lui montrant qu’il n’y a<br />

objectivem<strong>en</strong>t pas d’impact acoustique à <strong>sa</strong> gêne: « même si c’est psychologique, il y a quand même<br />

un phénomène physique, je p<strong>en</strong>se que le spectrogramme ça permet ça (dans les <strong>de</strong>ux s<strong>en</strong>s: à la fois<br />

« vous voyez bi<strong>en</strong> que ça va pas » et « vous voyez bi<strong>en</strong> que ça va bi<strong>en</strong> ») » Le spectrogramme permet<br />

à la relation thérapeutique <strong>de</strong> s’établir sur une base commune objective, qui a parfois manqué à la<br />

pati<strong>en</strong>te dans son parcours thérapeutique.<br />

La pati<strong>en</strong>te C nous dit : « J’ai bi<strong>en</strong> aimé être à <strong>de</strong>ux à regar<strong>de</strong>r le troisième truc. J’ai vraim<strong>en</strong>t bi<strong>en</strong><br />

aimé. On produit pour la machine avec l’œil <strong>de</strong> l’expert. y’a une machine qui va vraim<strong>en</strong>t voir ce que<br />

je produis et qu’on va décrypter ». Elle a été par le passé mal à l’aise avec <strong>de</strong>s approches<br />

thérapeutiques manquant, à son avis, <strong>de</strong> métho<strong>de</strong> formalisée et <strong>de</strong> feedback. L’utili<strong>sa</strong>tion d’un outil<br />

comme le spectrogramme est pour elle un gage <strong>de</strong> qualité pour une prise <strong>en</strong> charge.<br />

Un pati<strong>en</strong>t répondant au questionnaire internet précise : « Je vois un vrai intérêt à l'utili<strong>sa</strong>tion du<br />

spectrogramme par <strong>de</strong>s professionnels. En effet, cela met <strong>en</strong> évi<strong>de</strong>nce les explications parfois<br />

imagées <strong>de</strong>s professeurs <strong>de</strong> chant ou orthophoniste, qui peuv<strong>en</strong>t induire <strong>en</strong> erreur. Sans le<br />

spectrogramme, l'élève ou le pati<strong>en</strong>t ne peut faire confiance qu'au s<strong>en</strong>s <strong>de</strong> l'observation (développé<br />

ou non), du pratici<strong>en</strong>. »<br />

impact positif <strong>de</strong> l’interprétation par le thérapeute<br />

La pati<strong>en</strong>te B est sûre qu’elle est « beaucoup plus positive (<strong>de</strong>puis ce travail avec le<br />

spectrogramme) » Elle rapporte que <strong>de</strong>s personnes extérieures ont égalem<strong>en</strong>t reconnu les progrès<br />

réalisés, même si le jour du bilan <strong>de</strong> fin elle souffre d’allergies. Elle p<strong>en</strong>se que « Les échanges,<br />

l’opinion <strong>de</strong> l’expérim<strong>en</strong>tateur, ses remarques » l’ont aidé autant que l’outil spectrogramme. On<br />

ress<strong>en</strong>t que pour elle, le côté positif du spectrogramme est beaucoup induit par l’attitu<strong>de</strong> du<br />

thérapeute face à l’image.<br />

5.3.3 Utili<strong>sa</strong>tions préconisées et possibilité d’autonomie<br />

5.3.3.1 Public visé<br />

Résultats du questionnaire<br />

Les utili<strong>sa</strong>tions souhaitées sont plus avec un professeur <strong>de</strong> chant qu’avec un orthophoniste. De plus<br />

les pati<strong>en</strong>ts répon<strong>de</strong>nt <strong>de</strong> façon disparate lorsqu’il s’agit d’une utili<strong>sa</strong>tion avec un orthophoniste et<br />

<strong>de</strong> façon plus unanime pour le professeur <strong>de</strong> chant (écart type 0,6), <strong>en</strong>tre « tout à fait d’accord » et<br />

« plutôt d’accord ».<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 81


2 pati<strong>en</strong>ts sur les 10 qui ont répondu n’ont pas <strong>en</strong>vie d’utiliser le spectrogramme (1 « pas du tout »<br />

et 1 « plutôt pas ») , les autres ayant majoritairem<strong>en</strong>t « tout à fait » <strong>en</strong>vie, ce qui conduit à une<br />

gran<strong>de</strong> disparité <strong>de</strong>s réponses (écart type 1,5).<br />

Quel type <strong>de</strong> public<br />

La pati<strong>en</strong>te D p<strong>en</strong>se que « c’est pas du tout une métho<strong>de</strong> invasive, douloureuse pénible ». Elle<br />

compare notamm<strong>en</strong>t aux difficultés r<strong>en</strong>contrées classiquem<strong>en</strong>t <strong>en</strong> laryngoscopie avec le réflexe<br />

nauséeux notamm<strong>en</strong>t. Dans ce cadre, elle p<strong>en</strong>se que l’outil peut facilem<strong>en</strong>t être utilisé pour tout<br />

type <strong>de</strong> public. Elle p<strong>en</strong>se <strong>en</strong> particulier au côté ludique pour les <strong>en</strong>fants et très intéres<strong>sa</strong>nt pour les<br />

chanteurs.<br />

De façon générale, les pati<strong>en</strong>tes p<strong>en</strong>s<strong>en</strong>t que le spectrogramme est un outil « un peu avancé »<br />

(pati<strong>en</strong>te C) et trouv<strong>en</strong>t a priori qu’il est plus adapté pour les personnes qui sont « à l’écoute <strong>de</strong> leur<br />

<strong>voix</strong> » et qui « ont <strong>de</strong>s notions »<br />

La pati<strong>en</strong>te D p<strong>en</strong>se que « Ca pourrait mettre mal à l’aise quelqu’un qui est mal à l’aise avec les<br />

machines » puis se ravise <strong>en</strong> di<strong>sa</strong>nt que « même les personnes âgées, quelqu’un qui est un peu<br />

allergique à l’interv<strong>en</strong>tion d’une machine, si ça lui permet <strong>de</strong> voir l’objectif à atteindre et à régler les<br />

problèmes je vois pas du tout <strong>en</strong> quoi ça peut être gênant »<br />

Utili<strong>sa</strong>tion pour les chanteurs avancés<br />

La pati<strong>en</strong>te B est professeur <strong>de</strong> chant. Elle <strong>en</strong>vie d’utiliser le spectrogramme « plutôt [avec] <strong>de</strong>s<br />

élèves avancés, pour objectiver <strong>de</strong>s choses notamm<strong>en</strong>t pour le singing formant, mais notamm<strong>en</strong>t<br />

aussi pour tout ce qui est la <strong>voix</strong> mixte ».<br />

Alors qu’elle cherchait à produire un son chanté un peu <strong>en</strong> gorge ou non, afin <strong>de</strong> voir les différ<strong>en</strong>ces<br />

visibles au spectrogramme, La pati<strong>en</strong>te D remarque tout <strong>de</strong> même les limites <strong>de</strong> l’outil : « Cette<br />

machine là ne mesure pas tout.[…] : on <strong>en</strong>t<strong>en</strong>d mais on ne voit pas vraim<strong>en</strong>t il y a pas un avant /<br />

après qui soit clair, c’est pas clair <strong>de</strong> <strong>sa</strong>voir ce qui se passe : c’est la limite <strong>de</strong> l’outil ». En réalité, sur<br />

son exemple, on voit qu’il y a <strong>de</strong>s choses qui chang<strong>en</strong>t d’<strong>en</strong>droit, mais, il reste difficile <strong>de</strong> <strong>sa</strong>voir ce<br />

qui est le mieux, ce qu’on cherche.<br />

L’oreille experte d’un professeur <strong>de</strong> chant reste indisp<strong>en</strong><strong>sa</strong>ble.<br />

Utili<strong>sa</strong>tion par les professionnels <strong>de</strong> la <strong>voix</strong><br />

La pati<strong>en</strong>te C, journaliste, p<strong>en</strong>se que le spectrogramme est indiqué pour « tous ceux qui utilis<strong>en</strong>t<br />

leur <strong>voix</strong> » « un journaliste radio, il a besoin <strong>de</strong> poser <strong>sa</strong> <strong>voix</strong>, et ça peut être un bon complém<strong>en</strong>t <strong>de</strong><br />

voir comme ça, il va <strong>en</strong>t<strong>en</strong>dre que si il fait son intonation comme ça, il voit que quand il fait <strong>sa</strong> chute<br />

<strong>de</strong> phrase, il arrivera mieux à poser <strong>sa</strong> <strong>voix</strong> »<br />

Utili<strong>sa</strong>tion pour les dysphoniques<br />

La pati<strong>en</strong>te B p<strong>en</strong>se que « dans le cas <strong>de</strong> dysphonie je p<strong>en</strong>se que ça peut vraim<strong>en</strong>t être un bon outil »<br />

La pati<strong>en</strong>te D imagine que l’image spectrographique permet aux pati<strong>en</strong>ts dysphoniques d’être plus<br />

motivés pour arriver à un objectif : « j’imagine que [du fait que l’orthophoniste] leur [donne]<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 82


l’exercice qui fait que ça va mieux, <strong>en</strong> voyant le résultat, ils vont être plus motivés, avoir plus <strong>en</strong>vie<br />

<strong>de</strong> le faire »<br />

Cep<strong>en</strong>dant, la pati<strong>en</strong>te A rappelle que la phonation reste un « travail corporel ». Elle ne peut<br />

s’appuyer sur l’image ni sur ce qu’on a découvert <strong>en</strong>semble pour améliorer son geste vocal. Elle<br />

ajoute que le fait que le spectrogramme soit sur un petit écran constitue un obstacle pour<br />

« produire du son, à chercher <strong>de</strong>s petites variantes, à voir ce que ça change sur l’écran », qui est ce<br />

qui l’aurait intéressé, mais qui, selon elle, n’a pas été fait lors <strong>de</strong>s séances.<br />

5.3.3.2 Compréh<strong>en</strong>sion <strong>de</strong> l’image spectrographique<br />

Résultats du questionnaire<br />

Pour 7 personnes sur 10 sont « plutôt d’accord » (5 personnes) ou « tout à fait d’accord » (2<br />

personnes) avec le fait que l’image du spectrogramme soit déroutante. L’image du spectrogramme<br />

est <strong>en</strong> moy<strong>en</strong>ne plutôt déroutante, mais avec une forte disparité d’opinion suivant les personnes.<br />

(écart type 1,3)<br />

L’interprétation <strong>de</strong> l’image est facile la majorité <strong>de</strong>s personnes ayant répondu au questionnaire (6<br />

« plutôt d’accord » et 1 « tout à fait d’accord ». On note que l’image peut être déroutante <strong>sa</strong>ns<br />

forcém<strong>en</strong>t gêner l’interprétation. En moy<strong>en</strong>ne les personnes ayant répondu au questionnaire<br />

interprèt<strong>en</strong>t plutôt facilem<strong>en</strong>t l’image spectrographique.<br />

Une petite majorité <strong>de</strong>s personnes ayant répondu au questionnaire p<strong>en</strong>s<strong>en</strong>t qu’ils compr<strong>en</strong>n<strong>en</strong>t<br />

suffi<strong>sa</strong>mm<strong>en</strong>t le spectrogramme pour pouvoir l’utiliser seuls (6 sur 10, 5 « plutôt d’accord » et 1<br />

« tout à fait d’accord »). La disparité <strong>de</strong>s réponses est ici maximale. (écart type 1,4)<br />

remarques qualitatives<br />

Un pati<strong>en</strong>t écrit : « Le spectrogramme représ<strong>en</strong>te pour moi l"l'électrocardiogramme" <strong>de</strong> la <strong>voix</strong> ». Il<br />

<strong>sa</strong>it reconnaître les signes <strong>de</strong> raucité dans « le bruit <strong>en</strong>tre les harmoniques »<br />

On se r<strong>en</strong>d compte tout <strong>de</strong> même <strong>en</strong> séance que la compréh<strong>en</strong>sion est souv<strong>en</strong>t séquellaire. De plus<br />

les pati<strong>en</strong>ts <strong>en</strong> autonomie interprèt<strong>en</strong>t parfois l’image <strong>de</strong> façon assez fantaisiste. Un pati<strong>en</strong>t<br />

notamm<strong>en</strong>t était très <strong>en</strong>nuyé par le « trou » lorsqu’il <strong>en</strong>registrait <strong>de</strong>s /i/, alors que cette<br />

configuration <strong>de</strong>s harmoniques provi<strong>en</strong>t directem<strong>en</strong>t <strong>de</strong> la qualité <strong>de</strong> la voyelle. De même, un autre<br />

avait pour objectif <strong>de</strong> remplir tout l’espace <strong>en</strong>tre 0 et 4 kHz d’harmoniques, indép<strong>en</strong>damm<strong>en</strong>t <strong>de</strong>s<br />

formants constitutifs <strong>de</strong> la voyelle émise.<br />

Un exemple <strong>de</strong> pati<strong>en</strong>t répondant au questionnaire internet : « Dans mon cas, je ne parvi<strong>en</strong>s pas à<br />

distinguer mes harmoniques au niveau sonore, je vois <strong>en</strong> revanche sur le spectrogramme que j'<strong>en</strong><br />

perd certaines <strong>en</strong> montant dans les fréqu<strong>en</strong>ces. ». Nous ne sommes pas certains ici <strong>de</strong> ce qu’a<br />

compris le pati<strong>en</strong>t. Même s’il interprète bi<strong>en</strong> l’image, ici, on ne <strong>sa</strong>it pas s’il a bi<strong>en</strong> compris l’objectif :<br />

<strong>en</strong> montant la fréqu<strong>en</strong>ce fondam<strong>en</strong>tale, il est inévitable <strong>de</strong> faire diminuer le nombre d’harmoniques<br />

dans une ban<strong>de</strong> <strong>de</strong> fréqu<strong>en</strong>ce donnée.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 83


Enfin, nous avons constaté que même après les 3 séances du protocole con<strong>sa</strong>crées uniquem<strong>en</strong>t à la<br />

découverte du spectrogramme, les pati<strong>en</strong>ts pouvai<strong>en</strong>t avoir oublié ce que représ<strong>en</strong>t<strong>en</strong>t les traits<br />

horizontaux, à quoi correspondait le fondam<strong>en</strong>tal, etc.<br />

On <strong>en</strong> déduit que parfois les pati<strong>en</strong>ts peuv<strong>en</strong>t surestimer leur connais<strong>sa</strong>nce <strong>de</strong> l’outil, ce qui risque<br />

parfois <strong>de</strong> les m<strong>en</strong>er à <strong>de</strong> fausses interprétations et à <strong>de</strong>s fausses pistes d’exploration et <strong>de</strong><br />

<strong>rééducation</strong> <strong>de</strong> leur <strong>voix</strong> si leur erreur n’est pas repérée et corrigée par le thérapeute.<br />

5.3.3.3 Utili<strong>sa</strong>tion <strong>en</strong> autonomie<br />

Résultats du questionnaire<br />

Tous les pati<strong>en</strong>ts qui ont répondu au questionnaire sont d’accord avec la fait que le spectrogramme<br />

permet <strong>de</strong> s’amuser, et <strong>de</strong> visualiser <strong>de</strong>s caractéristiques objectives <strong>de</strong> la <strong>voix</strong>, mais ils sont les plus<br />

unanimes pour dire que le spectrogramme permet d’analyser la <strong>voix</strong> (<strong>en</strong>tre « plutôt d’accord » et<br />

« tout à fait d’accord »), <strong>sa</strong>uf la pati<strong>en</strong>te A qui répond « ne <strong>sa</strong>is pas ».<br />

5 pati<strong>en</strong>ts sur 10 ont téléchargé le logiciel, mais sur les 5, <strong>de</strong>ux n’ont pas pu l’utiliser pour <strong>de</strong>s<br />

raisons techniques (ils utilis<strong>en</strong>t <strong>de</strong>s ordinateurs avec le système d’exploitation Macintosh, pour<br />

lequel le logiciel proposé au téléchargem<strong>en</strong>t ne fonctionne pas. Pour ce système d’exploitation il<br />

semble que les spectrogrammes suffi<strong>sa</strong>mm<strong>en</strong>t fonctionnels sont tous payants.)<br />

4 pati<strong>en</strong>ts sur les 10 ont utilisé le site internet proposé. Les pages préférées sont celle sur la lecture<br />

d’int<strong>en</strong>sité et <strong>de</strong> hauteur, et celle sur la lecture du timbre. C’est la page « banque <strong>de</strong> son » qui a été<br />

le moins utilisé, mais il est difficile <strong>de</strong> faire <strong>de</strong>s généralités sur 3 pati<strong>en</strong>ts uniquem<strong>en</strong>t [[statistiques<br />

phpMyWebsite]]<br />

Problèmes techniques et convivialité<br />

L’ordinateur est parfois un obstacle pour les pati<strong>en</strong>ts, soit parce que le logiciel est perçu comme<br />

instable : « je voyais ton ordi bugger, et mon ordi maison rame beaucoup, j’ai peur qu’il ne suive<br />

pas » (pati<strong>en</strong>te C), soit par manque d’<strong>en</strong>vie <strong>de</strong> passer du temps <strong>en</strong>core sur un ordinateur « je passe<br />

déjà tellem<strong>en</strong>t <strong>de</strong> temps <strong>de</strong>vant l’ordinateur que j’ai pas <strong>en</strong>vie <strong>de</strong> m’installer <strong>de</strong>vant <strong>en</strong>core ».<br />

Dans un témoignage spontané, un pati<strong>en</strong>t hors protocole raconte : « Je maîtrise mal « la<br />

technique » et le simple fait d’appuyer sur run me stresse ». Certains témoignanges rapport<strong>en</strong>t<br />

égalem<strong>en</strong>t les conditions matérielles d’<strong>en</strong>registrem<strong>en</strong>t (bruit du PC, qualité du micro et <strong>de</strong>s Hauts-<br />

Parleurs) ne donn<strong>en</strong>t pas toujours <strong>de</strong>s résultats probants (<strong>voix</strong> perçue comme « métallique » par<br />

exemple)<br />

Nécessité d’un accompagnem<strong>en</strong>t pour interpréter l’image<br />

Pour la pati<strong>en</strong>te C, « c’est le spectrogramme avec l’explication qui décrypte ce qu’on voit à l’écran<br />

sinon ça sert à ri<strong>en</strong>. »<br />

La nécessité d’être initié est pointée par un pati<strong>en</strong>t qui répond au questionnaire internet : « C'est un<br />

outil ludique et instructif, à condition d'y avoir été initié auparavant, pour bi<strong>en</strong> compr<strong>en</strong>dre<br />

comm<strong>en</strong>t ça marche et ce qu'on peut faire avec. »<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 84


Pour certains pati<strong>en</strong>ts cep<strong>en</strong>dant, qui pr<strong>en</strong>n<strong>en</strong>t ici une attitu<strong>de</strong> <strong>de</strong> chercheur, l’appr<strong>en</strong>tis<strong>sa</strong>ge <strong>en</strong><br />

autonomie <strong>de</strong>s correspondances <strong>en</strong>tre l’auditif et le visuel est possible : « progressivem<strong>en</strong>t je vais<br />

appr<strong>en</strong>dre à lire mes <strong>de</strong>ssins <strong>en</strong> les regardant, les comparant, les écoutant »<br />

Nécessité d’un accompagnem<strong>en</strong>t pour gui<strong>de</strong>r le travail<br />

Le travail <strong>en</strong> autonomie avec le spectrogramme est freiné par le fait que les pati<strong>en</strong>ts ont besoin<br />

d’accompagnem<strong>en</strong>t : Pati<strong>en</strong>t B « J’ai besoin que <strong>de</strong> temps <strong>en</strong> temps il y ait <strong>de</strong>s g<strong>en</strong>s qui me dis<strong>en</strong>t<br />

« mais si, c’est la bonne voie/x, c’est ça.. » » / Pati<strong>en</strong>t C: « j’ai besoin d’un contrôle [extérieur]. […]<br />

Besoin <strong>de</strong> quelqu’un qui dit « exactem<strong>en</strong>t c’était ça » ou alors « ti<strong>en</strong>s si tu fai<strong>sa</strong>is ça » » Cet<br />

accompagnem<strong>en</strong>t permet d’<strong>en</strong>courager mais égalem<strong>en</strong>t <strong>de</strong> proposer <strong>de</strong>s idées, <strong>de</strong>s pistes.<br />

Un pati<strong>en</strong>t précise dans le questionnaire internet « Pour <strong>de</strong> l'autocorrection, je p<strong>en</strong>se qu'un<br />

pratici<strong>en</strong> doit aiguiller son pati<strong>en</strong>t dans <strong>de</strong>s exercices spécifiques à <strong>sa</strong> pathologie. Ou simplem<strong>en</strong>t<br />

pour lui indiquer la tonalité à partir <strong>de</strong> laquelle travailler ; <strong>en</strong> effet, ne connais<strong>sa</strong>nt pas mon registre,<br />

j'ai eu t<strong>en</strong>dance à forcer dans le grave ou l'aigu avec <strong>de</strong>s sons ouverts » Un autre : « Peut-être à ne<br />

pas utiliser uniquem<strong>en</strong>t seul, parce que grâce à lui on peut voir si ce qu'on fait est "correct" ou non,<br />

mais on n'a pas forcém<strong>en</strong>t les moy<strong>en</strong>s <strong>de</strong> compr<strong>en</strong>dre pourquoi ou comm<strong>en</strong>t y remédier si besoin »<br />

Les personnes utili<strong>sa</strong>nt le spectrogramme seuls ont parfois trouvé les consignes <strong>de</strong>s exercices « un<br />

peu floues » sur le site internet. Ils évoqu<strong>en</strong>t la nécessité d’avoir un « journal <strong>de</strong> bord » où noter les<br />

exercices qui ont été faits et comm<strong>en</strong>t ils ont été réussi, ainsi que l’<strong>en</strong>vie <strong>de</strong> faire le li<strong>en</strong> avec « <strong>de</strong>s<br />

techniques <strong>vocale</strong>s avec <strong>de</strong>s exercices pas à pas » « En fait un li<strong>en</strong> direct avec les exercices que<br />

propose tous les profs <strong>de</strong> chants (même sur le web), afin d'avoir un didacticiel qui nous met<br />

davantage dans une dynamique <strong>de</strong> progrès que <strong>de</strong> constat <strong>de</strong> <strong>sa</strong> qualité <strong>vocale</strong> »<br />

Nécessité d’un objectif<br />

Pour les pati<strong>en</strong>ts qui se s<strong>en</strong>t<strong>en</strong>t près à se servir seuls du spectrogramme, un objectif précis est<br />

néces<strong>sa</strong>ire : La pati<strong>en</strong>te D fournit un exemple avec une interrogation qu’elle a <strong>de</strong>puis un cours <strong>de</strong><br />

chant précis « je p<strong>en</strong>se que j’irai voir ce qui se passe dans les différ<strong>en</strong>ts /i/ les différ<strong>en</strong>tes positions <strong>de</strong><br />

langues et d’ouverture <strong>de</strong> bouche ». La pati<strong>en</strong>te A p<strong>en</strong>se s’<strong>en</strong> servir uniquem<strong>en</strong>t dans le cadre d’un<br />

travail précis sur les harmoniques (travail proposé par un Daïnouri Choque)<br />

Cep<strong>en</strong>dant, pour la pati<strong>en</strong>te D, le protocole a été plus une exploration qu’un travail sur un objectif<br />

<strong>en</strong> particulier (<strong>sa</strong>uf la <strong>de</strong>rnière séance où l’on a travaillé sur un extrait chanté et amélioré les aigus).<br />

Elle se <strong>de</strong>man<strong>de</strong> comm<strong>en</strong>t on pourrait travailler sur un objectif <strong>en</strong> particulier, surtout si la <strong>voix</strong> est<br />

pathologique. De même, pour la pati<strong>en</strong>te A « Dans ce qu'on fait <strong>en</strong>semble, il n'y a pas <strong>de</strong> soin, c'est<br />

plus un constat. Je le vois plus comme un truc <strong>de</strong> vérification, <strong>de</strong> confirmation » Une personne<br />

répondant au questionnaire internet va dans le même s<strong>en</strong>s d’outil <strong>de</strong> confirmation <strong>en</strong> di<strong>sa</strong>nt : « je<br />

n'ai pas <strong>en</strong>vie <strong>de</strong> l'utiliser très souv<strong>en</strong>t, je suis persuadée que les progrès s'install<strong>en</strong>t petit à petit,<br />

donc une fois par an me sembl<strong>en</strong>t suffi<strong>sa</strong>nt. »<br />

Utili<strong>sa</strong>tion autonome ludique<br />

Lorsqu’ils ne se s<strong>en</strong>t<strong>en</strong>t pas prêt à travailler leur <strong>voix</strong> avec l’ai<strong>de</strong> du spectrogramme, les pati<strong>en</strong>ts du<br />

protocole évoqu<strong>en</strong>t la possibilité d’utiliser le spectrogramme <strong>de</strong> façon ludique (« plutôt un<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 85


gadget », dit la pati<strong>en</strong>te A), parfois pour dédramatiser la dim<strong>en</strong>sion d’analyse que le<br />

spectrogramme comporte « peut-être si mon neveu il vi<strong>en</strong>t à la maison je le mettrai et on va jouer<br />

avec ; une utili<strong>sa</strong>tion ludique. J’ai toujours du mal à chanter chez moi, faut être capable <strong>de</strong> ses lâcher<br />

un peu pour s’amuser <strong>de</strong>vant le truc, c’est <strong>de</strong> l’auto-exploration et j’ai du mal à faire ça. » (pati<strong>en</strong>t C)<br />

5.3.4 Conclusion<br />

…<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 86


6 Discussion<br />

6.1 Validation <strong>de</strong>s hypothèses <strong>de</strong> travail<br />

6.1.1 Prise <strong>de</strong> consci<strong>en</strong>ce <strong>de</strong>s paramètres vocaux<br />

Dans notre étu<strong>de</strong>, la conduite <strong>de</strong>s exercices d’auto-analyse conduit les pati<strong>en</strong>ts à distinguer les<br />

différ<strong>en</strong>ts paramètres à évaluer (int<strong>en</strong>sité, hauteur, attaque, richesse, clarté du timbre et geste<br />

vocal), avec l’ai<strong>de</strong> d’un feedback visuel constitué par le spectrogramme, et un appr<strong>en</strong>tis<strong>sa</strong>ge rapi<strong>de</strong><br />

<strong>de</strong>s différ<strong>en</strong>ts paramètres à évaluer par <strong>de</strong>s ancrages externes pour l’attaque, la richesse et le<br />

timbre, prés<strong>en</strong>tés systématiquem<strong>en</strong>t avant les auto-analyses.<br />

6.1.1.1 Fiabilité interjuge<br />

En accord avec les conclusions <strong>de</strong> Dejonckere (Dejonckere, 2006), la fiabilité interjuge <strong>de</strong>s auditeurs<br />

du jury d’écoute est améliorée par l’adjonction d’une image spectrographique. Cela est<br />

particulièrem<strong>en</strong>t vrai pour la clarté, la richesse et le geste vocal.<br />

6.1.1.2 Observation <strong>de</strong>s paramètres<br />

Les auteurs p<strong>en</strong>s<strong>en</strong>t que le spectrogramme peut être un outil d’ai<strong>de</strong> à la prise <strong>de</strong> consci<strong>en</strong>ce <strong>de</strong><br />

certains paramètres vocaux et <strong>de</strong>s progrès effectués. Ils cit<strong>en</strong>t la hauteur (Coudière, 2003, p. 146),<br />

le timbre, l’attaque, la respiration, la précision <strong>de</strong>s phonèmes, le souti<strong>en</strong> <strong>en</strong> fin <strong>de</strong> phrase, la<br />

justesse (Nair, 1999).<br />

Les pati<strong>en</strong>ts et les personnes ayant répondu au questionnaire internet sont unanimem<strong>en</strong>t d’accord<br />

avec le fait que le spectrogramme peut permettre d’observer <strong>de</strong>s caractéristiques <strong>de</strong> leur <strong>voix</strong>. Dans<br />

le questionnaire post-protocole, les pati<strong>en</strong>ts du protocole cit<strong>en</strong>t <strong>en</strong> particulier la prise <strong>de</strong> consci<strong>en</strong>ce<br />

<strong>de</strong>s élém<strong>en</strong>ts précis <strong>de</strong> la dysphonie (spasme, ruptures <strong>de</strong> son..), les attaques dures et surtout les<br />

harmoniques (timbre vocalique, singing formant)<br />

6.1.1.3 Auto-évaluation <strong>de</strong> ses propres qualités <strong>vocale</strong>s : exercice d’auto-analyse<br />

Une bonne prise <strong>de</strong> consci<strong>en</strong>ce <strong>de</strong> ses paramètres vocaux se traduit notamm<strong>en</strong>t par une autoévaluation<br />

fiable <strong>de</strong> ses propres qualités <strong>vocale</strong>s. Il existe effectivem<strong>en</strong>t peu d’étu<strong>de</strong>s s’intéres<strong>sa</strong>nt à<br />

l’auto-évaluation par les pati<strong>en</strong>ts <strong>de</strong> leur propre <strong>voix</strong>. (Eadie et al., 2010, p. 564b) 71 . Les locuteurs<br />

baserai<strong>en</strong>t leurs jugem<strong>en</strong>ts sur <strong>de</strong>s indices différ<strong>en</strong>ts <strong>de</strong> ceux <strong>de</strong>s autres auditeurs.<br />

Meilleure distinction <strong>de</strong>s différ<strong>en</strong>ts paramètres<br />

D’après Hammarberg (1980) et Kreiman (Kreiman, Gerratt, Precoda, & Berke, 1992) (in Joana Revis,<br />

2004, p. 81), « les auditeurs candi<strong>de</strong>s t<strong>en</strong><strong>de</strong>nt à fon<strong>de</strong>r leurs impressions sur la hauteur et la<br />

puis<strong>sa</strong>nce davantage que sur les notions <strong>de</strong> souffle et <strong>de</strong> raucité ». Notre étu<strong>de</strong> permet d’observer<br />

les effets d’un appr<strong>en</strong>tis<strong>sa</strong>ge <strong>de</strong>s différ<strong>en</strong>ts paramètres vocaux <strong>en</strong> s’appuyant sur l’image<br />

spectrographique. Si les pati<strong>en</strong>ts ont au départ une vision « <strong>en</strong> bloc » <strong>de</strong> leur dysphonies, ils sont <strong>en</strong><br />

revanche capables, après feedback auditif et visuel, <strong>de</strong> dissocier les paramètres <strong>de</strong> hauteur,<br />

71 “A limited number of studies have investigated differ<strong>en</strong>ces betwe<strong>en</strong> pati<strong>en</strong>ts’ self-ratings of voice quality and inexperi<strong>en</strong>ced<br />

and experi<strong>en</strong>ced list<strong>en</strong>ers’ judgm<strong>en</strong>ts of their voice”<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 87


d’int<strong>en</strong>sité, <strong>de</strong> qualité d’attaque, <strong>de</strong> clarté et <strong>de</strong> richesse et <strong>de</strong> les apprécier chacun<br />

indép<strong>en</strong>damm<strong>en</strong>t.<br />

meilleure objectivité<br />

Pour Ka<strong>sa</strong>ma et Braslotto 72 , « les pati<strong>en</strong>ts jug<strong>en</strong>t leurs troubles vocaux par rapport aux<br />

ret<strong>en</strong>tissem<strong>en</strong>ts <strong>de</strong> ceux-ci sur leur vie quotidi<strong>en</strong>ne et non par rapport à l’altération <strong>de</strong> leurs qualités<br />

acoustiques ». (in Lescarmontier, 2012, p. 86). D’autres étu<strong>de</strong>s montr<strong>en</strong>t cep<strong>en</strong>dant que la<br />

corrélation <strong>en</strong>tre l’auto-évaluation par les pati<strong>en</strong>ts <strong>de</strong> la sévérité globale <strong>de</strong> leur dysphonie et les<br />

résultats à un test <strong>de</strong> qualité <strong>de</strong> vie (comme le VHI par exemple) reste modérée (Behrman, Sulica, &<br />

He, 2004), même si elle semble plus forte que la corrélation avec les tests perceptifs faits par un jury<br />

d’écoute (Ma & Yiu, 2001)<br />

Dans notre étu<strong>de</strong>, les modifications apportées par le spectrogramme vont dans le s<strong>en</strong>s d’une plus<br />

gran<strong>de</strong> objectivité. Le feedback auditif et visuel permet effectivem<strong>en</strong>t aux pati<strong>en</strong>ts d’affiner leur<br />

évaluation <strong>de</strong> l’int<strong>en</strong>sité, <strong>de</strong> la hauteur, <strong>de</strong> l’attaque.. Les différ<strong>en</strong>ts paramètres sont mieux<br />

distingués (moins corrélés <strong>en</strong>tre eux) du fait <strong>de</strong> ces feedback additionnels. Les corrélations<br />

observées chez les pati<strong>en</strong>ts s’approch<strong>en</strong>t <strong>de</strong> celles observées chez les auditeurs du jury d’écoute<br />

lorsqu’on ajoute les feedbacks externes.<br />

moindre corrélation <strong>en</strong>tre clarté et geste vocal<br />

Dans l’étu<strong>de</strong> <strong>de</strong> Eadie et ses collègues (Eadie et al., 2010), les auteurs ont notamm<strong>en</strong>t voulu<br />

déterminer les différ<strong>en</strong>ces <strong>en</strong>tre les auto-évaluations <strong>de</strong> 20 locuteurs dysphoniques et 4 locuteurs<br />

contrôle, et les évaluations d’auditeurs expérim<strong>en</strong>tés et inexpérim<strong>en</strong>tés <strong>en</strong> terme <strong>de</strong> « sévérité<br />

globale » et d’ « effort vocal » 73 sur <strong>de</strong>s extraits <strong>de</strong> <strong>voix</strong> parlée <strong>en</strong> lecture, <strong>en</strong>t<strong>en</strong>dus au casque. La<br />

sévérité globale et l’effort vocal étai<strong>en</strong>t évalués sur <strong>de</strong>s échelles visuelles analogiques <strong>de</strong> 100 mm.<br />

On peut rapprocher ces échelles <strong>de</strong> nos propres échelles « clarté du timbre : altéré / clair » et<br />

« comportem<strong>en</strong>t vocal : adapté / non adapté ». Ils y font la même observation que dans une étu<strong>de</strong><br />

précé<strong>de</strong>nte sur <strong>de</strong>s pati<strong>en</strong>ts dysphoniques : la corrélation <strong>en</strong>tre les <strong>de</strong>ux échelles « sévérité<br />

globale » et « effort vocal » est bi<strong>en</strong> moindre lors <strong>de</strong>s auto-évaluations que lors <strong>de</strong>s évaluations par<br />

un jury d’écoute 74 . Cela rejoint égalem<strong>en</strong>t nos conclusions concernant les corrélations <strong>en</strong>tre<br />

« clarté du timbre » et « geste vocal » : ces <strong>de</strong>ux échelles sont corrélées plus les auditeurs du jury<br />

d’écoute (0.85** à 0.78**), mais moins pour les pati<strong>en</strong>ts (0.71** à 0.41**). On note d’ailleurs que<br />

cet effet est <strong>en</strong>core plus marqué après les feedbacks externes additionnels. Eadie et ses collègues<br />

font l’hypothèse que les pati<strong>en</strong>ts, même lorsqu’ils jug<strong>en</strong>t leur effort vocal par un extrait ré<strong>en</strong>t<strong>en</strong>du,<br />

ne ti<strong>en</strong>n<strong>en</strong>t pas uniquem<strong>en</strong>t compte <strong>de</strong>s qualités acoustiques du signal audio. Ils cit<strong>en</strong>t Brand et ses<br />

collègues 75 , qui p<strong>en</strong>s<strong>en</strong>t que certains auditeurs peuv<strong>en</strong>t égalem<strong>en</strong>t faire la relation <strong>en</strong>tre ce qu’ils<br />

<strong>en</strong>t<strong>en</strong><strong>de</strong>nt et leur perception <strong>de</strong> l’effort dans la production <strong>de</strong> la <strong>voix</strong>. Cela expliquerait que les<br />

72<br />

: « vocal perception and life quality » faculda<strong>de</strong> <strong>de</strong> medicina <strong>de</strong> ribeirao prteo, universida<strong>de</strong> <strong>de</strong> <strong>sa</strong>o paulo<br />

73<br />

“overall severity (OS)” and “vocal effort (VE)”<br />

74<br />

“strong relationships were found across auditory-perceptual dim<strong>en</strong>sions for experi<strong>en</strong>ced and inexperi<strong>en</strong>ced list<strong>en</strong>ers; in<br />

contrast, the relationship betwe<strong>en</strong> perceived effort and severity was weak for the individuals with dysphonia”<br />

75<br />

Brandt JF, Ru<strong>de</strong>r KF, Shipp T. Vocal loudness and effort in continuous speech. J Acoust Soc Am. 1969;46:1543–1548.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 88


corrélations <strong>en</strong>tre les jugem<strong>en</strong>ts d’effort vocal par les pati<strong>en</strong>ts sont plus fortes avec les auditeurs<br />

plus expérim<strong>en</strong>tés qu’avec les auditeurs moins expérim<strong>en</strong>tés (Eadie et al., 2010, p. 571) [[=> à<br />

infirmer ou confirmer dans notre cas]]<br />

Pour les auditeurs du jury d’écoute, le geste vocal reste corrélé à la clarté et un peu à la qualité <strong>de</strong><br />

l’attaque. Pour les pati<strong>en</strong>ts, il semble que le feedback externe modifie leurs évaluations <strong>de</strong> la clarté<br />

et <strong>de</strong> la richesse mais pas du geste, ce qui aboutit à cette dé-corrélation. Avant le feedback, les<br />

pati<strong>en</strong>ts, <strong>en</strong> moy<strong>en</strong>ne, jug<strong>en</strong>t la richesse, la clarté et le geste d’un seul bloc (bloc compr<strong>en</strong>ant, dans<br />

une moindre mesure, la qualité <strong>de</strong> l’attaque). Le feedback externe améliore la prise <strong>de</strong> consci<strong>en</strong>ce<br />

<strong>de</strong>s différ<strong>en</strong>ces <strong>en</strong>tre qualité d’attaque, clarté et richesse, <strong>de</strong> façon indép<strong>en</strong>dante du geste vocal :<br />

lorsque <strong>de</strong>s modifications sont apportées à la clarté et à la richesse du timbre, les auditeurs ne<br />

modifi<strong>en</strong>t pas systématiquem<strong>en</strong>t leur évaluation du geste, comme si les auditeurs et les pati<strong>en</strong>ts, ne<br />

« voyant » pas le geste vocal sur l’image, ne p<strong>en</strong><strong>sa</strong>i<strong>en</strong>t pas à le modifier par la suite pour le mettre<br />

<strong>en</strong> cohér<strong>en</strong>ce avec la clarté du timbre. Cet effet est particulièrem<strong>en</strong>t prégnant pour les pati<strong>en</strong>ts, qui<br />

ont moins besoin que les auditeurs du jury d’écoute <strong>de</strong> se baser sur <strong>de</strong>s feedbacks externes pour<br />

juger ce paramètre.<br />

impact sur les s<strong>en</strong><strong>sa</strong>tions proprioceptives<br />

Pour Sapir et ses collègues, (in Lee, Drinnan, & Carding, 2005, p. 360a), les pati<strong>en</strong>ts se bas<strong>en</strong>t sur ce<br />

qu’ils <strong>en</strong>t<strong>en</strong><strong>de</strong>nt et sur ce qu’ils ress<strong>en</strong>t<strong>en</strong>t, tandis que les thérapeutes se bas<strong>en</strong>t sur ce qu’ils<br />

<strong>en</strong>t<strong>en</strong><strong>de</strong>nt et ce qu’ils voi<strong>en</strong>t du geste vocal. Behrman et ses collègues soulign<strong>en</strong>t égalem<strong>en</strong>t que les<br />

s<strong>en</strong><strong>sa</strong>tions d’effort vocal, d’inconfort musculaire conduis<strong>en</strong>t les pati<strong>en</strong>ts à évaluer leur <strong>voix</strong><br />

différemm<strong>en</strong>t <strong>de</strong>s thérapeutes <strong>de</strong> la <strong>voix</strong>, qui eux ne jug<strong>en</strong>t du comportem<strong>en</strong>t vocal qu’à partir <strong>de</strong><br />

ce qu’ils peuv<strong>en</strong>t voir (Behrman et al., 2004, p. 1698b). Dans notre étu<strong>de</strong>, le feedback visuel semble<br />

éloigner l’att<strong>en</strong>tion <strong>de</strong>s pati<strong>en</strong>ts <strong>de</strong> leur geste vocal, et dans le même temps, leur permet d’avoir<br />

<strong>de</strong>s évaluations plus proches <strong>de</strong> celles <strong>de</strong>s auditeurs du jury d’écoute. Dans le cadre d’une thérapie<br />

<strong>vocale</strong>, on pourrait se <strong>de</strong>man<strong>de</strong>r si l’évaluation première <strong>de</strong>s pati<strong>en</strong>ts, t<strong>en</strong>ant apparemm<strong>en</strong>t plus<br />

fortem<strong>en</strong>t compte <strong>de</strong> leur geste vocal, n’est pas justem<strong>en</strong>t à valoriser, au contraire <strong>de</strong> l’évaluation<br />

perceptive et acoustique externe. Le thérapeute aura à choisir <strong>en</strong>tre favoriser le caractère<br />

valori<strong>sa</strong>nt du feedback visuel et favoriser les s<strong>en</strong><strong>sa</strong>tions proprioceptives et la consci<strong>en</strong>ce du geste<br />

vocal. Les indications sont évi<strong>de</strong>mm<strong>en</strong>t diverses selon les pati<strong>en</strong>ts et selon leurs évolutions dans<br />

leur <strong>rééducation</strong>, sur le plan <strong>de</strong> la qualité subjective, objective, perceptive <strong>de</strong> leur <strong>voix</strong>, et sur le plan<br />

motivationnel et relationnel.<br />

Enfin, on note que les pati<strong>en</strong>ts, surtout ceux répondant au questionnaire internet, p<strong>en</strong>s<strong>en</strong>t que le<br />

spectrogramme affine leurs s<strong>en</strong><strong>sa</strong>tions proprioceptives. Les résultats <strong>de</strong> l’analyse <strong>de</strong>s exercices<br />

d’auto-analyse est remis <strong>en</strong> question par ce résultat. Des étu<strong>de</strong>s supplém<strong>en</strong>taires serai<strong>en</strong>t<br />

néces<strong>sa</strong>ires pour préciser cette question. On peut p<strong>en</strong>ser que suivant l’utili<strong>sa</strong>tion qui est faite du<br />

spectrogramme (<strong>en</strong> temps réel ou non, et selon les types d’exercices, la durée d’<strong>en</strong>trainem<strong>en</strong>t et<br />

d’autonomie par exemple), <strong>de</strong>s réaffér<strong>en</strong>ces peuv<strong>en</strong>t se faire, ou non, <strong>en</strong>tre les s<strong>en</strong><strong>sa</strong>tions<br />

proprioceptives et les s<strong>en</strong><strong>sa</strong>tions auditives. Notre étu<strong>de</strong> confirme que lorsque le feedback visuel a<br />

un grand intérêt dans le cas où les s<strong>en</strong><strong>sa</strong>tions proprioceptives sont perturbées (notamm<strong>en</strong>t pour la<br />

pati<strong>en</strong>te B hypers<strong>en</strong>sible à ses s<strong>en</strong><strong>sa</strong>tions internes). Nous p<strong>en</strong>sons que le li<strong>en</strong> <strong>en</strong>tre s<strong>en</strong><strong>sa</strong>tions<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 89


proprioceptives et auditives est favorisé par une visuali<strong>sa</strong>tion <strong>en</strong> temps réel, qui n’était pas au cœur<br />

<strong>de</strong> notre protocole.<br />

6.1.1.4 Conclusion<br />

Notre hypothèse est validée : l’utili<strong>sa</strong>tion du spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> permet une<br />

meilleure prise <strong>de</strong> consci<strong>en</strong>ce <strong>de</strong> ses paramètres vocaux tels que l’int<strong>en</strong>sité, la hauteur, le caractère<br />

<strong>de</strong> l’attaque. Ces paramètres sont, semble-t-il, influ<strong>en</strong>cés autant par le feedback auditif que par le<br />

feedback visuel. [[ ? ]]<br />

Les feedbacks visuels et auditifs permett<strong>en</strong>t égalem<strong>en</strong>t <strong>de</strong> distinguer dans la <strong>voix</strong> ce qui relève <strong>de</strong> la<br />

clarté et ce qui relève <strong>de</strong> la richesse du timbre, <strong>de</strong> façon indép<strong>en</strong>dante <strong>de</strong> la qualité <strong>de</strong> l’attaque.<br />

Cette distinction est favorisée par l’ajout du feedback visuel constitué par le spectrogramme.<br />

On note <strong>en</strong> revanche au travers <strong>de</strong> notre exercice d’auto-évaluation une décorrélation pour les<br />

pati<strong>en</strong>ts <strong>en</strong>tre l’évaluation <strong>de</strong> la clarté et celle du geste vocal. Notre exercice fait interv<strong>en</strong>ir le<br />

feedback visuel comme un feedback externe après-coup. Nous faisons l’hypothèse que la prise <strong>de</strong><br />

consci<strong>en</strong>ce <strong>de</strong>s li<strong>en</strong>s <strong>en</strong>tre feedback visuel et feedback proprioceptifs est favorisé par le feedback<br />

visuel <strong>en</strong> temps réel.<br />

6.1.2 auto-contrôle <strong>de</strong>s paramètres vocaux<br />

Les personnes répondant au questionnaire internet sont plus partagées <strong>en</strong> ce qui concerne la<br />

possibilité d’améliorer les paramètres <strong>de</strong> la <strong>voix</strong> observés sur le spectrogramme.<br />

Dans notre étu<strong>de</strong>, malgré le faible nombre <strong>de</strong> séance <strong>de</strong> travail (4 séances) et une population<br />

réduite (4 pati<strong>en</strong>tes), on mesure une amélioration <strong>de</strong>s productions <strong>de</strong>s pati<strong>en</strong>ts du protocole <strong>en</strong><br />

terme d’amélioration du rapport signal sur bruit et <strong>de</strong> diminution du shimmer, mais cep<strong>en</strong>dant<br />

d’autres paramètres objectifs (le jitter par exemple et le rapport <strong>de</strong>s TMP z/s) se détérior<strong>en</strong>t dans le<br />

même temps.<br />

Cep<strong>en</strong>dant, pour beaucoup <strong>de</strong> pati<strong>en</strong>ts, le feedback auditif et visuel est ress<strong>en</strong>ti comme insuffi<strong>sa</strong>nt<br />

pour améliorer ses productions <strong>vocale</strong>s. Il est considéré plutôt comme un moy<strong>en</strong> d’affiner ses<br />

s<strong>en</strong><strong>sa</strong>tions auditives et proprioceptives, qui permett<strong>en</strong>t, à leur tour, d’adapter son geste vocal.<br />

Bastian et Nagorsky indiqu<strong>en</strong>t que le feedback visuel laryngoscopique avec <strong>de</strong>s sujets dysphoniques<br />

doit v<strong>en</strong>ir <strong>en</strong> complém<strong>en</strong>t <strong>de</strong>s perceptions habituelles 76 ., qui rest<strong>en</strong>t les principaux moy<strong>en</strong>s <strong>de</strong><br />

parv<strong>en</strong>ir à un changem<strong>en</strong>t dans la production <strong>de</strong> la <strong>voix</strong>. (Bastian & Nagorsky, 1987, p. 1347)<br />

Comme Anne-Marie Laukkan<strong>en</strong> et ses collègues dans leur étu<strong>de</strong>, nous constatons que certains<br />

sujets peuv<strong>en</strong>t être plus à l’aise avec le feedback auditif, et que dans ce cas ils auront <strong>de</strong> moins bon<br />

résultats avec un feedback visuel, tandis que certains autres sujets, ne dispo<strong>sa</strong>nt pas d’une<br />

perception auditive suffi<strong>sa</strong>mm<strong>en</strong>t fine, auront au contraire absolum<strong>en</strong>t besoin du feedback visuel.<br />

(Laukkan<strong>en</strong> et al., 2004, p. 73b). Ces auteurs not<strong>en</strong>t que les sujets dispo<strong>sa</strong>nt du feedback visuel<br />

76 “if the study allu<strong>de</strong>d to indicate that laryngeal image biofeedback is a strong learning tool, only th<strong>en</strong> should it be assessed<br />

with actual voice disor<strong>de</strong>r pati<strong>en</strong>ts, as an adjunct to their auditory and somatos<strong>en</strong>sory feedback perception, rather than in<br />

“isolation” from them”<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 90


sembl<strong>en</strong>t avoir fait plus d’effort pour arriver au but, et que cela peut nuire à la qualité <strong>vocale</strong> que<br />

l’on recherche. Les auteurs préconis<strong>en</strong>t <strong>de</strong> ne pas négliger les feedbacks s<strong>en</strong>soriels habituels et <strong>de</strong><br />

toujours porter att<strong>en</strong>tion à la qualité <strong>de</strong> la <strong>voix</strong>. 77 (Laukkan<strong>en</strong> et al., 2004, p. 74a) Nous notons<br />

égalem<strong>en</strong>t <strong>de</strong>s cas d’utili<strong>sa</strong>tion du spectrogramme <strong>en</strong> autonomie, où <strong>de</strong>s comportem<strong>en</strong>ts excessifs<br />

<strong>de</strong> pati<strong>en</strong>t qui voudrait « faire une belle image » pourrai<strong>en</strong>t nuire à l’établissem<strong>en</strong>t d’un<br />

comportem<strong>en</strong>t vocal adapté. (Coudière, 2003, p. 134,147; Manteau, 2004, p. 66; Maulet, 1997, p.<br />

86; Nair, 1999, p. 17; Roch, 2001, pp. 62–63; Verdolini & Krebs, 1999, pp. 236–238)<br />

On note égalem<strong>en</strong>t que l’utili<strong>sa</strong>tion du spectrogramme peut induire <strong>de</strong>s comportem<strong>en</strong>ts vocaux<br />

inadaptés du fait du matériel lui-même : indui<strong>sa</strong>nt une posture inadéquate, gênant à cause <strong>de</strong> la<br />

nécessité du micro, et du stress <strong>de</strong>s dysfonctionnem<strong>en</strong>ts informatiques. Ces inconvéni<strong>en</strong>ts sont<br />

notés égalem<strong>en</strong>t dans le mémoire <strong>de</strong> Caroline Coudière (Coudière, 2003, p. 62,143)<br />

Conclusion : notre hypothèse n’est pas validée. Notre travail était axé sur le feedback externe<br />

après-coup et s’appuyait sur 4 pati<strong>en</strong>tes seulem<strong>en</strong>t. On fait l’hypothèse que le feedback <strong>en</strong> temps<br />

réel favorise un meilleur auto-contrôle <strong>de</strong> ses paramètres vocaux et que nous ne disposions pas<br />

d’une population suffi<strong>sa</strong>mm<strong>en</strong>t nombreuse pour répondre à cette question.<br />

6.1.3 Construction d’une image plus positive <strong>de</strong> <strong>sa</strong> <strong>voix</strong><br />

6.1.3.1 Effets observés dans l’exercice d’auto-analyse<br />

Le feedback auditif et visuel a le plus souv<strong>en</strong>t un effet gratifiant sur l’auto-évaluation <strong>de</strong> <strong>sa</strong> propre<br />

qualité d’attaque et la richesse <strong>de</strong> son timbre. Pour les pati<strong>en</strong>ts hors protocole, l’effet est visible<br />

aussi pour la clarté et le geste vocal.<br />

Dans l’étu<strong>de</strong> <strong>de</strong> Lee and coll (Lee et al., 2005), les auteurs conclu<strong>en</strong>t que le paramètre « Gra<strong>de</strong> » du<br />

GRBAS était jugé (<strong>en</strong> moy<strong>en</strong>ne) moins sévèrem<strong>en</strong>t par les clinici<strong>en</strong>s que par les pati<strong>en</strong>ts<br />

(respectivem<strong>en</strong>t 1 et 1,4). Cet effet est égalem<strong>en</strong>t cité par Sapir et al 78 (in Eadie et al., 2010, p.<br />

569b). Nous ne retrouvons pas cet effet : <strong>en</strong> moy<strong>en</strong>ne les pati<strong>en</strong>ts sur-évalu<strong>en</strong>t leur clarté. Les<br />

pati<strong>en</strong>ts hors protocole se sur-évalu<strong>en</strong>t surtout avant le feedback, et les pati<strong>en</strong>ts hors protocole<br />

davantage après le feedback.<br />

6.1.3.2 Effets observés par l’évolution <strong>de</strong>s pati<strong>en</strong>ts<br />

Les pourc<strong>en</strong>tages <strong>de</strong> <strong>sa</strong>tisfaction <strong>de</strong> chacun <strong>de</strong>s pati<strong>en</strong>ts du protocole augm<strong>en</strong>t<strong>en</strong>t <strong>en</strong>tre le début et<br />

la fin du protocole. Le VHI-10 diminue <strong>de</strong> 3,5 points <strong>en</strong> moy<strong>en</strong>ne (sur 40) pour la <strong>voix</strong> parlée.<br />

L’exam<strong>en</strong> détaillé <strong>de</strong>s adjectifs utilisés pour caractériser leur <strong>voix</strong> et la <strong>voix</strong> qu’ils voudrai<strong>en</strong>t avoir<br />

montre que les pati<strong>en</strong>ts ont tous une meilleure image <strong>de</strong> leur <strong>voix</strong> à la fin du protocole : ils lui<br />

donn<strong>en</strong>t plus <strong>de</strong> qualificatifs positifs, et sont moins frustrés par rapport à <strong>de</strong>s souhaits non réalisés.<br />

En détail, nous réalisons égalem<strong>en</strong>t que les pati<strong>en</strong>ts sont moins influ<strong>en</strong>cés par les qualificatifs se<br />

rapportant aux émotions et aux s<strong>en</strong><strong>sa</strong>tions, et plus par les qualificatifs se rapportant aux<br />

77 “the higher phonatory effort in the BF group seems to imply a danger of hyperfunctional voice production wh<strong>en</strong> visual<br />

feedback is excessively relied on. Therefore, it should be stressed that wh<strong>en</strong> visual feedback is used, other s<strong>en</strong>sory feedback<br />

should not be neglected and the trainees’ voice quality needs to be carefully monitored by the trainer”.<br />

78 Sapir S, Aronson AE, Thomas JE. Judgm<strong>en</strong>t of voice improvem<strong>en</strong>t after recurr<strong>en</strong>t laryngeal nerve section for spastic<br />

dysphonia: clinicians versus pati<strong>en</strong>ts. Ann Otol Rhinol Laryngol. 1986;95:137–141.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 91


paramètres acoustiques auxquels on s’est intéressé durant l’étu<strong>de</strong> : int<strong>en</strong>sité, clarté, richesse du<br />

timbre. On observe ici, comme dans l’exercice d’auto-analyse, une plus gran<strong>de</strong> objectivité,<br />

bénéfique à l’image qu’ont les pati<strong>en</strong>ts <strong>de</strong> leur <strong>voix</strong>. (Cette façon <strong>de</strong> caractériser <strong>sa</strong> <strong>voix</strong> correspond<br />

plus à la façon <strong>de</strong> caractériser le timbre <strong>de</strong>s auditeurs experts que <strong>de</strong>s auditeurs naïfs [garnier cité<br />

par … ? … ]. )<br />

6.1.3.3 Effets observés dans les comm<strong>en</strong>taires <strong>en</strong> fin <strong>de</strong> protocole et le questionnaire<br />

internet<br />

Les <strong>en</strong>treti<strong>en</strong>s <strong>de</strong> fin <strong>de</strong> protocole montr<strong>en</strong>t que le spectrogramme, plus qu’une simple réécoute <strong>de</strong><br />

<strong>sa</strong> <strong>voix</strong>, permet une mise à distance du problème <strong>de</strong> <strong>voix</strong> (Caza<strong>de</strong>, 2000, p. 14) et une<br />

dédramati<strong>sa</strong>tion.<br />

L’attitu<strong>de</strong> du thérapeute face à l’image et son interprétation positive <strong>de</strong>s phénomènes observés y<br />

est pour beaucoup, mais égalem<strong>en</strong>t le fait que <strong>de</strong> mettre à plat les difficultés ou les objectifs visés<br />

r<strong>en</strong>d la relation à <strong>sa</strong> <strong>voix</strong> plus facile. R<strong>en</strong>dre objectif les progrès effectués et les possibilités <strong>de</strong><br />

reproduire avec <strong>sa</strong> <strong>voix</strong> le modèle du thérapeute, voire <strong>de</strong> faire mieux que le thérapeute, semble<br />

redonner aux pati<strong>en</strong>ts confiance <strong>en</strong> leurs possibilités et leurs qualités <strong>vocale</strong>s.<br />

Nous avons observé que même lorsque les pati<strong>en</strong>ts pouvai<strong>en</strong>t être confrontés directem<strong>en</strong>t à leurs<br />

difficultés <strong>vocale</strong>s, cela leur était bénéfique. Les pati<strong>en</strong>ts exprim<strong>en</strong>t que le fait <strong>de</strong> pouvoir observer<br />

les difficultés donnai<strong>en</strong>t la possibilité <strong>de</strong> travailler <strong>de</strong>ssus. La possibilité offerte par le<br />

spectrogramme <strong>de</strong> se référer à un modèle visuel positif plutôt qu’à un feedback verbal négatif<br />

(Pearson et al., 2011, p. 174) peut être égalem<strong>en</strong>t un facteur permettant la restauration d’une<br />

meilleure image sonore du pati<strong>en</strong>t.<br />

Nous p<strong>en</strong>sons que les mêmes mécanismes psychologiques que ceux décrit par Valérie Peloux<br />

peuv<strong>en</strong>t être <strong>en</strong> jeu. Valérie Peloux explique <strong>en</strong> effet cet type d’effet pour les <strong>en</strong>fants<br />

mal<strong>en</strong>t<strong>en</strong>dants qui utilis<strong>en</strong>t le speechViewer « Le rééducateur n'est plus celui qui corrige, juge, ou<br />

évalue les productions, Il <strong>de</strong>vi<strong>en</strong>t celui qui "ai<strong>de</strong>" l'<strong>en</strong>fant face à la machine, qui conseille et surveille<br />

les manipulations.[…] C'est l'ordinateur qui est investi <strong>de</strong>s élém<strong>en</strong>ts <strong>de</strong> jugem<strong>en</strong>t, non plus l'adulte ».<br />

(Peloux, 1993, p. 61)<br />

Nous expliquons donc mal pourquoi les pati<strong>en</strong>tes sembl<strong>en</strong>t toutes moins sûres <strong>de</strong> leur <strong>voix</strong>, <strong>en</strong><br />

répondant plus souv<strong>en</strong>t avoir « peur que leur <strong>voix</strong> les trahiss<strong>en</strong>t » dans le questionnaire postprotocole.<br />

Cela peut être év<strong>en</strong>tuellem<strong>en</strong>t un effet <strong>de</strong>s divers biais liés à ce questionnaire.<br />

6.1.3.4 Conclusion<br />

Notre hypothèse est validée. Pour la construction d’une meilleure image <strong>de</strong> <strong>sa</strong> <strong>voix</strong> <strong>de</strong> la part du<br />

pati<strong>en</strong>t, il semble que l’image mise à distance et objectivée joue un rôle plus important que le<br />

feedback auditif. Cep<strong>en</strong>dant nous attirons l’att<strong>en</strong>tion sur le fait que la technique spectrographique<br />

seule ne suffit pas à produire cet effet. L’attitu<strong>de</strong> positive du thérapeute est néces<strong>sa</strong>ire.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 92


6.1.4 Impact positif sur la relation thérapeutique<br />

6.1.4.1 Modification <strong>de</strong> la position du thérapeute<br />

Caroline Coudière exprime le changem<strong>en</strong>t <strong>de</strong> la position du thérapeute lorsqu’un outil informatique<br />

est utilisé : « L’ordinateur change la place du thérapeute qui va <strong>de</strong>v<strong>en</strong>ir un gui<strong>de</strong> référ<strong>en</strong>t <strong>de</strong><br />

l’utili<strong>sa</strong>tion <strong>de</strong> la machine. Cela <strong>en</strong>traîne une modification par rapport à la loi : la relation duelle<br />

<strong>en</strong>seignant/ <strong>en</strong>seigné disparaît, le rééducateur n’est plus dans la position d’un dét<strong>en</strong>teur exclusif du<br />

<strong>sa</strong>voir. La démarche se situe dans une optique <strong>de</strong> transfert <strong>de</strong> connais<strong>sa</strong>nces. L’ordinateur est aussi<br />

l’objet <strong>de</strong> phénomènes transfér<strong>en</strong>tiels. Il va <strong>de</strong>v<strong>en</strong>ir pour le thérapeute un part<strong>en</strong>aire et médiateur<br />

<strong>de</strong> la relation thérapeutique. La tria<strong>de</strong> constituée peut permettre <strong>de</strong> débloquer une situation<br />

conflictuelle avec le rééducateur ou <strong>de</strong> surmonter un refus initial <strong>de</strong> prise <strong>en</strong> charge par le pati<strong>en</strong>t.<br />

Ce déplacem<strong>en</strong>t d’affects vers la machine permet aussi parfois d’éviter une approche trop directe du<br />

symptôme et <strong>de</strong> placer le pati<strong>en</strong>t dans une situation plus spontanée. […] La relation pratici<strong>en</strong>/<br />

pati<strong>en</strong>t existe aussi réellem<strong>en</strong>t quand on peut introduire <strong>de</strong>s tours <strong>de</strong> rôle, stopper l’application pour<br />

faire <strong>de</strong>s comm<strong>en</strong>taires ou poser <strong>de</strong>s questions. » (Coudière, 2003, p. 61)<br />

On note effectivem<strong>en</strong>t que la relation à trois avec l’ordinateur a pu être très appréciée (pati<strong>en</strong>te B)<br />

comme elle a pu égalem<strong>en</strong>t être plus difficile (pati<strong>en</strong>te A) selon les personnalités, les att<strong>en</strong>tes et les<br />

antécé<strong>de</strong>nts parfois malheureux <strong>de</strong>s pati<strong>en</strong>tes. La majorité <strong>de</strong>s pati<strong>en</strong>tes du protocole ont<br />

cep<strong>en</strong>dant beaucoup apprécié l’emploi du spectrogramme et les séances du protocole.<br />

6.1.4.2 Base <strong>de</strong> travail stable et partagée<br />

Pour certaines, et notamm<strong>en</strong>t la pati<strong>en</strong>te C, le spectrogramme permet l’instauration d’une relation<br />

apaisée avec le thérapeute, du fait <strong>de</strong> son côté (plus ou moins) objectif et indiscutable. Si<br />

l’interprétation <strong>de</strong> l’image spectrographique est subjective, <strong>en</strong> tout cas cet outil r<strong>en</strong>d possible le fait<br />

<strong>de</strong> s’<strong>en</strong>t<strong>en</strong>dre sur ce dont on parle, <strong>en</strong> le montrant sur l’écran. (D. Miller & Schutte, 1999a, p. 210).<br />

Harmoniser les perceptions et les att<strong>en</strong>tes du pati<strong>en</strong>t et du thérapeute peut être considéré comme<br />

un objectif <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> 79 (in Lee et al., 2005, p. 360b). En ce s<strong>en</strong>s, l’utili<strong>sa</strong>tion du<br />

spectrogramme peut-être très bénéfique.<br />

6.1.4.3 Nécessité <strong>de</strong> rester prés<strong>en</strong>t au pati<strong>en</strong>t<br />

Caroline Coudière (Coudière, 2003, p. 64) cite le dossier <strong>de</strong> N. Chaze 80 : « 60% <strong>de</strong>s orthophonistes<br />

non informatisés trouv<strong>en</strong>t que l’emploi <strong>de</strong> l’informatique <strong>en</strong> <strong>rééducation</strong> orthophonique est une<br />

contrainte nui<strong>sa</strong>nt gravem<strong>en</strong>t à la qualité et à la richesse <strong>de</strong> la relation ; alors que 97% <strong>de</strong>s<br />

orthophonistes informatisés p<strong>en</strong>s<strong>en</strong>t que l’ordinateur a permis d’<strong>en</strong>richir la relation et <strong>de</strong> compléter<br />

le travail. » En ce s<strong>en</strong>s, il semble que ce soit la non familiarité avec un outil qui fait craindre pour la<br />

qualité <strong>de</strong> la relation. Tout l’art <strong>de</strong> la <strong>rééducation</strong> orthophonique consiste à intégrer les différ<strong>en</strong>ts<br />

outils à disposition <strong>sa</strong>ns cesser <strong>de</strong> porter une att<strong>en</strong>tion particulière à la relation thérapeutique.<br />

79 Wa<strong>de</strong> D. (1998) Editorial, A framework for consi<strong>de</strong>ring rehabilitation interv<strong>en</strong>tions. Clin. Rehabil. 12, 363–368<br />

80 N. Chaze, Apports et limites <strong>de</strong> l’utili<strong>sa</strong>tion <strong>de</strong> l’informatique <strong>en</strong> <strong>rééducation</strong> orthophonique, dossier paru sur<br />

http://www.orthomalin.com, septembre 2002<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 93


Dans leur étu<strong>de</strong> avec <strong>de</strong>ux professeurs <strong>de</strong> chant, Welch observ<strong>en</strong>t que les professeurs <strong>de</strong> chant<br />

n’ont pas <strong>de</strong> difficulté à rester att<strong>en</strong>tif à l’élève, même lorsque les professeurs n’étai<strong>en</strong>t pas familier<br />

avec l’outil informatique (Welch et al., 2005, p. 241)<br />

6.1.4.4 Conclusion<br />

Notre hypothèse est validée. Nous p<strong>en</strong>sons que l’image spectrographique, à laquelle on peut se<br />

reporter objectivem<strong>en</strong>t, est à l’origine <strong>de</strong>s modifications bénéfiques <strong>de</strong> la relation thérapeutique<br />

plutôt qu’un feedback acoustique. De nouveau, nous précisons que c’est l’utili<strong>sa</strong>tion <strong>de</strong> l’outil à bon<br />

esci<strong>en</strong>t qui fait la relation thérapeutique, et non l’outil lui-même.<br />

6.2 Limites<br />

6.2.1 Biais relatif à la population<br />

6.2.1.1 Biais <strong>de</strong> recrutem<strong>en</strong>t<br />

Nous n’avons pu réaliser <strong>de</strong> recrutem<strong>en</strong>t systématique pour inclure les pati<strong>en</strong>ts à notre travail.<br />

Dans ces conditions, le recrutem<strong>en</strong>t était à base <strong>de</strong> volontariat et les personnes qui étai<strong>en</strong>t<br />

volontaires pour le protocole ont une relation à leur <strong>voix</strong> différ<strong>en</strong>te <strong>de</strong> la population tout-v<strong>en</strong>ant.<br />

La seule personne qui a été recrutée par le biais d’une orthophonie (Pati<strong>en</strong>te A) est celle qui a le<br />

moins compris la finalité <strong>de</strong>s séances du protocole, celle qui a été le plus critique vis-à-vis du<br />

spectrogramme et <strong>de</strong>s exercices d’auto-analyse. Cela laisse p<strong>en</strong>ser que la population tout-v<strong>en</strong>ant<br />

d’un cabinet d’orthophonie pourrait beaucoup plus souv<strong>en</strong>t avoir cette attitu<strong>de</strong> réservée face à<br />

cette approche que ce que nos résultats laiss<strong>en</strong>t <strong>en</strong>t<strong>en</strong>dre.<br />

On peut citer égalem<strong>en</strong>t le peu d’<strong>en</strong>thousiasme <strong>de</strong>s orthophonistes, et même parfois une franche<br />

incompréh<strong>en</strong>sion, face au protocole que nous proposions <strong>de</strong> mettre <strong>en</strong> place avec certains <strong>de</strong> leurs<br />

pati<strong>en</strong>ts. C’est justem<strong>en</strong>t cet état <strong>de</strong> fait qui nous a contraintes à modifier le protocole et recruter<br />

<strong>de</strong>s personnes <strong>en</strong> <strong>de</strong>hors <strong>de</strong>s cabinets d’orthophonie.<br />

De même, les personnes qui ont répondu au questionnaire internet sont très certainem<strong>en</strong>t celles<br />

qui sont les plus intéressées par notre étu<strong>de</strong>.<br />

Malgré le faible nombre <strong>de</strong> personnes questionnées par notre étu<strong>de</strong> et le fort biais <strong>de</strong> recrutem<strong>en</strong>t,<br />

les avis et les expéri<strong>en</strong>ces récoltées rest<strong>en</strong>t intéres<strong>sa</strong>nts à pr<strong>en</strong>dre <strong>en</strong> compte.<br />

6.2.1.2 Disparité pati<strong>en</strong>ts hors protocole / pati<strong>en</strong>ts protocole<br />

Les pati<strong>en</strong>tes du protocole étant toutes chanteuses, elles ont une connais<strong>sa</strong>nce et une pratique <strong>de</strong><br />

leur <strong>voix</strong> bi<strong>en</strong> différ<strong>en</strong>te <strong>de</strong> certains pati<strong>en</strong>ts hors protocole, dont certains seulem<strong>en</strong>t sont<br />

chanteurs ou chanteuses.<br />

Eadie et ses collègues ont étudié la différ<strong>en</strong>ce <strong>en</strong>tre musici<strong>en</strong>s et non musici<strong>en</strong>s dans leur fiabilité à<br />

évaluer les caractères rauques et soufflé <strong>de</strong> <strong>voix</strong> dysphoniques, <strong>en</strong> rapport avec leur perception <strong>de</strong><br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 94


la hauteur tonale. Colon et Estill 81 avai<strong>en</strong>t montré que les musici<strong>en</strong>s reconnais<strong>sa</strong>i<strong>en</strong>t mieux les<br />

timbres <strong>de</strong> <strong>voix</strong> chantées non dysphoniques. A leur suite, Eadie et ses collègues conclu<strong>en</strong>t que les<br />

musici<strong>en</strong>s ont une meilleure fiabilité interjuge que les non-musici<strong>en</strong>s, pour le caractère soufflé (et<br />

rauque dans une moindre mesure) <strong>de</strong> <strong>voix</strong> dysphoniques, sur <strong>de</strong>s voyelles t<strong>en</strong>ues.<br />

Nous retrouvons cet effet, car l’erreur sur la clarté est moindre pour les pati<strong>en</strong>ts du protocole<br />

(12,4mm) que pour ceux hors protocole (22,7mm).<br />

D’autre part le groupe hors protocole compr<strong>en</strong>d <strong>de</strong>s hommes et <strong>de</strong>s femmes alors que le groupe<br />

protocole est <strong>en</strong>tièrem<strong>en</strong>t constitué <strong>de</strong> femmes. Nous aurions pu t<strong>en</strong>ter <strong>de</strong> discriminer <strong>en</strong>tre les<br />

hommes et les femmes du groupe hors protocole afin d’étudier l’influ<strong>en</strong>ce <strong>de</strong> la variable sexe. Enfin,<br />

le groupe hors protocole est constitué <strong>de</strong> 11 personnes alors qu’il n’y a que 4 pati<strong>en</strong>tes dans le<br />

groupe protocole. Les comparaisons statistiques <strong>en</strong>tre ses <strong>de</strong>ux groupes ne sont pas <strong>en</strong>tièrem<strong>en</strong>t<br />

statistiquem<strong>en</strong>t vali<strong>de</strong>s.<br />

6.2.1.3 Biais relatifs au questionnaire internet<br />

Les réponses au questionnaire internet sont à pr<strong>en</strong>dre avec du recul : elles ne sont pas toujours<br />

cohér<strong>en</strong>tes (par exemple la question sur le temps réel). Il semble que la règle <strong>de</strong>s 3 « oui » (« quand<br />

on a répondu oui à la première question, oui à la question suivante, on a <strong>de</strong> fortes probabilités <strong>de</strong><br />

répondre égalem<strong>en</strong>t oui à la troisième » (Py, 2010, p. 23)) ait s<strong>en</strong>siblem<strong>en</strong>t faussé les réponses au<br />

questionnaire.<br />

6.2.1.4 Biais relatif au bilan subjectif<br />

On note que la relation <strong>en</strong>tre les pati<strong>en</strong>tes et l’expérim<strong>en</strong>tateur n’est pas la même au début du<br />

protocole qu’à la fin. Cela peut impliquer <strong>de</strong>s modifications dans chacun <strong>de</strong>s questionnaires (même<br />

la liste d’adjectif qui est pourtant remplie par le pati<strong>en</strong>t lorsqu’il est seul : <strong>en</strong> fin d’expérim<strong>en</strong>tation,<br />

les pati<strong>en</strong>tes <strong>sa</strong>v<strong>en</strong>t pour qui elles le rempliss<strong>en</strong>t, et la personnalité <strong>de</strong> l’expérim<strong>en</strong>tateur influ<strong>en</strong>ce<br />

leurs réponses, ce qui n’était pas le cas au début <strong>de</strong> l’expérim<strong>en</strong>tation). On <strong>de</strong>vra gar<strong>de</strong>r à l’esprit<br />

que les résultats <strong>de</strong> notre étu<strong>de</strong> sont bi<strong>en</strong> sûr liés à la façon dont l’expérim<strong>en</strong>tateur a m<strong>en</strong>é les<br />

séances et à la relation particulière qu’elle a tissé avec les pati<strong>en</strong>ts.<br />

6.2.1.5 Biais relatifs au bilan perceptif et au jury d’écoute:<br />

Nous avons suivi au maximum les recommandations <strong>de</strong> Joana Revis et son équipe (Joana Revis,<br />

2004, pp. 90–94). En revanche, pour <strong>de</strong>s raisons <strong>de</strong> disponibilité <strong>de</strong>s auditeurs, une seule session<br />

d’écoute a été effectuée. De plus la durée <strong>de</strong> la session d’écoute était trop gran<strong>de</strong> (près d’une<br />

heure et <strong>de</strong>mie) pour que toutes les évaluations puiss<strong>en</strong>t être effectuées à la suite dans <strong>de</strong>s<br />

conditions optimales (« une session d’écoute ne <strong>de</strong>vrait pas dépasser quarante-cinq minutes afin <strong>de</strong><br />

conserver toutes les capacités <strong>de</strong> conc<strong>en</strong>tration <strong>de</strong>s auditeurs »)<br />

D’autre part, malgré le soin apporté au matériel d’<strong>en</strong>registrem<strong>en</strong>t, le micro serre-tête n’a pas été<br />

positionné <strong>de</strong> la même façon pour les évaluations avant et après le protocole, ce qui a pu gêner les<br />

évaluations perceptives du jury d’écoute. D’autre part, pour <strong>de</strong>s raisons <strong>de</strong> disponibilité, <strong>de</strong>ux <strong>de</strong>s<br />

81 Colton RH, Estill J. Elem<strong>en</strong>ts of voice quality: perceptual, acoustic&physiologic aspects. In: Lass, ed. Speech and language: advances in basic<br />

research and practice. New York: Aca<strong>de</strong>mic Press; 1981:311–403.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 95


auditeurs du jury d’écoute étai<strong>en</strong>t égalem<strong>en</strong>t expérim<strong>en</strong>tateurs, les <strong>de</strong>ux autres connais<strong>sa</strong>nt chacun<br />

une pati<strong>en</strong>te du protocole. L’évaluation perceptive n’est pas effectuée rigoureusem<strong>en</strong>t <strong>en</strong> aveugle<br />

(Dejonckere et al., 2001, p. 81)<br />

6.2.2 Evaluation difficile <strong>de</strong> l’apport du feedback visuel<br />

6.2.2.1 Apport spécifique du feedback visuel par rapport au feedback auditif dans l’exercice<br />

d’auto-analyse<br />

Notre étu<strong>de</strong> distingue les apports du feedback visuel (spectrogramme) par rapport au feedback<br />

auditif (réécoute <strong>de</strong> l’extrait) <strong>de</strong> façon claire pour les auditeurs du jury d’écoute, pour lesquels la<br />

première condition d’évaluation est une écoute <strong>de</strong>s <strong>de</strong>ux sons, la <strong>de</strong>uxième condition étant l’écoute<br />

<strong>de</strong>s <strong>de</strong>ux sons avec la visuali<strong>sa</strong>tion du spectrogramme.<br />

En revanche, pour les pati<strong>en</strong>ts, nous n’avons pas respecté ces <strong>de</strong>ux conditions. En effet, nous<br />

voulions connaître leur évaluation immédiate, celle correspondant à ce qu’ils peuv<strong>en</strong>t expérim<strong>en</strong>ter<br />

dans leur vie quotidi<strong>en</strong>ne. Nous <strong>de</strong>vions donc leur <strong>de</strong>man<strong>de</strong>r leur évaluation directem<strong>en</strong>t après<br />

avoir émis un son. Afin <strong>de</strong> ne pas multiplier les évaluations, l’évaluation avec uniquem<strong>en</strong>t feedback<br />

auditif n’a pas été ret<strong>en</strong>u. De plus cette décision a été prise avant <strong>de</strong> r<strong>en</strong>oncer à constituer une<br />

population témoin <strong>de</strong> pati<strong>en</strong>ts qui aurai<strong>en</strong>t travaillé avec un feedback auditif mais <strong>sa</strong>ns feedback<br />

visuel.<br />

Cep<strong>en</strong>dant l’apport spécifique du feedback visuel a pu être appréh<strong>en</strong>dé <strong>de</strong> différ<strong>en</strong>tes manières :<br />

- par l’observation <strong>de</strong>s réactions <strong>de</strong>s pati<strong>en</strong>ts lors <strong>de</strong> la pas<strong>sa</strong>tion <strong>de</strong> l’exercice, et <strong>en</strong> leur<br />

<strong>de</strong>man<strong>de</strong>r « c’est plutôt <strong>en</strong> <strong>en</strong>t<strong>en</strong>dant ou <strong>en</strong> voyant que vous changez d’avis sur votre<br />

production ? ».<br />

- par l’observation <strong>de</strong>s réactions <strong>de</strong>s pati<strong>en</strong>ts <strong>en</strong> séance lorsqu’ils regar<strong>de</strong>nt l’image<br />

spectrographique <strong>sa</strong>ns réécouter leur <strong>voix</strong>. [[pas dépouillé]]<br />

- par l’introduction ponctuelle du feedback auditif seul <strong>en</strong>tre la condition <strong>sa</strong>ns feedback<br />

externe et la condition avec feedback auditif et visuel<br />

- Par comparaison <strong>de</strong>s résultats moy<strong>en</strong>s <strong>de</strong>s pati<strong>en</strong>ts du protocole <strong>en</strong>tre leur première<br />

pas<strong>sa</strong>tion (où l’on ajoute uniquem<strong>en</strong>t le feedback auditif) et les <strong>de</strong>uxièmes et troisièmes<br />

pas<strong>sa</strong>tions (où l’on ajoute <strong>en</strong> même temps les feedback auditif et visuel) <strong>de</strong> l’exercice<br />

d’auto-analyse. Les résultats <strong>de</strong> cette comparaison sont à interpréter avec réserve du fait du<br />

faible nombre <strong>de</strong> données (4 pas<strong>sa</strong>tions seulem<strong>en</strong>t), et du biais introduit par le fait que cette<br />

pas<strong>sa</strong>tion <strong>sa</strong>ns spectrogramme est systématiquem<strong>en</strong>t la première occurr<strong>en</strong>ce <strong>de</strong> l’exercice<br />

d’auto-analyse, et que <strong>de</strong>s effets dus au fait que les pati<strong>en</strong>ts doiv<strong>en</strong>t analyser leur <strong>voix</strong> <strong>en</strong><br />

détail pour la première fois peuv<strong>en</strong>t interv<strong>en</strong>ir.<br />

- <strong>en</strong> considérant, avec la réserve que le jury d’écoute est plus expérim<strong>en</strong>té que les pati<strong>en</strong>ts,<br />

que lorsque le feedback visuel ne modifie pas beaucoup les évaluations du jury d’écoute<br />

pour un paramètre, c’est que l’évaluation <strong>de</strong> ce paramètre dép<strong>en</strong>d surtout du feedback<br />

auditif (comme c’est le cas pour l’int<strong>en</strong>sité et surtout la hauteur)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 96


6.2.2.2 Apport spécifique du feedback visuel par rapport aux interv<strong>en</strong>tions verbales <strong>de</strong><br />

l’expérim<strong>en</strong>tateur dans l’exercice d’auto-analyse<br />

Lorsque les pati<strong>en</strong>ts s’évalu<strong>en</strong>t pour la <strong>de</strong>uxième fois, les expérim<strong>en</strong>tateurs pr<strong>en</strong>n<strong>en</strong>t <strong>en</strong> général<br />

[[pas mesuré]] plus <strong>de</strong> temps pour questionner le pati<strong>en</strong>t et le gui<strong>de</strong>r, notamm<strong>en</strong>t afin <strong>de</strong><br />

réinterpréter avec lui l’image spectrographique lorsqu’elle est mal comprise. Cela a été notamm<strong>en</strong>t<br />

le cas pour les pati<strong>en</strong>ts hors protocole. Dans ces conditions, il <strong>de</strong>vi<strong>en</strong>t plus difficile <strong>de</strong> faire la part<br />

<strong>de</strong>s effets induits par l’image spectrographique <strong>de</strong> ceux induits par les interv<strong>en</strong>tions <strong>de</strong>s<br />

expérim<strong>en</strong>tateurs. Cep<strong>en</strong>dant nous considérons le spectrogramme comme un outil mis à la<br />

disposition <strong>de</strong>s thérapeutes. L’effet <strong>de</strong> cet outil est indéniablem<strong>en</strong>t lié à la façon dont les<br />

thérapeutes l’utilis<strong>en</strong>t.<br />

On note que la pas<strong>sa</strong>tion <strong>de</strong>s pati<strong>en</strong>ts hors protocole (hormis une pati<strong>en</strong>te pour 2 pas<strong>sa</strong>tions) était<br />

faite <strong>en</strong> prés<strong>en</strong>ce <strong>de</strong>s <strong>de</strong>ux expérim<strong>en</strong>tateurs, tandis que la pas<strong>sa</strong>tion <strong>de</strong>s pati<strong>en</strong>ts protocole était<br />

toujours faite par le même expérim<strong>en</strong>tateur. La prés<strong>en</strong>ce du <strong>de</strong>uxième expérim<strong>en</strong>tateur et son<br />

approche spécifique induit év<strong>en</strong>tuellem<strong>en</strong>t <strong>de</strong>s attitu<strong>de</strong>s différ<strong>en</strong>tes par rapport à l’exercice et par<br />

rapport au spectrogramme.<br />

6.2.2.3 Rigueur <strong>de</strong>s conditions <strong>de</strong> conditionnem<strong>en</strong>t<br />

Il est clair que la complexité <strong>de</strong>s tâches <strong>de</strong>mandées lors <strong>de</strong> production <strong>vocale</strong>s variées ne se<br />

prêtai<strong>en</strong>t pas à un conditionnem<strong>en</strong>t type tout ou ri<strong>en</strong> ou même sur une échelle, comme préconisé<br />

dans les métho<strong>de</strong>s <strong>de</strong> conditionnem<strong>en</strong>t strict, dans les métho<strong>de</strong>s <strong>de</strong> biofeedback [[remettre une<br />

référ<strong>en</strong>ce, c’est dans la mémoire <strong>de</strong> Zon<strong>de</strong>r]]. De même, on n’a pas pu établir un protocole<br />

rigoureux avec un conditionnem<strong>en</strong>t avec feedback externe p<strong>en</strong>dant une pério<strong>de</strong>, une évaluation<br />

intermédiaire, puis l’arrêt <strong>de</strong> ce feedback externe, et une <strong>de</strong>uxième évaluation à distance avec<br />

reprise du conditionnem<strong>en</strong>t instrum<strong>en</strong>tal si néces<strong>sa</strong>ire (Volin, 1999, pp. 254–256) On n’a donc<br />

notamm<strong>en</strong>t pas pu étudier si les acquis dus au spectrogramme se générali<strong>sa</strong>it <strong>sa</strong>ns spectrogramme.<br />

Pour cela le protocole était trop court et la population trop peu nombreuse.<br />

Un programme aussi strict nous semblait nous éloigner du s<strong>en</strong>s <strong>de</strong> notre étu<strong>de</strong>, qui se voulait<br />

proche <strong>de</strong>s conditions <strong>de</strong> <strong>rééducation</strong> orthophonique <strong>en</strong> cabinet libéral, et qui se <strong>de</strong>vait donc <strong>de</strong><br />

s’adapter aux besoins <strong>de</strong>s pati<strong>en</strong>ts. En ce s<strong>en</strong>s cep<strong>en</strong>dant, les pati<strong>en</strong>ts du protocole ont pointé que<br />

les séances proposées lors du protocole ne constituai<strong>en</strong>t pas un soin dans le s<strong>en</strong>s où elles n’avai<strong>en</strong>t<br />

pas l’objectif <strong>de</strong> réduire un trouble. Les séances consistai<strong>en</strong>t plus <strong>en</strong> une découverte <strong>de</strong> <strong>sa</strong> <strong>voix</strong> et <strong>de</strong><br />

l’apport du spectrogramme qu’<strong>en</strong> <strong>de</strong>s séances <strong>de</strong> <strong>rééducation</strong> classiques où l’on aurait pointé<br />

ponctuellem<strong>en</strong>t <strong>de</strong>s caractéristiques intéres<strong>sa</strong>ntes à visualiser sur le spectrogramme (comme une<br />

leçon <strong>de</strong> chant décrite par Garyth Nair : « L’image <strong>en</strong> temps réel est toujours affichée lorsque l’élève<br />

chante, mais elle n’est utilisée seulem<strong>en</strong>t pour <strong>de</strong>s temps cours p<strong>en</strong>dant la session pour répondre à<br />

<strong>de</strong>s événem<strong>en</strong>ts spécifiques et courts » 82 Le reste du temps la leçon est conduite <strong>de</strong> façon<br />

traditionnelle. (Nair, 1999, p. 69))<br />

82 “the VRTF image is running the <strong>en</strong>tire time a stu<strong>de</strong>nt is singing, but it is used only briefly during the session to address specific<br />

short time ev<strong>en</strong>ts”<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 97


Il est intéres<strong>sa</strong>nt <strong>de</strong> noter que les découvertes et les jeux qui ont été effectués avec le<br />

spectrogramme, bi<strong>en</strong> que ne <strong>de</strong>mandant pas un investissem<strong>en</strong>t considéré comme un travail, ont<br />

été tout <strong>de</strong> même relevé comme pouvant induire <strong>de</strong>s progrès et <strong>de</strong>s prises <strong>de</strong> consci<strong>en</strong>ce. La prise<br />

<strong>de</strong> consci<strong>en</strong>ce est effectivem<strong>en</strong>t la première étape du soin. (Amy <strong>de</strong> la Bretèque, 2012, p. 132;<br />

Esti<strong>en</strong>ne, 1998, p. 92; David M. Howard et al., 2012, p. 9a; Roch, 2001, p. 61; Sarfati, 1998, pp. 53–<br />

54)<br />

6.2.3 Approche incomplète <strong>de</strong> la <strong>voix</strong><br />

Notre approche <strong>de</strong> la <strong>rééducation</strong> dans le protocole n’a jamais considéré l’articulation, le débit,<br />

intonation, le rythme <strong>de</strong> la parole. Ces paramètres ont cep<strong>en</strong>dant parfois été travaillés avec le<br />

spectrogramme, pour les pati<strong>en</strong>ts hors protocole dans le cadre <strong>de</strong> leur <strong>rééducation</strong> phoniatrique<br />

classique.<br />

Pour l’attaque, l’échelle bipolaire proposée est réductrice : une attaque peut être jugée à la fois<br />

soufflée et dure, ou <strong>de</strong> mauvaise qualité d’une autre manière (avec un port <strong>de</strong> <strong>voix</strong> par exemple). La<br />

même simplification est observée pour le timbre, évalué sur seulem<strong>en</strong>t <strong>de</strong>ux échelles (clarté et<br />

richesse). En particulier, nous n’avons pas distingué souffle et raucité pour les altérations du timbre.<br />

Cette donnée, ainsi que la couleur du timbre, pouvai<strong>en</strong>t cep<strong>en</strong>dant trouver leur place <strong>en</strong><br />

comm<strong>en</strong>taire libre sur la feuille d’évaluation.<br />

6.2.4 complexité <strong>de</strong> l’exercice d’auto-analyse<br />

L’exercice d’auto-analyse s’est avéré un peu trop complexe, cette complexité se tradui<strong>sa</strong>nt souv<strong>en</strong>t<br />

par un grand nombre <strong>de</strong> ratures sur les feuilles <strong>de</strong> pas<strong>sa</strong>tion.<br />

- les extrémités droites <strong>de</strong>s échelles ne correspon<strong>de</strong>nt pas toujours à l’objectif : le son le plus<br />

clair, le plus riche, le geste le plus adapté sont <strong>de</strong>s objectifs <strong>de</strong> l’exercice et sont tous tout à<br />

fait à droite. Cep<strong>en</strong>dant pour l’attaque, le point le plus à droite correspond à une attaque<br />

très dure, ce qui n’est pas l’objectif <strong>de</strong> l’exercice. Cela a parfois conduit à <strong>de</strong>s inversions<br />

d’échelles.<br />

- Pour certains pati<strong>en</strong>ts et pour certains auditeurs du jury d’écoute, placer <strong>de</strong>ux signes un à<br />

côté <strong>de</strong> l’autre, séparés <strong>de</strong> 2 à 5 mm, signifie que la personne p<strong>en</strong><strong>sa</strong>it que les <strong>de</strong>ux sons était<br />

similaires pour ce paramètre.<br />

- Les signes sont parfois placés <strong>en</strong> <strong>de</strong>hors <strong>de</strong> la ligne, ce qui complique la mesure <strong>de</strong>s<br />

évaluations.<br />

- Lorsqu’un son se modifie, il serait utile <strong>de</strong> pouvoir juger <strong>de</strong> ses paramètres avant et après le<br />

changem<strong>en</strong>t. Le cas s’est prés<strong>en</strong>té <strong>de</strong>ux fois avec la même pati<strong>en</strong>te, pour laquelle le son plus<br />

fort comm<strong>en</strong>çait clair et finis<strong>sa</strong>it très altéré.<br />

- Un auditeur du jury d’écoute n’a pas utilisé l’échelle « clarté » à bon esci<strong>en</strong>t, s’intéres<strong>sa</strong>nt<br />

plutôt à un timbre « sombre » plutôt qu’à un timbre « altéré » dans le s<strong>en</strong>s du gra<strong>de</strong> G du<br />

GRBASI<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 98


6.3 Perspectives<br />

6.3.1 Exercices plus détaillés sur le site internet<br />

Notre travail pourrait être complété par la formali<strong>sa</strong>tion d’une liste plus exhaustive <strong>de</strong>s exercices<br />

qui peuv<strong>en</strong>t être proposés <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> et pour lesquels la visuali<strong>sa</strong>tion du<br />

spectrogramme apporte un feedback intéres<strong>sa</strong>nt.<br />

6.3.2 Utili<strong>sa</strong>tion <strong>en</strong> autonomie<br />

Le questionnaire internet reflète que les personnes voulant utiliser le spectrogramme ress<strong>en</strong>t<strong>en</strong>t<br />

parfois que les exercices ne sont pas assez détaillés sur le site internet construit dans le cadre <strong>de</strong> ce<br />

mémoire, et qu’ils ont besoin d’un cadre <strong>de</strong> travail plus suivi. Il pourrait être intéres<strong>sa</strong>nt d’étudier à<br />

quel point une autonomi<strong>sa</strong>tion du pati<strong>en</strong>t est possible, souhaitable ou non.<br />

6.3.3 Préconi<strong>sa</strong>tions pour une utili<strong>sa</strong>tion positive du spectrogramme<br />

L’attitu<strong>de</strong> du thérapeute face à l’image spectrographique est plus importante que l’image ellemême<br />

: les séances faites avec les pati<strong>en</strong>ts ont été l’occasion d’observer certaines inquiétu<strong>de</strong>s <strong>de</strong>s<br />

pati<strong>en</strong>ts face au r<strong>en</strong>du visuel <strong>de</strong> leur <strong>voix</strong>. Il nous semblerait particulièrem<strong>en</strong>t judicieux <strong>de</strong> donner<br />

aux orthophonistes désirant utiliser cet outil <strong>de</strong>s clés permettant <strong>de</strong> r<strong>en</strong>voyer au pati<strong>en</strong>t une image<br />

positive <strong>de</strong> lui-même et <strong>de</strong> dédramatiser les différ<strong>en</strong>tes caractéristiques <strong>de</strong> la dysphonie mises <strong>en</strong><br />

évi<strong>de</strong>nce par l’image spectrographique.<br />

6.3.4 Impact du temps réel notamm<strong>en</strong>t sur les s<strong>en</strong><strong>sa</strong>tions proprioceptives<br />

Notre étu<strong>de</strong> a montré que le spectrogramme gar<strong>de</strong> un grand intérêt même lorsqu’il n’est pas utilisé<br />

<strong>en</strong> temps réel, mais juste après la phonation. Pour certains exercices et pour certains pati<strong>en</strong>ts, c’est<br />

même cette utili<strong>sa</strong>tion qui est la plus profitable. Cette utili<strong>sa</strong>tion est peu décrite dans la littérature.<br />

Des étu<strong>de</strong>s complém<strong>en</strong>taires sur le sujet sont néces<strong>sa</strong>ires pour affiner ces affirmations.<br />

La même remarque est égalem<strong>en</strong>t valable <strong>en</strong> ce qui concerne les s<strong>en</strong><strong>sa</strong>tions proprioceptives, qui,<br />

lors <strong>de</strong> l’utili<strong>sa</strong>tion du spectrogramme, peuv<strong>en</strong>t être considérées comme volontairem<strong>en</strong>t mises <strong>de</strong><br />

côté afin d’obt<strong>en</strong>ir plus d’objectivité ou au contraire considérées comme gran<strong>de</strong>m<strong>en</strong>t r<strong>en</strong>forcées<br />

par un feedback visuel. Les effets sembl<strong>en</strong>t dép<strong>en</strong>dre <strong>de</strong> la population et <strong>de</strong>s exercices, <strong>de</strong>s<br />

différ<strong>en</strong>tes utili<strong>sa</strong>tions (<strong>en</strong> temps réel ou non, <strong>de</strong> façon int<strong>en</strong>sive ou non) du spectrogramme.<br />

6.3.5 Réduction <strong>de</strong>s biais observés dans notre étu<strong>de</strong><br />

Chacun <strong>de</strong>s biais observés dans notre étu<strong>de</strong> gagnerait à être mieux contrôlé, notamm<strong>en</strong>t par <strong>de</strong>s<br />

populations plus nombreuses et la prés<strong>en</strong>ce d’une population témoin. Notre travail pourrait être le<br />

point <strong>de</strong> départ par exemple <strong>de</strong> l’observation <strong>de</strong> l’utili<strong>sa</strong>tion du spectrogramme au sein <strong>de</strong> séances<br />

<strong>de</strong> <strong>rééducation</strong>s orthophoniques classiques, ce qui était notre projet initial.<br />

Notre étu<strong>de</strong> compr<strong>en</strong>d <strong>de</strong>ux parties bi<strong>en</strong> distinctes (exercice d’auto-analyse et recueil <strong>de</strong><br />

comm<strong>en</strong>taires autour <strong>de</strong> l’utili<strong>sa</strong>tion du spectrogramme), qui aurai<strong>en</strong>t mérité chacune <strong>de</strong>s étu<strong>de</strong>s<br />

plus approfondies.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 99


Conclusion<br />

[[repr<strong>en</strong>dre les conclusions hypothèse par hypothèse ?]]<br />

L’étu<strong>de</strong> <strong>de</strong>s exercices d’auto-analyse couplée à celle <strong>de</strong>s comm<strong>en</strong>taires autour du spectrogramme<br />

nous a permis <strong>de</strong> dégager que, dans le cadre <strong>de</strong> notre travail :<br />

(1) la visuali<strong>sa</strong>tion du spectrogramme a un effet bénéfique sur l’image qu’a le pati<strong>en</strong>t <strong>de</strong> <strong>sa</strong><br />

propre <strong>voix</strong>, et gratifiant pour ce qui est <strong>de</strong> la richesse <strong>de</strong> son timbre et <strong>sa</strong> qualité d’attaque<br />

(2) cet effet est principalem<strong>en</strong>t dû à l’attitu<strong>de</strong> positive du thérapeute face à l’image<br />

spectrographique<br />

(3) le travail avec un outil tiers objectif comme le spectrogramme peut être vécu comme un<br />

apaisem<strong>en</strong>t <strong>de</strong> la relation thérapeutique dans la mesure où le thérapeute <strong>de</strong>vi<strong>en</strong>t un allié du<br />

pati<strong>en</strong>t davantage que son juge.<br />

(4) l’analyse <strong>de</strong> la <strong>voix</strong> par l’image spectrographique permet une meilleure prise <strong>de</strong> consci<strong>en</strong>ce<br />

et une meilleure connais<strong>sa</strong>nce <strong>de</strong>s diverses compo<strong>sa</strong>ntes <strong>de</strong> la <strong>voix</strong>,<br />

(5) cep<strong>en</strong>dant l’observation <strong>de</strong> ses caractéristiques ne débouche pas systématiquem<strong>en</strong>t vers<br />

une meilleure réali<strong>sa</strong>tion du geste vocal.<br />

Nous préconisons l’emploi du spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong>, avec cep<strong>en</strong>dant <strong>de</strong>s réserves<br />

importantes :<br />

- il est néces<strong>sa</strong>ire pour le thérapeute <strong>de</strong> valoriser l’image spectrographique laissée par la <strong>voix</strong><br />

du pati<strong>en</strong>t, et ne pas laisser le pati<strong>en</strong>t seul avec <strong>de</strong>s idées faussées sur <strong>sa</strong> <strong>voix</strong> et/ou une<br />

image <strong>de</strong> <strong>sa</strong> <strong>voix</strong> dévalori<strong>sa</strong>nte.<br />

- le spectrogramme s’intègre comme un outil supplém<strong>en</strong>taire au sein d’une <strong>rééducation</strong><br />

<strong>vocale</strong> classique, mais ne se substitue pas à l’expertise <strong>de</strong>s thérapeutes. Cet outil doit<br />

perturber au minimum le déroulem<strong>en</strong>t d’une séance habituelle : le thérapeute doit être<br />

suffi<strong>sa</strong>mm<strong>en</strong>t à l’aise avec l’informatique pour rester prés<strong>en</strong>t au pati<strong>en</strong>t et att<strong>en</strong>tif à son<br />

geste vocal. Une projection <strong>de</strong> l’image spectrographique sur grand écran et l’utili<strong>sa</strong>tion d’un<br />

micro qui puisse se faire oublier permettrai<strong>en</strong>t <strong>de</strong> limiter les inconvéni<strong>en</strong>ts <strong>de</strong> l’utili<strong>sa</strong>tion <strong>de</strong><br />

l’informatique sur le comportem<strong>en</strong>t vocal du pati<strong>en</strong>t et <strong>de</strong> son thérapeute, notamm<strong>en</strong>t <strong>en</strong><br />

termes <strong>de</strong> posture et <strong>de</strong> s<strong>en</strong><strong>sa</strong>tion <strong>de</strong> liberté.<br />

- le thérapeute <strong>de</strong> la <strong>voix</strong> doit gar<strong>de</strong>r à l’esprit que cet outil ne convi<strong>en</strong>dra pas néces<strong>sa</strong>irem<strong>en</strong>t<br />

à tous les pati<strong>en</strong>ts, et son utili<strong>sa</strong>tion <strong>de</strong>vra être adaptée aux besoins et à la personnalité <strong>de</strong><br />

chacun. L’outil spectrographique s’avère cep<strong>en</strong>dant un allié considérable, notamm<strong>en</strong>t pour<br />

les personnes qui sont à la recherche <strong>de</strong> données sci<strong>en</strong>tifiques objectives, ainsi que pour<br />

celles qui ont une mauvaise image <strong>de</strong> leur propre <strong>voix</strong>.<br />

- <strong>en</strong>fin il est néces<strong>sa</strong>ire pour le thérapeute d’avoir la possibilité <strong>de</strong> proposer lui-même <strong>de</strong>s<br />

exemples vocaux les plus précis possibles<br />

Nous espérons que la construction du site internet à l’occasion <strong>de</strong> ce mémoire soit une opportunité<br />

supplém<strong>en</strong>taire <strong>de</strong> démocrati<strong>sa</strong>tion <strong>de</strong> la connais<strong>sa</strong>nce <strong>de</strong> la <strong>voix</strong> et l’occasion d’heureuses<br />

découvertes pour <strong>de</strong> nombreux pati<strong>en</strong>ts, orthophonistes et professionnels <strong>de</strong> la <strong>voix</strong>.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 100


Table <strong>de</strong>s matières<br />

Remerciem<strong>en</strong>ts ...................................................................................................................................... 2<br />

Sommaire ............................................................................................................................................... 3<br />

Introduction ........................................................................................................................................... 1<br />

1 Assises théoriques .......................................................................................................................... 2<br />

1.1 dysphonie dysfonctionnelle et <strong>rééducation</strong> <strong>vocale</strong> ............................................................... 2<br />

1.1.1 Dysphonie dysfonctionnelle et image <strong>de</strong> soi ..................................................................... 2<br />

1.1.1.1 Définition .................................................................................................................. 2<br />

1.1.1.2 Forçage vocal et psychisme ...................................................................................... 2<br />

1.1.1.3 Dysphonie et mauvaise image <strong>de</strong> soi ....................................................................... 3<br />

1.1.2 Rééducation <strong>vocale</strong> ............................................................................................................ 3<br />

1.1.2.1 Objectifs .................................................................................................................... 3<br />

1.1.2.2 Complém<strong>en</strong>tarité <strong>de</strong>s conceptions sci<strong>en</strong>tifiques et traditionnelles ........................ 4<br />

L’orthophoniste part<strong>en</strong>aire du mé<strong>de</strong>cin et du chirurgi<strong>en</strong> ..................................................... 4<br />

La dim<strong>en</strong>sion psychologique .................................................................................................. 4<br />

Technique <strong>de</strong> <strong>rééducation</strong> orthophonique ............................................................................ 5<br />

1.1.2.3 Conclusion ................................................................................................................. 5<br />

1.1.3 Rétro-contrôle (feedback) <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> ............................................................. 5<br />

1.1.3.1 Définition <strong>de</strong> l’appr<strong>en</strong>tis<strong>sa</strong>ge par feedback .............................................................. 5<br />

1.1.3.2 Trois phases <strong>de</strong> l’appr<strong>en</strong>tis<strong>sa</strong>ge moteur ................................................................... 6<br />

1.1.3.3 Particularité du rétro-contrôle pour la production <strong>vocale</strong> ....................................... 7<br />

Rétro-contrôles habituels pour la <strong>voix</strong> ................................................................................... 7<br />

S<strong>en</strong>soriel, proprioceptif, postural ...................................................................................... 7<br />

Auditif : boucle audio-phonatoire ...................................................................................... 7<br />

Feedback verbal ................................................................................................................. 8<br />

Imitation ............................................................................................................................. 8<br />

Suppléer les feedbacks auditifs, proprioceptifs et verbaux ................................................... 8<br />

Particularité <strong>de</strong> l’appr<strong>en</strong>tis<strong>sa</strong>ge vocal <strong>en</strong> tant que comportem<strong>en</strong>t moteur .......................... 9<br />

1.1.3.4 feedback acoustique <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> .......................................................... 10<br />

1.1.3.5 Conclusion ............................................................................................................... 10<br />

1.2 Le spectrogramme ............................................................................................................... 11<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 101


1.2.1 Prés<strong>en</strong>tation du spectrogramme ..................................................................................... 11<br />

1.2.1.1 Notions d’acoustique .............................................................................................. 11<br />

1.2.1.2 Définition ................................................................................................................ 11<br />

1.2.1.3 Lecture <strong>de</strong> spectrogramme : la parole ................................................................... 11<br />

1.2.1.4 Lecture <strong>de</strong> spectrogramme : le timbre ................................................................... 12<br />

Définition .............................................................................................................................. 12<br />

Timbre vocalique .................................................................................................................. 12<br />

Les harmoniques .................................................................................................................. 13<br />

Le bruit <strong>en</strong>tre les harmoniques ............................................................................................ 13<br />

Classifications (voir <strong>en</strong> annexe) ............................................................................................ 14<br />

Exemples <strong>en</strong> <strong>voix</strong> chantée .................................................................................................... 14<br />

Singing formant ............................................................................................................ 14<br />

Voix soufflée ................................................................................................................. 15<br />

Voix serrée ................................................................................................................... 15<br />

1.2.1.5 Lecture <strong>de</strong> spectrogramme : l’attaque ................................................................... 15<br />

1.2.1.6 Conclusion ............................................................................................................... 15<br />

1.2.2 Utili<strong>sa</strong>tion du spectrogramme <strong>en</strong> temps réel .................................................................. 15<br />

1.2.2.1 Formation <strong>vocale</strong> <strong>de</strong>s chanteurs ............................................................................ 16<br />

1.2.2.2 Langue étrangères et acc<strong>en</strong>t, prosodie .................................................................. 17<br />

1.2.2.3 Surdité ..................................................................................................................... 17<br />

1.2.2.4 Dy<strong>sa</strong>rthrie................................................................................................................ 18<br />

1.2.2.5 Réeducation <strong>vocale</strong> ................................................................................................. 18<br />

1.2.2.6 Conclusion ............................................................................................................... 19<br />

1.3 Spectrogramme et <strong>rééducation</strong> <strong>vocale</strong> : avantages et limites ............................................ 19<br />

1.3.1 Avantages ......................................................................................................................... 19<br />

1.3.1.1 Prise <strong>de</strong> consci<strong>en</strong>ce ................................................................................................. 19<br />

importance <strong>de</strong> la prise <strong>de</strong> consci<strong>en</strong>ce <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> ............................................. 19<br />

Apport du spectrogramme ................................................................................................... 20<br />

1.3.1.2 Motivation .............................................................................................................. 21<br />

1.3.1.3 Autonomi<strong>sa</strong>tion ...................................................................................................... 21<br />

1.3.1.4 Enrichissem<strong>en</strong>t <strong>de</strong> compét<strong>en</strong>ces, diversification du travail orthophonique ......... 22<br />

1.3.1.5 Conclusion ............................................................................................................... 22<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 102


1.3.2 Limites <strong>de</strong> l’analyse spectrographique ............................................................................ 23<br />

1.3.2.1 Fiabilité <strong>de</strong> l’image .................................................................................................. 23<br />

1.3.2.2 Complém<strong>en</strong>tarité <strong>de</strong>s approches classiques et du feedback visuel ....................... 23<br />

1.3.2.3 Pertin<strong>en</strong>ce <strong>de</strong> l’information donnée par le spectrogramme .................................. 24<br />

1.3.2.4 Nécessité d’une formation spécifique .................................................................... 25<br />

1.3.2.5 Conclusion ............................................................................................................... 26<br />

1.3.3 Aspects ambival<strong>en</strong>ts ........................................................................................................ 26<br />

1.3.3.1 Conc<strong>en</strong>tration et charge cognitive ......................................................................... 26<br />

1.3.3.2 Nécessité du temps réel ......................................................................................... 27<br />

1.3.3.3 Analyse fine <strong>de</strong> <strong>sa</strong> production <strong>vocale</strong> ..................................................................... 28<br />

1.3.3.4 li<strong>en</strong> avec les feedbacks auditifs et proprioceptifs .................................................. 29<br />

1.3.3.5 Nécessité <strong>de</strong> retirer progressivem<strong>en</strong>t le feedback ................................................. 29<br />

1.3.3.6 Objectivité / subjectivité ......................................................................................... 30<br />

Evaluation et confirmation <strong>de</strong> l’intérêt <strong>de</strong> la <strong>rééducation</strong> .................................................. 30<br />

Feedback verbal facilité ....................................................................................................... 30<br />

L’interprétation reste subjective.......................................................................................... 31<br />

1.3.3.7 Conclusion ............................................................................................................... 31<br />

2 Problématique .............................................................................................................................. 32<br />

3 Hypothèse(s) ................................................................................................................................ 33<br />

4 Méthodologie ............................................................................................................................... 34<br />

4.1 Matériel ................................................................................................................................ 34<br />

4.1.1 Prés<strong>en</strong>tation générale ...................................................................................................... 34<br />

4.1.2 Description <strong>de</strong>s populations ............................................................................................ 34<br />

4.1.2.1 Pati<strong>en</strong>ts protocole .................................................................................................. 34<br />

Généralités ........................................................................................................................... 34<br />

La pati<strong>en</strong>te A ........................................................................................................................ 35<br />

La pati<strong>en</strong>te B ........................................................................................................................ 35<br />

La pati<strong>en</strong>te C ........................................................................................................................ 35<br />

La pati<strong>en</strong>te D ........................................................................................................................ 35<br />

4.1.2.2 Pati<strong>en</strong>ts hors protocole .......................................................................................... 35<br />

4.1.2.3 Personnes répondant au questionnaire internet ................................................... 35<br />

4.1.2.4 Jury d’écoute ........................................................................................................... 36<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 103


4.2 Métho<strong>de</strong> ............................................................................................................................... 36<br />

4.2.1 Protocole .......................................................................................................................... 36<br />

4.2.1.1 Déroulem<strong>en</strong>t général .............................................................................................. 36<br />

4.2.1.2 Evaluation pré- et post- protocole.......................................................................... 36<br />

Auto-évaluation du handicap ress<strong>en</strong>ti ................................................................................. 36<br />

Bilan vocal ............................................................................................................................ 37<br />

Court questionnaire sur la relation à <strong>sa</strong> <strong>voix</strong> ....................................................................... 38<br />

Entreti<strong>en</strong> semi-dirigé ............................................................................................................ 38<br />

Qualification <strong>de</strong> <strong>sa</strong> propre <strong>voix</strong> telle qu’elle est et telle qu’on voudrait qu’elle soit .......... 38<br />

4.2.1.3 Utili<strong>sa</strong>tion du spectrogramme ................................................................................ 38<br />

4.2.1.4 Exercices proposés .................................................................................................. 39<br />

4.2.1.5 Ress<strong>en</strong>ti face au spectrogramme ........................................................................... 41<br />

4.2.2 Pati<strong>en</strong>ts <strong>en</strong> autonomie ..................................................................................................... 41<br />

4.2.2.1 Site internet http://flor<strong>en</strong>ce.parm<strong>en</strong>tier.free.fr/acoustique/spectrogramme/ .... 41<br />

4.2.2.2 Questionnaire internet ........................................................................................... 43<br />

4.2.3 Exercice d’auto-analyse ................................................................................................... 43<br />

4.2.3.1 Description <strong>de</strong> l’exercice d’auto-analyse ................................................................ 43<br />

Principe <strong>de</strong> l’exercice ........................................................................................................... 43<br />

Intérêt <strong>de</strong> l’exercice ............................................................................................................. 44<br />

Echelles visuelles analogiques (voir <strong>en</strong> annexe) .................................................................. 45<br />

Banque <strong>de</strong> sons .................................................................................................................... 46<br />

Conditions d’<strong>en</strong>registrem<strong>en</strong>t ............................................................................................... 47<br />

Conditions <strong>de</strong> pas<strong>sa</strong>tion ....................................................................................................... 47<br />

Condition <strong>de</strong> l’évaluation perceptive ................................................................................... 47<br />

4.2.3.2 Métho<strong>de</strong> d’analyse <strong>de</strong>s résultats <strong>de</strong> l’exercice d’auto-analyse ............................. 47<br />

Mesures / vérifications / recherche <strong>de</strong>s valeurs aberrantes. .............................................. 47<br />

Calcul du paramètre « qualité d’attaque » .......................................................................... 48<br />

Mesure objectives ................................................................................................................ 48<br />

homogénéi<strong>sa</strong>tion <strong>de</strong>s évaluations du jury ........................................................................... 48<br />

Choix <strong>de</strong>s paramètres étudiés.............................................................................................. 48<br />

Variables gratification / ai<strong>de</strong> / erreur / corrélation ............................................................. 48<br />

Gratification ..................................................................................................................... 48<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 104


Erreur / ai<strong>de</strong> ..................................................................................................................... 49<br />

Résumé utili<strong>sa</strong>tion / gratification / ai<strong>de</strong> / erreur ............................................................. 49<br />

Corrélations ...................................................................................................................... 50<br />

Nature du feedback additionnel et nombre <strong>de</strong> données ................................................ 50<br />

Fiabilité évaluations du jury d’écoute pour l’exercice d’auto-analyse ................................ 50<br />

5 Analyse <strong>de</strong>s résultats.................................................................................................................... 51<br />

5.1 Auto-analyse : échelles visuelles analogiques ..................................................................... 51<br />

5.1.1 Utili<strong>sa</strong>tion <strong>de</strong>s échelles .................................................................................................... 51<br />

5.1.1.1 Distribution <strong>de</strong>s marques sur les échelles visuelles analogiques ........................... 51<br />

Remarque préliminaire : ...................................................................................................... 51<br />

5.1.1.2 Corrélations <strong>en</strong>tre les différ<strong>en</strong>tes échelles (tous groupes confondus et tous<br />

feedbacks confondus) .............................................................................................................. 52<br />

Pole clarté / geste / qualité d’attaque ................................................................................. 52<br />

Pole richesse /int<strong>en</strong>sité / attaque soufflée->dure ............................................................... 52<br />

Geste .................................................................................................................................... 53<br />

Hauteur ................................................................................................................................ 53<br />

5.1.1.3 Conclusion corrélations .......................................................................................... 53<br />

5.1.2 Fiabilité <strong>de</strong> l’évaluation subjective ................................................................................... 53<br />

5.1.2.1 Fiabilité intra-juge ................................................................................................... 53<br />

Conclusion fiabilité intrajuge ............................................................................................... 54<br />

Effet d’appr<strong>en</strong>tis<strong>sa</strong>ge supposé test/retest .......................................................................... 54<br />

Effet d’appr<strong>en</strong>tis<strong>sa</strong>ge ........................................................................................................... 55<br />

5.1.2.2 Fiabilité interjuge .................................................................................................... 56<br />

Conclusion sur la fiabilité interjuge <strong>de</strong> la mesure subjective par <strong>de</strong>s auditeurs du jury<br />

d’écoute : ............................................................................................................................. 56<br />

5.1.3 Corrélation avec les critères acoustiques ........................................................................ 57<br />

5.1.4 Influ<strong>en</strong>ce <strong>de</strong> l’image sur la perception <strong>de</strong> la qualité <strong>de</strong> la réali<strong>sa</strong>tion ............................. 57<br />

5.1.4.1 Utili<strong>sa</strong>tion du feedback additionnel........................................................................ 57<br />

Généralités ........................................................................................................................... 57<br />

Pour le feedback auditif et visuel, effet <strong>de</strong> l’appart<strong>en</strong>ance à un groupe (jury d’écoute,<br />

pati<strong>en</strong>ts hors protocole, pati<strong>en</strong>ts protocole) ....................................................................... 58<br />

5.1.4.2 Effet gratifiant du feedback additionnel................................................................. 59<br />

Généralités ........................................................................................................................... 59<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 105


Effets dévalori<strong>sa</strong>nts (prise <strong>de</strong> consci<strong>en</strong>ce d’un défaut) ................................................... 59<br />

Effets gratifiants (prise <strong>de</strong> consci<strong>en</strong>ce d’une qualité, confiance <strong>en</strong> soi) ......................... 59<br />

Pour le feedback auditif et visuel, effet <strong>de</strong> l’appart<strong>en</strong>ance à un groupe (jury d’écoute,<br />

pati<strong>en</strong>ts hors protocole, pati<strong>en</strong>ts protocole) ....................................................................... 59<br />

Différ<strong>en</strong>ce pour les pati<strong>en</strong>ts du protocole, <strong>en</strong>tre la première pas<strong>sa</strong>tion <strong>sa</strong>ns<br />

spectrogramme, et celles avec spectrogramme .................................................................. 60<br />

5.1.4.3 Ai<strong>de</strong> du feedback additionnel ................................................................................. 60<br />

5.1.4.4 Mise <strong>en</strong> perspective erreurs / utili<strong>sa</strong>tion / ai<strong>de</strong> / gratification .............................. 61<br />

Richesse, clarté et qualité d’attaque ................................................................................... 61<br />

Richesse du timbre ............................................................................................................... 61<br />

Clarté du timbre ................................................................................................................... 62<br />

Qualité d’attaque ................................................................................................................. 62<br />

Différ<strong>en</strong>ce d’int<strong>en</strong>sité .......................................................................................................... 63<br />

Geste .................................................................................................................................... 63<br />

Différ<strong>en</strong>ce <strong>de</strong> hauteur .......................................................................................................... 64<br />

5.1.4.5 Corrélations <strong>en</strong>tre les évaluations <strong>de</strong>s différ<strong>en</strong>ts paramètres ............................... 64<br />

Richesse et int<strong>en</strong>sité ............................................................................................................ 64<br />

Int<strong>en</strong>sité et attaque.............................................................................................................. 65<br />

Int<strong>en</strong>sité et clarté ................................................................................................................. 65<br />

Clarté et hauteur .................................................................................................................. 65<br />

Isolation <strong>de</strong> l’évaluation du geste ........................................................................................ 65<br />

5.1.4.6 Conclusion ............................................................................................................... 66<br />

5.2 Evolution <strong>de</strong>s pati<strong>en</strong>ts protocole ......................................................................................... 66<br />

5.2.1 bilan vocal ........................................................................................................................ 66<br />

5.2.1.1 Evaluation objective................................................................................................ 66<br />

5.2.1.2 Evaluation perceptive ............................................................................................. 67<br />

5.2.2 Evolution <strong>de</strong> l’exercice d’auto-analyse ............................................................................ 67<br />

5.2.3 Modification <strong>de</strong> la façon <strong>de</strong> voir <strong>sa</strong> <strong>voix</strong> .......................................................................... 68<br />

5.2.3.1 Evolution <strong>de</strong>s questionnaires d’auto-évaluation .................................................... 68<br />

5.2.3.2 Liste d’adjectifs ....................................................................................................... 69<br />

5.2.3.3 Conclusion ............................................................................................................... 72<br />

5.3 Comm<strong>en</strong>taires autour du spectrogramme .......................................................................... 73<br />

5.3.1 Impact sur le geste vocal .................................................................................................. 73<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 106


5.3.1.1 s<strong>en</strong><strong>sa</strong>tions acoustiques et proprioceptives ............................................................ 73<br />

Réponses au questionnaire internet .................................................................................... 73<br />

possible focali<strong>sa</strong>tion sur l’image au détrim<strong>en</strong>t <strong>de</strong>s s<strong>en</strong><strong>sa</strong>tions ........................................... 73<br />

ouverture <strong>de</strong>s s<strong>en</strong><strong>sa</strong>tions auditives ..................................................................................... 73<br />

ouverture <strong>de</strong>s s<strong>en</strong><strong>sa</strong>tions proprioceptives .......................................................................... 74<br />

Ai<strong>de</strong> lorsque les s<strong>en</strong><strong>sa</strong>tions et l’audition interne sont perturbés ........................................ 74<br />

5.3.1.2 Temps réel .............................................................................................................. 74<br />

Résultats du questionnaire .................................................................................................. 74<br />

Besoin <strong>de</strong> se conc<strong>en</strong>trer sur le geste vocal .......................................................................... 74<br />

Besoin <strong>de</strong> liberté, pas <strong>de</strong> supervision .................................................................................. 74<br />

Temps réel plus utile sur <strong>de</strong>s phénomènes longs ................................................................ 75<br />

intérêt du spectrogramme même après coup ..................................................................... 75<br />

5.3.1.3 Comportem<strong>en</strong>t vocal .............................................................................................. 75<br />

Résultats du questionnaire .................................................................................................. 75<br />

ordinateur et posture ........................................................................................................... 76<br />

problème du micro ........................................................................................................... 76<br />

problème <strong>de</strong> la visuali<strong>sa</strong>tion sur un écran ....................................................................... 76<br />

prise <strong>de</strong> consci<strong>en</strong>ce d’un comportem<strong>en</strong>t qui modifie la phonation.................................... 76<br />

5.3.2 intérêt particuliers <strong>de</strong> la visuali<strong>sa</strong>tion du spectrogramme .............................................. 76<br />

5.3.2.1 Paramètres vocaux que le spectrogramme permet d’observer et d’améliorer .... 76<br />

Résultats du questionnaire .................................................................................................. 76<br />

impact <strong>de</strong> la visuali<strong>sa</strong>tion d’un timbre altéré ...................................................................... 77<br />

possible image viol<strong>en</strong>te <strong>de</strong> la dysphonie ......................................................................... 77<br />

intérêt majeur : pouvoir travailler <strong>de</strong>ssus ........................................................................ 77<br />

Attaques facilem<strong>en</strong>t visualisées ........................................................................................... 78<br />

Phonétique ........................................................................................................................... 78<br />

harmoniques ........................................................................................................................ 78<br />

5.3.2.2 Moy<strong>en</strong> d’analyse sci<strong>en</strong>tifique d’étu<strong>de</strong> et <strong>de</strong> connais<strong>sa</strong>nce .................................... 78<br />

Moy<strong>en</strong> <strong>de</strong> <strong>sa</strong>tisfaire une soif <strong>de</strong> connais<strong>sa</strong>nce .................................................................... 78<br />

Possbilité d’adopter un protocole <strong>de</strong> <strong>rééducation</strong> <strong>en</strong>courageant....................................... 79<br />

Attirer l’att<strong>en</strong>tion sur une partie du son .............................................................................. 79<br />

Intérêt intellectuel au détrim<strong>en</strong>t d’une utilité pour la <strong>voix</strong> ? .............................................. 79<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 107


5.3.2.3 Reflet objectif r<strong>en</strong>du positif par le thérapeute ....................................................... 79<br />

Reflet objectif ....................................................................................................................... 79<br />

Possibilité <strong>de</strong> mettre son problème <strong>de</strong> <strong>voix</strong> à distance, et dédramatiser ........................... 80<br />

Possibilité d’observer l’évolution d’un travail ..................................................................... 80<br />

Possibilité d’une relation apaisée avec le thérapeute ......................................................... 81<br />

impact positif <strong>de</strong> l’interprétation par le thérapeute ........................................................... 81<br />

5.3.3 Utili<strong>sa</strong>tions préconisées et possibilité d’autonomie ........................................................ 81<br />

5.3.3.1 Public visé ............................................................................................................... 81<br />

Résultats du questionnaire .................................................................................................. 81<br />

Quel type <strong>de</strong> public .............................................................................................................. 82<br />

Utili<strong>sa</strong>tion pour les chanteurs avancés ................................................................................ 82<br />

Utili<strong>sa</strong>tion par les professionnels <strong>de</strong> la <strong>voix</strong> ......................................................................... 82<br />

Utili<strong>sa</strong>tion pour les dysphoniques ........................................................................................ 82<br />

5.3.3.2 Compréh<strong>en</strong>sion <strong>de</strong> l’image spectrographique ....................................................... 83<br />

Résultats du questionnaire .................................................................................................. 83<br />

remarques qualitatives ........................................................................................................ 83<br />

5.3.3.3 Utili<strong>sa</strong>tion <strong>en</strong> autonomie ........................................................................................ 84<br />

Résultats du questionnaire .................................................................................................. 84<br />

Problèmes techniques et convivialité .................................................................................. 84<br />

Nécessité d’un accompagnem<strong>en</strong>t pour interpréter l’image................................................ 84<br />

Nécessité d’un accompagnem<strong>en</strong>t pour gui<strong>de</strong>r le travail ..................................................... 85<br />

Nécessité d’un objectif ......................................................................................................... 85<br />

Utili<strong>sa</strong>tion autonome ludique .............................................................................................. 85<br />

5.3.4 Conclusion ........................................................................................................................ 86<br />

6 Discussion ..................................................................................................................................... 87<br />

6.1 Validation <strong>de</strong>s hypothèses <strong>de</strong> travail ................................................................................... 87<br />

6.1.1 Prise <strong>de</strong> consci<strong>en</strong>ce <strong>de</strong>s paramètres vocaux ................................................................... 87<br />

6.1.1.1 Fiabilité interjuge .................................................................................................... 87<br />

6.1.1.2 Observation <strong>de</strong>s paramètres .................................................................................. 87<br />

6.1.1.3 Auto-évaluation <strong>de</strong> ses propres qualités <strong>vocale</strong>s : exercice d’auto-analyse .......... 87<br />

Meilleure distinction <strong>de</strong>s différ<strong>en</strong>ts paramètres ................................................................. 87<br />

meilleure objectivité ............................................................................................................ 88<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 108


moindre corrélation <strong>en</strong>tre clarté et geste vocal .................................................................. 88<br />

impact sur les s<strong>en</strong><strong>sa</strong>tions proprioceptives ........................................................................... 89<br />

6.1.1.4 Conclusion ............................................................................................................... 90<br />

6.1.2 auto-contrôle <strong>de</strong>s paramètres vocaux ............................................................................. 90<br />

6.1.3 Construction d’une image plus positive <strong>de</strong> <strong>sa</strong> <strong>voix</strong> .......................................................... 91<br />

6.1.3.1 Effets observés dans l’exercice d’auto-analyse ...................................................... 91<br />

6.1.3.2 Effets observés par l’évolution <strong>de</strong>s pati<strong>en</strong>ts .......................................................... 91<br />

6.1.3.3 Effets observés dans les comm<strong>en</strong>taires <strong>en</strong> fin <strong>de</strong> protocole et le questionnaire<br />

internet 92<br />

6.1.3.4 Conclusion ............................................................................................................... 92<br />

6.1.4 Impact positif sur la relation thérapeutique .................................................................... 93<br />

6.1.4.1 Modification <strong>de</strong> la position du thérapeute............................................................. 93<br />

6.1.4.2 Base <strong>de</strong> travail stable et partagée .......................................................................... 93<br />

6.1.4.3 Nécessité <strong>de</strong> rester prés<strong>en</strong>t au pati<strong>en</strong>t .................................................................. 93<br />

6.1.4.4 Conclusion ............................................................................................................... 94<br />

6.2 Limites .................................................................................................................................. 94<br />

6.2.1 Biais relatif à la population .............................................................................................. 94<br />

6.2.1.1 Biais <strong>de</strong> recrutem<strong>en</strong>t .............................................................................................. 94<br />

6.2.1.2 Disparité pati<strong>en</strong>ts hors protocole / pati<strong>en</strong>ts protocole.......................................... 94<br />

6.2.1.3 Biais relatifs au questionnaire internet .................................................................. 95<br />

6.2.1.4 Biais relatif au bilan subjectif .................................................................................. 95<br />

6.2.1.5 Biais relatifs au bilan perceptif et au jury d’écoute: ............................................... 95<br />

6.2.2 Evaluation difficile <strong>de</strong> l’apport du feedback visuel .......................................................... 96<br />

6.2.2.1 Apport spécifique du feedback visuel par rapport au feedback auditif dans<br />

l’exercice d’auto-analyse.......................................................................................................... 96<br />

6.2.2.2 Apport spécifique du feedback visuel par rapport aux interv<strong>en</strong>tions verbales <strong>de</strong><br />

l’expérim<strong>en</strong>tateur dans l’exercice d’auto-analyse ................................................................... 97<br />

6.2.2.3 Rigueur <strong>de</strong>s conditions <strong>de</strong> conditionnem<strong>en</strong>t ......................................................... 97<br />

6.2.3 Approche incomplète <strong>de</strong> la <strong>voix</strong> ...................................................................................... 98<br />

6.2.4 complexité <strong>de</strong> l’exercice d’auto-analyse .......................................................................... 98<br />

6.3 Perspectives ......................................................................................................................... 99<br />

6.3.1 Exercices plus détaillés sur le site internet ...................................................................... 99<br />

6.3.2 Utili<strong>sa</strong>tion <strong>en</strong> autonomie ................................................................................................. 99<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 109


6.3.3 Préconi<strong>sa</strong>tions pour une utili<strong>sa</strong>tion positive du spectrogramme .................................... 99<br />

6.3.4 Impact du temps réel notamm<strong>en</strong>t sur les s<strong>en</strong><strong>sa</strong>tions proprioceptives ........................... 99<br />

6.3.5 Réduction <strong>de</strong>s biais observés dans notre étu<strong>de</strong> .............................................................. 99<br />

Conclusion .......................................................................................................................................... 100<br />

Table <strong>de</strong>s matières ............................................................................................................................. 101<br />

bibliographie ...................................................................................................................................... 111<br />

glos<strong>sa</strong>ire ............................................................................................................................................. 120<br />

annexes .............................................................................................................................................. 122<br />

Classifications ................................................................................................................................. 122<br />

figures ............................................................................................................................................. 125<br />

Quelques résultats détaillés (VHI, qualificatifs), ............................................................................ 131<br />

Spectrogrammes tirés du site internet .......................................................................................... 135<br />

Intérêt du travail <strong>de</strong> l’attaque ................................................................................................ 135<br />

Attaque dure ...................................................................................................................... 136<br />

Attaque molle ou soufflée ................................................................................................. 136<br />

Attaque douce / équilibrée ................................................................................................ 136<br />

Script praat ..................................................................................................................................... 137<br />

Docum<strong>en</strong>ts du protocole (déroulem<strong>en</strong>t <strong>de</strong> l’exercice, feuilles <strong>de</strong> pas<strong>sa</strong>tion, feuilles <strong>de</strong> cotation du<br />

bilan vocal…) .................................................................................................................................. 138<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 110


ibliographie<br />

Aima<strong>de</strong>ddine, S., & Kerlan, M. (2003). Le rôle <strong>de</strong> la <strong>rééducation</strong> orthophonique dans la prise <strong>de</strong><br />

consci<strong>en</strong>ce <strong>de</strong> la <strong>voix</strong> et l’interprétation du trouble vocal, <strong>en</strong> cas <strong>de</strong> dysphonie avec compo<strong>sa</strong>nte<br />

fonctionnelle : chez <strong>de</strong>ux populations culturellem<strong>en</strong>t différ<strong>en</strong>tes, française et marocaine : es<strong>sa</strong>i<br />

d’analyse <strong>de</strong> quelques cas (Mémoire d’orthophonie). Be<strong>sa</strong>nçon, Be<strong>sa</strong>nçon. Retrieved from<br />

http://www.sudoc.fr/109240030<br />

Amy <strong>de</strong> la Bretèque, B. (2004). L’équilibre et le rayonnem<strong>en</strong>t <strong>de</strong> la <strong>voix</strong>. Marseille: Solal.<br />

Amy <strong>de</strong> la Bretèque, B. (2012). Règles générales <strong>de</strong> la <strong>rééducation</strong> <strong>vocale</strong>. In La <strong>voix</strong> parlée et la <strong>voix</strong><br />

chantée (pp. 130–147). Montpellier: Sauramps médical.<br />

Barnes-Burroughs, K., Lan, W. Y., Edwards, E., & Archambeault, N. (2008). Curr<strong>en</strong>t attitu<strong>de</strong>s toward<br />

voice studio teaching technology: a bicoastal survey of classical singing pedagogues. Journal of<br />

voice: official journal of the Voice Foundation, 22(5), 590–602. doi:10.1016/j.jvoice.2006.12.004<br />

Bastian, R. W., & Nagorsky, M. J. (1987). Laryngeal image biofeedback. The Laryngoscope, 97(11),<br />

1346–1349. doi:10.1288/00005537-198711000-00019<br />

Beauch<strong>en</strong>e, P., & Bouquay, A. (1994). Approche rééducative <strong>de</strong> la dy<strong>sa</strong>rthrie post-traumatique et <strong>de</strong><br />

la dysprosodie sur le logiciel Speech Viewer II (Mémoire d’orthophonie). Unité d’Enseignem<strong>en</strong>t et<br />

<strong>de</strong> Recherche “Me<strong>de</strong>cine et Techniques Médicales”, Nantes.<br />

Behrman, A., Sulica, L., & He, T. (2004). Factors predicting pati<strong>en</strong>t perception of dysphonia caused<br />

by b<strong>en</strong>ign vocal fold lesions. The Laryngoscope, 114(10), 1693–1700. doi:10.1097/00005537-<br />

200410000-00004<br />

Bele, I. V. (2005). Reliability in Perceptual Analysis of Voice Quality. Journal of Voice, 19(4), 555–573.<br />

doi:10.1016/j.jvoice.2004.08.008<br />

Bergeras, M., & Tain, L. (2007). Des orthophonistes dans le mon<strong>de</strong> <strong>de</strong> la <strong>voix</strong> : <strong>sa</strong>voir, <strong>sa</strong>voir-faire et<br />

légitimité. In Le métier d’orthophoniste : langage, g<strong>en</strong>re et profession (pp. 173–180). R<strong>en</strong>nes: Éd. <strong>de</strong><br />

l’École nationale <strong>de</strong> la <strong>sa</strong>nté publique.<br />

Blayac, J. P., B<strong>en</strong>sous<strong>sa</strong>n, P.-L., & Marotin, O. (2012). La <strong>voix</strong> dans le soin, la <strong>voix</strong> <strong>en</strong> musicothérapie.<br />

In La <strong>voix</strong> parlée et la <strong>voix</strong> chantée (pp. 148–155). Montpellier: Sauramps médical.<br />

Borel, S. (2002). Evaluation <strong>de</strong> l’impact <strong>de</strong> la paralysie récurr<strong>en</strong>tielle sur la qualité <strong>de</strong> vie à l’ai<strong>de</strong> du<br />

“Voice Handicap In<strong>de</strong>x” : étu<strong>de</strong> <strong>de</strong> 6 cas (Mémoire d’orthophonie). Paris.<br />

Caza<strong>de</strong>, A. (2000). De l’u<strong>sa</strong>ge <strong>de</strong>s courbes sonores et autres supports graphiques pour ai<strong>de</strong>r<br />

l’appr<strong>en</strong>ant <strong>en</strong> langues. Alsic. Appr<strong>en</strong>tis<strong>sa</strong>ge <strong>de</strong>s Langues et Systèmes d’Information et <strong>de</strong><br />

Communication, 2(2), 3–32.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 111


Chan, K. M. K., & Yiu, E. M.-L. (2002). The effect of anchors and training on the reliability of<br />

perceptual voice evaluation. Journal of speech, language, and hearing research: JSLHR, 45(1), 111–<br />

126. doi:10.1044/1092-4388(2002/009)<br />

Chevrie-Muller, C. (1990). Ecouter, mesurer la <strong>voix</strong>. In L’Esprit <strong>de</strong>s <strong>voix</strong> : étu<strong>de</strong>s sur la fonction<br />

<strong>vocale</strong> (pp. 53–67). Gr<strong>en</strong>oble: la P<strong>en</strong>sée <strong>sa</strong>uvage Ed.<br />

Cooke, A., Ludlow, C. L., Hallett, N., & Selbie, W. S. (1997). Characteristics of vocal fold adduction<br />

related to voice onset. Journal of voice: official journal of the Voice Foundation, 11(1), 12–22.<br />

Cooper, M. (1974). Spectrographic Analysis of Fundam<strong>en</strong>tal Frequ<strong>en</strong>cy and Hoars<strong>en</strong>ess before and<br />

after Vocal Rehabilitation. Journal of Speech and Hearing Disor<strong>de</strong>rs, 39(3), 286–297.<br />

Cornut, G. (2009). La <strong>voix</strong>. Paris: Presses universitaires <strong>de</strong> France.<br />

Cotelle, S. (1993). Etu<strong>de</strong> <strong>de</strong> la relation pati<strong>en</strong>t-thérapeute dans la <strong>rééducation</strong> <strong>vocale</strong> [Texte<br />

imprimé]: Echo du féminin et du masculin (mémoire d’orthophonie). [s.n.], S.l.].<br />

Coudière, C. (2003). De l’utilité <strong>de</strong>s logiciels pour la <strong>voix</strong> <strong>en</strong> <strong>rééducation</strong> <strong>de</strong> dysphonies<br />

dysfonctionnelles (Mémoire d’orthophonie). Université Paul Sabatier. Faculté <strong>de</strong> Mé<strong>de</strong>cine<br />

Toulouse-Rangueil, Toulouse, France.<br />

Deary, I. J., Wilson, J. A., Carding, P. N., & Mack<strong>en</strong>zie, K. (2003). The dysphonic voice heard by me,<br />

you and it: differ<strong>en</strong>tial associations with personality and psychological distress. Clinical<br />

Otolaryngology & Allied Sci<strong>en</strong>ces, 28(4), 374–378.<br />

Dejonckere, P. H. (2001). La systémati<strong>sa</strong>tion du traitem<strong>en</strong>t orthophonique <strong>en</strong> élém<strong>en</strong>ts : une<br />

métho<strong>de</strong> pour catégoriser et quantifier les compo<strong>sa</strong>ntes d’un traitem<strong>en</strong>t fonctionnel. In Dysphonies<br />

et <strong>rééducation</strong>s <strong>vocale</strong>s <strong>de</strong> l’adulte (pp. 349–356). Marseille: Solal.<br />

Dejonckere, P. H. (2006). améliorer la fiabilité <strong>de</strong> l’analyse perceptive <strong>de</strong> la <strong>voix</strong> pathologique par un<br />

support visuel sonagraphique. In Voix parlée et chantée (pp. 35–42). Ville-d’Avray: C. Klein-Dallant.<br />

Dejonckere, P. H., Bradley, P., Clem<strong>en</strong>te, P., Cornut, G., Crevier-Buchman, L., Friedrich, G., …<br />

Woi<strong>sa</strong>rd, V. (2001). A basic protocol for functional assessm<strong>en</strong>t of voice pathology, especially for<br />

investigating the efficacy of (phonosurgical) treatm<strong>en</strong>ts and evaluating new assessm<strong>en</strong>t techniques.<br />

Gui<strong>de</strong>line elaborated by the Committee on Phoniatrics of the European Laryngological Society (ELS).<br />

European archives of oto-rhino-laryngology: official journal of the European Fe<strong>de</strong>ration of Oto-<br />

Rhino-Laryngological Societies (EUFOS): affiliated with the German Society for Oto-Rhino-<br />

Laryngology - Head and Neck Surgery, 258(2), 77–82.<br />

Delacroix, L., Morsomme, D., & Remacle, M. (2009). <strong>rééducation</strong> logopédique <strong>de</strong>s paralysies<br />

cordales. In Précis d’audiophonologie et <strong>de</strong> déglutition. Tome II, Les voies aéro-digestives<br />

supérieures (pp. 423–430). Marseille: Solal.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 112


Eadie, T. L., Kapsner, M., Ros<strong>en</strong>zweig, J., Waugh, P., Hillel, A., & Merati, A. (2010). The role of<br />

experi<strong>en</strong>ce on judgm<strong>en</strong>ts of dysphonia. Journal of Voice, 24(5), 564–573.<br />

Espanol, C. (2011). Etu<strong>de</strong> <strong>de</strong> différ<strong>en</strong>ts facteurs pouvant favoriser la récupération dans les paralysies<br />

récurr<strong>en</strong>tielles unilatérales post-chirurgicales [Texte imprimé] (Mémoire d’orthophonie). [s.n.],<br />

Paris.<br />

Esti<strong>en</strong>ne, F. (1998). Voix parlée, <strong>voix</strong> chantée : exam<strong>en</strong> et thérapie. Paris: Masson.<br />

Esti<strong>en</strong>ne, F. (2001). Exam<strong>en</strong> et thérapie <strong>de</strong> la <strong>voix</strong>, réflexions et actions. In Dysphonies et<br />

<strong>rééducation</strong>s <strong>vocale</strong>s <strong>de</strong> l’adulte (pp. 27–49). Marseille: Solal.<br />

Esti<strong>en</strong>ne, F., & Morsomme, D. (2009). Traitem<strong>en</strong>t orthophonique <strong>de</strong>s pathologies <strong>vocale</strong>s. In Précis<br />

d’audiophonologie et <strong>de</strong> déglutition. Tome II, Les voies aéro-digestives supérieures (pp. 257–268).<br />

Marseille: Solal.<br />

Esti<strong>en</strong>ne, F., & Piérart, B. (2006). Les bilans <strong>de</strong> langage et <strong>de</strong> <strong>voix</strong> : fon<strong>de</strong>m<strong>en</strong>ts théoriques et<br />

pratiques. Paris: Masson.<br />

Ferrand, C. T. (1995). Effects of practice with and without knowledge of results on jitter and<br />

shimmer levels in normally speaking wom<strong>en</strong>. Journal of Voice, 9(4), 419–423.<br />

Fisher, J., Kayes, G., & Reeve, M. (2003, August). Adv<strong>en</strong>ced Vocal Training with Vocal Process:<br />

Computer Voice Analysis. Poster pres<strong>en</strong>ted at the Fifth Pan European Voice Confer<strong>en</strong>ce (PEVoC 5),<br />

Graz.<br />

Foisneau, S., Rie<strong>de</strong>l, S., Chevalier, D., & Decorte, D. (2003). La <strong>voix</strong> dans tous ses états. Isbergues:<br />

Ortho éd.<br />

Fonagy, I. (1990). Les langages <strong>de</strong> la <strong>voix</strong>. In L’Esprit <strong>de</strong>s <strong>voix</strong> : étu<strong>de</strong>s sur la fonction <strong>vocale</strong> (pp. 69–<br />

84). Gr<strong>en</strong>oble: la P<strong>en</strong>sée <strong>sa</strong>uvage Ed.<br />

Fortin, E., Guth, P., & Tain, L. (2007). Entre “parler droit” et “sonner juste” : les arrangem<strong>en</strong>ts <strong>en</strong>tre<br />

orthophonistes et pati<strong>en</strong>tèle au cours d’une <strong>rééducation</strong> <strong>vocale</strong>. In Le métier d’orthophoniste :<br />

langage, g<strong>en</strong>re et profession (pp. 235–243). R<strong>en</strong>nes: Éd. <strong>de</strong> l’École nationale <strong>de</strong> la <strong>sa</strong>nté publique.<br />

Fournier, C. (1989). La <strong>voix</strong>, un art et un métier : anatomie, physiologie, acoustique, phonétique :<br />

technique <strong>de</strong> la <strong>voix</strong> professionnelle. Seyssel, France: CCL editions.<br />

Fournier, C., & Dupessey, M. (2001). Education et <strong>rééducation</strong> <strong>vocale</strong>s : les bases d’une approche<br />

parallèle. Cas particulier <strong>de</strong>s comédi<strong>en</strong>s et <strong>de</strong>s chanteurs. In Dysphonies et <strong>rééducation</strong>s <strong>vocale</strong>s <strong>de</strong><br />

l’adulte (pp. 221–245). Marseille: Solal.<br />

Fugain, C. (1990). La dysphonie fonctionnelle. In L’Esprit <strong>de</strong>s <strong>voix</strong> : étu<strong>de</strong>s sur la fonction <strong>vocale</strong> (pp.<br />

99–106). Gr<strong>en</strong>oble: la P<strong>en</strong>sée <strong>sa</strong>uvage Ed.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 113


Ghio, A. (2012). bilan instrum<strong>en</strong>tal <strong>de</strong> la dysphonie. In La <strong>voix</strong> parlée et la <strong>voix</strong> chantée (pp. 69–104).<br />

Montpellier: Sauramps médical.<br />

Gillie, C. (n.d.). La Voix au Risque <strong>de</strong> la Perte ; <strong>de</strong> l’aphonie à “l’a” phonie”. Paris 7, Ecole Doctorale<br />

<strong>de</strong> Recherches <strong>en</strong> Psychanalyse.<br />

Giovanni, A., & Aumelas, E. (2004). Anatomie et physiologie <strong>de</strong> la phonation. In Le bilan d’une<br />

dysphonie : état actuel et perspectives (pp. 7–43). Solal.<br />

Giovanni, A., & F<strong>en</strong>ollar, C. (2004). analyse subjective par le pati<strong>en</strong>t <strong>de</strong> son handicap vocal. In Le<br />

Bilan D’une Dysphonie : État Actuel Et Perspectives (pp. 45–66). Solal.<br />

Giovanni, A., Robieux, C., & Santini, L. (2012). physiologie <strong>de</strong> la phonation. In La <strong>voix</strong> parlée et la <strong>voix</strong><br />

chantée (pp. 9–16). Montpellier: Sauramps médical.<br />

Hart, M. (2002a). l’analyse sonagraphique : un nouvel outil pédagogique ? Le journal <strong>de</strong> l’AFPC, (9),<br />

25–31.<br />

Hart, M. (2002b). Utili<strong>sa</strong>tion <strong>de</strong> l’analyse sonagraphique <strong>de</strong> la <strong>voix</strong> chantée dans les écrits <strong>de</strong> trois<br />

grands pédagogues américains : William V<strong>en</strong>nard, D. Ralph Appelman, Berton Coffin. Le journal <strong>de</strong><br />

l’AFPC, (9), 52–54.<br />

Heinrich, N. (2012). Physiologie <strong>de</strong> la <strong>voix</strong> chantée : vibrations laryngées et adaptations phonorésonantielles.<br />

In La <strong>voix</strong> parlée et la <strong>voix</strong> chantée (pp. 17–32). Montpellier: Sauramps médical.<br />

Hoppe, D., Sadakata, M., & De<strong>sa</strong>in, P. (2006). Developm<strong>en</strong>t of real-time visual feedback assistance<br />

in singing training: a review. Journal of computer assisted learning, 22(4), 308–316.<br />

Howard, D. M. (2002). The real and the non-real in speech measurem<strong>en</strong>ts. Medical <strong>en</strong>gineering &<br />

physics, 24(7), 493–500.<br />

Howard, D. M., Welch, G. F., Brereton, J., Himoni<strong>de</strong>s, E., DeCosta, M., Williams, J., & Howard, A. W.<br />

(2004). WinSingad: A real-time display for the singing studio*. Logopedics Phonatrics Vocology,<br />

29(3), 135–144.<br />

Howard, David M. (2005). Human hearing mo<strong>de</strong>lling real-time spectrography for visual feedback in<br />

singing training. Folia phoniatrica et logopaedica: official organ of the International Association of<br />

Logopedics and Phoniatrics (IALP), 57(5-6), 328–341. doi:10.1159/000087085<br />

Howard, David M, Brereton, J., Welch, G. F., Himoni<strong>de</strong>s, E., Decosta, M., Williams, J., & Howard, A.<br />

W. (2007). Are real-time displays of b<strong>en</strong>efit in the singing studio? An exploratory study. Journal of<br />

voice: official journal of the Voice Foundation, 21(1), 20–34. doi:10.1016/j.jvoice.2005.10.003<br />

Howard, David M., Abberton, E., & Fourcin, A. (2012). Disor<strong>de</strong>red voice measurem<strong>en</strong>t and auditory<br />

analysis. Speech Commun., 54(5), 611–621. doi:10.1016/j.specom.2011.03.008<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 114


Juli<strong>en</strong>, P. (2009). Perception <strong>de</strong> la musique et dysphonie (Mémoire d’orthophonie). Université <strong>de</strong> la<br />

méditerrannée. Ecole d’Orthophonie <strong>de</strong> Marseille.<br />

Klein-Dallant, C. (2001). le travail <strong>de</strong> l’espace et <strong>de</strong> la résonance. In Dysphonies et <strong>rééducation</strong>s<br />

<strong>vocale</strong>s <strong>de</strong> l’adulte (pp. 119–125). Marseille: Solal.<br />

Ko<strong>en</strong>ig, W. (1946). The Sound Spectrograph. Acoustical Society of America Journal, 18, 19.<br />

doi:10.1121/1.1916342<br />

Kreiman, J., Gerratt, B. R., Kempster, G. B., Erman, A., & Berke, G. S. (1993). Perceptual evaluation of<br />

voice quality: review, tutorial, and a framework for future research. Journal of speech and hearing<br />

research, 36(1), 21–40.<br />

Kreiman, J., Gerratt, B. R., Precoda, K., & Berke, G. S. (1992). Individual differ<strong>en</strong>ces in voice quality<br />

perception. Journal of speech and hearing research, 35(3), 512–520.<br />

Lamesch, S. (2012). Les ressources du numérique dans l’<strong>en</strong>seignem<strong>en</strong>t du chant. Journal <strong>de</strong><br />

l’Association Française <strong>de</strong>s Professeurs <strong>de</strong> Chant, 9, 61–65.<br />

Larson, C. R., Altman, K. W., Liu, H., & Hain, T. C. (2008). Interactions betwe<strong>en</strong> auditory and<br />

somatos<strong>en</strong>sory feedback for voice F 0 control. Experim<strong>en</strong>tal Brain Research, 187(4), 613–621.<br />

doi:10.1007/s00221-008-1330-z<br />

Laukkan<strong>en</strong>, A.-M., Syrjä, T., Laitala, M., & Leino, T. (2004). Effects of two-month vocal exercising<br />

with and without spectral biofeedback on stu<strong>de</strong>nt actors’ speaking voice. Logopedics, phoniatrics,<br />

vocology, 29(2), 66–76.<br />

Le Huche, F., & Allali, A. (2001). La <strong>voix</strong>. Paris: Masson.<br />

Leclerc, C. (2007). “Spécialistes” <strong>de</strong> la <strong>rééducation</strong> <strong>vocale</strong> : <strong>de</strong>s parcours <strong>en</strong>tre <strong>de</strong>ux mon<strong>de</strong>s. In Le<br />

métier d’orthophoniste : langage, g<strong>en</strong>re et profession (pp. 105–116). R<strong>en</strong>nes: Éd. <strong>de</strong> l’École<br />

nationale <strong>de</strong> la <strong>sa</strong>nté publique.<br />

Lee, M., Drinnan, M., & Carding, P. (2005). The reliability and validity of pati<strong>en</strong>t self-rating of their<br />

own voice quality. Clinical Otolaryngology, 30(4), 357–361.<br />

Leipp, E. (2010). Acoustique et musique données physiques et technologiques, problèmes <strong>de</strong><br />

l’audition <strong>de</strong>s sons musicaux, principes <strong>de</strong> fonctionnem<strong>en</strong>t et signification acoustique <strong>de</strong>s<br />

principaux archétypes d’instrum<strong>en</strong>ts <strong>de</strong> musique, les musiques expérim<strong>en</strong>tales, l’acoustique <strong>de</strong>s<br />

<strong>sa</strong>lles. Paris: Presses <strong>de</strong>s Mines-Mines ParisTech.<br />

Lescarmontier, E. (2012). Exclusion du facteur personnel dans le jugem<strong>en</strong>t <strong>de</strong>s dysphonies<br />

(mémoire d’orthophonie). Université François Rabelais (Tours). UFR <strong>de</strong> mé<strong>de</strong>cine, Tours.<br />

Ma, E. P., & Yiu, E. M. (2001). Voice activity and participation profile: assessing the impact of voice<br />

disor<strong>de</strong>rs on daily activities. Journal of speech, language, and hearing research: JSLHR, 44(3), 511–<br />

524.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 115


Manteau, E. (2004). Rééducation ou conservation du langage oral et <strong>de</strong> la parole dans les surdités<br />

appareillées ou non, y compris <strong>en</strong> cas d’implantation cochléaire. In Les approches thérapeutiques<br />

<strong>en</strong> orthophonie (pp. 29–79). Isbergues: Ortho édition.<br />

Marié-Bailly, I. (2004, juin). La <strong>voix</strong> s<strong>en</strong>sorielle - percevoir pour émettre (Mémoire DIU <strong>de</strong><br />

Phoniatrie). Université Paris 13 - UFG Santé Mé<strong>de</strong>cine Biologie humaine, Bobigny.<br />

Mart<strong>en</strong>s, J. W., Versnel, H., & Dejonckere, P. H. (2007). The effect of visible speech in the perceptual<br />

rating of pathological voices. Archives of Otolaryngology—Head & Neck Surgery, 133(2), 178–185.<br />

Martin, P. (2008). Phonétique acoustique. Paris: A. Colin.<br />

Maulet, M. (1997). Expéri<strong>en</strong>ces d’utili<strong>sa</strong>tion <strong>de</strong> SpeechViewer aurpès d’<strong>en</strong>fants prés<strong>en</strong>tant <strong>de</strong>s<br />

troubles <strong>de</strong> la <strong>voix</strong> et <strong>de</strong> la parole. Analyse, applications et limites. En partiuclier, chez l’<strong>en</strong>fant<br />

atteint <strong>de</strong> défici<strong>en</strong>ce auditive. Pres<strong>en</strong>ted at the Entreti<strong>en</strong>s d’orthophonie.<br />

McCoy, S. J. (2004). Your voice, an insi<strong>de</strong> view : multimedia voice sci<strong>en</strong>ce and pedagogy. [Princeton,<br />

N.J.]: Insi<strong>de</strong> View Press.<br />

M<strong>en</strong>in-Sicard, A., & Sicard, É. (2006). Vocalab: ai<strong>de</strong> à l’évaluation et à la <strong>rééducation</strong> <strong>de</strong> la <strong>voix</strong> et <strong>de</strong><br />

la parole : <strong>de</strong> la théorie à la pratique. Isbergues (76-78 rue Jean-Jaurès, 62330): Ortho éd.<br />

Miller, D., & Schutte, H. K. (1999a). The use of spectrum analysis in the voice studio. In Voice--<br />

tradition and technology : the use of computer feedback in voice training (pp. 189–210). San Diego,<br />

Calif.: Singular Publishing.<br />

Miller, D., & Schutte, H. K. (1999b). The use of the electroglottograph in the voice studio. In Voice--<br />

tradition and technology : the use of computer feedback in voice training (pp. 211–225). San Diego,<br />

Calif.: Singular Publishing.<br />

Miller, Donald G., & Schutte, H. K. (1990). Feedback from spectrum analysis applied to the singing<br />

voice. Journal of Voice, 4(4), 329–334. doi:10.1016/S0892-1997(05)80050-5<br />

Miller, Donald Gray. (2008). Resonance in singing : voice building through acoustic feedback.<br />

Princeton, NJ: Insi<strong>de</strong> View Press.<br />

Miller, R., & Gouëlou, J.-M. (1993). La Structure du chant pédagogie systématique <strong>de</strong> l’art du chant.<br />

Paris: Cité <strong>de</strong> la musique-C<strong>en</strong>tre <strong>de</strong> ressources musique et danse.<br />

Morsomme, D., & Esti<strong>en</strong>ne, F. (2006). Bilan vocal. In Les bilans <strong>de</strong> langage et <strong>de</strong> <strong>voix</strong> : fon<strong>de</strong>m<strong>en</strong>ts<br />

théoriques et pratiques (pp. 223–256). Paris: Masson.<br />

Nair, G. (1999). Voice-- tradition and technology : the use of computer feedback in voice training.<br />

San Diego, Calif.: Singular Publishing.<br />

Ormezzano, Y. (2000). Le Gui<strong>de</strong> <strong>de</strong> la <strong>voix</strong>. Paris: O. Jacob.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 116


Pearson, P., Pickering, L., & Da Silva, R. (2011). The impact of computer assisted pronunciation<br />

training on the improvem<strong>en</strong>t of Vietnamese learner production of English syllable margins. In<br />

Proceedings of the 2nd Pronunciation in Second Language Learning and Teaching Confer<strong>en</strong>ce, (pp.<br />

169–180). Pres<strong>en</strong>ted at the Pronunciation in Second Language Learning and Teaching Confer<strong>en</strong>ce,<br />

Ames, IA: Iowa State University: J. Levis & K. LeVelle.<br />

Peloux, V. (1993). Outil informatique et <strong>rééducation</strong> : intérêt <strong>de</strong> Speech Viewer (Mémoire<br />

d’orthophonie). [s.n.], Montpellier.<br />

Pierce, J. R. (1984). Le son musical musique, acoustique et informatique. Paris: Pour la sci<strong>en</strong>ce.<br />

Py, B. (2010). La statistique <strong>sa</strong>ns formule mathématique avec 150 questions et exercices corrigés<br />

d’<strong>en</strong>traînem<strong>en</strong>t aux exam<strong>en</strong>s. Paris: Pearson education.<br />

Remacle, M. (2009). les laryngopathies dysfonctionnelles. In Précis d’audiophonologie et <strong>de</strong><br />

déglutition. Tome II, Les voies aéro-digestives supérieures (pp. 243–255). Marseille: Solal.<br />

Remacle, M., & Morsomme, D. (2009). Evaluation objective <strong>de</strong> la <strong>voix</strong>. In Précis d’audiophonologie<br />

et <strong>de</strong> déglutition. Tome II, Les voies aéro-digestives supérieures (pp. 121–134). Marseille: Solal.<br />

Revis, J, Giovanni, A., & Triglia, J. M. (2002). Influ<strong>en</strong>ce of voice onset on the perceptual analysis of<br />

dysphonia. Folia phoniatrica et logopaedica: official organ of the International Association of<br />

Logopedics and Phoniatrics (IALP), 54(1), 19–25. doi:48593<br />

Revis, Joana. (2004). l’analyse perceptive <strong>de</strong>s dysphonies. In Le bilan d’une dysphonie : état actuel<br />

et perspectives. Solal.<br />

Revis, Joana, & Cayreyre, F. (2004). Rééducation <strong>de</strong>s troubles <strong>de</strong> la <strong>voix</strong> d’origine organique ou<br />

fonctionnelle. In Les approches thérapeutiques <strong>en</strong> orthophonie. Tome 3 (pp. 91–103). Isbergues:<br />

Ortho édition.<br />

Revis, Joana, Galant,, C., & Minghelli, E. (2012). analyse perceptive <strong>de</strong> la dysphonie, historique et<br />

perspective. In La <strong>voix</strong> parlée et la <strong>voix</strong> chantée (pp. 57–68). Montpellier: Sauramps médical.<br />

Revis, Joana, Giovanni, A., & Triglia, J.-M. (2002). Influ<strong>en</strong>ce <strong>de</strong> l’attaque sur l’analyse perceptive <strong>de</strong>s<br />

dysphonies. Folia Phoniatrica et Logopaedica, 54(1), 19–25. doi:10.1159/000048593<br />

Roch, J.-B. (2001). Douze clefs pour la <strong>rééducation</strong> <strong>de</strong> la <strong>voix</strong>. In Dysphonies et <strong>rééducation</strong>s <strong>vocale</strong>s<br />

<strong>de</strong> l’adulte (pp. 51–65). Marseille: Solal.<br />

Rodríguez, W. R., Saz, O., & Lleida, E. (2012). A prelingual tool for the education of altered voices.<br />

Speech Communication, 54(5), 583–600. doi:10.1016/j.specom.2011.05.006<br />

Romand, C. (1999). Utili<strong>sa</strong>tion <strong>de</strong> Speechviewer dans le traitem<strong>en</strong>t <strong>de</strong>s aspects segm<strong>en</strong>taux et<br />

suprasegm<strong>en</strong>taux <strong>de</strong> la parole chez <strong>de</strong>s <strong>en</strong>fants sourds profonds. Glos<strong>sa</strong>, (68), 28–35.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 117


Ros<strong>en</strong>, C. A., Lee, A. S., Osborne, J., Zullo, T., & Murry, T. (2004). Developm<strong>en</strong>t and validation of the<br />

voice handicap in<strong>de</strong>x-10. The Laryngoscope, 114(9), 1549–1556. doi:10.1097/00005537-200409000-<br />

00009<br />

Roure, M. (2005). L’attaque vocalique chez le chanteur (Mémoire d’orthophonie). [s.n.],<br />

Montpellier.<br />

Rousseaux, F. (1989). De l’u<strong>sa</strong>ge <strong>de</strong> la relaxation dans les dysphonies dysfonctionnelles: le point du<br />

vue du pati<strong>en</strong>t [Texte imprimé] (mémoire d’orthophonie). [s.n.], S.l.].<br />

Sarfati, J. (1998). Soigner la <strong>voix</strong>. Marseille, France: Solal.<br />

Singly, F. <strong>de</strong>. (2008). Le questionnaire. [Paris]: A. Colin.<br />

Steinhauer, K., & Grayhack, J. P. (2000). The role of knowledge of results in performance and<br />

learning of a voice motor task. Journal of voice: official journal of the Voice Foundation, 14(2), 137–<br />

145.<br />

Steinhauer, K., Grayhack, J. P., Smiley-Oy<strong>en</strong>, A. L., Shaiman, S., & McNeil, M. R. (2004). The<br />

relationship among voice onset, voice quality, and fundam<strong>en</strong>tal frequ<strong>en</strong>cy: a dynamical perspective.<br />

Journal of Voice, 18(4), 432–442.<br />

Van Leer, E., & Connor, N. P. (2010). Pati<strong>en</strong>t Perceptions of Voice Therapy Adher<strong>en</strong>ce. Journal of<br />

Voice, 24(4), 458–469. doi:10.1016/j.jvoice.2008.12.009<br />

Verdolini, K., & Krebs, D. E. (1999). Some consi<strong>de</strong>rations on the sci<strong>en</strong>ce of special chall<strong>en</strong>ges in voice<br />

training. In Voice-- tradition and technology : the use of computer feedback in voice training (pp.<br />

227–239). San Diego, Calif.: Singular Publishing.<br />

Volin, R. A. (1999). Applying gram to common speech pathology and voice therapy techniques. In<br />

Voice-- tradition and technology : the use of computer feedback in voice training (pp. 241–258). San<br />

Diego, Calif.: Singular Publishing.<br />

Welch, G. F. (1985). A Schema Theory of How Childr<strong>en</strong> Learn to Sing in Tune. Psychology of Music,<br />

13(1), 3–18. doi:10.1177/0305735685131001<br />

Welch, G. F., Howard, D. M., Himoni<strong>de</strong>s, E., & Brereton, J. (2005). Real-time feedback in the singing<br />

studio: an innovatory action-research project using new voice technology. Music Education<br />

Research, 7(2), 225–249. doi:10.1080/14613800500169779<br />

Wilson, P. H., Lee, K., Callaghan, J., Thorpe, C. W., Maimets-Volk, K., Parncutt, R., … Ross, J. (2007).<br />

Learning to sing in tune: Does real-time visual feedback help? In Proceedings of the Confer<strong>en</strong>ce on<br />

Interdisciplinary Musicology (CIM07) (p. 9). Pres<strong>en</strong>ted at the 3rd Confer<strong>en</strong>ce on Interdisciplinary<br />

Musicology, Tallinn, Estonia: R. Parncutt, A. Kessler & F. Zimmer.<br />

Wilson, P. H., Thorpe, C. W., & Callaghan, J. (2005). Looking at singing: does real-time visual<br />

feedback impove the way we learn to sing? In 2nd APSCOM Confer<strong>en</strong>ce: Asia-Pacific Society for the<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 118


Cognitive Sci<strong>en</strong>ces of Music (p. 10). Pres<strong>en</strong>ted at the 2nd APSCOM Confer<strong>en</strong>ce: Asia-Pacific Society<br />

for the Cognitive Sci<strong>en</strong>ces of Music, Séoul, Corée du Sud.<br />

Woi<strong>sa</strong>rd, V. (2004). le bilan vocal <strong>en</strong> pratique. In Le bilan d’une dysphonie : Etat actuel et<br />

perspectives (pp. 197–207). Solal.<br />

Wolfe, V. I., & Steinfatt, T. M. (1987). Prediction of vocal severity within and across voice types.<br />

Journal of speech and hearing research, 30(2), 230–240.<br />

Wuyts, F. L., De Bodt, M. S., & Van <strong>de</strong> Heyning, P. H. (1999). Is the reliability of a visual analog scale<br />

higher than an ordinal scale? An experim<strong>en</strong>t with the GRBAS scale for the perceptual evaluation of<br />

dysphonia. Journal of voice: official journal of the Voice Foundation, 13(4), 508–517.<br />

Yanagihara, N. (1967). Significance of Harmonic Changes and Noise Compon<strong>en</strong>ts in Hoars<strong>en</strong>ess.<br />

Journal of Speech and Hearing Research, 10(3), 531–541.<br />

Yasui, A. (2004). Objective study of vocal disor<strong>de</strong>rs uses spectrograph’. Bulletin of Universities and<br />

Institues, 2, 35–46.<br />

Yumoto, E., Sa<strong>sa</strong>ki, Y., & Okamura, H. (1984). Harmonics-to-Noise Ratio and Psychophysical<br />

Measurem<strong>en</strong>t of the Degree of Hoars<strong>en</strong>ess. Journal of Speech and Hearing Research, 27(1), 2–6.<br />

Zon<strong>de</strong>r, A. (2002). Le biofeedback électromyographique, outil d’évaluation <strong>en</strong> orthophonie :<br />

application aux paralysies faciales, infirmités motrices cérébrales et troubles <strong>de</strong> la cinématique<br />

temporo-mandibulaire (Mémoire d’orthophonie). Paris.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 119


glos<strong>sa</strong>ire<br />

(la définition <strong>de</strong>s notions acoustiques est inspirée notamm<strong>en</strong>t <strong>de</strong> (Roure, 2005, pp. 17–18) et (Leipp,<br />

2010, pp. 20–28))<br />

l’adaptation phono-résonantielle<br />

ét<strong>en</strong>due : espace <strong>en</strong>tre la note la plus grave et la note la plus aiguë que le sujet peut émettre.<br />

(<strong>en</strong>viron <strong>de</strong>ux octaves pour un sujet normal <strong>sa</strong>ns éducation <strong>vocale</strong>)<br />

Fatigue <strong>vocale</strong> : elle est mal définie. On peut citer la fatigue <strong>de</strong>s muscles laryngés et respiratoires,<br />

supposée myogénique. Résulte un contrôle difficile <strong>de</strong>s fréqu<strong>en</strong>ces (<strong>voix</strong> plus aiguë ou au contraire<br />

plus grave), un durcissem<strong>en</strong>t <strong>de</strong>s ligam<strong>en</strong>ts, articulations et membranes, une <strong>voix</strong> plus faible<br />

Feedback proprioceptif : information sur la performance donné par <strong>de</strong>s récepteurs s<strong>en</strong>sitifs situé<br />

dans les muscles. (Welch, 1985, p. 6)<br />

Feedback extéroceptif : information sur la performance fourni par les principaux organes <strong>de</strong>s s<strong>en</strong>s :<br />

les yeux, les oreilles, la bouche, le nez, les mains et l’appareil vestibulaire (Welch, 1985, p. 6)<br />

forçage vocal : observé dans <strong>de</strong>s situations comme parler à un auditeur éloigné ou peu att<strong>en</strong>tif ou<br />

<strong>en</strong>core dans le bruit, ou émettre un son plus aigu qu’à l’accoutumée. Le sujet ne contrôle pas <strong>sa</strong><br />

dép<strong>en</strong>se d’énergie, ne pr<strong>en</strong>d pas <strong>de</strong> repos réparateur.<br />

Formant : ban<strong>de</strong> <strong>de</strong> fréqu<strong>en</strong>ce amplifiée par les cavités <strong>de</strong> résonance. Conti<strong>en</strong>t généralem<strong>en</strong>t<br />

plusieurs harmoniques.<br />

Fréqu<strong>en</strong>ce (<strong>en</strong> Hertz : Hz) : c’est un nombre par unité <strong>de</strong> temps. Pour un son périodique, c’est le<br />

nombre <strong>de</strong> cycles complets effectués <strong>en</strong> une secon<strong>de</strong>. La fréqu<strong>en</strong>ce est l’inverse <strong>de</strong> la pério<strong>de</strong>. On<br />

parle <strong>de</strong> « cycles par secon<strong>de</strong> » ou <strong>de</strong> « Hertz » (Hz). Un son d’une fréqu<strong>en</strong>ce <strong>de</strong> 500Hz a une<br />

pério<strong>de</strong> <strong>de</strong> 1/500 secon<strong>de</strong> (ou 2 ms)<br />

Harmoniques : dans un son périodique complexe, partie du son dont la fréqu<strong>en</strong>ce est un multiple <strong>de</strong><br />

la fréqu<strong>en</strong>ce fondam<strong>en</strong>tale. L’harmonique 0 et l’harmonique 1 correspon<strong>de</strong>nt à la fréqu<strong>en</strong>ce<br />

fondam<strong>en</strong>tale.<br />

Knowledge of Results (KR) : information sur la performance fournie par l’expérim<strong>en</strong>tateur, le<br />

professeur ou une autre source externe. (Welch, 1985, p. 6) (feedback externe)<br />

Malm<strong>en</strong>age vocal : situation <strong>de</strong> forçage vocal dans lequel le sujet utilise mal <strong>sa</strong> <strong>voix</strong>, <strong>en</strong> utili<strong>sa</strong>nt par<br />

exemple systématiquem<strong>en</strong>t une <strong>voix</strong> d’insistance. De plus, il ne ti<strong>en</strong>t pas compte <strong>de</strong>s signaux<br />

d’alerte et <strong>de</strong> fatigue<br />

Résonateur : cavité possédant une fréqu<strong>en</strong>ce <strong>de</strong> résonance. En particulier les cavités pharyngée,<br />

buccale et na<strong>sa</strong>le amplifi<strong>en</strong>t certaines ban<strong>de</strong>s <strong>de</strong> fréqu<strong>en</strong>ces <strong>de</strong> la <strong>voix</strong> humaine, et <strong>en</strong> atténu<strong>en</strong>t<br />

d’autres. Les fréqu<strong>en</strong>ces graves sont favorablem<strong>en</strong>t amplifiées par <strong>de</strong> gran<strong>de</strong>s cavités et <strong>de</strong> petits<br />

orifices (surface <strong>de</strong> l’ouverture) alors que les fréqu<strong>en</strong>ces aiguës sont amplifiées par <strong>de</strong> petites<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 120


cavités <strong>de</strong> grands orifices. Un résonateur est dit sélectif lorsque la ban<strong>de</strong> pas<strong>sa</strong>nte (<strong>de</strong> fréqu<strong>en</strong>ces)<br />

est étroite, il est dit amorti lorsque la ban<strong>de</strong> pas<strong>sa</strong>nte est large.<br />

Singing Formant / formant du chanteur : r<strong>en</strong>forcem<strong>en</strong>t <strong>de</strong>s harmoniques aigues (<strong>en</strong>tre 2000 à 4000<br />

Hz selon les auteurs) caractéristique <strong>de</strong> la <strong>voix</strong> humaine.<br />

Son périodique : un son est dit périodique lorsque le mouvem<strong>en</strong>t du corps mis <strong>en</strong> vibration se<br />

reproduit indéfinim<strong>en</strong>t, i<strong>de</strong>ntique à lui-meme, au bout d’un certain temps appelé pério<strong>de</strong> T. A ce<br />

type <strong>de</strong> son, on peut attribuer une hauteur. Parmi les sons périodiques, on distingue les sons<br />

périodiques simples et les sons périodiques complexes.<br />

Son périodique simple = son pur. La représ<strong>en</strong>tation temporelle <strong>de</strong> ce son est sinusoïdale. La<br />

fréqu<strong>en</strong>ce est unique et constante, <strong>en</strong> théorie l’amplitu<strong>de</strong> reste constante égalem<strong>en</strong>t. C’est le<br />

mouvem<strong>en</strong>t périodique le plus simple qui soit, assimillable au mouvem<strong>en</strong>t d’un point décrivant le<br />

périmètre d’un cercle.<br />

Son périodique complexe. La représ<strong>en</strong>tation temporelle <strong>de</strong> ce son est régulière mais non<br />

sinusoïdale Une on<strong>de</strong> complexe peut se décomposer <strong>en</strong> plusieurs on<strong>de</strong>s simples <strong>de</strong> fréqu<strong>en</strong>ces<br />

différ<strong>en</strong>tes. Chacune <strong>de</strong> ces fréqu<strong>en</strong>ces est le multiple d’une fréqu<strong>en</strong>ce <strong>de</strong> base appelée fréqu<strong>en</strong>ce<br />

fondam<strong>en</strong>tale. Les multiples <strong>de</strong> cette fréqu<strong>en</strong>ce sont appelés harmoniques.<br />

Surm<strong>en</strong>age vocal : situation <strong>de</strong> forçage vocal dans lequel le sujet, pour <strong>de</strong>s raisons professionnelles<br />

ou psychologiques, ne pr<strong>en</strong>d pas <strong>de</strong> repos à la mesure <strong>de</strong> ses besoins physiologiques<br />

Tessiture : intervalle cont<strong>en</strong>ant l’<strong>en</strong>semble <strong>de</strong>s sons émis avec ai<strong>sa</strong>nce (<strong>sa</strong>ns se mettre à mal, <strong>sa</strong>ns<br />

<strong>en</strong> éprouver <strong>de</strong> fatigue <strong>vocale</strong> anormale) et qualité (c’est-à-dire <strong>en</strong> contrôlant correctem<strong>en</strong>t la<br />

stabilité et l’int<strong>en</strong>sité). Utilisé par le sujet pour la parole et pour le chant<br />

Vibrato : modulation <strong>de</strong> la <strong>voix</strong>, régulière, itérative et syncronoe <strong>de</strong>s trois parmaètres hauteur (1/4 à<br />

½ ton), int<strong>en</strong>sité (2 à 3dB) timbre, avec une fréqu<strong>en</strong>ce <strong>de</strong> 6 à 7 cycle par secon<strong>de</strong> ; le vibrato est<br />

diversem<strong>en</strong>t apprécié selon les esthétiques. Suppose la t<strong>en</strong>ue d’une note, et n’est donc pas prés<strong>en</strong>t<br />

<strong>en</strong> <strong>voix</strong> parlée. [<strong>voix</strong> parlée, <strong>voix</strong> chantée, Amy <strong>de</strong> la Bretèque]. « Il constitue une ornem<strong>en</strong>tation <strong>de</strong><br />

la <strong>voix</strong> qui est la conséqu<strong>en</strong>ce d’un geste vocal parfaitem<strong>en</strong>t exécuté » (Esti<strong>en</strong>ne, 1998, p. 161)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 121


annexes<br />

Classifications<br />

Critère Objectifs Cotation<br />

Richesse du<br />

spectre<br />

Stabilité du<br />

spectre<br />

Energie du<br />

spectre<br />

Rapidité <strong>de</strong><br />

dégradation<br />

Propreté du<br />

spectre<br />

Déterminer la qualité du timbre<br />

<strong>en</strong> évaluant la richesse <strong>en</strong><br />

harmoniques : on distinguera les<br />

harmoniques situés dans les<br />

basses fréqu<strong>en</strong>ces (< 1500 Hz) et<br />

ceux > 1500 Hz dits extravocaliques,<br />

qui vi<strong>en</strong>n<strong>en</strong>t donner<br />

toute <strong>sa</strong> richesse au timbre<br />

Sur la partie stable du spectre (on<br />

ne ti<strong>en</strong>t pas compte <strong>de</strong> l’attaque)<br />

on recherche <strong>de</strong>s variations <strong>de</strong><br />

fréqu<strong>en</strong>ce (instabilité dans le<br />

tracé <strong>de</strong>s harmoniques) ou<br />

d’int<strong>en</strong>sité (instabilité <strong>de</strong> couleur)<br />

Appréh<strong>en</strong><strong>de</strong>r l’int<strong>en</strong>sité <strong>de</strong> la F0<br />

et <strong>de</strong>s premiers harmoniques au<br />

travers <strong>de</strong> l’énergie du spectre<br />

(représ<strong>en</strong>tée par la couleur)<br />

Rechercher <strong>de</strong>s signes <strong>de</strong><br />

dégradation rapi<strong>de</strong> du spectre<br />

(perte d’énergie rapi<strong>de</strong> qui serait<br />

liée à l’incompét<strong>en</strong>ce glottique)<br />

Rechercher la prés<strong>en</strong>ce <strong>de</strong> traces<br />

erratiques (traces vertes qui se<br />

superpos<strong>en</strong>t aux harmoniques)<br />

(Remacle & Morsomme, 2009, p. 129)<br />

(Yanagihara, 1967, pp. 533–534)<br />

0 : bon<br />

1 : moy<strong>en</strong><br />

2 : mauvais<br />

prés<strong>en</strong>ce d’harmoniques répartis<br />

sur l’<strong>en</strong>semble du spectre<br />

prés<strong>en</strong>ce d’harmoniques dans les<br />

basses fréqu<strong>en</strong>ces uniquem<strong>en</strong>t<br />

Mauvais :<br />

prés<strong>en</strong>ce rare d’harmoniques<br />

même dans les basses fréqu<strong>en</strong>ces<br />

0 : bon pas ou peu <strong>de</strong> variations<br />

1 : moy<strong>en</strong><br />

2 mauvais<br />

0 : bon<br />

1 : moy<strong>en</strong><br />

2 : mauvais<br />

0 : bon<br />

1 : moy<strong>en</strong><br />

2 : mauvais<br />

variations légères <strong>de</strong> fréqu<strong>en</strong>ce ou<br />

d’int<strong>en</strong>sité<br />

variations importantes <strong>de</strong><br />

fréqu<strong>en</strong>ce ou d’int<strong>en</strong>sité<br />

F0 et 1ers harmoniques <strong>de</strong> bonne<br />

int<strong>en</strong>sité (jaunes)<br />

F0 <strong>de</strong> bonne int<strong>en</strong>sité mais 1 er<br />

harmoniques relativem<strong>en</strong>t faibles<br />

(rouges)<br />

F0 <strong>de</strong> faible int<strong>en</strong>sité et 1 er<br />

harmoniques faibles ou abs<strong>en</strong>ts<br />

le spectre se mainti<strong>en</strong>t sur toute la<br />

durée <strong>de</strong> l’émission<br />

le spectre se dégra<strong>de</strong> légèrem<strong>en</strong>t<br />

<strong>de</strong> façon progressive<br />

toute l’énergie est conc<strong>en</strong>trée sur<br />

l’attaque<br />

0 : bon abs<strong>en</strong>ce <strong>de</strong> traces erratiques<br />

1 : moy<strong>en</strong><br />

2 : mauvais<br />

prés<strong>en</strong>ce <strong>de</strong> traces erratiques<br />

occasionnelles<br />

prés<strong>en</strong>ce <strong>de</strong> traces erratiques<br />

importantes<br />

(Wolfe & Steinfatt, 1987, p. 233)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 122


Reprise <strong>de</strong> Yanagihara 1967 + première catégorie<br />

<strong>sa</strong>ns bruit<br />

Type 0 et 0+ (Cooper, 1974, p. 291) compo<strong>sa</strong>ntes harmoniques normales sur toutes<br />

les fréqu<strong>en</strong>ces, <strong>sa</strong>ns compo<strong>sa</strong>nte <strong>de</strong> bruit<br />

type I : les harmoniques sont mélangées avec du<br />

bruit, principalem<strong>en</strong>t dans la zone formantielle <strong>de</strong>s<br />

voyelles 83<br />

type II : le bruit domine sur les harmoniques au<br />

niveau du second formant du [[/è/]] et du /i/, et on<br />

observe aussi un peu <strong>de</strong> bruit dans les hautes<br />

fréqu<strong>en</strong>ces au-<strong>de</strong>là <strong>de</strong> 3000 Hz pour les voyelles<br />

[[/è/]] et /i/. 84<br />

type III : les seconds formants du [[/è/]] et du /i/<br />

sont totalem<strong>en</strong>t remplacés par du bruit. La<br />

compo<strong>sa</strong>nte <strong>de</strong> bruit au-<strong>de</strong>là <strong>de</strong> 3000Hz augm<strong>en</strong>te<br />

<strong>en</strong> int<strong>en</strong>sité et <strong>en</strong> ét<strong>en</strong>due fréqu<strong>en</strong>tielle 85<br />

type IV : les seconds formants du [[/schwa, è/]] et<br />

du /i/ sont remplacés par du bruit, et même les<br />

premiers formants <strong>de</strong> toutes les voyelles per<strong>de</strong>nt<br />

leurs harmoniques au profit du bruit. De plus le<br />

bruit est int<strong>en</strong>sifié au niveau <strong>de</strong>s hautes<br />

fréqu<strong>en</strong>ces. 86<br />

compo<strong>sa</strong>ntes harmoniques normales mixées avec<br />

<strong>de</strong>s compo<strong>sa</strong>ntes <strong>de</strong> bruit principalem<strong>en</strong>t dans la<br />

région <strong>de</strong>s formants <strong>de</strong>s voyelles<br />

compo<strong>sa</strong>ntes <strong>de</strong> bruit prédominant sur les<br />

compo<strong>sa</strong>ntes harmoniques pour le second<br />

formant, et légères compo<strong>sa</strong>ntes <strong>de</strong> bruit dans la<br />

région <strong>de</strong>s hautes fréqu<strong>en</strong>ces (<strong>en</strong>viron 3 kHz)<br />

le second formant est complètem<strong>en</strong>t remplacé<br />

par les compo<strong>sa</strong>ntes <strong>de</strong> bruit, et <strong>de</strong>s<br />

compo<strong>sa</strong>ntes <strong>de</strong> bruit additionnel supérieures à 3<br />

kHz s’int<strong>en</strong>sifi<strong>en</strong>t et élargiss<strong>en</strong>t leur champs<br />

les premiers et <strong>de</strong>uxièmes harmoniques sont<br />

remplacées par du bruit, et les compo<strong>sa</strong>ntes <strong>de</strong><br />

bruit sont int<strong>en</strong>sifiées dans les hautes fréqu<strong>en</strong>ces.<br />

83<br />

The regular harmonic compon<strong>en</strong>ts are mixed with the noise compon<strong>en</strong>t chiefly in the formant region of the vowels<br />

84<br />

“The noise compon<strong>en</strong>ts in the second formants of /[[è]]/ and /i/ predominate over the harmonic compon<strong>en</strong>ts, and slight<br />

additional noise compon<strong>en</strong>ts appear in the high frequ<strong>en</strong>cy region above 3000 Hz in the vowels /[[è]]/ and /i/” .<br />

85<br />

“The second formants of /[[è]]/ and /i/ are totally replaced by noise compon<strong>en</strong>ts, and the additional noise compon<strong>en</strong>ts above<br />

3000 Hz further int<strong>en</strong>sify their <strong>en</strong>ergy and expand their range”.<br />

86<br />

“The second formants of la/, /[[è]]/, and li/ are replaced by noise compon<strong>en</strong>ts, and ev<strong>en</strong> the first formants of all vowels oft<strong>en</strong><br />

lose their periodic compon<strong>en</strong>ts which are supplem<strong>en</strong>ted by noise compon<strong>en</strong>ts. In addition, more int<strong>en</strong>sified high frequ<strong>en</strong>cy<br />

additional noise compon<strong>en</strong>ts are se<strong>en</strong>”.<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 123


(Remacle & Morsomme, 2009, p. 130) (Delacroix et al., 2009, p. 427) 87<br />

analyse <strong>de</strong> SMLT <strong>en</strong> ban<strong>de</strong> étroite, <strong>de</strong> 0 à 1000 Hz<br />

d’un /a:/ t<strong>en</strong>u. Classification utilisée « <strong>en</strong> clinique<br />

<strong>de</strong> manière quotidi<strong>en</strong>ne »<br />

Classe 4 : prés<strong>en</strong>ce <strong>de</strong> la fréqu<strong>en</strong>ce fondam<strong>en</strong>tale<br />

et <strong>de</strong>s harmoniques. Abs<strong>en</strong>ce <strong>de</strong> bruits<br />

Classe 3 : prés<strong>en</strong>ce <strong>de</strong> la fréqu<strong>en</strong>ce fondam<strong>en</strong>tale<br />

et d’harmoniques. Le bruit est <strong>en</strong>core prés<strong>en</strong>t<br />

Classe 2 : prés<strong>en</strong>ce <strong>de</strong> la fréqu<strong>en</strong>ce fondam<strong>en</strong>tale.<br />

Prés<strong>en</strong>ce <strong>de</strong> bruit. La prés<strong>en</strong>ce d’harmonique est<br />

possible mais <strong>de</strong> faible int<strong>en</strong>sité<br />

(mesures acoustiques pour l’évaluation <strong>de</strong> la <strong>voix</strong><br />

dans le cadre <strong>de</strong> paralysies cordales)<br />

classification à cinq niveaux <strong>de</strong> la qualité <strong>de</strong>s<br />

tracés d’analyse spectrale<br />

tracé 4 : fondam<strong>en</strong>tal et harmoniques bi<strong>en</strong><br />

prés<strong>en</strong>ts, abs<strong>en</strong>ce <strong>de</strong> bruit, la <strong>voix</strong> est normale »<br />

tracé 3 : fondam<strong>en</strong>tal plus distinct, harmoniques<br />

prés<strong>en</strong>ts mais persistance du bruit<br />

tracé 2 : apparition <strong>de</strong> la fréqu<strong>en</strong>ce<br />

fondam<strong>en</strong>tale, mais toujours paruvreté <strong>en</strong><br />

harmoniques et prés<strong>en</strong>ce <strong>de</strong> bruit<br />

Classe 1 : prés<strong>en</strong>ce <strong>de</strong> bruit mais abs<strong>en</strong>ce <strong>de</strong> signal tracé 1 ; prés<strong>en</strong>ce <strong>de</strong> bruit et abs<strong>en</strong>ce <strong>de</strong> son<br />

classe 0 : le tracé ne comporte pas d’harmonique<br />

i<strong>de</strong>ntifiable. Le tracé est pratiquem<strong>en</strong>t plat signant<br />

la faiblesse <strong>de</strong> l’énergie acoustique et l’abs<strong>en</strong>ce <strong>de</strong><br />

sonori<strong>sa</strong>tion<br />

tracé 0 : plat, <strong>sa</strong>ns harmoniques ni sonori<strong>sa</strong>tion<br />

87 Citant Remacle, Millet, Van <strong>de</strong>n Eeckhaut : application <strong>de</strong> l’analyseur <strong>de</strong> fréqu<strong>en</strong>ce à haute résolution. Proposition <strong>de</strong><br />

standardi<strong>sa</strong>tion. Compte-r<strong>en</strong>dus <strong>de</strong>s séances, 86è congrès français d’ORL et <strong>de</strong> pathologie cervico-faciale (pp. 159-164) Paris :<br />

Editions Arnette<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 124


figures<br />

Illustration : spectrogrammes jugés comme type I, III et IV par les <strong>de</strong>ux juges (Yumoto et al., 1984, p. 4)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 125


(Ko<strong>en</strong>ig, 1946)<br />

Leipp<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 126


(Welch, 1985)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 127


Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 128


Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 129


« Un son, ayant un fondam<strong>en</strong>tal relativem<strong>en</strong>t int<strong>en</strong>se et peu d’harmoniques, est « velouté » « moelleux » s’il est placé<br />

dans la tessiture grave ou médium […]. Si le fondam<strong>en</strong>tal est placé dans la tessiture suraiguë, le son re<strong>de</strong>vi<strong>en</strong>t perçant,<br />

détimbré ; <strong>en</strong> effet, ses harmoniques sort<strong>en</strong>t <strong>de</strong> l’aire audible […] Un son comportant quelques harmoniques comme<br />

précé<strong>de</strong>mm<strong>en</strong>t, mais dont l’int<strong>en</strong>sité individuelle est faible, reste « pauvre » […]. Avec <strong>de</strong>s harmoniques inférieurs<br />

d’importance décrois<strong>sa</strong>nte, le son <strong>de</strong>vi<strong>en</strong>t graduellem<strong>en</strong>t « rond », « chaud » […] [comme la flûte dans son domaine<br />

grave] Lorsque le son comporte <strong>de</strong>s harmoniques très nombreux, mais <strong>de</strong> faible int<strong>en</strong>sité, il est « maigre » […]. Si les<br />

harmoniques inférieurs s’amplifi<strong>en</strong>t, le son <strong>de</strong>vi<strong>en</strong>t « plein », « éclatant » […] Lorsque exist<strong>en</strong>t uniquem<strong>en</strong>t <strong>de</strong>ux<br />

groupes d’harmoniques, l’un dans le grave, l’autre dans l’aigu, le timbre est « creux » […]. Si les harmoniques <strong>de</strong> rang<br />

supérieur prédomin<strong>en</strong>t nettem<strong>en</strong>t, le son <strong>de</strong>vi<strong>en</strong>t « criard », « aci<strong>de</strong> », « vert », « aigre », <strong>en</strong> un mot, dissonant à cause<br />

<strong>de</strong> ces harmoniques […] Un son harmonique dont on coupe le fondam<strong>en</strong>tal et dont on atténue les harmoniques <strong>de</strong><br />

fiable rang <strong>de</strong>vi<strong>en</strong>t « nasillard » […] Quand les harmoniques impairs prédomin<strong>en</strong>t, le son « sonne la clarinette » […]<br />

Lorsque ce sont les harmoniques paris, le son a un timbre clair […] ». (Leipp, 2010, pp. 150–154)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 130


Quelques résultats détaillés (VHI, qualificatifs),<br />

utili<strong>sa</strong>tion <strong>de</strong>s échelles visuelles analogiques<br />

Tout son confondu et tout feedback confondu, l’image ci-après reproduit la feuille <strong>de</strong> pas<strong>sa</strong>tion et<br />

décrit la distribution <strong>de</strong>s réponses pour chacune <strong>de</strong>s échelles et pour chaque groupe. (bleu : tous ;<br />

vert : auditeurs du jury d’écoute ; rouge : pati<strong>en</strong>ts ; orange : pati<strong>en</strong>ts hors protocole ; violet :<br />

pati<strong>en</strong>ts protocole)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 131


Evolution objective <strong>de</strong>s pati<strong>en</strong>ts du protocole<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 132


Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 133


Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 134


Mise <strong>en</strong> perspective erreurs / utili<strong>sa</strong>tion / ai<strong>de</strong> / gratification par paramètres et par<br />

groupe<br />

Spectrogrammes tirés du site internet<br />

Intérêt du travail <strong>de</strong> l’attaque<br />

Joana Revis et al(J Revis, Giovanni, & Triglia, 2002) rapport<strong>en</strong>t que "L'attaque correspond à la mise<br />

<strong>en</strong> vibration <strong>de</strong>s cor<strong>de</strong>s <strong>vocale</strong>s. Une attaque normale est caractérisée par une fermeture <strong>de</strong>s cor<strong>de</strong>s<br />

<strong>vocale</strong>s simultanée à la mise <strong>en</strong> fonctionnem<strong>en</strong>t <strong>de</strong> la colonne d'air. ". "L'attaque pathologique est<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 135


caractérisée ess<strong>en</strong>tiellem<strong>en</strong>t par <strong>de</strong>ux fonctionnem<strong>en</strong>ts perceptibles à l'oreille: l'attaque soufflée et<br />

l'attaque dure. Dans les <strong>de</strong>ux cas, la pathologie correspond à une perte <strong>de</strong> la simultanéité <strong>de</strong> la<br />

fermeture et du souffle". (Joana Revis, Giovanni, & Triglia, 2002, p. 24)<br />

Attaque dure<br />

Les observations <strong>de</strong> Cooke et al (Cooke, Ludlow, Hallett, & Selbie, 1997) <strong>en</strong> cinématographie ultra<br />

rapi<strong>de</strong> caractéris<strong>en</strong>t les attaques dures par une vitesse d'accolem<strong>en</strong>t <strong>de</strong>s plis vocaux très gran<strong>de</strong>,<br />

<strong>de</strong>s plis vocaux plus rai<strong>de</strong>s, et un délai très court <strong>en</strong>tre l'adduction <strong>de</strong>s plis vocaux et le début <strong>de</strong> la<br />

phonation.<br />

D'après Richard Miller (Miller & Gouëlou, 1993), ce début <strong>de</strong> son résultant <strong>de</strong> l'adduction (du<br />

rapprochem<strong>en</strong>t) <strong>de</strong>s cor<strong>de</strong>s <strong>vocale</strong>s avant la phonation a été nommé <strong>de</strong> différ<strong>en</strong>tes façon : attaque<br />

glottale, occlusion glottale, clic glottal, coup <strong>de</strong> glotte... Ce type d’attaque est décrit par les auteurs<br />

comme « courant <strong>en</strong> pathologie » (Ormezzano, 2000) (Cooke et al., 1997) (Cornut, 2009), « avec<br />

resserrem<strong>en</strong>t du vestibule laryngé et rapprochem<strong>en</strong>t <strong>de</strong>s ban<strong>de</strong>s v<strong>en</strong>triculaires » (Cornut, 2009 , et<br />

cont<strong>en</strong>ant une notion <strong>de</strong> lutte (Fonagy, 1990, p. 73).<br />

Pour Joana Révis et ses collègues, « L’attaque dure correspond à un coup <strong>de</strong> glotte. C’est une<br />

attaque brève. Les cor<strong>de</strong>s <strong>vocale</strong>s sont fermées avant la mise <strong>en</strong> fonctionnem<strong>en</strong>t <strong>de</strong> la colonne d’air.<br />

Ce type d’attaque <strong>en</strong>tre dans le cadre <strong>de</strong> la perception du forçage vocal » (Joana Revis et al., 2002, p.<br />

24) [[n° <strong>de</strong> pages à vérifier]].<br />

Attaque molle ou soufflée<br />

A l'opposé, on trouve la configuration <strong>de</strong> l’attaque molle ou soufflée, où il existe « un<br />

flux respiratoire avant d'émettre un son » (R. Miller & Gouëlou, 1993), «résultant <strong>en</strong> une sorte <strong>de</strong><br />

début du son aspiré [h] ». Les observations <strong>de</strong> Cooke et al(Cooke et al., 1997) <strong>en</strong> cinématographie<br />

ultra rapi<strong>de</strong> montr<strong>en</strong>t que les attaques soufflées [breathy] sont caractérisées par une vitesse<br />

d'accolem<strong>en</strong>t <strong>de</strong>s plis vocaux très petite, une rai<strong>de</strong>ur <strong>de</strong>s plis vocaux moins importante et un délai<br />

très grand <strong>en</strong>tre l'adduction <strong>de</strong>s plis vocaux et le début <strong>de</strong> la phonation.<br />

Pour Joana Révis et ses collègues, « L’attaque soufflée correspond à une fuite d’air lors <strong>de</strong> la mise <strong>en</strong><br />

vibration <strong>de</strong>s cor<strong>de</strong>s <strong>vocale</strong>s. C’est une attaque longue. La colonne d’air est mise <strong>en</strong> fonctionnem<strong>en</strong>t<br />

avant la fermeture <strong>de</strong>s cor<strong>de</strong>s <strong>vocale</strong>s. Une attaque soufflée pourrait amplifier la perception du<br />

souffle » (Joana Revis et al., 2002, p. 24). Dans ce type d’attaque, « le vibrateur laryngé mettra alors<br />

plus <strong>de</strong> temps à acquérir une stabilité vibratoire » (Ormezzano, 2000), et « le son démarre<br />

progressivem<strong>en</strong>t, avec un timbre qui reste souv<strong>en</strong>t légèrem<strong>en</strong>t voilé au départ » (Cornut, 2009)<br />

Selon Richard Miller (R. Miller & Gouëlou, 1993) « <strong>de</strong> par son défaut fondam<strong>en</strong>tal même, qui est<br />

l'excès d'écoulem<strong>en</strong>t <strong>de</strong> souffle joint à une insuffi<strong>sa</strong>nce <strong>de</strong> pression, le début du son aspiré offre<br />

exactem<strong>en</strong>t ce dont il est temporairem<strong>en</strong>t besoin pour lutter contre la t<strong>en</strong>sion <strong>de</strong> l'émission <strong>vocale</strong> »<br />

Attaque douce / équilibrée<br />

Pour l’attaque douce, Richard Miller(R. Miller & Gouëlou, 1993) parle <strong>de</strong> "dynamic muscle<br />

equilibrium", traduit par Jean-Marie Gouëlou par le terme « pondération dynamique <strong>de</strong>s muscles »,<br />

remplaçant la notion d'équilibre par celle <strong>de</strong> pondération. Guy Cornut, repris par Ormezzano, parle<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 136


d'attaque douce. « Dans l'attaque douce, il y a apparemm<strong>en</strong>t un synchronisme parfait <strong>en</strong>tre le<br />

mouvem<strong>en</strong>t <strong>de</strong> fermeture glottique et le mouvem<strong>en</strong>t expiratoire. En réalité, la vibration laryngée<br />

comm<strong>en</strong>ce alors que les cor<strong>de</strong>s <strong>vocale</strong>s ne sont pas <strong>en</strong>core tout à fait fermées. C'est le pas<strong>sa</strong>ge <strong>de</strong><br />

l'air <strong>en</strong>tre elles qui provoque leur fermeture et <strong>en</strong>traîne la vibration laryngée. Il s'agit donc d'une<br />

attaque dynamique créée par l'écoulem<strong>en</strong>t <strong>de</strong> l'air ; c'est celle que l'on appelle l' « attaque sur le<br />

souffle » » (Cornut, 2009)<br />

D'après Richard Miller (R. Miller & Gouëlou, 1993), « Ri<strong>en</strong> ne <strong>sa</strong>urait être plus bénéfique à<br />

l'instrum<strong>en</strong>t vocal, <strong>en</strong> matière <strong>de</strong> perfectionnem<strong>en</strong>t technique du chant, que le positionnem<strong>en</strong>t <strong>de</strong>s<br />

cor<strong>de</strong>s <strong>vocale</strong>s <strong>en</strong> vue d'un début <strong>de</strong> son précis. C'est ce réglage préphonatoire <strong>de</strong>s muscles du larynx<br />

qui, combiné au <strong>de</strong>gré exact <strong>de</strong> pression sous-glottique et d'écoulem<strong>en</strong>t <strong>de</strong> l'air, fournit la base<br />

même d'un acte vocal correct. »<br />

L'équilibrage <strong>de</strong>s pressions et la mise <strong>en</strong> équilibre du larynx afin qu'il puisse vibrer le plus librem<strong>en</strong>t<br />

possible passe par l'émission d'un début <strong>de</strong> son équilibré. (Fournier, 1989, p. 130) (Amy <strong>de</strong> la<br />

Bretèque, 2012, p. 132) (Joana Revis & Cayreyre, 2004, pp. 100–101)<br />

Script praat<br />

input_directory$ = "E:/memoire_ortho/ressources/auto-analyse/son_par_son/"<br />

fil<strong>en</strong>ame$ = "output_praat_new.txt"<br />

file<strong>de</strong>lete 'fil<strong>en</strong>ame$'<br />

# écriture <strong>de</strong> la première ligne du fichier<br />

fileapp<strong>en</strong>d 'fil<strong>en</strong>ame$' nom, int<strong>en</strong>sité, fréqu<strong>en</strong>ce, fréqu<strong>en</strong>ce moy<strong>en</strong>ne, singing formant, jitter (%),<br />

shimmer (dB), nhr (dB), 'newline$'<br />

Create Strings as file list... list 'input_directory$'*.wav<br />

numberOfFiles = Get number of strings<br />

echo 'numberOfFiles' fichiers<br />

for ifile to numberOfFiles<br />

select Strings list<br />

sound$ = Get string... ifile<br />

Read from file... 'input_directory$''sound$'<br />

objectname$ = selected$ ("Sound", 1)<br />

start_of_signal = Get starting time<br />

<strong>en</strong>d_of_signal = Get finishing time<br />

# fréqu<strong>en</strong>ce<br />

To Pitch... 0.0 75 600<br />

f0 = Get quantile... 0 0 0.50 Hertz<br />

# int<strong>en</strong>sité<br />

select Sound 'objectname$'<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 137


To Int<strong>en</strong>sity... 100 0 yes<br />

int = Get quantile... 0 0 0.5<br />

# richesse harmonique 2000-5000 par rapport à 60-2000<br />

select Sound 'objectname$'<br />

To Spectrum... yes<br />

harm = Get band <strong>en</strong>ergy differ<strong>en</strong>ce... 60 2000 2000 5000<br />

# voice report (jitter, shimmer, hnr)<br />

select Sound 'objectname$'<br />

plus Pitch 'objectname$'<br />

To PointProcess (cc)<br />

select Sound 'objectname$'<br />

plus Pitch 'objectname$'<br />

plus PointProcess 'objectname$'_'objectname$'<br />

report$ = Voice report... start_of_signal <strong>en</strong>d_of_signal 70 1000 2 9 0.03 0.45<br />

meanPitch = extractNumber (report$, "Mean pitch: ")<br />

jitter_loc = extractNumber (report$, "Jitter (local): ") * 100<br />

shimmer_loc = extractNumber (report$, "Shimmer (local, dB): ")<br />

mean_nhr = extractNumber (report$, "Mean harmonics-to-noise ratio: ")<br />

# écriture dans le fichier<br />

fileapp<strong>en</strong>d 'fil<strong>en</strong>ame$' 'objectname$', 'int:2', 'f0:2', 'meanPitch:2', 'harm:2', 'jitter_loc:2',<br />

'shimmer_loc:2','mean_nhr:2', 'newline$'<br />

printline 'sound$'<br />

# ménage<br />

select Sound 'objectname$'<br />

plus Pitch 'objectname$'<br />

plus PointProcess 'objectname$'_'objectname$'<br />

plus Int<strong>en</strong>sity 'objectname$'<br />

plus Spectrum 'objectname$'<br />

Remove<br />

<strong>en</strong>dfor<br />

select Strings list<br />

Remove<br />

Docum<strong>en</strong>ts du protocole (déroulem<strong>en</strong>t <strong>de</strong> l’exercice, feuilles <strong>de</strong> pas<strong>sa</strong>tion, feuilles<br />

<strong>de</strong> cotation du bilan vocal…)<br />

Spectrogramme <strong>en</strong> <strong>rééducation</strong> <strong>vocale</strong> Page 138

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!