20.07.2013 Views

Master 2: didactique - masterfle

Master 2: didactique - masterfle

Master 2: didactique - masterfle

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

1<br />

Productions et apprentissage<br />

3. Outils de transcription et d’analyse<br />

<strong>Master</strong> 1 : 2011


2<br />

Enregistrement et transcription<br />

Questions pratiques:<br />

Comment faire un enregistrement vidéo sur<br />

ordinateur<br />

Comment transcrire les phénomènes de l’oral<br />

Comment délimiter les segments pour la<br />

transcription<br />

Comment choisir et utiliser un outil de<br />

transcription


3<br />

Enregistrer sur ordinateur<br />

Ouvrir Windows Movie Maker (Programmes –<br />

Accessoires – Divertissement)<br />

Cliquer<br />

sur<br />

Tâches


4<br />

Capture vidéo<br />

Choisir Capturer la vidéo - Capturer à<br />

partir du périphérique vidéo<br />

Le logiciel détectera la (les)<br />

caméra(s)<br />

Donner un nom au fichier et<br />

choisir l’emplacement<br />

Suivre ensuite les fenêtres qui<br />

s’affichent


5<br />

Exemples d’enregistrement<br />

1<br />

2<br />

Enregistrement<br />

sonore ou vidéo (pour<br />

la gestualité etc.)<br />

De préférence sous<br />

forme numérique<br />

Utiliser un micro<br />

externe de bonne<br />

qualité


6<br />

Aides à la transcription<br />

Soundscriber : outil de transcription (U. du<br />

Michigan: http://lw.lsa.umich.edu/eli/micase/index.htm<br />

Outils intégrés dans des systèmes de<br />

transcription/analyse (Walker Controller de CLAN)<br />

Outils d’analyse acoustique (Sonic Mode, PRAAT)


7<br />

Les problèmes de transcription<br />

Une bonne transcription prend du temps – jusqu’à<br />

une heure pour une minute<br />

Comment transcrire les caractéristiques de l’oral en<br />

L2:<br />

erreurs<br />

hésitations et pauses<br />

formes intermédiaires<br />

répétitions et reprises<br />

Importance des conventions de transcription


8<br />

Exercice de transcription<br />

Le déclencheur<br />

L’enregistrement


9<br />

*INV: www . [+ bch]<br />

*401: c' est dommage #0_882 &=rire !<br />

*401: #0_278 c' est dommage↑ +/.<br />

*INV: uhhuh .<br />

*401: +, [/] [#1_085] parce+que: [*] #0_406 ils vont mettre le<br />

[*] frigo↑ #0_581 [/] [#1_561] dans le [*] appartement↑ [*]<br />

#0_569 pour [*] la fenêtre↑ .<br />

*401: #0_621 mai:s [/] #1_764 mai:s #0_871 le frigo a: [/] #0_511 a [*] tombé↑<br />

#0_593 dans [*] le:@fs [*] #1_202 voitour↑ [: voiture] [*] #0_900 parce+que


10<br />

Principales conventions de transcription<br />

xxx séquence incompréhensible<br />

xx mot incompréhensible<br />

# pause<br />

+/ interruption (énoncé incomplet)<br />

+ reprise d’un énoncé interrompu<br />

[?] interprétation plausible (best guess)<br />

[*] erreur (renvoi à la couche %err: voir plus loin)<br />

[/] répétition d’un élément précédent<br />

[//] répétition avec correction


11<br />

Conventions de transcription<br />

Pour plus de détails sur les conventions de<br />

transcription, voir:<br />

le manuel de CHAT (en anglais)<br />

http://childes.psy.cmu.edu/manuals/chat.pdf<br />

le manuel du corpus PAROLE (en français):<br />

http://talkbank.org/BilingBank/<br />

cliquer ensuite sur “PAROLE documents”, puis<br />

“PAROLE_manuel.pdf”<br />

Note: les conventions de transcription de CHILDES (pp. 16-30) peuvent être<br />

utilisées quel que soit l’outil de transcription.


Transcription<br />

détaillée<br />

Fichier de transcription


13<br />

Autres exemples<br />

Enregistrements<br />

Transcriptions<br />

406A<br />

417A


14<br />

Créer un fichier son<br />

Pour visualiser la courbe sonore et pour utiliser la<br />

détection automatique des pauses, il faudra un<br />

fichier son à part<br />

Pour extraire le son du fichier vidéo, utiliser un<br />

convertisseur vidéo→audio<br />

exemple: Free Video to Audio Converter<br />

http://www.free-audio-editor.com/otherfreeproducts/products.htm


15<br />

Délimiter des segments<br />

L’oral n’est pas clairement découpé en phrases<br />

Trois solutions possibles:<br />

transcrire au kilomètre<br />

utiliser des critères syntaxiques et sémantiques<br />

pour délimiter les énoncés (à la main)<br />

faire un découpage selon les pauses (à la main ou<br />

automatiquement)<br />

Le choix dépendra des analyses à faire


16<br />

Choisir un outil de transcription<br />

WORD<br />

ou tout autre traitement de texte<br />

CLAN<br />

http://childes.psy.cmu.edu/<br />

ELAN<br />

http://www.lat-mpi.eu/tools/elan<br />

DIGITAL REPLAY SYSTEM<br />

http://web.mac.com/andy.crabtree/NCeSS_<br />

Digital_Records_Node/Welcome.html<br />

PRAAT<br />

http://www.fon.hum.uva.nl/praat<br />

Simple à utiliser, mais mal adapté.<br />

Impossible de lier transcription et son.<br />

Format non-exportable.<br />

Nombreux programmes d’analyse.<br />

Lien transcription son par balises.<br />

Interface pas très conviviale.<br />

Interface plus moderne, multilingue.<br />

Bonne gestion vidéo+audio. Détection<br />

des silences; concordancier intégré.<br />

Conçu pour des transcriptions multimodales.<br />

Outil très complet, mais<br />

assez complexe. En anglais seulement.<br />

Dédié aux analyses phonétiques.<br />

Détection des syllabes avec un script<br />

supplémentaire.


17<br />

CLAN et ELAN comparés


18<br />

CLAN


19<br />

ELAN<br />

play


20<br />

Avantages de CLAN et d’ELAN<br />

mode de transcription<br />

facile<br />

manuel : conventions de<br />

transcription éprouvées<br />

base de données CHILDES<br />

nombreux outils d’analyse<br />

dans CLAN: freq, mlu, etc.<br />

analyseur MOR<br />

interface plus moderne<br />

accepte divers formats de<br />

fichier son/vidéo<br />

possibilité<br />

d’importer/exporter<br />

concordancier intégré<br />

transcription phonétique<br />

possible<br />

possibilité d’échanger des fichiers entre CLAN et ELAN


21<br />

Pour transcrire avec ELAN<br />

Ouvrir ELAN: vous verrez une page blanche<br />

Dans fichier/ouvrir, sélectionner le(s) fichier(s) à<br />

transcrire – fichier audio et/ou vidéo<br />

Vous verrez alors<br />

l’écran de<br />

transcription<br />

Ici, deux fichiers,<br />

vidéo et son,<br />

pour le même<br />

enregistrement


22<br />

Ecran de transcription<br />

Si le lecteur vidéo<br />

ne s’affiche pas,<br />

aller dans<br />

Affichage/Media<br />

Player<br />

Si la courbe<br />

sonore est trop<br />

plate, faire un clic<br />

droit et choisir<br />

Zoom Vertical


23<br />

Délimiter les séquences<br />

Choisir l’onglet “Audio Recognizer”


24<br />

Sélectionner un segment de silence dans la courbe<br />

acoustique et cliquer sur “Add Channel 1”<br />

Sélectionner un autre segment pour “Add Channel 2”<br />

Positionner le curseur pour “Minimal silence duration” et<br />

“Minimal non-silence duration”<br />

Cliquer sur “Start”<br />

Si le résultat semble satisfaisant, cliquer sur “Create tier(s)”


25<br />

Transcription<br />

Cocher “mode de sélection”<br />

Dans la couche transcription,<br />

sélectionner une séquence<br />

Alt-N pour annoter<br />

Cliquer sur<br />

Taper la transcription<br />

Valider la transcription avec<br />

Ctrl+Enter


26<br />

Les couches de transcription<br />

Chaque transcription possède une couche principale<br />

(main tier) et éventuellement des couches<br />

dépendantes<br />

Exemples de couches dépendantes:<br />

%com: commentaire<br />

%err: pour coder les erreurs<br />

%mor: analyse morpho-syntaxique<br />

%phon: transcription phonologique<br />

Dans ELAN et dans CLAN on peut créer autant de<br />

couches dépendantes qu’on le souhaite


27<br />

Couche dépendante: %err<br />

Transcription de l’erreur dans la couche principale:<br />

Si le sujet produit une forme inexistante, on transcrit généralement la<br />

forme correcte visée, suivie de [*]<br />

S’il produit une forme existante, mais inappropriée, on la transcrit telle<br />

quelle, toujours suivie de [*]<br />

On insère en-dessous une couche %err pour expliciter<br />

l’erreur, en utilisant la notation forme produite = forme visée<br />

*06N: um # xxx # elle a um enfant [*].<br />

%err: enfante = enfant


28<br />

Mesurer les pauses dans ELAN<br />

A la main: sélectionner la couche de découpage<br />

double-clic dans un segment de silence<br />

la durée apparaît au-dessus des boutons de lecture<br />

Automatique: sélectionner « rechercher »<br />

choisir la couche (« acteur ») de découpage<br />

rechercher « s »<br />

Exemple de résultat: diapo. suivante


29<br />

Mesure automatique<br />

Liste de toutes<br />

les silences,<br />

avec début, fin<br />

et durée


30<br />

Pour transcrire avec CLAN<br />

1 ère étape: gérer les fichiers<br />

Ouvrir CLAN - Les boutons<br />

permettent de définir 4 dossiers:<br />

working: dossier de travail, où<br />

CLAN va chercher les fichiers<br />

qu’il doit traiter<br />

output: dossier de sortie, où il<br />

place les fichiers qu’il crée. Par<br />

défaut ce dossier est le même<br />

que le dossier de travail.<br />

lib: bibliothèque – contient des<br />

fichiers d’exemples, etc.<br />

mor lib: contient les fichiers<br />

utilisés pour l’analyse morphosyntaxique<br />

Si la palette de commande disparaît, elle peut être réouverte avec Ctrl-D


31<br />

Pour transcrire avec CLAN<br />

2 ème étape: lecture du fichier son<br />

1. Avec Walker Controller<br />

permet une écoute par segments, avec pause<br />

automatique (pour taper)<br />

possiblitié de régler la durée des segments et des pauses<br />

2. Avec Transcribe Mode<br />

permet de poser des balises pour lier le son à la<br />

transcription<br />

segmentation un peu fastidieuse, mais transcription plus<br />

facile par la suite


32<br />

Ouvrir Clan<br />

Dans le menu Window, sélectionner Walker<br />

Controller<br />

Définir:<br />

Walk length (durée de chaque segment, en<br />

millisecondes)<br />

Loop number (nombre de répétitions)<br />

Backspace (retour)<br />

Walk Pause Length (pause entre chaque<br />

écoute)<br />

Cliquer sur « Open Media » pour<br />

sélectionner le fichier à transcrire (fichier<br />

.wav)<br />

Ensuite, pour contrôler la lecture :<br />

lancer la lecture (avec répétitions et pauses<br />

automatiques) : F6<br />

revenir sur le segment précédent : F7<br />

relire le segment courant : F8<br />

sauter au segment suivant : F9<br />

Walker<br />

Controller


Ouvrir Clan<br />

Dans le menu Mode, sélectionner<br />

Transcribe sound or movie (ou faire<br />

33<br />

F5)<br />

Choisir le fichier<br />

Découper l’enregistrement en<br />

segments:<br />

à la fin de chaque énoncé, appuyer une<br />

fois sur la barre espace<br />

une balise est posée (matérialisée par<br />

un point)<br />

continuer à poser les balises jusqu’à la<br />

fin de l’enregistrement<br />

En cas d’erreur:<br />

effacer les balises mal placées<br />

appuyer sur F5 pour relancer<br />

l’enregistrement<br />

reprendre la segmentation (barre<br />

espace)<br />

Transcribe<br />

Mode


34<br />

Fichier segmenté<br />

Chaque balise marque la fin<br />

d’un segment<br />

Pour écouter un segment,<br />

placer le curseur à l’intérieur<br />

et faire F4<br />

Si la segmentation est<br />

convenable, enregistrer le<br />

fichier<br />

Vous êtes prêt à transcrire


35<br />

Mesurer les pauses dans CLAN<br />

Ouvrir Sonic Mode<br />

Repérer la pause sur le tracé acoustique<br />

Sélectionner avec la souris<br />

La durée (en millisecondes) apparaît à gauche

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!