Master 2: didactique - masterfle
Master 2: didactique - masterfle
Master 2: didactique - masterfle
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
1<br />
Productions et apprentissage<br />
3. Outils de transcription et d’analyse<br />
<strong>Master</strong> 1 : 2011
2<br />
Enregistrement et transcription<br />
Questions pratiques:<br />
Comment faire un enregistrement vidéo sur<br />
ordinateur<br />
Comment transcrire les phénomènes de l’oral<br />
Comment délimiter les segments pour la<br />
transcription<br />
Comment choisir et utiliser un outil de<br />
transcription
3<br />
Enregistrer sur ordinateur<br />
Ouvrir Windows Movie Maker (Programmes –<br />
Accessoires – Divertissement)<br />
Cliquer<br />
sur<br />
Tâches
4<br />
Capture vidéo<br />
Choisir Capturer la vidéo - Capturer à<br />
partir du périphérique vidéo<br />
Le logiciel détectera la (les)<br />
caméra(s)<br />
Donner un nom au fichier et<br />
choisir l’emplacement<br />
Suivre ensuite les fenêtres qui<br />
s’affichent
5<br />
Exemples d’enregistrement<br />
1<br />
2<br />
Enregistrement<br />
sonore ou vidéo (pour<br />
la gestualité etc.)<br />
De préférence sous<br />
forme numérique<br />
Utiliser un micro<br />
externe de bonne<br />
qualité
6<br />
Aides à la transcription<br />
Soundscriber : outil de transcription (U. du<br />
Michigan: http://lw.lsa.umich.edu/eli/micase/index.htm<br />
Outils intégrés dans des systèmes de<br />
transcription/analyse (Walker Controller de CLAN)<br />
Outils d’analyse acoustique (Sonic Mode, PRAAT)
7<br />
Les problèmes de transcription<br />
Une bonne transcription prend du temps – jusqu’à<br />
une heure pour une minute<br />
Comment transcrire les caractéristiques de l’oral en<br />
L2:<br />
erreurs<br />
hésitations et pauses<br />
formes intermédiaires<br />
répétitions et reprises<br />
Importance des conventions de transcription
8<br />
Exercice de transcription<br />
Le déclencheur<br />
L’enregistrement
9<br />
*INV: www . [+ bch]<br />
*401: c' est dommage #0_882 &=rire !<br />
*401: #0_278 c' est dommage↑ +/.<br />
*INV: uhhuh .<br />
*401: +, [/] [#1_085] parce+que: [*] #0_406 ils vont mettre le<br />
[*] frigo↑ #0_581 [/] [#1_561] dans le [*] appartement↑ [*]<br />
#0_569 pour [*] la fenêtre↑ .<br />
*401: #0_621 mai:s [/] #1_764 mai:s #0_871 le frigo a: [/] #0_511 a [*] tombé↑<br />
#0_593 dans [*] le:@fs [*] #1_202 voitour↑ [: voiture] [*] #0_900 parce+que
10<br />
Principales conventions de transcription<br />
xxx séquence incompréhensible<br />
xx mot incompréhensible<br />
# pause<br />
+/ interruption (énoncé incomplet)<br />
+ reprise d’un énoncé interrompu<br />
[?] interprétation plausible (best guess)<br />
[*] erreur (renvoi à la couche %err: voir plus loin)<br />
[/] répétition d’un élément précédent<br />
[//] répétition avec correction
11<br />
Conventions de transcription<br />
Pour plus de détails sur les conventions de<br />
transcription, voir:<br />
le manuel de CHAT (en anglais)<br />
http://childes.psy.cmu.edu/manuals/chat.pdf<br />
le manuel du corpus PAROLE (en français):<br />
http://talkbank.org/BilingBank/<br />
cliquer ensuite sur “PAROLE documents”, puis<br />
“PAROLE_manuel.pdf”<br />
Note: les conventions de transcription de CHILDES (pp. 16-30) peuvent être<br />
utilisées quel que soit l’outil de transcription.
Transcription<br />
détaillée<br />
Fichier de transcription
13<br />
Autres exemples<br />
Enregistrements<br />
Transcriptions<br />
406A<br />
417A
14<br />
Créer un fichier son<br />
Pour visualiser la courbe sonore et pour utiliser la<br />
détection automatique des pauses, il faudra un<br />
fichier son à part<br />
Pour extraire le son du fichier vidéo, utiliser un<br />
convertisseur vidéo→audio<br />
exemple: Free Video to Audio Converter<br />
http://www.free-audio-editor.com/otherfreeproducts/products.htm
15<br />
Délimiter des segments<br />
L’oral n’est pas clairement découpé en phrases<br />
Trois solutions possibles:<br />
transcrire au kilomètre<br />
utiliser des critères syntaxiques et sémantiques<br />
pour délimiter les énoncés (à la main)<br />
faire un découpage selon les pauses (à la main ou<br />
automatiquement)<br />
Le choix dépendra des analyses à faire
16<br />
Choisir un outil de transcription<br />
WORD<br />
ou tout autre traitement de texte<br />
CLAN<br />
http://childes.psy.cmu.edu/<br />
ELAN<br />
http://www.lat-mpi.eu/tools/elan<br />
DIGITAL REPLAY SYSTEM<br />
http://web.mac.com/andy.crabtree/NCeSS_<br />
Digital_Records_Node/Welcome.html<br />
PRAAT<br />
http://www.fon.hum.uva.nl/praat<br />
Simple à utiliser, mais mal adapté.<br />
Impossible de lier transcription et son.<br />
Format non-exportable.<br />
Nombreux programmes d’analyse.<br />
Lien transcription son par balises.<br />
Interface pas très conviviale.<br />
Interface plus moderne, multilingue.<br />
Bonne gestion vidéo+audio. Détection<br />
des silences; concordancier intégré.<br />
Conçu pour des transcriptions multimodales.<br />
Outil très complet, mais<br />
assez complexe. En anglais seulement.<br />
Dédié aux analyses phonétiques.<br />
Détection des syllabes avec un script<br />
supplémentaire.
17<br />
CLAN et ELAN comparés
18<br />
CLAN
19<br />
ELAN<br />
play
20<br />
Avantages de CLAN et d’ELAN<br />
mode de transcription<br />
facile<br />
manuel : conventions de<br />
transcription éprouvées<br />
base de données CHILDES<br />
nombreux outils d’analyse<br />
dans CLAN: freq, mlu, etc.<br />
analyseur MOR<br />
interface plus moderne<br />
accepte divers formats de<br />
fichier son/vidéo<br />
possibilité<br />
d’importer/exporter<br />
concordancier intégré<br />
transcription phonétique<br />
possible<br />
possibilité d’échanger des fichiers entre CLAN et ELAN
21<br />
Pour transcrire avec ELAN<br />
Ouvrir ELAN: vous verrez une page blanche<br />
Dans fichier/ouvrir, sélectionner le(s) fichier(s) à<br />
transcrire – fichier audio et/ou vidéo<br />
Vous verrez alors<br />
l’écran de<br />
transcription<br />
Ici, deux fichiers,<br />
vidéo et son,<br />
pour le même<br />
enregistrement
22<br />
Ecran de transcription<br />
Si le lecteur vidéo<br />
ne s’affiche pas,<br />
aller dans<br />
Affichage/Media<br />
Player<br />
Si la courbe<br />
sonore est trop<br />
plate, faire un clic<br />
droit et choisir<br />
Zoom Vertical
23<br />
Délimiter les séquences<br />
Choisir l’onglet “Audio Recognizer”
24<br />
Sélectionner un segment de silence dans la courbe<br />
acoustique et cliquer sur “Add Channel 1”<br />
Sélectionner un autre segment pour “Add Channel 2”<br />
Positionner le curseur pour “Minimal silence duration” et<br />
“Minimal non-silence duration”<br />
Cliquer sur “Start”<br />
Si le résultat semble satisfaisant, cliquer sur “Create tier(s)”
25<br />
Transcription<br />
Cocher “mode de sélection”<br />
Dans la couche transcription,<br />
sélectionner une séquence<br />
Alt-N pour annoter<br />
Cliquer sur<br />
Taper la transcription<br />
Valider la transcription avec<br />
Ctrl+Enter
26<br />
Les couches de transcription<br />
Chaque transcription possède une couche principale<br />
(main tier) et éventuellement des couches<br />
dépendantes<br />
Exemples de couches dépendantes:<br />
%com: commentaire<br />
%err: pour coder les erreurs<br />
%mor: analyse morpho-syntaxique<br />
%phon: transcription phonologique<br />
Dans ELAN et dans CLAN on peut créer autant de<br />
couches dépendantes qu’on le souhaite
27<br />
Couche dépendante: %err<br />
Transcription de l’erreur dans la couche principale:<br />
Si le sujet produit une forme inexistante, on transcrit généralement la<br />
forme correcte visée, suivie de [*]<br />
S’il produit une forme existante, mais inappropriée, on la transcrit telle<br />
quelle, toujours suivie de [*]<br />
On insère en-dessous une couche %err pour expliciter<br />
l’erreur, en utilisant la notation forme produite = forme visée<br />
*06N: um # xxx # elle a um enfant [*].<br />
%err: enfante = enfant
28<br />
Mesurer les pauses dans ELAN<br />
A la main: sélectionner la couche de découpage<br />
double-clic dans un segment de silence<br />
la durée apparaît au-dessus des boutons de lecture<br />
Automatique: sélectionner « rechercher »<br />
choisir la couche (« acteur ») de découpage<br />
rechercher « s »<br />
Exemple de résultat: diapo. suivante
29<br />
Mesure automatique<br />
Liste de toutes<br />
les silences,<br />
avec début, fin<br />
et durée
30<br />
Pour transcrire avec CLAN<br />
1 ère étape: gérer les fichiers<br />
Ouvrir CLAN - Les boutons<br />
permettent de définir 4 dossiers:<br />
working: dossier de travail, où<br />
CLAN va chercher les fichiers<br />
qu’il doit traiter<br />
output: dossier de sortie, où il<br />
place les fichiers qu’il crée. Par<br />
défaut ce dossier est le même<br />
que le dossier de travail.<br />
lib: bibliothèque – contient des<br />
fichiers d’exemples, etc.<br />
mor lib: contient les fichiers<br />
utilisés pour l’analyse morphosyntaxique<br />
Si la palette de commande disparaît, elle peut être réouverte avec Ctrl-D
31<br />
Pour transcrire avec CLAN<br />
2 ème étape: lecture du fichier son<br />
1. Avec Walker Controller<br />
permet une écoute par segments, avec pause<br />
automatique (pour taper)<br />
possiblitié de régler la durée des segments et des pauses<br />
2. Avec Transcribe Mode<br />
permet de poser des balises pour lier le son à la<br />
transcription<br />
segmentation un peu fastidieuse, mais transcription plus<br />
facile par la suite
32<br />
Ouvrir Clan<br />
Dans le menu Window, sélectionner Walker<br />
Controller<br />
Définir:<br />
Walk length (durée de chaque segment, en<br />
millisecondes)<br />
Loop number (nombre de répétitions)<br />
Backspace (retour)<br />
Walk Pause Length (pause entre chaque<br />
écoute)<br />
Cliquer sur « Open Media » pour<br />
sélectionner le fichier à transcrire (fichier<br />
.wav)<br />
Ensuite, pour contrôler la lecture :<br />
lancer la lecture (avec répétitions et pauses<br />
automatiques) : F6<br />
revenir sur le segment précédent : F7<br />
relire le segment courant : F8<br />
sauter au segment suivant : F9<br />
Walker<br />
Controller
Ouvrir Clan<br />
Dans le menu Mode, sélectionner<br />
Transcribe sound or movie (ou faire<br />
33<br />
F5)<br />
Choisir le fichier<br />
Découper l’enregistrement en<br />
segments:<br />
à la fin de chaque énoncé, appuyer une<br />
fois sur la barre espace<br />
une balise est posée (matérialisée par<br />
un point)<br />
continuer à poser les balises jusqu’à la<br />
fin de l’enregistrement<br />
En cas d’erreur:<br />
effacer les balises mal placées<br />
appuyer sur F5 pour relancer<br />
l’enregistrement<br />
reprendre la segmentation (barre<br />
espace)<br />
Transcribe<br />
Mode
34<br />
Fichier segmenté<br />
Chaque balise marque la fin<br />
d’un segment<br />
Pour écouter un segment,<br />
placer le curseur à l’intérieur<br />
et faire F4<br />
Si la segmentation est<br />
convenable, enregistrer le<br />
fichier<br />
Vous êtes prêt à transcrire
35<br />
Mesurer les pauses dans CLAN<br />
Ouvrir Sonic Mode<br />
Repérer la pause sur le tracé acoustique<br />
Sélectionner avec la souris<br />
La durée (en millisecondes) apparaît à gauche