15.02.2015 Views

Culture, patrimoine, création - Cluster 13

Culture, patrimoine, création - Cluster 13

Culture, patrimoine, création - Cluster 13

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

documentation produite par les établissements ecclésiastiques ou encore par les entreprises<br />

commerciales).<br />

Cette action conjointe « Comptes de châtellenies » et LIRIS est adressée au cluster <strong>13</strong><br />

assortie d’une demande d’appui budgétaire destinée à financer des missions aux Archives<br />

(examen de la documentation originale et des conditions de numérisation), des réunions, et<br />

l’achat du matériel informatique nécessaire.<br />

Premières pistes de travail à explorer<br />

Pour les comptes des Châtellenie<br />

De nos premières réunions de travail, il est ressorti que le LIRIS peut découper les rouleaux<br />

en rubriques et peut indexer ces rubriques.<br />

La méthode permettant d’extraire les rubriques va s’appuyer sur les titres de ces rubriques<br />

qui sont positionnés de façon marginale par rapport aux rubriques.<br />

Pour l’indexation, on élaborera une méthode de la famille du "word spotting" en s’appuyant<br />

sur les informations que fourniront les historiens quant aux contenus des rubriques et au<br />

degré de régularité de celles-ci.<br />

Rappelons que le « Word Spotting » est un ensemble d’outils logiciels qui est capable de<br />

retrouver toutes les occurrences d’un mot dans un texte en mode image. On dispose de<br />

deux façons d’indiquer le mot qui nous intéresse à l’ordinateur :<br />

- On lui indique une occurrence du mot sur l’image avec la souris,<br />

- Si on a une bonne connaissance de l’écriture manuscrite du document étudié, on<br />

peut directement saisir le mot au clavier ; un logiciel que l’on aura préalablement<br />

élaboré en s’appuyant sur la connaissance de l’écriture construira l’image du mot et<br />

on sera ramené au cas précédent.<br />

Pour les lettres secrètes<br />

Une première piste de travail consisterait à utiliser un produit de « reconnaissance à la<br />

volée » qui vient d’être mis au point au LIRIS et à l’adapter pour en faire un outil d’aide à la<br />

transcription. Cette approche tente de prendre en compte de la façon la plus intelligente et<br />

ergonomique possible une nécessaire intervention humaine pour corriger la reconnaissance.<br />

Après un apprentissage très réduit, le logiciel tente d'abord de reconnaitre les mots qui lui<br />

sont soumis en procédant par itérations successives, et ne demande de l’aide à l’historien<br />

que lorsqu’il ne trouve pas de solution. Cette solution d'aide à la transcription ne cherche<br />

donc pas à se substituer au chercheur, mais à optimiser ses interventions dans le processus<br />

de reconnaissance.<br />

Bilan de la recherche<br />

Nous conclurons l’année de travail par une dernière réunion avec tous les partenaires qui<br />

auront contribué à cette recherche.<br />

La présentation de ce bilan pour les membres du <strong>Cluster</strong> et pour les chercheurs intéressés<br />

donnera lieu à une journée organisée à Chambéry.<br />

162

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!