Culture, patrimoine, création - Cluster 13
Culture, patrimoine, création - Cluster 13
Culture, patrimoine, création - Cluster 13
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>Cluster</strong> <strong>13</strong><br />
Projets Patrimoine et territoire / Corpus numériques<br />
Exploitation des corpus numérisés :<br />
étude de faisabilité pour des ensembles de documents patrimoniaux<br />
médiévaux<br />
Des comptes de Châtellenie savoyards<br />
Des lettres secrètes et curiales des pontifes<br />
--------<br />
Jean-Louis Gaulin / Hubert Emptoz<br />
-------<br />
La reproduction des fonds manuscrits médiévaux sous forme digitale est un mouvement<br />
massif : bibliothèques et archives offrent de plus en plus d’accès aux images numérisées de<br />
codices et dossiers. Ces nouveaux supports questionnent la pratique de l’historien : non<br />
seulement notre accès, immédiat ou à distance aux documents est facilité, mais encore nous<br />
sommes face à de nouvelles questions heuristiques. Comment exploiter ces fonds<br />
numérisés, si l’on souhaite dépasser la simple lecture et transcription à l’œil nu <br />
Il y a quelques années encore on aurait évoqué des machines de reconnaissance<br />
automatique des textes.<br />
La démarche qui semble plus réaliste et plus prometteuse est celle qui va consister, pour un<br />
corpus donné, à concevoir et à élaborer une chaîne de numérisation dans le cadre d’une<br />
coopération entre les spécialistes du corpus et des experts du numérique. Cette démarche<br />
permettra de co-concevoir des outils et des méthodes correspondant aux pratiques et aux<br />
usages des spécialistes du Corpus ; de ce fait les outils et méthodes ne seront pas<br />
informatiquement parlant surdimensionnés par rapport à l’usage qui en sera fait. Cette<br />
démarche est aussi celle qui permettra de repérer et de mettre en relief le maximum de<br />
l’information portée par le document.<br />
Dans les documents textuels comme les « Comptes des Châtellenie » ou les « Lettres<br />
papales » l’information à exploiter se situe à trois niveaux.<br />
a) Il y a d’abord l’information portée par les lignes de textes, c’est le contenu proprement<br />
dit.<br />
b) Il y a ensuite toutes les informations inhérentes à la mise en page du document ;<br />
conçue par les scripteurs, elle permet de mettre en relief le contenu, et de faciliter la<br />
lecture.<br />
c) Il y a enfin des informations présentes, de facto, mais qui ne correspondent pas à une<br />
volonté initiale du scripteur ; dans le cas des documents médiévaux les styles<br />
d’écritures, les changements de main, les traces de vieillissement relèvent de ce type<br />
d’information, au demeurant fort utile pour l’historien.<br />
La potentialité d’extraction des informations dépend de la qualité de la numérisation ; les<br />
caractéristiques de cette numérisation (résolution, couleur ou niveaux de gris, etc.) ne<br />
160