15.02.2015 Views

Culture, patrimoine, création - Cluster 13

Culture, patrimoine, création - Cluster 13

Culture, patrimoine, création - Cluster 13

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Cluster</strong> <strong>13</strong><br />

Projets Patrimoine et territoire / Corpus numériques<br />

Exploitation des corpus numérisés :<br />

étude de faisabilité pour des ensembles de documents patrimoniaux<br />

médiévaux<br />

Des comptes de Châtellenie savoyards<br />

Des lettres secrètes et curiales des pontifes<br />

--------<br />

Jean-Louis Gaulin / Hubert Emptoz<br />

-------<br />

La reproduction des fonds manuscrits médiévaux sous forme digitale est un mouvement<br />

massif : bibliothèques et archives offrent de plus en plus d’accès aux images numérisées de<br />

codices et dossiers. Ces nouveaux supports questionnent la pratique de l’historien : non<br />

seulement notre accès, immédiat ou à distance aux documents est facilité, mais encore nous<br />

sommes face à de nouvelles questions heuristiques. Comment exploiter ces fonds<br />

numérisés, si l’on souhaite dépasser la simple lecture et transcription à l’œil nu <br />

Il y a quelques années encore on aurait évoqué des machines de reconnaissance<br />

automatique des textes.<br />

La démarche qui semble plus réaliste et plus prometteuse est celle qui va consister, pour un<br />

corpus donné, à concevoir et à élaborer une chaîne de numérisation dans le cadre d’une<br />

coopération entre les spécialistes du corpus et des experts du numérique. Cette démarche<br />

permettra de co-concevoir des outils et des méthodes correspondant aux pratiques et aux<br />

usages des spécialistes du Corpus ; de ce fait les outils et méthodes ne seront pas<br />

informatiquement parlant surdimensionnés par rapport à l’usage qui en sera fait. Cette<br />

démarche est aussi celle qui permettra de repérer et de mettre en relief le maximum de<br />

l’information portée par le document.<br />

Dans les documents textuels comme les « Comptes des Châtellenie » ou les « Lettres<br />

papales » l’information à exploiter se situe à trois niveaux.<br />

a) Il y a d’abord l’information portée par les lignes de textes, c’est le contenu proprement<br />

dit.<br />

b) Il y a ensuite toutes les informations inhérentes à la mise en page du document ;<br />

conçue par les scripteurs, elle permet de mettre en relief le contenu, et de faciliter la<br />

lecture.<br />

c) Il y a enfin des informations présentes, de facto, mais qui ne correspondent pas à une<br />

volonté initiale du scripteur ; dans le cas des documents médiévaux les styles<br />

d’écritures, les changements de main, les traces de vieillissement relèvent de ce type<br />

d’information, au demeurant fort utile pour l’historien.<br />

La potentialité d’extraction des informations dépend de la qualité de la numérisation ; les<br />

caractéristiques de cette numérisation (résolution, couleur ou niveaux de gris, etc.) ne<br />

160

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!