12.07.2015 Views

cahier des clauses techniques particulieres - Bibliothèque nationale ...

cahier des clauses techniques particulieres - Bibliothèque nationale ...

cahier des clauses techniques particulieres - Bibliothèque nationale ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Marché à procédure adaptéeN° 2010-15CAHIER DES CLAUSES TECHNIQUES PARTICULIERESétabli en application de l'article 28 du code <strong>des</strong> marchés publicsEtablissement :Bibliothèque <strong>nationale</strong> et universitaire de Strasbourg5 rue du Maréchal JoffreBP 5102967070 STRASBOURG CEDEXObjet du marché :Bibliothèque numérique : acquisition d'un outil degestion électronique de document (GED), d'une chaînede numérisation et de prestations associéesL'entreprise soussignée reconnaît avoir pris connaissance <strong>des</strong>pages du C.C.T.P. numérotées de 1 à 24(date, cachet, signature)Le présent C.C.T.P. fait référence au <strong>cahier</strong> <strong>des</strong> <strong>clauses</strong> administratives généralesapplicables aux marchés publics de fournitures courantes et services (C.C.A.G. - F.C.S.)Il comporte 26 feuillets numérotés de 1 à 24


BNU Projet Bibliothèque numérique - GED DSI-DCPTable <strong>des</strong> matièresArticle 1:OBJET DU MARCHE.................................................................................................4Article 2:DESCRIPTION DU MARCHE...................................................................................4Article 3:CONDITIONS TECHNIQUES PARTICULIERES AU PRESENT MARCHE.......43.1.Contexte ..........................................................................................................................43.1.1La Bibliothèque <strong>nationale</strong> et universitaire de Strasbourg.........................................43.1.2La numérisation à la BNU .......................................................................................53.2.Attendus <strong>techniques</strong> .......................................................................................................73.2.1Les données..............................................................................................................7Volumétrie et accroissement :.......................................................................................7Typologie <strong>des</strong> documents originaux :...........................................................................83.2.2Typologie <strong>des</strong> formats informatiques ......................................................................8Critères de choix...........................................................................................................93.3. Structure de la base (classification)................................................................................93.4.Spécifications <strong>techniques</strong> : import, traitement et stockage <strong>des</strong> objets..........................103.4.1 Import et formats <strong>des</strong> fichiers numériques ...........................................................103.4.2Contrôle qualité .....................................................................................................103.4.3Formats ..................................................................................................................103.4.4Nommage <strong>des</strong> fichiers............................................................................................11Fonctionnement général :............................................................................................11Reprise de l'existant :..................................................................................................11Modification ultérieure :.............................................................................................113.4.5 Archivage...............................................................................................................113.5.Métadonnées et identifiants...........................................................................................123.5.1Acquisition <strong>des</strong> métadonnées.................................................................................123.5.2Attribution d'identifiants pérennes..........................................................................133.5.3Relations métadonnées / documents.......................................................................133.5.4Texte intégral..........................................................................................................133.5.5 Contrôle qualité.....................................................................................................133.6.Moteur de recherche......................................................................................................133.6.1Fonctions de recherche...........................................................................................143.6.2Présentation <strong>des</strong> résultats........................................................................................14Généralités.................................................................................................................14Affichage abrégé........................................................................................................14Affichage détaillé.......................................................................................................14Exploitation <strong>des</strong> résultats...........................................................................................15Export..........................................................................................................................15Fonctionnalités avancées...........................................................................................153.7.Spécifications <strong>techniques</strong> : diffusion ............................................................................15Export vers CMS.........................................................................................................163.8.Module optionnel pour le PEB dématérialisé ...............................................................163.9.Moteur de workflow (automatisation <strong>des</strong> processus)....................................................163.10.Administration de l'outil..............................................................................................173.10.1 Utilisateurs ..........................................................................................................173.10.2 Statistiques ..........................................................................................................17Cahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 2 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCP3.10.3 Formation ............................................................................................................183.10.4Maintenance .........................................................................................................18Article 4:ANNEXES ................................................................................................................194.1. Liste <strong>des</strong> programmes de numérisation de la BNU .....................................................194.2.Système de nommage <strong>des</strong> répertoires et fichiers ..........................................................204.3. Le standard ARK ........................................................................................................214.4.Schéma XML <strong>des</strong> métadonnées d'archivage PAC/SIP du CINES................................224.5. Modèle de fichiers METS............................................................................................224.6.Tableau de correspondance de UNIMARC vers Dublin Core .....................................224.7.Tableau à remplir par le soumissionnaire......................................................................24Cahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 3 Marché n° 2010-15


Article 1:BNU Projet Bibliothèque numérique - GED DSI-DCPOBJET DU MARCHELe présent marché a pour objet la fourniture d'un logiciel de gestion électronique dedocuments (GED), de prestations d'installation et de transfert de compétences à laBibliothèque <strong>nationale</strong> et universitaire de Strasbourg selon les modalités définies dans le<strong>cahier</strong> <strong>des</strong> charges.Article 2:DESCRIPTION DU MARCHELe présent marché se compose d'un seul lot pour la fourniture du logiciel de GED 1 ou DAM 2 ,création d'un workflow de numérisation (automatisation <strong>des</strong> processus pour la chaîne denumérisation) et la prestation associée.Article 3:CONDITIONS TECHNIQUES PARTICULIERES AU PRESENTMARCHELe présent <strong>cahier</strong> <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières (C.C.T.P.) a pour objet l'acquisition parla Bibliothèque <strong>nationale</strong> et universitaire de Strasbourg (BNU) d'une solution logicielle debibliothèque numérique, couvrant la gestion <strong>des</strong> processus de numérisation, le traitement <strong>des</strong>données numérisées, la gestion du stockage de ces données, leur recherche et leur diffusion.3.1. Contexte3.1.1 La Bibliothèque <strong>nationale</strong> et universitaire de StrasbourgPremière bibliothèque de l'enseignement supérieur français, la Bibliothèque <strong>nationale</strong> etuniversitaire de Strasbourg assume plusieurs missions : bibliothèque de recherche en scienceshumaines et sociales au service de la communauté universitaire dans un contexte en pleineévolution, elle a aussi une forte vocation régionale et un rôle patrimonial éminent ; elle est enmême temps une bibliothèque publique ouverte sur la cité, dont les dimensions européenneset numériques se développent activement.Parmi ses projets majeurs : une bibliothèque numérique dans le cadre du contrat quadriennal2009-2012, et un grand projet architectural de modernisation et d'extension (BNU Nouvelle)confié à l'Agence Nicolas Michelin et Associés (Paris). Les collections patrimoniales de laBNU comportent environ 1,1 million d'ouvrages antérieurs à 1920 (dont plus de 220 000ouvrages antérieurs à 1810 et plus de 2 000 incunables), plus de 5 000 papyrus, 6 700manuscrits, 39 000 monnaies, 54 000 cartes et 120 000 documents iconographiques. Lanumérisation du patrimoine dont elle est la gardienne est pour la BNU une activité régulièredepuis une quinzaine d'années. Elle entend aujourd'hui développer une politique plusambitieuse dans ce domaine, à <strong>des</strong> fins de préservation, de diffusion et d'exploitationscientifique de ses collections, dans un souci de coordination avec les initiatives existant enFrance comme à l'étranger.A cet effet, la BNU souhaite se doter en 2010 de divers outils :• un nouveau site web, fondé sur le CMS Drupal ;1 Gestion éléctronique de documents2 Digital Asset ManagementCahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 4 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCP• un appareil de numérisation, ou scanner, <strong>des</strong>tiné à la numérisation de sesdocuments patrimoniaux, particulièrement fragiles ;• un outil de gestion de workflow de numérisation et de gestion de bibliothèquenumérique, qui fait l'objet du présent <strong>cahier</strong> <strong>des</strong> charges.Un nouveau service, le service de la Bibliothèque numérique, sera créé en septembre 2010pour piloter l'ensemble du processus opérationnel de la numérisation à la BNU. Ce servicesera intégré à la Direction de la conservation et du patrimoine.3.1.2 La numérisation à la BNULa BNU poursuit une politique de numérisation de ses collections depuis une quinzained'années. La première initiative a été dans les années 1990 la réalisation d'un vidéodisqueconsacré aux images d'Alsace. Les contenus de ce vidéodisque, soit plus de 30 000 images,sont aujourd'hui accessibles en ligne sur la bibliothèque numérique de la BNU.Outre la numérisation effectuée suite à <strong>des</strong> deman<strong>des</strong> de reproduction émises par <strong>des</strong> lecteurs,plusieurs programmes portant sur la numérisation de corpus spécifiques ont été menés aucours de la décennie 2000-2010 :• Manuscrits de la Mystique rhénane : 23 manuscrits médiévaux, 2 incunables,soit 9 000 images.• Monnaies alsaciennes : 5 000 monnaies, soit 10 000 images.• Cartes alsaciennes : 2 500 cartes• Ouvrages alsatiques de référence : une centaine de titres <strong>des</strong> 18e-20e siècles,environ 20 000 pages.D'autres programmes sont menés en partenariat avec <strong>des</strong> organismes extérieurs :• Cartes du Rhin supérieur : dans le cadre du réseau EUCOR• Enluminures et manuscrits médiévaux : dans le cadre d'un programme mené parl'Institut de Recherche et d'Histoire <strong>des</strong> Textes (CNRS)• Journaux de tranchées de la Première Guerre mondiale : dans le cadre d'unpartenariat avec la Bibliothèque <strong>nationale</strong> de France et la Bibliothèque dedocumentation inter<strong>nationale</strong> contemporaine à Paris-Nanterre (2009-2012)• Presse protestante : dans le cadre du partenariat Pôle Associé de la BnF• Papyrus : en collaboration avec la Maison interuniversitaire <strong>des</strong> sciences del'homme d'Alsace (MISHA).La BNU entend aujourd'hui développer fortement ce pan de son activité, suivant trois axesprincipaux :Cahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 5 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCP• assurer la préservation du patrimoine régional et national, par une reproductionde ses collections sur support numérique ;• diffuser ses richesses documentaires au plus large public, en visantprincipalement les publics universitaires et scientifiques, au moment où l'opérationBNU Nouvelle imposera la fermeture du bâtiment principal pour plus de trois années ;• renforcer l'exploitation scientifique de ses collections via <strong>des</strong> projets communsavec les acteurs scientifiques locaux, régionaux et nationaux. Il est à noter ici qu'unerépartition <strong>des</strong> responsabilités entre la BNU et l'Université de Strasbourg a étédéterminée dans le cadre <strong>des</strong> contrats quadriennaux respectifs <strong>des</strong> deuxétablissements : la BNU est positionnée comme chef de file sur la numérisation et lepatrimoine.La logique de numérisation de corpus conduite jusqu'à présent sera complétée par unenouvelle politique de numérisation de masse. Sur ce point précis, la BNU sera attentive à nepas numériser <strong>des</strong> documents déjà numérisés par ailleurs, par la BnF, par d'autresbibliothèques alsaciennes, ou par <strong>des</strong> bibliothèques alleman<strong>des</strong>.Pour conduire cette politique, la BNU souhaite se doter d'équipements spécifiques denumérisation, qui viendront en 2010 compléter ceux déjà présents au sein de son atelierphotographique. L'acquisition d'une solution logicielle de bibliothèque numérique, objet duprésent <strong>cahier</strong> <strong>des</strong> charges, permettra de faciliter les opérations de numérisation et de mise enligne <strong>des</strong> contenus numérisés.La politique de la BNU pour 2010 et les années suivantes s'articulera autour de 5 axesstratégiques :• Reprise de l'existant pour l'intégration dans le progiciel de bibliothèquenumérique ;• Poursuite <strong>des</strong> programmes existants (journaux de tranchées, alsatiques,iconographie) : numérisation en externe ;• Lancement d'un programme de numérisation systématique de documentspatrimoniaux (manuscrits, incunables, ouvrages du 16e siècle ; ostraca) : numérisationen interne ;• Numérisation à la demande via le programme européen Ebooks on Demand :numérisation en interne ;• Articulation avec les programmes locaux, régionaux, nationaux et européens.Cette articulation sera définie en fonction de l'avancement <strong>des</strong> programmes externes àla BNU.D'autres axes de travail pourront être étudiés en cours d'année en fonction <strong>des</strong> besoins etopportunités, notamment :• Partenariats sur projets de recherche ciblés ;• Numérisation de masse.Cahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 6 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCPLa BNU est attentive à la bonne visibilité de ses collections numérisées. Ceci vaut pour sapropre bibliothèque numérique, mais aussi à terme pour Gallica, Europeana, ainsi que pour laBibliothèque scientifique numérique que souhaite développer le Ministère de l'enseignementsupérieur et de la recherche.Elle accorde également une grande importance à la préservation de ses données numérisées, etsouhaite inscrire son action dans les politiques locales et <strong>nationale</strong>s de l'archivage à longterme <strong>des</strong> données numériques.Les données doivent également pouvoir être intégrées dans le futur portail numérique <strong>des</strong>savoirs de la Région Alsace.3.2. Attendus <strong>techniques</strong>La mise en place de la bibliothèque numérique se fait en même temps que celle d'un nouveauCMS (Drupal). L'outil de bibliothèque numérique repose sur un progiciel de GED ou DAMqui doit :• être pilotable par un système d'API afin que le CMS puisse accéder à la diffusion<strong>des</strong> ressources numériques ;• intégrer un moteur de recherche capable de répondre aux besoins définis dans leprésent document ;• être compatible avec les outils bibliographiques existants (catalogue sur V-SMART), et avec le résolveur de liens OpenURL V-Link de la même société ;• supporter l'authentification transparente via SSO ;• supporter ldap et active directory ;• proposer <strong>des</strong> fonctions de modifications d'images : recadrage, tatouage, tatouageen filigrane (watermarking) (optionnel) ;• respecter le protocole CMIS (Content Management Interoperability Services).Le progiciel de GED doit pouvoir fonctionner en environnement virtualisé (actuellement laBNU utilise une solution basée sur Linux/Xen).Concernant le stockage : le progiciel de GED doit pouvoir se connecter à nos baies SANEMC² fonctionnant avec <strong>des</strong> partitions en RAID5 et reliées aux serveurs en Fibre Channel.Les recommandations sur la configuration minimale du serveur de production doivent êtreprécisées.3.2.1 Les donnéesVolumétrie et accroissement :Le nombre de pages numérisées par la BNU est aujourd'hui estimé à environ 1 million.L'accroissement prévu est de 200 000 pages par an.Cahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 7 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCPTypologie <strong>des</strong> documents originaux :L'activité de numérisation de la BNU peut porter sur tous les types de documents et <strong>des</strong>upports, quel que soit le contexte du document :• types de documents :• textes ;• images fixes (texte numérisé, photo ou image de tous formats : d'unemonnaie à une carte format > A3 ou à l'affiche A0) ;• documents sonores ;• documents vidéo ;• contextes :• documents isolés (éventuellement appartenance intellectuelle à unemême collection y compris pour <strong>des</strong> types de documents différents) ;• documents reliés (livres, journaux …) ;• collections ou fonds constitués (fonds d'archives, collections de pièces,etc. ;• expositions virtuelles mêlant <strong>des</strong> images, du texte, <strong>des</strong> vidéos, <strong>des</strong>enregistrements sonores...3.2.2 Typologie <strong>des</strong> formats informatiquesLe progiciel doit permettre de gérer ou de s'interfacer avec les formats suivants (préciser sil'outil ne peut pas gérer un ou <strong>des</strong> formats mentionnés dans le tableau de réponse) :• Formats de diffusion :• Affichage web• Respect <strong>des</strong> normes W3C• Norme d'accessibilité WCAG 2.0 ; WAI• Éventuellement publication électronique• E Pub (ebook)• Formats de métadonnées :• de <strong>des</strong>cription• Dublin Core qualifié ou simple• Unimarc• Optionnel : Marc21, MarcXML• EAD (DTD de <strong>des</strong>cription d'archives)• METS• MODS• LOM pour la <strong>des</strong>cription <strong>des</strong> ressources pédagogiques• d'archivage <strong>des</strong> documents• PREMIS (en relation avec le CINES, cf. infra).De nouveaux formats de métadonnées doivent pouvoir être ajoutés facilement selon lesbesoins pour respecter l'évolution <strong>des</strong> standards.Cahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 8 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCP• Encodage <strong>des</strong> caractères• Unicode UTF-8• Ansi• Formats d'échange <strong>des</strong> données et protocoles d'interopérabilité• ISO 2709• XML• OAI/PMH• OpenURLCritères de choixL'outil doit respecter les différents formats demandés. Un soin particulier est apporté auxpropositions avec <strong>des</strong> logiciels libres dont le code source est fourni.Ouverture du logiciel de bibliothèque numérique (interopérabilité, interfaçage, ajoutd'extensions).3.3. Structure de la base (classification)La numérisation à la BNU est organisée autour de programmes. La structure de la base dedonnées qui constitue le cœur du progiciel de bibliothèque numérique de la BNU doit refléterl'organisation en programmes de la politique de numérisation de celle-ci : les corpus dedocuments numérisés sont organisés en répertoires, à partir d'une racine déclinable en sousensemblescohérents. Le nombre maximal de niveaux d'arborescence est fixé à 4. Dans le casde programmes pluri-annuels, un niveau intermédiaire de répertoires représente les années aucours <strong>des</strong>quelles ont lieu les opérations de numérisation. Dans le cas de programmes réaliséssuivants plusieurs marchés, un niveau intermédiaire de répertoires représente les différentsmarchés.Exemples d'arborescence :• Programme 1 (Numérisation à la demande) > Année de numérisation > Unitébibliographique• Programme 2 (Images d'Alsace) > Année de numérisation > Unitébibliographique• Programme 7 (Cartes d'Alsace) > Année de numérisation > Unitébibliographique• Programme 9 (Journaux de tranchées) > Titre 1 > Année > Unitébibliographique• Programme 12 (Ouvrages alsaciens du 16e siècle) > Marché > Année > Unitébibliographique• (exemple : Programme 12 > Lot 1 : Interne BNU > 2010 > Livre 1Programme 12 > Lot 2 : Marché extérieur 1 > 2010 > Livre 1Programme 12 > Lot 3 : Marché extérieur 2 > 2010 > Livre 1Cahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 9 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCPLe système de nommage <strong>des</strong> répertoires reflètent les éléments suivants :• Dans tous les cas : l'identifiant de l'institution ; le numéro du programme ;• Suivant le niveau d'arborescence : la cote du document ; le numéro du documentnumérisé dans la chaîne de numérisation.Un renommage automatique <strong>des</strong> répertoires et fichiers doit être possible en cas dedéplacement de ces répertoires et fichiers au sein de la base de données.3.4. Spécifications <strong>techniques</strong> : import, traitement et stockage <strong>des</strong> objetsLa solution de bibliothèque numérique retenue doit être à même de gérer <strong>des</strong> données issuesd'opérations de numérisation réalisées soit en interne à la BNU soit externalisées.3.4.1 Import et formats <strong>des</strong> fichiers numériquesLors de l'import <strong>des</strong> données il doit être possible :• de définir <strong>des</strong> profils d'import/export de documents, avec ou sans leurs métadonnées,ou de métadonnées seules• d'importer/exporter en masse (par lots)• d'importer/exporter à l'unité• d'importer dynamiquement depuis le robot de numérisation <strong>des</strong> fichiers etmétadonnées.Il est nécessaire de pouvoir importer directement dans un répertoire pré-défini dansl'arborescence, notamment à partir du numéro d'opération de numérisation indiqué dans lenommage <strong>des</strong> fichiers (voir infra).3.4.2 Contrôle qualitéSont vérifiées à cette étape, de manière la plus automatisée possible :• la complétude et la cohérence <strong>des</strong> fichiers versés ;• l'absence de doublons : l'outil doit prévoir un système de repérage <strong>des</strong> doublonset de dédoublonnage le cas échéant ;• la lisibilité <strong>des</strong> fichiers par l'outil ;• la bonne prise en compte dans l'arborescence pré-définie.3.4.3 FormatsDe manière générale les formats de fichiers les plus courants sont supportés en entrée,notamment:• Texte : OpenOffice.org (.sxw, .odt), Word (.doc), Acrobat (.pdf), RTF (.rtf), Excel(.xls), Power Point (.ppt)• Images fixes : JPEG (.jpg), GIF(.gif), TIFF (.tif), JPEG 2000 (.jp2), bitmap (.bmp),PNG (.png)• Audio : OggVorbis (.ogg), MPEG-1/2 Audio Layer 3 (.mp3), Real Audio (.ram), WAV(.wav), MIDI (.mid)• Vidéo : MPEG (.mpg), QuickTime (.mov)., Clip vidéo (.avi), .flv, .swfCahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 10 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCPOptionnel : l'outil peut procéder automatiquement à la migration <strong>des</strong> formats d'entrée vers lesformats suivants :• Texte : .xml ;• Image : .tiff ; png• Audio : .mp3• Vidéo : .mpgCette opération est suivie d'un contrôle qualité automatisé, par une lecture aléatoire <strong>des</strong>fichiers transformés.3.4.4 Nommage <strong>des</strong> fichiersFonctionnement général :L'outil retenu doit permettre de suivre la correspondance entre le nommage <strong>des</strong> fichiers,l'identification bibliographique du document numérisé, et le numéro du programme dans lecadre duquel le document a été numérisé.Les principes du système de nommage <strong>des</strong> fichiers sont exposés en annexe.Reprise de l'existant :Un système de renommage automatique de lots de fichiers, sur la base d'une programmationmanuelle est proposé pour la reprise de l'existant. Les documents numérisés à partir de laprogrammation 2010 sont créés suivant le système de nommage adéquat.Modification ultérieure :Il peut arriver qu'un document numérisé dans le cadre d'un programme doive être rattaché àun autre programme pour <strong>des</strong> raisons de cohérence. C'est notamment le cas de documentsnumérisés à la demande, qui pourraient être rattachés à un programme thématique.Exemple : un papyrus numérisé à la demande d'un chercheur. Les répertoires et fichierspourraient être déplacés du répertoire du programme "Numérisation à la demande" vers lesrépertoires du programme "Papyrus".Un tableau de correspondance doit permettre de suivre ces déplacements au sein de la base.Les répertoires et fichiers déplacés doivent être renommés automatiquement, en fonction deleur nouvel emplacement.3.4.5 ArchivageL'export <strong>des</strong> fichiers au format .tiff (ou jpeg2000 ou .png) est envisagé pour l'archivagepérenne (vers <strong>des</strong> serveurs en interne, vers le CINES, ou vers d'autres prestataires).Cahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 11 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCP3.5. Métadonnées et identifiants3.5.1 Acquisition <strong>des</strong> métadonnéesL'ajout de métadonnées se fait par plusieurs biais :• Extraction automatique <strong>des</strong> données <strong>techniques</strong> lors de l'import de fichiers ou à partirde l'aquisition via la chaîne de numérisation (date de l'opération, type MIME...) ;• Extraction automatique de métadonnées contenues dans certains fichiers comme lestags IPTC pour les images, ID3 pour le son, les propriétés <strong>des</strong> fichiers bureautiques ouPDF ;• Conversion automatique de la notice unimarc issue du SIGB en métadonnées DublinCore ;• Possibilité d'import également de fichiers XML ou CSV contenant <strong>des</strong> métadonnées ;• Possibilité de récupérer <strong>des</strong> métadonnées de nos partenaires par moissonnage OAI-PMH de leur base.Nature <strong>des</strong> métadonnées• De contexte :• l'identifiant international de la BNU (identifiant ISIL de la BNU :FR674821001) doit être une métadonnée systématique dans chacun <strong>des</strong> fichiersnumériques correspondant à une unité bibliographique ;• la position du document dans l'arborescence doit être traduite dans lesmétadonnées. Le format EAD peut être employé ;• l'outil doit permettre de décrire <strong>des</strong> collections - c'est-à-dire <strong>des</strong> ensembles dedocuments - au format EAD. C'est le cas notamment pour les collections dedocuments iconographiques. L'indexation doit donc être possible à chaqueniveau de l'arborescence.• Descriptives :• Bibliographiques : à partir de l'import <strong>des</strong> données bibliographiques depuis leSIGB, transformation au format Dublin Core. (cf. paragraphe 5)• Complémentaires :• l'outil doit permettre l'ajout manuel de métadonnées <strong>des</strong>criptivescomplémentaires, au niveau de chaque document. Le format METS serautilisé pour les documents de type "livre" ou "journal" ;• Résumé / <strong>des</strong>cription : champ libre alimenté manuellement, pourchaque document / chaque dossier. Doit apparaître dans la notice quis'affiche dans les résultats de recherche.• De droit : (afin de limiter l'accès au document) :• Accès libre : permet d'afficher le document en mode normal avec possibilitésde zoom et de téléchargements• Accès restreint : ne permet par défaut d'afficher le document qu'en mode"vignette" en illustration de sa notice bibliographique. Pas de zoom ni detéléchargement possible. Consultation en mode normal et zoom autorisésuniquement sur les postes situés à l'intérieur <strong>des</strong> murs de la BNU. LaCahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 12 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCPmétadonnée doit mentionner une date de libération du document, sur le modèleAAAAMMJJ (ex : 2034/01/01), date à laquelle le document devient en accèslibre.• De conservation : les métadonnées de conservation doivent être conformes au schémaOAIS. Le format PREMIS peut être une solution proposée.3.5.2 Attribution d'identifiants pérennesA chaque unité bibliographique est attribué un numéro identifiant pérenne, sur le standardARK utilisé par la BNF (cf.annexe 3). L'identifiant ARK traduit l'arborescence de lacollection, et sert de localisation de l'unité bibliographique sur Internet. Le système permetl'ajout automatique de cet identifiant ARK dans le champ 846 de la notice bibliographique auformat MARC correspondant à l'unité bibliographique numérisée. Le système doit par ailleurssupporter d'autres standard d'identifiants pérennes PURL, DOI, Handle....issus de sourcesextérieures.L'ajout de métadonnées doit se faire à chaque niveau de l'arborescence.3.5.3 Relations métadonnées / documentsChaque enregistrement de métadonnées doit pouvoir être lié à l'objet ou aux objetsnumériques concernés sur la base d'un ou plusieurs critères d'identification personnalisables etcette liaison est possible tout au long de la vie du document.3.5.4 Texte intégralCertains documents numérisés au format image peuvent offrir une recherche en texte intégralsuite au traitement par un logiciel de reconnaissance optique de caractères. Ce logiciel estindépendant de la solution retenue car il doit notamment être capable de lire l'allemandgothique manuscrit mais les deux doivent s'interfacer. Le fichier océrisé importé doit pouvoirêtre modifié facilement, sans avoir besoin d'être exporté et réimporté, le système doit doncêtre capable d'assembler et de dissocier <strong>des</strong> pages pdf.3.5.5 Contrôle qualitéLe contrôle qualité s'effectue manuellement ou automatiquement sur les points suivants :• fonctionnement du lien depuis la notice bibliographique du catalogue (contrôleautomatique);• cohérence de l'identifiant (URL) (contrôle automatique) ;• lisibilité <strong>des</strong> documents en ligne ;• qualité de son indexation.3.6. Moteur de rechercheUn moteur de recherche performant doit être intégré à la solution pour, d'une part effectuer<strong>des</strong> recherches professionnelles et d'autre part, faire l'objet d'une requête via une API par leCMS Drupal et offrir <strong>des</strong> possibilités de recherche avancées pour les internautes.Cahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 13 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCP3.6.1 Fonctions de recherche• Une recherche globale simple de type "google" qui porte sur l'ensemble <strong>des</strong>métadonnées et sur le texte intégral lorsqu'il est disponible avec pondération <strong>des</strong>résultats.• Une recherche avancée avec :• <strong>des</strong> restrictions personnalisables notamment (chronologique,géographique, par support, par collection)• l'utilisation d'opérateurs booléens et de proximité• le paramétrage <strong>des</strong> index sur lesquels s'opère la recherche.• Une fonction de suggestion et de correction orthographique est appréciée.• Une présentation de type "annuaire" par feuilletage <strong>des</strong> catégories de la base ou parnavigation dans un index est également proposée.• Le retour à l'écran d'accueil ou à la liste <strong>des</strong> résultats est disponible à tout moment.3.6.2 Présentation <strong>des</strong> résultatsGénéralités• Un fil d'Ariane ou un menu avec l'arborescence toujours visible est disponible pour serepérer à chaque étape de la recherche.• Un rappel <strong>des</strong> termes de la recherche est apprécié de même que les termes de larecherche peuvent êtres surlignés dans la <strong>des</strong>cription ou dans les extraits du texteintégral.Affichage abrégé• Un affichage abrégé présente, en premier lieu, les documents avec une vignette et une<strong>des</strong>cription succincte. A ce stade, on doit pouvoir accéder à une prévisualisation rapidedu document à l'aide de modules additionnels ou à l'affichage de la <strong>des</strong>criptiondétaillée (ensemble <strong>des</strong> métadonnées).• Les résultats peuvent être triés par titre, par date, par collection, par type, parpertinence par liste ou par collections et une restriction peut être relancée à partir de"facettes" proposées automatiquement par le moteur.Affichage détailléL'affichage détaillé donne accès à l'ensemble <strong>des</strong> métadonnées du document, aux différentsobjets et à leurs fonctions associées, notamment :• pour les documents composés, l'affichage de la table <strong>des</strong> matières cliquable(monographies, périodiques)• pour les textes numérisé l'image est affichée par défaut, mais l'utilisateur peut choisirde passer en mode texte ou d'avoir un affichage simultanée <strong>des</strong> deux• une visionneuse est intégrée pour les document en mode images avec, applicable parprofil de document,• l'affichage par vignettes (chemin de fer)• l'affichage <strong>des</strong> pages personnalisé pour les livres (à chevrons, au clic,éventuellement tourne-page Flash, accès direct à une page spécifiée)Cahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 14 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCP• un zoom dynamique sur <strong>des</strong> parties du document avec un rappel toujoursprésent du document entier• l'affichage en multi-fenêtrage de plusieurs objets pour comparaisons etéventuellement possibilité de rotation• pour le son et la vidéo, incrustation d'un lecteur flash (possibilité de lire les documentsen streaming).Exploitation <strong>des</strong> résultatsExport• historique <strong>des</strong> recherches• sauvegarde <strong>des</strong> notices bibliographiques dans un panier• possibilité de générer un flux RSS à partir d'une recherche pré-enregistrée.• impression• envoi par courriel sous forme d'archive zip pour plusieurs items• téléchargement au format allégé (question <strong>des</strong> droits pour les internautes), Pdf,image JPG• export <strong>des</strong> métadonnées sous plusieurs formats possible (RIS, Texte, Html,MarcXML, DC...).Fonctionnalités avancées• recommandations de documents similaires fondés sur les métadonnées• possibilité de poster <strong>des</strong> commentaires et de les afficher ou non pour lesinternautes• possibilité d'effectuer <strong>des</strong> paiements via une interface de paiement sécurisésouscrite par la BNU• possibilité de construire une Url à l'aide de variables {ID; ISSN; TITLE...] àpartir de métadonnées existantes afin de rebondir vers une autre application(Catalogue, AtoZ, Numes, Calames).3.7. Spécifications <strong>techniques</strong> : diffusion• Génération de flux RSS sur les nouveaux documents ajoutés• Exposition aux moteurs de recherche :Les documents numérisés doivent pouvoir être indexés par les moteurs derecherche du web : Google, Exalead, Yahoo!, Bing, etc.• Exposition au moissonnage OAI-PMH :Afin d'alimenter <strong>des</strong> portails comme Gallica ou Europeana, les métadonnéessont versées dans un entrepôt OAI structuré selon une arborescencepersonnalisable. Il doit être possible d'autoriser à la moisson tout ou partie <strong>des</strong>collections, selon un paramétrage manuel.Cahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 15 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCP• Enrichissement scientifique <strong>des</strong> données :La BNU entend permettre l'enrichissement scientifique <strong>des</strong> données numériséespar l'ajout d'un appareil scientifique (de type textes, commentaires,bibliographies) au niveau <strong>des</strong> unités bibliographiques mais aussi <strong>des</strong> collections,donc à chaque niveau de l'arborescence <strong>des</strong> dossiers. Exemple : présentationhistorique et scientifique d'une collection de manuscrits ; <strong>des</strong>cription détailléed'un document de cette collection en particulier. L'outil retenu doit permettre degérer le plus facilement possible l'articulation entre les commentaires sur lesdonnées numérisées et les données numérisées elles-mêmes.Export vers CMSLe prestataire doit fournir un jeu d'APIs ou de webservices permettant de requêter et d'afficherles documents et leur <strong>des</strong>cription dans le CMS (Drupal) avec les mêmes fonctionnalités quecelles proposées en interne dans la partie "Moteur de recherche".3.8. Module optionnel pour le PEB dématérialiséL'outil peut permettre de gérer le prêt entre bibliothèques dématérialisé par le téléchargementvia un portail sécurisé <strong>des</strong> deman<strong>des</strong> d'autres bibliothèques.Fonctions souhaitées :• Authentification sur identification de la bibliothèque demandeuse (inscriptionpossible en cas de 1ère demande)• Stockage dans un espace <strong>des</strong>tiné à délivrer le document numérisé à labibliothèque demandeuse• Possibilité d'interfacer ce module avec <strong>des</strong> fonctions tel que téléchargementunique, impression unique.3.9. Moteur de workflow (automatisation <strong>des</strong> processus)De manière générale, la supervision de la numérisation (suivi du traitement du documentoriginal : organisation de l'envoi à la numérisation en interne ou au prestataire externe ;contrôle du retour en magasin après la numérisation) doit être possible via le moteur deworkflow. Un proposition de workflow peut être la suivante :• Création d'un répertoire par projet identifié ;• Création d'une « fiche » pour chaque objet à numériser, sous son répertoire «projet » ;• Import <strong>des</strong> données bibliographiques de chaque objet, par import dans la base<strong>des</strong> données bibliographiques de chaque unité bibliographique à numériser ounumérisée, depuis le SIGB V-Smart de la société Infor ;• Attribution d'un identifiant pérenne à chaque objet ;• Suivi du traitement du document original (organisation de l'envoi à lanumérisation en interne ou au prestataire externe ; contrôle du retour en magasin aprèsla numérisation) ;• Acquisition : soit automatiquement par interface avec le matériel denumérisation, soit par l'import de fichiers numérisés en externe ;• Contrôle qualité ;• Océrisation (le cas échéant) ;Cahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 16 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCP• Ajout <strong>des</strong> métadonnées : Dublin Core ; METS ; etc.• Ajout du statut du document numérisé : accès libre / accès restreint ;• Contrôle qualité ;• Export de sauvegarde ;• Exposition au moissonnage ;• Export vers CMS pour diffusionLe workflow doit respecter les contraintes suivantes :• Traitements automatisés : les différentes conversions de format et les ajoutsautomatiques de métadonnées doivent être déclenchés par le moteur de worklow.• Traitements manuels : les professionnels identifiés sont sollicités automatiquementpour vérifier et enrichir les métadonnées présentes, classer les objets dans <strong>des</strong>collections ou définir les profils d'affichage.• Le circuit de validation avant la publication en ligne <strong>des</strong> documents doit être trèssouple et personnalisable.3.10. Administration de l'outilUne interface d'administration en ligne est appréciée.3.10.1 UtilisateursL'outil doit offrir la possibilité de s'interfacer à un annuaire Active Directory afin de connecterles groupes et les utilisateurs existants dans l'annuaire de l'établissement.On dispose d'au moins 4 profils d'utilisation :• les administrateurs (qui paramètrent la base et attribuent les droits, alimentent,modifient et consultent, etc.)• les gestionnaires (qui alimentent, modifient, suppriment, mettent à jour etconsultent)• les utilisateurs (les agents de la BNU qui consultent uniquement)• les internautes (qui consultent une partie de la base, via le site Internet de laBNU).On peut envisager <strong>des</strong> niveaux de consultation différenciés suivant les profils de chacun, qu’ils’agisse <strong>des</strong> administrateurs ou <strong>des</strong> utilisateurs.3.10.2 StatistiquesL'outil doit permettre aux administrateurs d'effectuer facilement <strong>des</strong> analyses statistiques surl'ensemble <strong>des</strong> données et fonctionnalités.Cahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 17 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCP3.10.3 FormationLe prestataire forme les administrateurs à la procédure intégrale de paramétrage de la base et àla gestion <strong>des</strong> profils. Les gestionnaire sont formés à l’alimentation et la consultation. Desgui<strong>des</strong> d’utilisation (en version papier et électronique) sont fournis, décrivant lesfonctionnalités du système en fonction du type de profil. Le système doit proposer une aidegénérale et une aide contextuelle.3.10.4 MaintenanceSi le logiciel est payant, la 1ère année doit être gratuite.Cahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 18 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCP6 Incontournables alsatiques 2008-20097 Cartes d'Alsace 2008-20118 Presse protestante 2009-20129 Journaux de tranchées 2009-201210 Placards de la guerre 1914-1918 2010-11 Affiches alsaciennes 2010-12 Ouvrages alsaciens du 16e siècle 2010-12a Numérisation interne BNU 2010-12b Marché extérieur 1 2010-13 Fonds Nuremberg 2010-201114 Poésie alsacienne 18e-20e siècles 2010-201115 Inventaires historiques de la BNU 2010-201216 Papyrus 2008-20124.2. Système de nommage <strong>des</strong> répertoires et fichiersLa plus grande attention est portée au système de nommage <strong>des</strong> fichiers et répertoires danslesquels sont organisées les données.Les principes généraux du système de nommage <strong>des</strong> répertoires et fichiers sont les suivants :• les noms de répertoires et de fichiers (y compris le séparateur et l'extension) sontlimités à 45 caractères (hors indication de format), qui doivent obligatoirementêtre <strong>des</strong> lettres capitales, <strong>des</strong> chiffres ou <strong>des</strong> tirets bas (_). La virgule « , » n'estautorisée que dans le nommage <strong>des</strong> répertoires, uniquement dans la mention dela cote du document numérisé. Les points « . » figurant dans les cotes sont enrevanche à enlever ;Cahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 20 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCP• l'identifiant de la BNU doit être présent systématiquement, à la fois pour lesfichiers et les répertoires. L'identifiant international de la BNU est le numéroISIL : « FR674821001 »http://www.bs.dk/isil/ .• les éléments significatifs sont séparés par <strong>des</strong> tirets bas (underscore : "_") ;• le nommage <strong>des</strong> répertoires est constitué <strong>des</strong> éléments suivants :◦ dans tous les cas : l'identifiant de l'institution ; le numéro du programme ;◦ suivant le niveau d'arborescence : l'année de la numérisation ; la cote dudocument ; le numéro du document numérisé dans la chaîne denumérisation ;◦ certains cas particuliers (périodiques, lots de documents non individualisésdans le catalogue) font l'objet d'une solution spécifique ;• le nommage <strong>des</strong> fichiers doit être signifiant et traduire à la fois l'identité del'unité bibliographique numérisée et son emplacement dans les programmes denumérisation de la BNU.Un document détaillé <strong>des</strong> spécifications retenues par la BNU est fourni aux candidats surdemande.4.3. Le standard ARKLe standard ARK est une URL créée pour permettre un accès constant et à long terme auxinformations d'un objet. ARK peut identifier les objets de tout type: documents numériques,bases de données, images, logiciels, et les sites web, ainsi que les objets physiques (livres,statues, images etc. ) et même objets intangibles (produits chimiques, maladies ...).ARK est représenté par une séquence de caractères qui contient l'étiquette, "ark:",éventuellement précédée par le nom du protocole ("http://") et de l'hôte par lequel commencechaque URL.http://example.org/ark:/13030/654xz321/s3/f8.05v.tiff\________________/ \__/ \___/ \______/ \____________/(modifiable) | | | IdentifiantLabel ARK | | (NMA-supported)| | |Name Mapping Authority | Name (NAA-assigned)(NMA) |Name Assigning AuthorityNumber (NAAN)Cahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 21 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCP4.4. Schéma XML <strong>des</strong> métadonnées d'archivage PAC/SIP du CINESLa structure de référence pour les enveloppes <strong>des</strong>criptives <strong>des</strong> documents à verser (SIP) esttéléchargeable :le fichier de <strong>des</strong>cription du document transféré sip.xsdle fichier <strong>des</strong> notifications avis.xsdle fichier de <strong>des</strong>cription du document archivé aip.xsd4.5. Modèle de fichiers METSMETS (Metadata Encoding & Transmission Standard) maintenu par la Library of Congress,permet de créer <strong>des</strong> objets numériques complexes, très structurés et dynamiques,«rassemblant» <strong>des</strong> objets numériques plus simples, quelconques et éventuellement dispersés.Constitué de sept sections (carte de structure, section <strong>des</strong> métadonnées <strong>des</strong>criptives,administratives, section <strong>des</strong> fichiers, de leurs comportements ...) liées entre elles et au traversde leurs éléments-fils, il permet de gérer et diffuser la collection de multiples façons.Pour décrire les objets de base, METS intègre <strong>des</strong> éléments de tous les jeux de métadonnéesXML ou pointe sur <strong>des</strong> <strong>des</strong>criptions existantes ; il comprend un seul ensemble sémantiquespécifique portant sur les droits d’usage. METS permet enfin de créer <strong>des</strong> packagesconformes au modèle OAIS. Ce format efficace mais assez complexe est de plus en plusutilisé. METS website4.6. Tableau de correspondance de UNIMARC vers Dublin CoreTitle200 a c d e h i r500 a h i k l m n q r s u w (titre uniforme)530 a b (titre clé)51X 520 54X a e h i t( tous titres ajouté)503 a b d e f h i j k l m n (titre de forme)327 aCreator700 a b c d f701 ab c d f710 a b c d e f g h711 a b c d e f g h720 a f721 a fCahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 22 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCPSubject600 a b f x606 a610 aDescription300 a330 aPublisher210 a c702 si $4160, 610, 650 : a b c d f712 si $4160 610, 650: a b c d e f g h620 dContributors200 f g702 a b c d f Sauf si $4610, $4650 ou $4160712 a b c d e f g h Sauf si $4610, $4650 ou $4160722 a f Sauf si $4610, $4650 ou $4160722 a f Sauf si $4610, $4650 ou $4160Date210 d100 ( position 9 à 16 )Typelabel (position 7)200 bFormat 215 a c dFormat Format de fichier (type MIME)Identifier url pérenne du documentSourceBibliothèque <strong>nationale</strong> et universitaire de Strasbourg930 a coteLanguage 101 a (code alphabétique sur 3 caractères)Relation Lien vers le Webopac sur le no de noticeCoverage 607 a x y zRights à préciserCahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 23 Marché n° 2010-15


BNU Projet Bibliothèque numérique - GED DSI-DCP4.7. Tableau à remplir par le soumissionnaireTableau à remplir par le soumissionnaire et à retourner sous forme papier accompagnée dufichier sur CD-Rom avec la proposition d'offre de service. Les réponses données auront valeurcontractuelle.Cahier <strong>des</strong> <strong>clauses</strong> <strong>techniques</strong> particulières 24 Marché n° 2010-15

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!