11.07.2015 Views

X - Luc Quoniam

X - Luc Quoniam

X - Luc Quoniam

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

etc. La base de données est accessible à travers CORBA 13permettant d’interroger plusieurs bases de données à la fois.qui est une interface quiPour faciliter les échanges d’informations entre les bases de données, les ontologies sontutilisées. Il s’agit de représentations formelles d’un domaine scientifique donné. Dans cesreprésentations, les objets et les relations entre ces objets sont décrits. Les ontologiespeuvent être utilisées pour représenter les schémas d’organisation de l’information dans unebase. L’ontologie devient la référence commune à plusieurs bases de données et elle permetl’échange d’information entre les différentes bases.B. COUPLAGE DES BASES DE DONNÉES FACTUELLES AVEC DES BASES DE DONNÉESBIBLIOGRAPHIQUESDans une base de données, les informations peuvent être codées, soit dans un langagenaturel, par exemple l’anglais, soit codé dans un langage symbolique ou numérique. Dans lepremier cas, nous parlerons de données textuelles, dans le second cas de donnéesfactuelles. Nous parlerons de bases de données textuelles pour les bases de données quirenferment essentiellement du texte. Il s’agit principalement de bases de donnéesbibliographiques telles que Medline. Les bases de données factuelles sont les bases dedonnées qui contiennent peu de texte. Il s’agit par exemple de bases de données deséquences ou d’encyclopédies sur les gènes d’un organisme particulier comme Flybase.Nous inscrivons notre travail dans le couplage de bases de données bibliographiques avecdes bases de données factuelles et plus généralement dans la mise en relation de donnéestextuelles et de données symboliques ou numériques. Il s’agit de mettre en relation unensemble de textes avec une collection d’informations contenues dans une base de données.Les liens peuvent être considérés, soit comme un repérage de faits décrits dans des textes,soit comme le repérage d’un commentaire textuel sur des faits. Ainsi, il s’agit, soit deconstruire automatiquement une bibliographie, soit de repérer des faits décrits dans destextes.La création de liens entre données textuelles et données factuelles touche à la fois à larecherche d’information et à l’extraction d’information :− Quel sont les textes qui décrivent le mieux tel ou tel fait ?− Quelles sont les meilleures représentations du contenu du texte ?Dans notre cas, la base de données textuelles est Medline. Les bases de donnée factuelles quenous utilisons sont, d’une part Flybase et d’autre part une base de données sur lesinteractions génétiques que nous avons construite. Dans cette dernière, les interactions sontdécrites par un couple de gènes et une indication sur le sens de l’interaction.Le lien entre Flybase et Medline consiste à identifier un gène dans une phrase : tel gèneapparaît sous telle forme dans telle phrase à tel endroit dans la phrase. Le lien entre la basede données sur les interactions que nous avons créée et Medline correspond à lareconnaissance d’une interaction dans une phrase : tel gène interagit avec tel gène (avecindication éventuelle du sens) d’après telle phrase.Ainsi, chaque lien est de nature assez différente. Dans le cas de l’identification des gènes, labase de données sur les gènes est donnée d’avance et il s’agit donc davantage de recherche13 Voir http://www.corba.org/23

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!