11.07.2015 Views

X - Luc Quoniam

X - Luc Quoniam

X - Luc Quoniam

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

− parcourir la littérature associée à un gène donné de façon plus ou moins large,− rechercher la littérature relative à un groupe de gènes,− rechercher des termes associés à un gène donné,− trouver les noms officiels d’un gène donné,− rechercher les termes MeSH associées à un groupe de gène,− interpréter des données d’expressions.C. MÉTHODES BASÉES SUR LA COOCCURRENCE POUR EXTRAIRE DES INFORMATIONSSUR LES INTERACTIONS GÉNÉTIQUES OU MOLÉCULAIRESRINDFLESCH et alii propose un système d’extraction d’informations sur les relationsqu’entretiennent gènes, médicaments et cellules (2000). Il s’agit de trouver des relations dutype : dans les cellules de type C, l’expression du gène G est inhibée (ou activée) par lemédicament M, ou du type, les cellules du type C acquièrent une résistance (ou unesensibilité) au médicament M quand le gène G s’exprime. Ce type d’informations est utiledans l’étude du cancer. Le système est basé sur la reconnaissance dans une même phrased’un gène, d’un type cellulaire et d’un médicament. Il s’agit donc d’un système basé sur lacooccurrence, même si la relation en question est tripartite. Le système proposé ne permetpas de déterminer le type de relation entre les trois entités mais les auteurs projettent d’yarriver à l’avenir.PILLET et alii proposent aussi un système basé sur la cooccurrence (1998). Il s’agit d’extrairedes informations sur les interactions génétiques ou moléculaires à partir de commentairesbibliographiques contenus dans Flybase. Le système est basé à la fois sur la cooccurrence etsur la présence d’un vocabulaire spécifique dans la phrase. Nous avons utilisé ce travail etnous donnerons plus d’information quand nous décrirons nos réalisations.D. MÉTHODES BASÉES SUR DES MOTIFS TEXTUELS POUR EXTRAIRE DESINFORMATIONS SUR LES INTERACTIONS GÉNÉTIQUES OU MOLÉCULAIRESPour détecter des interactions, la cooccurrence de deux labels n’est pas un facteur suffisant.La cooccurrence peut avoir lieu pour bien d’autres raisons que la description d’uneinteraction. Des éléments supplémentaires d’informations doivent être adjoints pourdécider si une interaction est décrite ou non. De plus, dans le cas où il y auraitcooccurrence, et sauf dans le cas où il n’y aurait que deux labels, il resterait à déterminerentre quels labels les interactions ont lieu. La question du sens, de A vers B ou de B vers A,doit aussi être posée. La question de savoir quel est le type de l’interaction, activation ouinhibition par exemple, reste elle aussi ouverte.Ainsi, il apparaît nécessaire de faire une analyse plus approfondie de la phrase. Il estimportant de repérer des verbes tel que activate ou inhibit et de déterminer sujets etcompléments d’objets associés. Il s’agit donc de faire appel au traitement automatique deslangues. Les travaux qui suivent font appels à cette technique.BLASCHKE et alii (1999) proposent un système d’extraction d’informations sur lesinteractions entres protéines. Ce système s’appelle suiseki 21 . Il permet de travailler sur unensemble prédéfini de protéines impliquées dans un même processus. Les résumés issus deMedline qui correspondent à ce processus sont analysés. Il s’agit de reconnaître des motifsdu type : Protéine A – Action – Protéine B, où Protéine A et Protéine B sont des noms de21 Des exemples d’application sont accessible sur http://www.pdg.cnb.uam.es/suiseki/index.html37

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!