13.07.2015 Views

Programme et résumés (pdf) - Société statistique du Canada

Programme et résumés (pdf) - Société statistique du Canada

Programme et résumés (pdf) - Société statistique du Canada

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Mardi 30 mai • Tuesday, May 30, 10:15–11:45 105Session 06C Mardi 30 mai • Tuesday, May 30, 10:15–11:45 SSC2050BioinformaticsBioinformatique[MS-91]Applications of Computational Intelligence to Pattern Discovery in Biological SystemsApplications de l’intelligence informatique à la découverte de patrons reliés aux systèmes biologiquesGary FOGEL, Natural Selection, Inc.Les systèmes biologiques sont intrinsèquement non linéaires.Une méthode pour comprendre les systèmes bio-logiques est de ré<strong>du</strong>ire c<strong>et</strong>te non-linéarité à des relationslinéaires pour ensuite appliquer les méthodes <strong>statistique</strong>susuelles de développement de modèles. Lorsque les méca-niques sous-jacentes sont largement linéaires, ces méthodesfonctionnent très bien. Cependant, lorsque les variables enbiologie sont largement non linéaires, de nouvelles méthodesinformatiques peuvent être utilisées pour éviter la ré<strong>du</strong>c-tion aux premiers principes. C<strong>et</strong> exposé décrit des tentativesd’utilisation d’intelligence informatique pour la reconnais-sance <strong>et</strong> la découverte de formes dans un assortiment de pro-blèmes biologiques dont l’espace de paramètres contient dela non-linéarité <strong>et</strong>/ou qui ont un grand nombre de solutionspossibles.Biological systems are inherently nonlinear. Onem<strong>et</strong>hod of understanding biological systems is tofirst re<strong>du</strong>ce this nonlinearity to linear relationshipsand apply standard statistical m<strong>et</strong>hods for modeldevelopment. When the underlying mechanics arelargely linear, these m<strong>et</strong>hods work very well. However,when the biology is vastly nonlinear, novelcomputational m<strong>et</strong>hods can be employed that avoidre<strong>du</strong>ction to first principles. This lecture describesefforts to use computational intelligence m<strong>et</strong>hodsfor pattern recognition and pattern discovery in anassortment of biological problems which containnonlinearity in feature space and/or have vast numberof possible solutions.[MS-92]Operons and the Quality of Predictions of Functional Interactions Using Phylogen<strong>et</strong>ic ProfilesLes opérons <strong>et</strong> la qualité des prévisions des interactions fonctionnelles en utilisant des profils phylogénétiquesGabriel MORENO-HAGELSIEB, Wilfrid Laurier University, Sarath JANGA, CCG-UNAMLes opérons se composent de gènes qui fonctionnent d’unefaçon reliée. Les profils phylogénétiques sont des vecteursdécrivant la présence ou l’absence d’un gène à travers d’unensemble de données de génome. Si deux gènes fonctionnentensemble, ils devraient être absents ou présents à travers desorganismes. Par conséquent, leurs profils phylogénétiquesdevraient être corrélés. Nous avons déterminé une valeurde confiance pour des prévisions d’opéron en utilisant desprofils phylogénétiques valides dans n’importe quel Proca-ryote. Un ensemble de données non redondant de génomesaugmente le nombre de prévisions à un niveau de confiancede 0,90 par un ratio moyen de 1,36. Les résultats montrentla puissance <strong>et</strong> l’importance des étalons positifs <strong>et</strong> négatifspour l’amélioration des prévisions en utilisant le contexte génomique.Operons are composed of functionally-relatedgenes. Phylogen<strong>et</strong>ic profiles are vectors describingthe presence/absence of a gene across a genomedatas<strong>et</strong>. If two genes work tog<strong>et</strong>her, they shouldbe both either absent or present across organisms.Thus, their phylogen<strong>et</strong>ic profiles should correlate.We devised a confidence value for operon predictionsusing phylogen<strong>et</strong>ic profiles valid in anyProkaryote. A non-re<strong>du</strong>ndant genome datas<strong>et</strong> increasesthe number of predictions at a confidencevalue of 0.90 by an average ratio of 1.36. The resultsshow the power and importance of positiveand negative gold standards for the improvementof predictions using genomic context.SH = Somerville House SSC = Social Science Centre UC = University College

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!