Programme et résumés (pdf) - Société statistique du Canada
Programme et résumés (pdf) - Société statistique du Canada
Programme et résumés (pdf) - Société statistique du Canada
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Mardi 30 mai • Tuesday, May 30, 10:15–11:45 105Session 06C Mardi 30 mai • Tuesday, May 30, 10:15–11:45 SSC2050BioinformaticsBioinformatique[MS-91]Applications of Computational Intelligence to Pattern Discovery in Biological SystemsApplications de l’intelligence informatique à la découverte de patrons reliés aux systèmes biologiquesGary FOGEL, Natural Selection, Inc.Les systèmes biologiques sont intrinsèquement non linéaires.Une méthode pour comprendre les systèmes bio-logiques est de ré<strong>du</strong>ire c<strong>et</strong>te non-linéarité à des relationslinéaires pour ensuite appliquer les méthodes <strong>statistique</strong>susuelles de développement de modèles. Lorsque les méca-niques sous-jacentes sont largement linéaires, ces méthodesfonctionnent très bien. Cependant, lorsque les variables enbiologie sont largement non linéaires, de nouvelles méthodesinformatiques peuvent être utilisées pour éviter la ré<strong>du</strong>c-tion aux premiers principes. C<strong>et</strong> exposé décrit des tentativesd’utilisation d’intelligence informatique pour la reconnais-sance <strong>et</strong> la découverte de formes dans un assortiment de pro-blèmes biologiques dont l’espace de paramètres contient dela non-linéarité <strong>et</strong>/ou qui ont un grand nombre de solutionspossibles.Biological systems are inherently nonlinear. Onem<strong>et</strong>hod of understanding biological systems is tofirst re<strong>du</strong>ce this nonlinearity to linear relationshipsand apply standard statistical m<strong>et</strong>hods for modeldevelopment. When the underlying mechanics arelargely linear, these m<strong>et</strong>hods work very well. However,when the biology is vastly nonlinear, novelcomputational m<strong>et</strong>hods can be employed that avoidre<strong>du</strong>ction to first principles. This lecture describesefforts to use computational intelligence m<strong>et</strong>hodsfor pattern recognition and pattern discovery in anassortment of biological problems which containnonlinearity in feature space and/or have vast numberof possible solutions.[MS-92]Operons and the Quality of Predictions of Functional Interactions Using Phylogen<strong>et</strong>ic ProfilesLes opérons <strong>et</strong> la qualité des prévisions des interactions fonctionnelles en utilisant des profils phylogénétiquesGabriel MORENO-HAGELSIEB, Wilfrid Laurier University, Sarath JANGA, CCG-UNAMLes opérons se composent de gènes qui fonctionnent d’unefaçon reliée. Les profils phylogénétiques sont des vecteursdécrivant la présence ou l’absence d’un gène à travers d’unensemble de données de génome. Si deux gènes fonctionnentensemble, ils devraient être absents ou présents à travers desorganismes. Par conséquent, leurs profils phylogénétiquesdevraient être corrélés. Nous avons déterminé une valeurde confiance pour des prévisions d’opéron en utilisant desprofils phylogénétiques valides dans n’importe quel Proca-ryote. Un ensemble de données non redondant de génomesaugmente le nombre de prévisions à un niveau de confiancede 0,90 par un ratio moyen de 1,36. Les résultats montrentla puissance <strong>et</strong> l’importance des étalons positifs <strong>et</strong> négatifspour l’amélioration des prévisions en utilisant le contexte génomique.Operons are composed of functionally-relatedgenes. Phylogen<strong>et</strong>ic profiles are vectors describingthe presence/absence of a gene across a genomedatas<strong>et</strong>. If two genes work tog<strong>et</strong>her, they shouldbe both either absent or present across organisms.Thus, their phylogen<strong>et</strong>ic profiles should correlate.We devised a confidence value for operon predictionsusing phylogen<strong>et</strong>ic profiles valid in anyProkaryote. A non-re<strong>du</strong>ndant genome datas<strong>et</strong> increasesthe number of predictions at a confidencevalue of 0.90 by an average ratio of 1.36. The resultsshow the power and importance of positiveand negative gold standards for the improvementof predictions using genomic context.SH = Somerville House SSC = Social Science Centre UC = University College