comptes-rendus des séances - Savoirs Textes Langage - Lille 3
comptes-rendus des séances - Savoirs Textes Langage - Lille 3
comptes-rendus des séances - Savoirs Textes Langage - Lille 3
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
(il n’y a pas de raisons sérieuses de croire que notre intelligence échappe aux limitations<br />
formulées par la logique) mais elle est bien meilleure que celle que nous réussissons à placer<br />
dans nos programmes : aujourd’hui nous ne savons pas écrire <strong>des</strong> programmes assez malins<br />
pour égaler notre capacité à percevoir <strong>des</strong> analogies (figure 10).<br />
FIG. 10 – Bien sûr la ressemblance entre ces images échappe aussi bien à la distance de<br />
Hausdorff qu’à la distance informationnelle.<br />
7. Utilité pratique de la distance informationnelle<br />
L’indécidabilité rend-t-elle stérile la distance informationnelle ? Heureusement non, car<br />
les majorations que l’on peut calculer facilement la rendent utilisable dans plusieurs cas.<br />
Un domaine d’application de la distance informationnelle est la bioinformatique (M. Li<br />
et al., 2001) ; (M. Li et al., 2003) ; (J.-S. Varré et al., 1999) où elle sert à évaluer la distance<br />
entre séquences génétiques. Depuis longtemps les généticiens, et tout particulièrement<br />
ceux qui souhaitent faire de la reconstitution d’arbres phylogénétiques (ce sont les arbres qui<br />
indiquent les parentés entre espèces animales et végétales) utilisent <strong>des</strong> mesures de ressemblance<br />
entre séquences génétiques. L’idée à la base <strong>des</strong> distances les plus souvent utilisées<br />
est le décompte <strong>des</strong> mutations, délétions ou insertions de nucléoti<strong>des</strong> (les lettres de l’alphabet<br />
génétique) : plus le nombre de ces événements ponctuels pour passer d’une séquence<br />
à l’autre est grand plus les séquences sont considérées comme éloignées. Récemment, de<br />
nouvelles distances ont été proposées qui mesurent l’éloignement entre séquences en considérant<br />
d’autres événements possibles, comme les déplacements de morceaux de séquences<br />
ou leur duplication. Ces distances sont conçues comme <strong>des</strong> approximations calculables de la<br />
distance informationnelle. Elles sont plus précises que les distances utilisées classiquement<br />
(qu’elles généralisent) et produisent <strong>des</strong> arbres phylogénétiques intéressants. Une autre application<br />
est le classement automatique <strong>des</strong> langues : un arbre <strong>des</strong> langues a été obtenu par<br />
cette méthode (voir (M. Li et al., 2003)).<br />
52