02.07.2013 Views

comptes-rendus des séances - Savoirs Textes Langage - Lille 3

comptes-rendus des séances - Savoirs Textes Langage - Lille 3

comptes-rendus des séances - Savoirs Textes Langage - Lille 3

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

(il n’y a pas de raisons sérieuses de croire que notre intelligence échappe aux limitations<br />

formulées par la logique) mais elle est bien meilleure que celle que nous réussissons à placer<br />

dans nos programmes : aujourd’hui nous ne savons pas écrire <strong>des</strong> programmes assez malins<br />

pour égaler notre capacité à percevoir <strong>des</strong> analogies (figure 10).<br />

FIG. 10 – Bien sûr la ressemblance entre ces images échappe aussi bien à la distance de<br />

Hausdorff qu’à la distance informationnelle.<br />

7. Utilité pratique de la distance informationnelle<br />

L’indécidabilité rend-t-elle stérile la distance informationnelle ? Heureusement non, car<br />

les majorations que l’on peut calculer facilement la rendent utilisable dans plusieurs cas.<br />

Un domaine d’application de la distance informationnelle est la bioinformatique (M. Li<br />

et al., 2001) ; (M. Li et al., 2003) ; (J.-S. Varré et al., 1999) où elle sert à évaluer la distance<br />

entre séquences génétiques. Depuis longtemps les généticiens, et tout particulièrement<br />

ceux qui souhaitent faire de la reconstitution d’arbres phylogénétiques (ce sont les arbres qui<br />

indiquent les parentés entre espèces animales et végétales) utilisent <strong>des</strong> mesures de ressemblance<br />

entre séquences génétiques. L’idée à la base <strong>des</strong> distances les plus souvent utilisées<br />

est le décompte <strong>des</strong> mutations, délétions ou insertions de nucléoti<strong>des</strong> (les lettres de l’alphabet<br />

génétique) : plus le nombre de ces événements ponctuels pour passer d’une séquence<br />

à l’autre est grand plus les séquences sont considérées comme éloignées. Récemment, de<br />

nouvelles distances ont été proposées qui mesurent l’éloignement entre séquences en considérant<br />

d’autres événements possibles, comme les déplacements de morceaux de séquences<br />

ou leur duplication. Ces distances sont conçues comme <strong>des</strong> approximations calculables de la<br />

distance informationnelle. Elles sont plus précises que les distances utilisées classiquement<br />

(qu’elles généralisent) et produisent <strong>des</strong> arbres phylogénétiques intéressants. Une autre application<br />

est le classement automatique <strong>des</strong> langues : un arbre <strong>des</strong> langues a été obtenu par<br />

cette méthode (voir (M. Li et al., 2003)).<br />

52

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!