24.06.2013 Views

Traitement automatique du signal ECG pour l'aide au diagnostic de ...

Traitement automatique du signal ECG pour l'aide au diagnostic de ...

Traitement automatique du signal ECG pour l'aide au diagnostic de ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

CHAPITRE 3. EFFET DU SOUS-ÉCHANTILLONNAGE 36<br />

3.4 Discussion<br />

Le cas 4 se détache clairement <strong>du</strong> lot, même à l’œil nu. Le test <strong>de</strong> Stu<strong>de</strong>nt <strong>de</strong><br />

supériorité confirme également qu’il est supérieur à tous les <strong>au</strong>tres cas envisagés.<br />

Il obtient en moyenne un BCR <strong>de</strong> 77,43% ce qui est supérieur <strong>au</strong>x résultats obtenus<br />

dans [17] (71,39%), mais inférieur à ceux <strong>de</strong> [1] (85,39%). Le nombre restreint<br />

<strong>de</strong> comparaison vient <strong>du</strong> fait que très peu d’articles utilisent un paradigme interpatient,<br />

et encore moins utilisent les standards <strong>de</strong> l’AAMI. Malheureusement, il<br />

a obtenu une fois sur les vingt un BCR <strong>de</strong> 43,40% ce qui peut sans doute venir<br />

<strong>de</strong> plusieurs sources : soit K le nombre <strong>de</strong> battements <strong>de</strong> classe N gardés avait<br />

une valeur extrême, soit le clustering a convergé vers un minimum local cette<br />

fois-là, soit le problème a sur-appris lors <strong>de</strong> l’étape <strong>de</strong> ré<strong>du</strong>ction <strong>de</strong> dimension,<br />

soit une combinaison <strong>de</strong>s trois. K avait une valeur très moyenne (2477 sachant<br />

qu’il <strong>de</strong>vait être compris entre 412 et 3783). L’étape <strong>de</strong> sélection <strong>de</strong> variables<br />

n’a pas gardé plus ou moins <strong>de</strong> variables que <strong>pour</strong> les 19 <strong>au</strong>tres expériences (11<br />

alors que les <strong>au</strong>tres varient entre 9 et 18). C’est donc soit dû à une m<strong>au</strong>vaise<br />

convergence <strong>du</strong> clustering, soit dû à une sombre combinaison insondable. Certaines<br />

techniques existent <strong>pour</strong> prévenir d’une m<strong>au</strong>vaise convergence lors d’un<br />

clustering et mériteraient d’être appliquées. Il y a <strong>au</strong> moins <strong>de</strong>ux manières <strong>de</strong><br />

faire : soit initialiser plus intelligement les clusters par <strong>de</strong>s techniques heuristiques,<br />

soit relancer le clustering plusieurs fois avec une initialisation aléatoire<br />

différente et choisir celle qui revient le plus souvent, ou la meilleure <strong>au</strong> sens d’un<br />

critère, ou encore moyenner. Evi<strong>de</strong>mment, cela con<strong>du</strong>it à une étape <strong>de</strong> clustering<br />

encore plus longue. F<strong>au</strong>te <strong>de</strong> temps, ces pistes n’ont pas pu être investiguées.<br />

Les techniques « On The Fly » sont peut être utiles <strong>pour</strong> effectuer un « préclustering<br />

» , mais sont moins performantes que le clustering. On peut expliquer<br />

cela par le fait que dans le clustering, un outlier va peut-être influencer celui-ci,<br />

mais a très peu <strong>de</strong> chances d’émerger en tant que centroï<strong>de</strong> (après recentrage).<br />

Dans les techniques OTF par contre, les outliers seront gardés d’office.<br />

Deux jeux <strong>de</strong> battements ont été utilisés : ceux <strong>de</strong> longueur constante (cas<br />

1 à 6) et ceux <strong>de</strong> longueurs non-constantes (cas 7 à 10). Les expériences ne<br />

permettent pas <strong>de</strong> conclure qu’un jeu est meilleur que l’<strong>au</strong>tre. Par contre, le<br />

cas 4 étant meilleur que tous les <strong>au</strong>tres, nous continuerons uniquement avec les<br />

battements <strong>de</strong> longueur constante.<br />

Il est intéressant <strong>de</strong> remarquer que le LDA pondéré obtient systématiquement<br />

un meilleur score que sa version non pondérée, ce qui prouve son utilité.<br />

Par contre, son action n’est pas optimale, et ne permet pas <strong>de</strong> surpasser le<br />

problème <strong>du</strong> déséquilibre seul. L’utilisation simultanée <strong>du</strong> clustering et <strong>de</strong> la<br />

pondération <strong>de</strong> l’algorithme <strong>de</strong> classification donne <strong>de</strong>s meilleurs résultats que<br />

ceux obtenus si on les utilise séparément. Dans la suite, nous gar<strong>de</strong>rons les expériences<br />

1 à 4 comme base, car elles permettent <strong>de</strong> comparer les métho<strong>de</strong>s <strong>de</strong><br />

base (cas 1), l’utilisation <strong>du</strong> clustering seul (cas 3), l’utilisation <strong>de</strong> la modification<br />

d’algorithme (cas 2) et la synergie <strong>de</strong>s <strong>de</strong>ux (cas 4).

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!