compression d'images appliquee aux angiographies cardiaques

N° d’ordre 97 ISAL 0107 Année 1997 

THESE 

Présentée 

DEVANT L’INSTITUT NATIONAL DE SCIENCES 

APPLIQUEES DE LYON 

pour obtenir 

LE GRADE DE DOCTEUR 

FORMATION DOCTORALE: GENIE BIOLOGIQUE ET MEDICAL 

ECOLE DOCTORALE DES SCIENCES POUR L’INGENIEUR DE LYON: Electronique, 

Electrotechnique, Automatique 

PAR 

PATRICIA BEAUREPAIRE, EPOUSE BERETTA 

Ingénieur de l’Université de Technologie de Compiègne 

Génie Biologique et Médical - Promotion 1987 

COMPRESSION D’IMAGES APPLIQUEE AUX 

ANGIOGRAPHIES CARDIAQUES: 

ASPECTS ALGORITHMIQUES, 

EVALUATION DE LA QUALITE DIAGNOSTIQUE 

Soutenue le 21 novembre 1997 devant la commission d’examen 

Jury: 

Pr M. Amiel 

Pr D. Barba Rapporteur 

Pr M. Bertrand Rapporteur 

Pr R. Goutte 

Dr H. Haas 

Pr. M. Lamure Rapporteur 

Pr. R. Prost Directeur de thèse

REMERCIEMENTS 

Le présent travail n’a pu aboutir que grâce au soutien et à l’aide d’un nombre conséquent de 

personnes que j’ai eu la chance de trouver sur mon parcours depuis 1991. 

Tout a commencé par la compréhension de mes motivations par deux personnes, au même 

moment et dans des contextes différents. 

• Monsieur le Professeur Amiel, codirecteur du Laboratoire CREATIS à Lyon (alors appelé 

LTSU), a tout de suite accepté de m’aider à trouver un cadre pour un DEA et une thèse. Je 

lui suis reconnaissante de m’avoir ouvert les portes de ses équipes de recherche. 

• Monsieur Vandelle, de la Société Philips Systèmes Médicaux à Paris, a soutenu ma 

transition entre une fonction technico-commerciale et des investigations cliniques et 

scientifiques. Il a réalisé que le fil conducteur était l’imagerie médicale, en faisant évoluer 

mon centre d’intérêt de l’utilisateur au concepteur. Je le remercie d’avoir initié les 

démarches qui m’ont conduite à participer à un projet de recherche au sein des structures 

internationales de Philips Medical Systems (PMS) en Hollande, et qui ont permis la mise en 

place d’une convention Cifre. 

Une convention Cifre comprend trois partenaires: un laboratoire universitaire, un industriel, et 

un étudiant en thèse. 

• Le laboratoire universitaire est le laboratoire CREATIS, abrité par l’INSA de Lyon et par 

l’Hôpital Neuro-Cardiologique de Lyon. Je remercie les Professeurs Amiel et Goutte pour 

leur accueil dans leur laboratoire, pour leur participation à de nombreuses discussions sur 

mon travail, et pour leur participation à mon jury de thèse. 

• L’industriel est la Société Philips Systèmes Médicaux, dont le siège français est à Paris. Je 

remercie Monsieur Philippe Soly pour son soutien continu et le lien qu’il m’a permis de 

garder avec la société, tout en étant basée dans un autre contexte. Le Docteur Hein Haas, 

a été le coordinateur, depuis la Hollande, du projet PMS de compression. Je lui dois une 

grande partie de mes progrès au cours de ces années, grâce à son talent pour gérer un 

projet complexe, à son soutien logistique, à sa rigueur pour atteindre les objectifs fixés, aux 

contacts internationaux dont il m’a fait bénéficier, et grâce au temps et aux conseils 

consacrés à mes travaux. 

• Il est inutile de présenter l’étudiant(e) en thèse. Mais une thèse est peu de chose sans un 

bon directeur de thèse. Je tiens à exprimer ma sincère gratitude au Professeur Rémy Prost 

pour avoir encadré mon DEA et ma thèse. Sa créativité scientifique m’a constamment 

gardée en éveil. Il m’a beaucoup apporté tant au niveau théorique (il faut dire qu’il y avait du 

chemin à parcourir!), qu’au niveau de soutiens concrets pour faire avancer mes travaux.

Je tiens à exprimer ma reconnaissance à Monsieur le Professeur Dominique Barba, de 

l’IRESTE à Nantes, 

et à Monsieur le Professeur Michel Lamure, de l’URA 394, Université Claude Bernard de Lyon 

pour avoir bien voulu s’intéresser à ce travail et en être les rapporteurs. 

Je suis particulièrement heureuse que Monsieur le Professeur Michel Bertrand, de l’Hôpital 

Cardiologique de Lille, ait accepté de me faire bénéficier de son ultime soutien en étant 

rapporteur. Je garde une nostalgie de mon séjour de deux ans dans son Service 

d’Hémodynamique, à cause de l’ambiance de travail, la gentillesse et l’efficacité que j’y ai 

trouvées. 

A l’équipe de l’Hôpital Cardiologique de Lyon: 

Ricardo Roriz et Guy Durand de Gévigné pour m’avoir initiée à la coronarographie et avoir 

contribué aux idées de bases des protocoles d’évaluation, 

Gérard Finet, Thierry Moll. 

Et au collègues du B13: Claire Baldy, Emmanuelle Canet, Christian Renaudin, Ferial Tlemsani, 

A Renée. 

A l’équipe de Creatis: 

Bernard et Daniel pour le temps passé sur mes problèmes informatiques, 

Atilla Baskurt, Olivier Baudin, Hugues Benoît Catin, Christophe Odet, Marc Robini, Nicolas 

Rougnon-Glasson et tous ceux qui m’ont donné des coups de main. 

A “la grand famille” du Centre Hémodynamique de Lille: 

Merci de m’avoir si chaleureusement accueillie, de m’avoir autant aidée et fait rire. 

A Eric van Belle pour sa participation en tant qu’observateur de l’évaluation diagnostique, 

à Eugène Mac Fadden pour tout ce temps passé à améliorer le contenu et la langue de mes 

rédactions en anglais, 

à Christophe Bauters, au Pr Jean Marc Lablanche, 

à Michel, Jean Philippe pour le temps passé avec mes fichiers ou mes photos et à Jean Paul 

pour son aide avec le prototype de CD 

et à Catherine, Claudine, Sylvette, et toute l’équipe 

Many thanks to the compression project team : 

Paul Zwart from, Philips Medical Systems X-ray Pre-development, who untiringly provided 

tapes, tools, time, ideas and logic to support me from beginning and after the end. 

Hein Haas, who is invited to read my warm French comments earlier in these 

acknowledgments. 

Marcel Breeuwer, Richard Heusdens, René Klein Gunnewick, Peter van Otterloo, from Philips 

Research, for sharing so much of their knowledge. 

I am grateful to the Hermann/UT team of Houston for their participation in the compression 

evaluation study. 

I was honored that Professor Gould, Smalling, Anderson and Schroth accepted to participate in 

the reading sessions, and gave their valuable advice on the study. 

It has been a chance for me to work with Professor Richard Kirkeeide. Many thanks for all the 

efforts to meet the schedule with viewing sessions, and for the lengthy discussions. 

I have been privileged to be associated with the LKEB for the QCA evaluation. I am grateful to 

Professor Hans Reiber and Doctor Gerald Koning for their support and valuable work. 

Je voudrais exprimer mes sincères remerciements à Monsieur le Professeur Adeleine, du 

Laboratoire d’Informatique Médicale des Hospices Civils de Lyon, pour m’avoir offert son

temps, ses explications et m’avoir aidée dans mes analyses de données. Cette aide a été 

d’une grande valeur ajoutée. Merci à Madame Canova. 

Many thanks to my current colleagues, who brought their little touch to this work: 

Ruud ten Caat, Ruud Weterings, Tim Beuman and my colleagues from Philips Medical 

Systems CardioVascular in Best. 

A tous mes amis, et à Odile qui a suivi de près le feuilleton de la thèse. 

A tous ceux que je n’ai pas cités ici et que j’ai rencontrés pendant ce travail.

Enfin, je dois tout à ma famille qui m’a soutenue dans tous mes efforts. 

A mes parents, mon meilleur tremplin dans la vie. 

A ma grand-mère dont je suis fière. 

Aux quatre générations qui tissent leurs liens. 

A mes beaux-parents, à qui ce nom convient à merveille. 

A tous mes proches, 

Pour qu’ils ne leur vienne jamais l’idée de comprimer 

les images de coeur qu’ils ont dans la tête 

A Yves, 

et à son prochain succès 

ce travail lui est dû 

cette thèse lui est dédiée

ENGLISH SUMMARY 

Image compression is key for archiving and communication of digital cardiac angiograms. 

We studied some algorithm aspects of a compression technique adapted to such images, and validated the 

diagnostic quality of compressed images. 

In a compression scheme based on the Discrete Cosine Transform, we focused on two topics: 

- the adaptivity and robustness of scalar quantizers, 

- the effect of post-processing in combination with compression. 

These algorithmic problems are general and can be applied to other compression methods. 

It is not possible to validate the diagnostic quality of compressed medical images based on mathematics 

parameters. An evaluation with medical experts is needed. 

We present experiments in which the diagnostic quality of three compression techniques were assessed with a 

compression ratio of 12:1: the JPEG standard, the MPEG standard, and a dedicated method developed in Philips 

Laboratories, the so-called MLOT. We assessed visual interpretation and quantitative analysis performed on noncompressed 

and compressed images from patient studies. 

We found that the observer variability of visual interpretation and of quantitative analysis is not statistically 

significantly modified by compression. In our experimental conditions, compression does not significantly alter the 

diagnostic quality. 

Our results are very promising. They show that image compression is acceptable for the clinical work. There is a 

vast field of applications for the compression of cardiac angiograms. Either dedicated algorithms can be developed 

and optimum results can be reached; or standard algorithms can be applied. Clinical evaluations are key to 

determine the boundaries within which any compression method can be used for medical applications. 

RESUME EN FRANCAIS 

La compression d'images avec perte présente aujourd'hui un intérêt majeur pour l'archivage et la communication 

des angiographies cardiaques. 

Notre travail porte sur les aspects algorithmiques d'une technique de compression adaptée à cette modalité 

d'imagerie médicale, et sur la validation de la qualité diagnostique d'images comprimées. 

Dans un schéma de compression à base de la transformation cosinus discrète de l’image (Full-Frame DCT) nous 

avons principalement étudié deux aspects : l'adaptivité et la robustesse de la quantification scalaire des coefficients 

du plan de le DCT d'une part, et la prise en compte de post traitements d'autre part. 

Ces deux aspects algorithmiques ont une portée générale, ils sont applicables à d'autres méthodes de 

compression. 

La validation de la qualité diagnostique d'images médicales comprimées ne peut pas être, actuellement, basée sur 

des paramètres mathématiques, mais uniquement sur une évaluation par des experts médicaux. 

Nous avons conduit des campagnes d'évaluation de la qualité diagnostique avec trois méthodes de compression à 

un taux maximum de 12:1 : le standard JPEG, le standard MPEG, et MLOT, une méthode dédiée développée par 

les laboratoires Philips. 

Nous avons pu observer que, dans les conditions définies ci-dessus, la compression n’augmente pas la variabilité 

des interprétations visuelles et des mesures quantitatives de façon statistiquement significative. Dans nos 

conditions expérimentales, la qualité diagnostique de l’image comprimée est préservée . 

Globalement, les résultats de ces expériences sont très prometteurs car ils attestent que la compression est 

acceptable pour le travail du clinicien. Il existe un vaste champ d'applications de la compression pour les 

angiographies cardiaques en développant des algorithmes dédiés supérieurs aux standards, en identifiant à l’aide 

d’évaluations cliniques les limites d’application de des algorithmes standards ou dédiés.

TABLE DES MATIERES 

REMERCIEMENTS............................................................................................................. 8 

INTRODUCTION............................................................................................................... 18 

CADRE DE TRAVAIL ....................................................................................................... 24 

PARTIE I : COMPRESSION D'ANGIOGRAPHIES CARDIAQUES : 

PROBLEMES ALGORITHMIQUES ET ILLUSTRATION AVEC LA FULL-FRAME 

DCT 29 

CHAPITRE I-1 ETUDE BIBLIOGRAPHIQUE DES METHODES DE COMPRESSION 

D'IMAGES ................................................................................................................. 30 

1. Généralités sur la compression d'images ................................................................. 31 

1.1. Contraintes et applications d'un système de compression............................ 31 

1.2. Mesures de performance............................................................................... 32 

1.2.1. Taux de compression..................................................................... 32 

1.2.2.Entropie .......................................................................................... 32 

1.3. Mesures de distorsion ................................................................................... 33 

2. Principales méthodes de compression d'image........................................................ 34 

2.1. Classification des méthodes de compression ............................................... 34 

2.1.1. Méthodes avec ou sans perte........................................................ 34 

2.1.2. Méthodes par pixels, groupes de pixels, ou image entière ............ 34 

2.1.3. Méthodes intra- et inter- images .................................................... 34 

2.1.4. Méthodes adaptives, non adaptives .............................................. 35 

2.1.5. Méthodes spatiales et méthodes par transformation ..................... 35 

2.2. Méthodes sans perte..................................................................................... 45 

2.2.1. Méthodes différentielles et prédictives........................................... 35 

2.2.2. Méthodes par plages (Runlength coding) ...................................... 36 

2.2.3. Codeurs entropiques...................................................................... 36 

2.2.4. Méthodes par dictionnaire adaptif (Lempel-Ziv)............................. 38 

2.2.5. Codage arithmétique...................................................................... 38 

2.3. Méthodes avec pertes ................................................................................... 39 

2.3.1. Sous-échantillonnage .................................................................... 39 

2.3.2. Quantification scalaire.................................................................... 39 

2.3.3. Quantification vectorielle................................................................ 39 

2.3.4. Méthodes par transformation......................................................... 40 

2.3.5. Codage sous-bandes..................................................................... 44 

2.3.6. Ondelettes ..................................................................................... 45 

2.4. Autres méthodes ........................................................................................... 45 

2.4.1. Méthodes par contour.................................................................... 45 

2.4.2. Méthodes texturales....................................................................... 45 

2.4.3. Fractales ........................................................................................ 46 

2.5. Standard pour les images fixes : JPEG......................................................... 46 

2.5.1. Principes généraux ........................................................................ 46 

2.5.2. Descriptif résumé et illustré de l'algorithme JPEG avec perte ....... 46 

2.6. Standard pour séquences d'images : MPEG................................................. 50 

2.6.1. Principes généraux ........................................................................ 50

2.6.2. Descriptif résumé de l'algorithme MPEG ....................................... 51 

2.6.3. Principaux artéfacts ....................................................................... 52 

2.7. Méthode développée par Philips : MLOT ...................................................... 53 

CHAPITRE I-2 GENERALITES SUR LES IMAGES MEDICALES ET ANGIOGRAPHIQUES : 

ACQUISITION, COMPRESSION ET STANDARDISATION..................... 56 

1. Compression des images médicales ........................................................................ 57 

1.1. Tendance en radiologie................................................................................. 57 

1.2. Tendance en cardiologie ............................................................................... 58 

2. Standards d'images médicales ................................................................................. 59 

2.1. Pourquoi un standard .................................................................................... 59 

2.2. Historique des standards ACR-NEMA et DICOM.......................................... 59 

2.3. DICOM et la compression ............................................................................. 59 

3. Standards médicaux et standards industriels ........................................................... 60 

4. Principe et particularité de l'angiographie cardiaque................................................. 61 

5. Quelques propriétés des images d'angiographies cardiaques.................................. 63 

CHAPITRE I-3 ALLOCATION DES BITS DANS LA TECHNIQUE FULL FRAME DCT .. 67 

1. Introduction ............................................................................................................... 68 

2. Coding of the DCT Coefficients ................................................................................ 69 

2.1. Full Frame DCT coding scheme.................................................................... 69 

2.2. Normalized DCT coefficents.......................................................................... 70 

2.3. Zonal splitting of the DCT plane .................................................................... 70 

2.4. Uniform optimal quantizer.............................................................................. 72 

2.5. Integer bit allocation ...................................................................................... 74 

2.6. Coding of the quantized DCT coefficients ..................................................... 75 

3. Experimental results and discussion......................................................................... 75 

3.1. Experiments................................................................................................... 75 

3.2. Discussion ..................................................................................................... 76 

3.3. Perspectives .................................................................................................. 78 

4. Conclusion ................................................................................................................ 78 

CHAPITRE I-4 COMPRESSION FULL FRAME DCT ET RENFORCEMENT DE CONTOUR 

80 

1. Introduction ............................................................................................................... 82 

2. Should the raw image or the processed image be compressed? ............................. 82 

2.1. Edge enhancement filtering of digital cardiac angiograms ............................ 82 

2.2. Edge enhancement after data compression.................................................. 84 

2.3. Edge enhancement before data compression............................................... 84 

2.4. integration of the edge enhancement in the compression / 

decompression process................................................................................. 85 

2.5. Integration of de-enhancement in the decompression scheme .................. 

by inverse filtering.......................................................................................... 86 

2.6. Improvement of the de-enhancement of compressed images .................... 

by regularization ............................................................................................ 86 

3. Full Frame DCT coding and directional quantization ................................................ 88 

3.1. Block Diagram ............................................................................................... 88 

3.2. Full Frame DCT and zonal splitting ............................................................... 88 

3.3. Bit allocation, quantization and coding .......................................................... 89 

4. Experimental results and discussion......................................................................... 90 

4.1. Results from simulations of the compression ................................................ 90 

4.2. Results on coded images .............................................................................. 91 

5. Conclusion ................................................................................................................ 93

CHAPITRE I-5 ETUDE THEORIQUE DE LA ROBUSTESSE DU QUANTIFICATEUR 

UNIFORME OPTIMUM ........................................................................... 96 

1. Introduction ............................................................................................................... 97 

2. Matched uniform quantizers with generalized Gaussian distributions....................... 99 

2.1. Notation ......................................................................................................... 99 

2.2. Mean Square Error of uniform quantizers with GG pdf................................ 100 

2.3. Minimum-MSE uniform quantizer ................................................................ 103 

2.4. Entropy of uniform quantizers with GG pdf.................................................. 105 

2.5. Entropy-constrained uniform quantizer with GG pdf.................................... 107 

3. Mismatched uniform quantizers .............................................................................. 109 

3.1. Mismatched relative to the shape................................................................ 109 

3.1.1. Minimum-MSE uniform quantizers............................................... 110 

3.1.2. Entropy-constrained uniform quantizers ...................................... 111 

3.2. Mismatch relative to the variance ................................................................ 112 

3.2.1. Minimum-MSE uniform quantizers............................................... 112 

3.2.2. Entropy-constrained uniform quantizers ...................................... 114 

4. Discussion and conclusion...................................................................................... 114 

CHAPITRE I-6 APPLICATION DE L'ETUDE DE LA ROBUSTESSE DU 

QUANTIFICATEUR UNIFORME A LA COMPRESSION D'IMAGES PAR 

FULL-FRAME-DCT ................................................................................ 116 

1. Introduction ............................................................................................................. 117 

2. Ensemble d'images test.......................................................................................... 117 

3. Méthode de compression........................................................................................ 118 

3.1. FFDCT......................................................................................................... 118 

3.2. Découpage circulaire................................................................................... 118 

3.3. Evaluation des paramètres de la distribution des régions ........................... 119 

3.4. Allocation marginale et quantificateur ‘midtread’ uniforme .......................... 122 

3.5. Calcul du taux de compression ................................................................... 122 

4. Résultats ............................................................................................................... 122 

4.1. Apport du quantificateur optimisé par rapport au quantificateur 

non optimisé ................................................................................................ 122 

4.2. Vérification de la stabilité des caractéristiques statistiques des images 

d'une même séquence associée à la robustesse du quantificateur. ........... 125 

4.3. Quantificateur modélisé à partir d'un ensemble d'images : 

effet de la non-adaptation............................................................................ 126 

5. Discussion............................................................................................................... 130 

CHAPITRE I-7 CONCLUSION DE LA PARTIE COMPRESSION .................................. 131 

PARTIE II : EVALUATION DE LA QUALITE D'ANGIOGRAPHIES CARDIAQUES 

COMPRIMEES...........................................................................................136 

CHAPITRE II-1 ETUDE BIBILOGRAPHIQUE DES METHODES D'EVALUATION D'IMAGES 

COMPRIMEES ET PROPOSITION D'UNE NOUVELLE APPROCHE ADAPTEE 

AUX EXAMENS ANGIOGRAPHIQUES ................................................. 137 

1. Bibliographie sur l'évaluation d'images comprimées............................................... 138 

1.1. Introduction.................................................................................................. 138 

1.2. Liste des principales méthodes d'évaluation ............................................... 138 

1.3. Quantification objective de la qualité par mesures de type SNR................. 139

1.4. Appréciation visuelle subjective de la qualité d'image ................................. 139 

1.5. Indices diagnostics de la performance du couple observateur/test 

diagnostic ...................................................................................................... 141 

1.5.1. Notion de "gold standard" ............................................................ 141 

1.5.2. Indices diagnostics : sensibiliité, spécificité, PVP, PVN............... 141 

1.6. Fidilité diagnostique par la méthode ROC................................................... 142 

1.6.1. Historique..................................................................................... 142 

1.6.2. Principe........................................................................................ 143 

1.6.3. Etudes de compression d'images radiologiques à base 

de méthode ROC......................................................................... 145 

1.7. Fidélité diagnostique par d'autres méthodes ............................................... 145 

2. Protocole expérimental de nos évaluations diagnostiques ..................................... 146 

2.1. Choix du type d'examen .............................................................................. 146 

2.2. Tâche diagnostique ..................................................................................... 147 

2.2.1. Tâche d'interprétation visuelle uniquement.................................. 147 

2.2.2. Ventriculographie......................................................................... 147 

2.2.3. Coronarographie.......................................................................... 149 

2.3. Protocole expérimental................................................................................ 152 

3. Principaux outils statistiques utilisés ....................................................................... 153 

3.1. Méthodologie basée sur la concordance..................................................... 153 

3.1.1. Type de concordances évaluées ................................................. 153 

3.1.2. Reproductibilité des observateurs dans l'interprétation ................ 

de coronarographies..................................................................... 154 

3.2. Estimation statistique de la concordance .................................................... 155 

3.2.1. Concordance par test de kappa................................................... 155 

3.2.2. Coefficient de corrélation de concordance de Lin........................ 156 

3.2.3.Graphiques des différences en fonction des moyennes ............... 159 

3.2.4. Analyse de la variance................................................................. 159 

CHAPITRE II-2 PREMIERE ETUDE D'EVALUATION DIAGNOSTIQUE ....................... 161 

1. Introduction ............................................................................................................. 162 

2. Materials & methods ............................................................................................... 163 

2.1. Patient selection .......................................................................................... 163 

2.2. Image selection ........................................................................................... 163 

2.3. Image processing ........................................................................................ 163 

2.4. Observers and viewing sessions ................................................................. 164 

2.5. Diagnostic task ............................................................................................ 165 

3. Statistical analysis................................................................................................... 165 

3.1. Introduction.................................................................................................. 165 

3.2. Analysis of the LV interpretations ................................................................ 165 

3.3. Analysis of the coronary angiogram interpretations..................................... 166 

4. Results ............................................................................................................... 166 

4.1. Image quality judgements............................................................................ 166 

4.2. Left ventricle interpretations ........................................................................ 167 

4.2.1. Introduction .................................................................................. 167 

4.2.2. Inter-observer agreement ............................................................ 167 

4.2.3. Intra-observer agreement ............................................................ 169 

4.3. Coronary arteriogram interpretations........................................................... 170 

4.3.1. A score for coronary branches..................................................... 170 

4.3.2. Inter-observer agreement ............................................................ 171 

4.3.3. Intra-observer agreement ............................................................ 172 

5. Conclusion .............................................................................................................. 173 

CHAPITRE II-3 DEUXIEME ETUDE D'EVALUATION DIAGNOSTIQUE ....................... 175

1. Introduction ............................................................................................................. 176 

2. Methods ............................................................................................................... 177 

2.1. Angiography ................................................................................................ 177 

2.2. Images......................................................................................................... 178 

2.2.1. Images selection and transfer...................................................... 178 

2.2.2. Image treatments......................................................................... 178 

2.2.3. Film review................................................................................... 179 

2.3. Data collected during review........................................................................ 179 

2.3.1. Segment classification ................................................................. 179 

2.3.2. Scoring sheet............................................................................... 180 

2.4. Data analysis ............................................................................................... 180 

3. Results ............................................................................................................... 181 

3.1. Ventriculograms........................................................................................... 181 

3.1.1. Side by side comparisons (O-J-L)................................................ 181 

3.1.2. LV-gram quality and docs comments on perceptual quality......... 182 

3.1.3. Location of LV abnormalities ....................................................... 182 

3.1.4. Distribution of abnormalities per image treatment ...................... 183 

3.1.5. Agreement tables......................................................................... 183 

3.2. Arteriograms ................................................................................................ 184 

3.2.1. Side by side comparison (O-J-L) ................................................. 184 

3.2.2. Coronary arteriograms quality and comments ............................. 185 

3.2.3. Location of coronary arteries abnormalities ................................. 185 

3.2.4. Distribution of abnormalities per image treatment ....................... 186 

3.2.5. Differences of scores between image treatments........................ 186 

4. Discussion............................................................................................................... 188 

4.1. Major findings .............................................................................................. 188 

4.2. Discussion of issues related to the method ................................................. 189 

4.2.1. Interpretation of complete cases.................................................. 189 

4.2.2. Gold standard .............................................................................. 189 

4.2.3. Variability of observers' visual interpretation................................ 189 

4.3. Need for complementary studies................................................................. 190 

CHAPITRE II-4 MESURES QUANTITATIVES SUR LES IMAGES COMPRIMEES....... 191 

1. Etude bibliographique des méthodes d'analyse quantitative des coronaires.......... 192 

1.1. Brève description de l'analyse quantitative.................................................. 192 

1.2. Historique .................................................................................................... 192 

1.3. Système QCA des appareils Philips............................................................ 192 

1.4. Precision et limitations du système ............................................................. 194 

2. Méthodes pour tester un système QCA.................................................................. 195 

3. Travaux de la littérature sur la QCA avec compression.......................................... 195 

4. Méthode de notre étude de QCA appliquée sur des images comprimées.............. 196 

4.1. Protocole expérimental................................................................................ 196 

4.2. Valeurs mesurées et analysées .................................................................. 197 

5. Résultats ............................................................................................................... 198 

5.1. Comparaisons inter-compression................................................................ 198 

5.1.1.Graphes des différences par rapport aux moyennes.................... 198 

5.1.2. Coefficient de concordance de Lin .............................................. 200 

5.2. Comparaisons intra-compression................................................................ 202 

5.2.1. Graphes des différences par rapport aux moyennes................... 202 

5.2.2. Coefficients concordance de Lin.................................................. 205 

5.2.3. Coefficient de variations............................................................... 205 

5.3. Analyse de la variance ................................................................................ 206 

6. Discussion............................................................................................................... 208

6.1. Résultats des analyses de données............................................................ 208 

6.2. Aspects méthodologiques du protocole expérimental ................................. 209 

6.3. Robustesse de la QCA à la compression.................................................... 209 

7. Conclusion .............................................................................................................. 209 

CHAPITRE II-5 CONCLUSION DE LA PARTIE EVALUATION ..................................... 210 

1. Objet des évaluations ............................................................................................. 211 

2. Qualité subjective.................................................................................................... 211 

2.1. Comparaison de JPEG, MPEG et MLOT .................................................... 211 

2.2. Visibilité de la présence de la compression selon les observateurs............ 211 

2.3. Effet des post-traitements ........................................................................... 212 

3. Evaluations diagnostiques ...................................................................................... 212 

3.1. Conditions expérimentales .......................................................................... 212 

3.2. Méthode statistique et variabilité des observateurs..................................... 212 

3.3. Principaux résultats ..................................................................................... 213 

4. Evaluation QCA ...................................................................................................... 213 

5. Perpectives ............................................................................................................. 214 

BILAN ET PERSPECTIVES ........................................................................................... 215 

REFERENCES BIBLIOGRAPHIQUE ............................................................................. 219 

ANNEXE ............................................................................................................... 229 

Questionnaires diagnostics des évaluations

INTRODUCTION 

- 13 -

- 14 -

Problématique liée au remplacement du ciné-film 

Ce travail s'inscrit dans la perspective du remplacement du film de radio-cinéma, actuel support 

universel pour la visualisation et l'archivage des angiographies cardiaques, par un support 

entièrement numérique. 

L'angiographie cardiaque est une modalité d'imagerie cardiaque à base de rayons X qui permet 

de visualiser les cavités et les vaisseaux du cœur. Au cours d'un examen, un cathéter est 

introduit en général depuis l'aine et amené par le réseau vasculaire jusqu'aux ventricules ou à 

l'ostium (embouchure) des artères coronaires. D'où le nom de cathétérisme cardiaque donné à 

l'ensemble de cette procédure. Un produit de contraste opaque aux rayons X est injecté 

sélectivement alors qu'une séquence d'images est réalisée. On visualise ainsi l'anatomie de 

cavités et artères du cœur, tout en évaluant leur dynamique. On recherche principalement des 

défauts de contraction du ventricule gauche, et des rétrécissements ou sténoses des artères 

coronaires. 

L'angiographie cardiaque reste un examen invasif, pratiqué en dernier lieu pour compléter une 

série de tests afin de confirmer ou de poser un diagnostic et une thérapeutique. Cette série de 

tests comprend examens cliniques, ECG 1 d'effort, imagerie par médecine nucléaire, 

échocardiographie. Bien que l'imagerie par angiographie cardiaque ne soit pas d'une fiabilité 

absolue, elle est encore la référence pour juger de pathologies cardiaques, notamment pour les 

maladies coronaires. Cet examen revêt une importance capitale en occident notamment, où les 

maladies cardiaques sont une cause majeure de mortalité. 

Le film 35-mm présente des qualités qui ont établi dans les faits son statut de support standard. 

La qualité d'image est excellente, surtout en ce qui concerne la résolution spatiale: l'oeil est loin 

de pouvoir distinguer le plus petit détail disponible sur ce support argentique. La durabilité d'un 

film est inégalée: on peut encore visionner les examens réalisés aux tout débuts de 

l'angiographie cardiaque il y a plus de vingt ans. Le film de radio-cinéma est utilisé partout, ce 

standard est échangé entre les services cliniques des établissements hospitaliers, entre de 

nombreux établissements pour des recherches multi-centriques au niveau national ou 

international. 

Pourquoi remplacer un tel "étalon or"? 

L'archivage et la gestion des bobines de radio-cinéma 35-mm est toujours une difficulté pour 

les services hospitaliers concernés. Le film génère un coût non négligeable, dû au support 

vierge, au développement de type photographique (impliquant matériel et personnel), et au 

stockage. Ce coût est estimé à 100 dollars en moyenne par film aux Etats-Unis [NISS-94]. Le 

stockage demande espace et organisation. Bien que la durée légale pendant laquelle un film 

doive être conservé en France soit de dix ans, il n'est probablement pas évident pour tous les 

établissements de ressortir un examen après un tel laps de temps. Autre handicap, la 

duplication d'un film ne préserve pas sa qualité originale. Par conséquent, lorsqu’un service 

envoie un film à un autre, il ne dispose plus de son archive sur le patient. 

Les techniques d'imagerie numérique ont fait leur entrée il y a dix ans déjà dans les salles de 

cathétérisme. L'apport de ces techniques a été considérable. Tout d'abord les traitements 

numériques permettent d'améliorer la visibilité des vaisseaux et facilitent l'interprétation des 

images. Bien que la résolution spatiale d'une image numérique soit inférieure à celle d'un film 

35-mm, le gain en résolution de contraste rehausse nettement la qualité diagnostique. 

Deuxième point, des logiciels de mesure apportent une information plus précise qu'avant sur la 

contractilité du muscle cardiaque et la taille des vaisseaux, grâce à des calculs basés sur les 

pixels. Troisième point, l'avènement des images numériques et de leur corollaire le temps réel 

1 ECG: ElectroCardioGramme 

- 15 -

a permis l'essor de procédures interventionnelles, dont les fameux "ballonnages" ou 

angioplasties. La possibilité de visionner de nouveau immédiatement une séquence, d’agrandir 

(zoom) un vaisseau permet de juger instantanément du résultat après le gonflage d'un 

ballonnet. Quatrième point, la duplication d'une image numérique est parfaite. Enfin, on 

commence à bénéficier des technologies liées aux autoroutes de l'information pour transmettre 

les images d'un service ou d'un site hospitalier à un autre (télé-cardiologie). L'intérêt d'un 

archivage numérique est certain, et les cardiologues envisagent tout naturellement de travailler 

sans film dès que possible. 

Apport de l’angiographie cardiaque numérique 

Le support final des angiographies reste encore souvent aujourd'hui le film de radio-cinéma. 

L'intérêt d'une solution entièrement numérique est incontesté. Cependant, on atteint les limites 

des technologies actuelles, du moins à des coûts acceptables. Il y a deux pierres 

d'achoppement. La première réside dans la capacité des disques informatiques. Un examen 

typique d'angiographie cardiaque comprend au minimum une douzaine de séquences pour voir 

le ventricule gauche et les artères coronaires sous différents angles. Réalisées à 12,5 ou 25 

images par secondes (15 ou 30 im/sec aux Etats-Unis), afin de suivre la dynamique cardiaque, 

l'ensemble de ces séquences totalise facilement 2000 à 3000 images, pour un seul examen. 

En terme d'espace disque, cela correspond à 500 à 800 MO (Mega-octets), avec le format 

habituel d'images de 512x512 pixels codés sur 8 bits. Sur un système d'angiographie 

numérique, on arrive maintenant à stocker le travail d’un à quelques jours. Ensuite, au fur et à 

mesure que la journée avance, les premiers examens sont écrasés. Deuxième difficulté 

technologique vis à vis d'une solution numérique: la visualisation dynamique. Pour visualiser de 

nouveau un examen à la cadence nécessaire, il faut disposer d’une rapidité d’accès au médium 

de stockage (à travers un réseau, ou sur un support comme le CD) qui n’est pas encore 

possible sur les images brutes dans l’état actuel de la technologie. 

Intérêt de la compression d’image 

Pour contourner les deux difficultés technologiques majeures posées par l'archivage numérique 

des angiographies cardiaques, à savoir la capacité de stockage et la visualisation à cadence 

élevée sur des supports standards tels que le CD ou à travers des réseaux informatiques, une 

solution s'impose: la compression d'image. 

Par des techniques combinant des recettes astucieuses avec des théories mathématiques 

avancées, on parvient à réduire l'espace disque nécessaire à une image. On stocke un 

ensemble binaire codé. Avant de pouvoir visualiser l'image, il faut lui appliquer le processus 

inverse pour obtenir à nouveau un ensemble de pixels visibles. Le processus ou l'algorithme 

permettant de passer des pixels originaux à un ensemble binaire codé correspondent à l'étape 

de compression d'image; le processus ou l'algorithme permettant de retrouver ensuite une 

image sous forme de pixels correspond à l'étape de décompression. En toute rigueur, l'image 

comprimée (appelée aussi compressée) est un ensemble binaire codé, et l'image décomprimée 

(ou décompressée) est l'ensemble de pixels que l'on a reconstruit à partir de l'ensemble binaire 

codé. Dans la pratique, on parle souvent d'image comprimée pour désigner une image qui a 

subi les deux étapes de compression et décompression. 

On distingue deux types de compression de donnée, selon qu'il est possible ou non de 

retrouver exactement l'information de départ: la compression sans perte, et la compression 

avec perte. 

La compression sans perte est complètement réversible, aucune perte d’information n’est 

introduite par les processus de compression/décompression. Les taux de compression que l’on 

peut atteindre sont limités. Pour les images médicales, ils sont de l’ordre de 2 à 3:1 [ROOS-91]. 

Un taux de compression de 2:1 correspond à une réduction par un facteur 2 de l’espace disque 

occupé par l’image. 

- 16 -

La compression avec perte introduit une distorsion irréversible. Elle seule permet d’atteindre les 

taux de compression important. Selon la méthode de compression, selon les propriétés de 

l’image de départ, selon le taux de compression, la distorsion est plus ou moins importante, et 

plus ou moins visible. 

L'idée de la compression avec perte commence à pouvoir être évoquée devant la communauté 

médicale; elle n'était pas du tout acceptée lorsque ce travail a commencé. La crainte d’une 

perte d’information diagnostique constituait un frein psychologique et légal majeur. La présente 

thèse fait partie des travaux montrant qu’une perte d’information au sens technique n’est pas 

forcément associée à une perte de qualité au sens diagnostic. 

Cahier des charges du projet dans lequel s’insère le présent travail 

Le présent travail s’inscrit dans le cadre d’un projet multidisciplinaire coordonné par une équipe 

de recherche de la Société Philips Medical Systems aux Pays-Bas. De ce fait, les images 

utilisées dans nos travaux proviennent de systèmes d’angiographie cardiaque numérique 

Philips. Le projet a porté sur la mise au point de méthodes de compression appropriées aux 

examens d’angiographie cardiaque, et sur leur validation dans des conditions cliniques. Dans 

l’absolu, les images comprimées avec la ou les méthodes retenues devaient pouvoir remplacer 

complètement les images originales. Le but ultime était de réaliser une compression temps réel 

pendant l’acquisition. 

Le cahier des charges de la méthode de compression était le suivant: 

- possibilité de contrôler avec précision le taux de compression, afin que chaque image occupe 

un espace disque fixe et connu à l’avance 

- possibilité d’accéder à chaque image individuellement 

- obtention d’une qualité visuelle propice au diagnostic pour un taux de 8 à 12:1 

- absence d’artefacts de blocs tels que ceux introduits par les standards JPEG et MPEG 

- robustesse visuelle aux post-traitements, notamment à un traitement de renforcement de 

contours employé en angiographie cardiaque 

- possibilité de réaliser l’algorithme de compression en hardware 

Le cahier des charges de la validation clinique était le suivant: 

- évaluer la qualité visuelle (cosmétique) 

- évaluer si l’interprétation diagnostique visuelle reste inchangée avec la compression 

- évaluer si le résultat des mesures quantitatives reste inchangé avec la compression 

- comparer les performances d’algorithmes dédiés (mis au point durant ce projet), et 

d’algorithmes standards tels que JPEG et MPEG. 

Objet de nos travaux 

Nos travaux sont constitués de deux parties principales. La première partie traite de notre 

contribution en matière d’algorithme de compression. La deuxième partie traite de nos études 

d’évaluation diagnostique, sur lesquelles a porté une part majoritaire de nos efforts. 

Le travail de compression a essentiellement visé à élucider des aspects algorithmiques 

originaux, selon des questions suscitées par les particularités des images d’angiographie 

cardiaque. La mise au point d’une méthode complète n’a pas été l’objectif principal, compte 

tenu du temps à consacrer aux études d’évaluation. 

Nous avons choisi d’illustrer les aspects algorithmiques que nous avons développés en 

travaillant dans le cadre d’une méthode de compression par transformation à base de Full- 

Frame DCT. Cette méthode proposée dans le domaine médical par [LO-85] et [CHAN-89] 

présentait au début de nos travaux (c’est à dire en 1991) plusieurs avantages: 

- absence d’artefacts de bloc du fait du traitement pleine image (Full-Frame) 

- 17 -

- possibilité d’intégrer les post traitements dans le processus de compression 

- faculté d’utiliser une adaptation au système visuel humain 

- existence d’un hardware performant ([HO-91]). 

Les résultats sur les aspects algorithmiques de compression abordés dans cette thèse ont une 

portée plus générale que leur simple application à la compression par Full-Frame DCT. Ils 

peuvent aisément être étendus, à d’autres méthodes par transformation notamment. 

Le travail d’évaluation a consisté en plusieurs études. Les algorithmes évalués ont été: les 

standards JPEG et MPEG, et une méthode mise au point par les laboratoires du groupe 

Philips, dénotée MLOT. Malheureusement, nous n’avons pas pu inclure les images 

comprimées par Full-Frame DCT dans ces campagnes, pour des raisons pratiques. 

Nous avons réalisé trois campagnes d’évaluation: deux campagnes à partir de l’interprétation 

visuelle diagnostique (dénotées “évaluations diagnostiques”), et une campagne à partir de 

mesures quantitatives assistées par logiciel (dénotée “évaluation QCA 2 ”). 

Contenu de ce mémoire 

En préliminaire, nous présenterons le contexte général de notre thèse. Celle-ci a été réalisée 

dans le cadre d’une convention Cifre avec la Société Philips Systèmes Médicaux et le 

Laboratoire Creatis. Les équipes industrielles, universitaires et hospitalières impliquées dans 

nos études seront brièvement présentées dans ce chapitre. 

La première partie de ce mémoire est consacrée au thème de la compression. Elle comprend 

plusieurs chapitres. 

Une revue des méthodes de compression d’image sera donnée dans le chapitre II-1. On y 

abordera des notations, et des notions générales telles que les mesures de performance et de 

distorsion. On y trouvera une explication du mécanisme des principales méthodes de 

compression existantes, avec un peu plus de détail sur les méthodes que nous avons étudiées 

ou utilisées. Le chapitre II-2 abordera des généralités sur les images médicales numériques, 

sur les angiographies cardiaques, et évoquera les avantages et les inconvénients associés aux 

formats d’images standards, que se soit les formats médicaux tels que DICOM, ou les formats 

de l’industrie de l’image tels que JPEG. 

Les quatre chapitres suivants seront consacrés à nos développements en matière de 

quantification et de compression à base de Full-Frame DCT. Le premier thème est l’allocation 

de bits (chapitre I-3). Une fois l’image transformée par Full-Frame DCT, une stratégie de 

répartition des bits doit être réalisée. Le deuxième thème est la combinaison compression et 

renforcement (chapitre I-4). Le renforcement de contour a pour inconvénient de renforcer les 

artefacts de compression, pas seulement par le bord des vaisseaux! Nous aborderons des 

stratégies pour minimiser cet inconvénient. Nous verrons aussi comment il est possible de faire 

d’une pierre deux coups, en effectuant le renforcement au cours du processus de compression. 

Le troisième thème est celui de l’adaptativité du quantificateur (chapitre I-5). Le quantificateur 

étudié est le quantificateur scalaire uniforme. Nous avons mené une étude théorique de 

l’impact d’une mauvaise adaptation des paramètres utilisés dans le quantificateur par rapport 

aux paramètres de la distribution réelle du signal à quantifier. Nous avons validé cette étude 

théorique par une expérimentation à partir d’images (chapitre I-6). Pour finir, le chapitre I-7 

donnera une synthèse sur la partie compression. 

La deuxième partie de ce mémoire est consacrée à l'évaluation. Elle comprend elle aussi 

plusieurs chapitres. 

Le chapitre II-1 est une analyse bibliographique sur les méthodes d’évaluation de la qualité 

cosmétique et diagnostique d’images comprimées. Nous y expliquons aussi en quoi consistent 

les tâches d’interprétations visuelles qui conduisent à un diagnostic sur les examens 

2 QCA: de l’anglais Quantitative Coronary Analysis 

- 18 -

d’angiographies cardiaques. Nous avons mis au point un protocole expérimental et une analyse 

statistique qui s’adapte au plus près à ces tâches cliniques. 

Les chapitres II-2 et II-3 décrivent les deux campagnes d’évaluation diagnostiques (méthode, 

résultats et discussions). Il a été demandé à des experts médicaux d’effectuer une 

interprétation visuelle sur des angiographies cardiaques originales et comprimées. Cette 

interprétation consiste à trouver et classifier des anormalités sur les segments de ventricule 

gauche et sur les segments de coronaires. Nous avons cherché à quantifier statistiquement le 

degré d’accord entre les interprétations sur les images originales et comprimées, et à évaluer si 

cet accord est significativement modifié par la compression. 

La première évaluation diagnostique s’est déroulée à l’Hôpital Cardiologique de Lille, avec les 

méthodes MPEG et MLOT, à un taux de 12:1. Nous avons comparé les interprétations visuelles 

de deux cardiologues sur des examens d’angiographie originaux et comprimés. 

La deuxième évaluation subjective s’est déroulée au Hermann Hospital à Houston (Texas, 

USA), avec les méthodes JPEG et MLOT, à un taux de 12:1. Nous avons comparé les 

interprétations visuelles de quatre cardiologues sur des examens d’angiographie originaux et 

comprimés. 

Le chapitre II-4 est consacré à l’évaluation QCA. Nous y introduirons la méthode de mesure sur 

laquelle a porté l’étude. Nous résumerons les rares travaux d’évaluation de compression et 

QCA. Nous expliquerons notre protocole expérimental, les outils statistiques utilisés, donnerons 

les résultats et leur interprétation. La campagne d'évaluation QCA s'est déroulée à l'AZL de 

Leiden. 

Le chapitre II-5 est une synthèse sur l’évaluation. 

Une synthèse et conclusion générale terminera ce mémoire. 

- 19 -

CADRE DE TRAVAIL 

- 20 -

- 21 -

Cadre général 

Ce travail de thèse a été réalisé dans le cadre d’une convention CIFRE impliquant le 

Laboratoire CREATIS et la Société Philips Systèmes Médicaux. Les études présentées dans ce 

mémoires s’insèrent dans un projet de recherche industrielle piloté depuis les Pays-Bas par le 

groupe Pre-Development de la division Cardio-Vasculaire internationale de la Société Philips 

Medical Systems (PMS). Le but du projet est de tester dans des conditions cliniques l’effet de 

la compression d’images sur des angiographies cardiaques. Les méthodes de compression 

concernées sont des standards existants et des méthodes développées spécifiquement. Les 

retombées attendues concernent la réalisation de systèmes d’angiographie cardiaque 

complètement digitaux, ce qui reste un défi technologique pour le stockage et la communication 

des images compte tenu de la taille et du nombre d’images par examen. 

Pour réaliser les objectifs fixés, il a été nécessaire de s’insérer dans un contexte 

pluridisciplinaire de médecins et d’ingénieurs. Afin de diversifier les sources d’images et de 

pouvoir consulter les experts de plusieurs centres, une coopération avec plusieurs sites a été 

mise en place: 

• le Laboratoire Creatis pour des questions algorithmiques en compression d’image 

appliquées aux angiographies cardiaques, et pour la mise au point des protocoles 

d’évaluation. 

• le Laboratoire de Recherche NatLab du groupe Philips aux Pays-Bas où a été mis au point 

un algorithme spécifique testé dans la cadre de la présente thèse, appelé MLOT 

• l’Hôpital Cardiologique de Lyon pour des études pilotes d’évaluation clinique d’images 

comprimées 

• l’Hôpital Cardiologique de Lille pour une campagne d’évaluation portant sur deux méthodes 

de compression (le standard MPEG et la méthode spécifique MLOT) 

• le Hermann Hospital et l’Université du Texas à Houston pour une campagne d’évaluation 

portant sur deux méthodes de compression (le standard JPEG et la méthode spécifique 

MLOT) 

• l’AZL de Leiden aux Pays-Bas pour une campagne de mesures quantitatives sur des images 

comprimées par deux méthodes (le standard JPEG et la méthode spécifique MLOT) 

Convention CIFRE 

Le système des conventions CIFRE a été mis au point par le Ministère de la Recherche 

français en vue de faciliter les coopérations entre les laboratoires publiques de recherche et les 

entreprises privées. Les conventions CIFRE sont gérées par l’Association Nationale pour la 

Recherche Technique (ANRT) et comprennent trois partenaires: un laboratoire universitaire de 

recherche, un industriel, et un étudiant en thèse. L’étudiant effectue sa thèse dans le cadre du 

laboratoire, tout en étant salarié de l’entreprise. Un contrat de coopération lie le laboratoire et 

l’entreprise. L’entreprise prend des engagements vis à vis de l’ANRT et de l'étudiant, et perçoit 

une subvention pour couvrir une partie des dépenses salariales de celui-ci. 

Laboratoire Creatis 

Le laboratoire CREATIS (Centre de REcherche et d’Applications en Traitement de l’Image et 

du Signal) est une Unité Mixte de Recherche du Centre National de la Recherche Scientifique: 

l’UMR 5515. L’ancienne appellation de cette unité était au début de ce travail: Laboratoire de 

Traitement du Signal et des Ultra-Sons (LTSU). Creatis est affilié à l’Institut National de la 

Santé et de la Recherche Médicale. Le laboratoire dépend de l’Institut National des Sciences 

Appliquées (INSA) de Lyon, et de l’Université Claude Bernard de Lyon. L’unité comprend une 

soixantaine de chercheurs à temps complet ou partiel, ainsi qu’une dizaine de membres de 

personnel technique. Les membres de Creatis se répartissent sur deux sites: l’INSA et l’Hôpital 

Neuro-Cardiologique Louis-Pradel. 

- 22 -

La spécificité de Creatis est de réunir au sein d’une même unité des chercheurs en sciences de 

la vie (radiologues, cardiologues, vétérinaires), et des chercheurs en sciences pour l’ingénieur 

(informaticiens, mathématiciens appliqués...). 

Les sujets de recherches sont principalement axés autour du traitement de l’image appliqué 

aux images médicales. Les travaux sont organisés en thèmes scientifiques (axes de 

recherche), et projets médicaux (applications médicales spécifiques). 

Les thèmes scientifiques de l’unité sont: 

• Imagerie Dynamique, 

• Imagerie Volumique, 

• Formation de l’Image Ultrasonore. 

Les projets médicaux sont: 

• Imagerie fonctionnelle de l’ischémie myocardique 

• Imagerie morphologique et fonctionnelle des vaisseaux 

• Radiologie quantitative de la structure osseuse: structure du réseau trabéculaire 

• Traitement des images IRM de sclérose en plaques: corrélation avec le retentissement 

fonctionnel 

• Aide au diagnostic des pathologies du sein. 

Société Philips Medical Systems 

La Société Philips Medical Systems est l’un des grands constructeurs mondiaux d’imagerie 

médicale. Sa gamme de produits comprend les systèmes de radiologie conventionnels et 

numériques, la scanographie, la résonance magnétique, l'échographie. Les systèmes vers 

lesquels le présent travail est principalement orienté sont les systèmes d’angiographie 

cardiaque. Philips est leader mondial dans ce domaine avec un parc d’environ 2000 machines 

installées, soit 40% du total. 

Philips Medical Systems est une division du groupe Philips, dont le siège est à Eindhoven aux 

Pays-Bas. Le groupe Philips compte environ 230000 personnes et PMS environ 9000. 

La structure française de PMS a principalement une activité de vente et après-vente. Dans le 

cadre d’études et de recherche avec des établissements hospitaliers, l’organisation nationale 

procure un support technique et logistique, ce qui a typiquement été le cas pour le bon 

déroulement de nos expériences pilotes et campagnes d’évaluation réalisées en France. PMS 

France est le partenaire industriel de cette convention Cifre. 

La totalité du projet de compression a été pilotée par le groupe "Pre-Development X-Ray" de 

PMS à Best, près de Eindhoven, aux Pays-Bas. Le site de Best, compte environ 2000 

personne. Il abrite le siège de PMS et l’un des centres importants de fabrication, notamment 

des gammes de radiologie numérique. Le groupe "Pre-Development X-Ray" s’occupe de tout 

projet en amont du développement, c’est à dire de la mise au point et de l’évaluation de 

nouvelles technologies ayant un potentiel d’application dans les futurs produits. La mise au 

point et le test de méthodes de compression, l’évaluation du potentiel technologique et médical 

de ces méthodes fait typiquement partie de ses activités. Au début de ce travail, ce groupe 

comptait environ 8 personnes. Il en compte aujourd’hui une vingtaine, plus quelques élèves 

ingénieurs en stage. 

Le laboratoire NatLab est l’un de cinq laboratoires de recherche du groupe Philips. Il est situé à 

Eindhoven. Une de ses équipes, le groupe Digital Signal Processing développe de nouvelles 

applications pour les systèmes de communications audio et vidéo. Par exemple, il a mis au 

point la compression utilisée par Philips en télévision haute définition et pour les cassettes 

DCC. PMS a impliqué ce groupe dans le développement d’un algorithme de compression 

- 23 -

adapté aux images médicales, avec comme principale application l’angiographie cardiaque. Ce 

travail a débouché sur l’algorithme MLOT qui a fait l’objet des évaluations présentées dans ce 

mémoire. 

La structure de PMS aux USA a également été impliquée pour coordonner les contacts avec 

des équipes hospitalo-universitaires. Il était prévu au début du projet de participer à une étude 

multi-centrique en radiologie pilotée par l’UCLA et utilisant une méthode de compression à 

base de Full-Frame DCT. Cette étude n’a finalement pas vu le jour. En revanche, PMS-USA a 

procuré son soutien pour l’évaluation que nous avons réalisé à Houston. 

Hôpital Cardiologique de Lille 

L’hôpital Cardiologique de Lille fait partie de la dizaine d’hôpitaux français dont les soins sont 

dédiés uniquement à cette spécialité. Notre première campagne d’évaluation diagnostique s’y 

est déroulée, au sein du Département d’Hémodynamique. Ce service compte trois salles 

d’angiographies cardiaques, dont deux numériques. Il réalise 3500 examens d’angiographies 

cardiaques par an, dont 1000 interventions. Ces examens sont réalisés par une équipe 

d’environ six cardiologues à pleins temps, et de nombreux vacataires. L’activité de recherche 

clinique de ce centre est très intense et implique chacun des membres du personnel. Cette 

particularité a été très propice au bon déroulement de notre étude et de projets corollaires qui 

se sont déroulés durant mon séjour à Lille. Les thèmes de recherche sont axés autour du 

diagnostic et du traitement des maladies coronariennes. Ils concernent les nouveaux dispositifs 

d’imagerie, le matériel interventionnel, les traitements médicamenteux associés aux prothèses 

endo-vasculaires... Le Département d’Hémodynamique est “core laboratory” dans de nombreux 

protocoles de recherche clinique multi-centriques impliquant des mesures quantitatives sur les 

films d’angiographies. 

Hermann Hospital / University of Texas 

Le Hermann Hospital de Houston aux Etats-Unis est un hôpital privé à but non lucratif. Il est 

situé dans le plus grand complexe médical des USA, appelé le Texas Medical Center (un 

conglomérat d’établissements hospitaliers dont la densité et la taille nous sont inconnus en 

Europe). Il est le centre de formation (“teaching hospital”) pour l’University of Texas Medical 

School. Le centre d’hémodynamique (“cath lab”) compte trois salles d’angiographies 

cardiaques et réalise environ 1200 examens par ans. Une équipe de médecins est responsable 

du service médical en même temps que de l’activité de formation et de recherche. Les thèmes 

principaux d’investigations concernent le diagnostic et le traitement de l’infarctus du myocarde 

et de l’angor instable. Les activités de recherche concernent les développements et l’évaluation 

de nouvelles modalités d’imagerie, et développement et l’évaluation de médicaments, de 

matériels interventionnels. 

AZL de Leiden 

Le “Laboratory for Clinical Experimental Image Processing” (abréviation hollandaise: LKEB) fait 

partie de l’Hôpital Universitaire de Leiden (abréviation hollandaise: AZL). Il est constitué d’une 

équipe d’une trentaine de personnes de formation scientifique et technique. Ses axes de 

recherche et développement concernent le traitement d’image en radiologie et cardiologie. Sa 

spécialité concerne les logiciels d’analyse quantitative en angiographie cardiaques. Les 

logiciels de mesures quantitatives des ventricules gauches et des artères coronaires 

disponibles sur les systèmes Philips ont été mis au point et évalués par le LKEB. Les autres 

thèmes d’analyse quantitative étudiés concernent par exemple la résonance magnétique et 

les ultrasons. 

- 24 -

PARTIE I 

Compression d’angiographies 

cardiaques: 

problèmes algorithmiques et illustration 

avec la Full-Frame DCT 

- 29 -

CHAPITRE I-1 

ETUDE BIBLIOGRAPHIQUE DES 

METHODES DE COMPRESSION 

D’IMAGES 

- 30 -

Chapitre I-1: Etude bibiographique des méthodes de compression d’images 

1. Généralités sur la compression d’images 

1.1. Contraintes et applications d’un système de compression 

La compression d’une image numérique permet de réduire le nombre de bits qu’elle 

occupe. Les deux principes qui interviennent pour atteindre cet objectif sont la réduction 

de la redondance (n'introduisant pas de perte), et la représentation approximative de 

l’information contenue dans l’image (introduisant une perte). 

Une image numérique est une matrice composée d’échantillons élémentaires appelés 

pixels (1) . Nous appellerons M le nombre de lignes de l’image, et N le nombre de colonnes. 

La position d’un pixel sur la matrice image sera indiquée par son indice de ligne m∈[0,M[, 

et son indice de colonne n∈[0,N[. A chaque pixel d’une image monochrome est associé 

une valeur numérique à laquelle correspond un niveau de gris. En général, le nombre de 

niveaux de gris est une puissance de deux. Par exemple, une image dont les pixels ont 

des niveaux de gris représentés avec des nombres allant de 0 à 255, soit 256 valeurs 

possibles, est codée sur 8 bits par pixel (bpp (2) ). Notons que par convention le niveau de 

gris ‘0’ correspond à du noir, et le niveau ‘255’ à du blanc. Le nombre de bits par pixels R 

(3) est appelé ‘débit’. On notera R o le débit de l’image originale avant compression, et R c 

son débit après compression. 

L’image originale est une matrice de pixels qui occupe au total: 

B o =M.N.R o bits. 

L’image comprimée est une suite de bits qui occupe B c bits. On voit que R c = Bc ( M. N) 

correspond au nombre de bits moyens ramené au nombre de pixels. Cependant l’image 

comprimée n’est généralement pas physiquement composée de pixels. La décompression 

est nécessaire pour représenter l'image décomprimée sous forme de pixels visibles. 

L’image décomprimée occupe alors la même place que l’image originale soit B o bits, mais 

elle peut avoir subi une distorsion due à la compression. Par abus de langage, nous 

appellerons souvent par la suite ‘image comprimée’ une image qui aura en réalité subi 

successivement l’opération de compression et l’opération inverse de décompression. 

La compression d’images peut s’employer avec des contraintes et des attentes très 

différentes, selon l’utilisation à laquelle les images sont destinées. On peut vouloir réduire 

le nombre de bits d’une image avec une contrainte sur la capacité de stockage, la vitesse 

de transmission, le temps d’accès depuis un médium de stockage, etc... On peut prévoir 

d’utiliser l’image décomprimée pour des applications de loisir, du traitement d’image, de la 

recherche visuelle rapide dans une base d'images, du diagnostic médical, etc... 

Toute la problématique de la compression d’image consiste à satisfaire les 

contraintes technologiques, techniques ou financières auxquelles on est confronté, 

tout en obtenant la qualité requise de l'image décomprimée pour l’application 

désirée. 

1 pixel : abréviation de l’anglais "picture element" 

2 bpp : abréviation de "bit par pixel" 

3 R : de l'anglais "rate", débit 

- 31 -


1.2. Mesures de performance 

1.2.1. Taux de compression 

En plus du débit R c , une mesure courante pour déterminer le degré de compression 

obtenu est le taux de compression CR (1) . Il est défini par: 

CR = 

nombre de bits de l'image originale 

nombre de bits de l'image comprimée = 

R 

R 

o 

c 

(I-1.1) 

Pour une même méthode de compression et un même CR réalisés sur des images 

distinctes, la qualité obtenue peut être très variable d’une image à l’autre. Les propriétés 

statistiques des images originales jouent un rôle prépondérant dans le résultat obtenu. 

Par exemple avec une image sur-échantillonnée, donc très redondante, il est facile 

d’obtenir des taux élevés. La théorie de l’information donne une limite théorique au CR 

maximal qu’il est possible d’obtenir sans distorsion pour toute méthode de compression 

sur une image donnée. 

1.2.2. Entropie 

L’entropie est une grandeur qui caractérise la quantité d’information que contient une 

image. Par exemple une image dont tous les pixels ont la même valeur contient très peu 

d’information car elle est extrêmement redondante, son entropie est faible. En revanche, 

une image dont tous les pixels ont une valeur aléatoire contient beaucoup d’information, 

son entropie est forte. Ceci est comparable à l’entropie en thermodynamique qui croit 

avec le désordre. 

En pratique, l’entropie d’une image numérique est inversement liée à la probabilité 

d’apparition des niveaux de gris dans l’image. Plus une valeur de gris k est rare, plus sa 

probabilité d’apparition p(k) est faible, et cela contribue à une entropie globale plus 

grande. Par définition, l’entropie d'ordre zéro H 0 est donnée par: 

L’utilisation du logarithme de base deux fait de H 0 le nombre de bits moyen par pixel 

R 

2 −1 

H 0 = - ∑ pk ( ).log pk ( ) bpp (I-1.2) 

2 

k = 0 

nécessaire pour coder toute l’information contenue dans l’image. Une image codée avec 

R bits par pixels a en fait presque toujours une entropie d'ordre zéro inférieure à R. Dans 

sa théorie de l’information applicable à tout signal y compris les images, Shannon a 

démontré un théorème qui indique qu’il est possible de coder (comprimer) un signal 

d’entropie H avec H bpp, tout en obtenant une distorsion arbitrairement faible [SHAN-48]. 

Par conséquent, l’entropie H 0 d’une image originale fournit le débit minimal qu’il est 

possible d’atteindre par compression pixel par pixel sans dégrader l’image, et par là 

même un taux de compression sans perte maximal. 

1.3. Mesures de distorsion 

La distorsion (D) est l’erreur introduite par l’opération de compression, due au fait 

qu’éventuellement l’image reconstruite n’est pas exactement identique à l’image originale. 

1 CR : de l'anglais "compression ratio" (taux de compression) 

- 32 -


La mesure de distorsion utilisée généralement en compression d’image est l’erreur 

quadratique moyenne MSE (1) . Cette grandeur est définie par la moyenne des écarts au 

carré e 2 

entre le pixel (m,n) de l’image originale I(m,n), et le pixel (m,n) de l’image 

mn 

reconstruite Î(m,n) 

MSE = 

1 

MN . 

M −1 

N −1 

^ 

2 

∑∑ [ Imn ( , ) − Imn ( , )] 

(I-1.3) 

m= 

0 n= 

0 

On référence cette erreur par rapport à la dynamique de l’image en décibels. On obtient 

un rapport signal sur bruit crête pour une image dont le maximum est 2 R -1 dénoté PSNR 

(peak SNR). Si le minimum de l’image est nul (image bien cadrée) on obtient le rapport 

signal sur bruit crête à crête noté PPSNR (peak to peak SNR (2) ) 

Lorsque la reconstruction est parfaite, la MSE est nulle et le PPSNR tend vers l’infini. 

2 1 

PSNR ou PPSNR = 10.log 10 

. ( R − ) 

MSE 

2 

dB 

(I-1.4) 

Ces mesures de distorsion sont objectives et simples à calculer. Certaines méthodes de 

compression recherchent le meilleur compromis entre la performance et la distorsion, et 

optimisent des courbes taux-distorsion ou R(D) (3) . Cette approche sera utilisée dans le 

chapitre I-6. 

L’inconvénient de la MSE est qu’elle ne rend pas compte de la perte de qualité visuelle 

engendrée par la compression. Si tous les pixels d’une image étaient translatés, l’erreur 

quadratique serait très élevée, alors que la qualité visuelle serait parfaitement bonne. De 

plus. la MSE est une mesure globale sur toute l’image, qui gomme les variations locales. 

Par exemple dans une image médicale, si des détails anatomiques importants sont 

dégradés par la compression et si la majeure partie du reste de l’image est fidèlement 

restituée, alors la MSE est relativement faible mais, pour l’expert médical, cette image a 

une qualité diagnostique médiocre. 

De très nombreuses recherches visent à trouver des mesures objectives de distorsion qui 

prédisent suffisamment bien la qualité perceptuelle. Ces travaux ont apporté une 

connaissance sur les réponses du système visuel humain (dénoté HVS (4) ) à certaines 

formes de dégradation. Il est de plus nécessaire de valider la mesure de distorsion à 

l’utilisation et l’usage qui sera fait des images décomprimées. Ces études, même 

appliquées à l’imagerie médicale, n’ont pas encore abouti à une mesure de distorsion qui 

prédise de façon satisfaisante la qualité des images reconstruites en fonction de leur 

emploi pour une interprétation visuelle ou automatique, avec ou sans analyse quantitative 

(par exemple dans l’évaluation des sténoses). L’état de l’art consiste encore à se baser 

sur des mesures de distorsion lors du développement de la méthode de compression, et 

ensuite de le valider à l'aide d'observateurs par des comparaisons statistiques. Cette 

approche est largement utilisée dans notre travail. 

1 MSE : de l’anglais “Mean Square Error” (erreur quadratique moyenne) 

2 SNR : de l'anglais "Signal to Noise Ratio" (rapport signal sur bruit) 

3 R (D) : de l'anglais "Rate-Distorsion" (débit-distorsion) 

4 HVS : de l'anglais "Human Visual System" (système visuel humain) 

- 33 -


2. Principales méthodes de compression d’images 

Cette section donne une présentation des différentes méthodes courantes en 

compression d'images. Le lecteur familier de ces techniques peut se reporter directement 

à a section 2.5.6 sur la méthode MLOT. 

2.1. Classification des méthodes de compression 

On peut établir une classification des principales méthodes de compression à l’aide de 

différents critères. Nous en donnons cinq dans ce qui suit. Puis nous introduirons dans les 

sections 2.2 et 2.3 les méthodes les plus courantes, en incluant les méthodes sur 

lesquelles a porté ce travail du point de vue des aspects algorithmique et de leur 

évaluation. 

2.1.1. Méthodes avec ou sans perte d’information 

Cette première classification s’intéresse à la présence ou non d’une distorsion ou perte 

d’information introduite par la compression. C’est la classification que nous utiliserons par 

la suite en 2.2 et 2.3 pour exposer les principales méthodes de compression rencontrées. 

Le taux de compression (CR) généralement atteint par les méthodes sans perte sur des 

images médicales normalement échantillonnées est d'environ 2 ou 3 [ROOS-91], [LIEN- 

95], [NZOM-95]. 

2.1.2. Méthodes par pixels, groupes de pixels, ou image entière 

Cette deuxième classification s’intéresse à la zone de travail de base sur laquelle 

s’appliquent les algorithmiques: des pixels individuels, des blocs de pixels, ou toute 

l’image. Pour citer quelques exemples: 

• codage individuel des pixels: méthodes sans perte par DPCM (1) [CUTL-52] et codage de 

Huffman [HUFF-52]; 

• codage de blocs de pixels: les standards JPEG (2) [PENN-93] et MPEG (3) [LEGA-91] 

travaillent par blocs adjacents de 8x8 pixels, la quantification vectorielle [GERS-82]; 

• codage de l’image entière: DCT (4) Full-Frame (étudiée dans cette thèse), codage 

d'images sous-bandes par filtrage [WOOD-86] ou décomposition sur une base 

d’ondelettes [BARL-94], [MALL-89]. 

2.1.3. Méthodes intra- et inter-images 

Cette troisième classification s’applique aux séquences d’images (séries temporelles ou 

séries de coupes 3D). Les méthodes intra-images (intra-frame en anglais) effectuent la 

compression de chaque image individuellement. Les méthodes inter-images (inter-frame) 

exploitent la redondance entre les images successives. Le standard multimédia MPEG 

code des séquences d’images en détectant le mouvement d’une image à l’autre. Les 

zones fixes de l’image ne contiennent pas d’information supplémentaire, les zones 

mobiles contiennent une information qu’il faut coder. 

2.1.4. Méthodes adaptatives, non-adaptatives 

Cette quatrième classification indique si la méthode de compression est adaptative ou 

non. Une méthode non-adaptative applique les mêmes paramètres (bits alloués et 

1 DPCM : de l'anglais "Differential Pulse Code Modulation" (modulation par impulsion et codage 

différentielle) 

2 JPEG: de l'anglais "Joint Picture Expert Group", méthose standardisée de codage inter-image 

3 MPEG: de l'anglais "Motion Picture Expert Group", méthode standardiséé de codage multimédia 

4 DCT: de l'anglais "Discrete Cosine Transform" (transformée cosinus discrète) 

- 34 -


quantificateurs) de façon fixe, quel que soit l’ensemble de données à coder. Une méthode 

adaptative va modifier ses paramètres au fur et à mesure du codage, en s’adaptant aux 

données d’entrée. 

2.1.5. Méthodes spatiales et méthodes par transformation 

La cinquième classification s’intéresse au domaine dans lequel s’effectuent les opérations 

de base de la compression. Une image peut être représentée de deux façons strictement 

équivalentes: 

• Dans le domaine spatial, dans lequel l’image est représentée sous forme de pixels. 

C’est le domaine accessible visuellement à l’observateur. 

• Dans un domaine fréquentiel, dans lequel l’image est représentée sous forme de 

coefficients de fréquences spatiales. Le passage d’un domaine à l’autre se fait par des 

transformations mathématiques totalement réversibles, telles que la transformation de 

Fourrier ou la transformation Cosinus. Intuitivement, une fréquence spatiale correspond 

au fait qu’un motif se reproduit régulièrement dans l’image, avec une certaine 

fréquence, comme par exemple un damier. 

Dans le domaine spatial, l’information contenue dans l’image est distribuée sur toute la 

matrice image. Dans le domaine des fréquences, l’information (qui est strictement 

équivalente) est généralement plus “concentrée”. De ce fait, il est approprié de construire 

un algorithme de compression sur les coefficients du plan des fréquences de l’image. 

Cette approche est largement utilisée, par exemple dans les méthodes standards JPEG et 

MPEG. 

2.2. Méthodes sans pertes 

Les méthodes sans pertes peuvent s’appliquer dans le domaine spatial, ou plus 

difficilement, dans le domaine des fréquences. Pour rester général, nous emploierons le 

terme symbole au lieu de pixel ou bien coefficient du domaine des fréquences, et la notion 

de séquence de symboles pour une image ou une partie d’image. Les termes réversible et 

irréversible seront employés respectivement comme synonymes de sans et avec perte. 

2.2.1. Méthodes différentielles et prédictives 

Ces méthodes exploitent la redondance entre un symbole et ses voisins, qui en général 

se ressemblent beaucoup. Par exemple, on code le premier symbole, on calcule la 

différence avec le second symbole et on code cette différence. Celle dernière nécessite 

moins de bits que les symboles eux-mêmes car cette différence est souvent faible. On 

code ensuite la différence entre le deuxième symbole et le troisième, etc... 

Dans des systèmes plus complexes et performants, on établit une fonction de prédiction 

qui permet d’estimer la valeur d’un symbole en fonction de la valeur des symboles voisins. 

On code alors l’erreur de prédiction, qui est l’écart entre la vraie valeur du symbole et la 

valeur prédite. La fonction de prédiction peut être plus ou moins complexe selon l’ordre de 

prédiction (nombre de symboles impliqués dans le calcul de prédiction), la topologie 

(position des symboles voisins utilisés dans le calcul), l’utilisation de pondération (poids 

affectés aux symboles du calcul de prédiction selon leur position relative par rapport au 

symbole prédit ou selon les propriétés statistiques de l’ensemble de symboles). La façon 

de coder les erreurs de prédiction est souvent basée sur la quantification scalaire, que 

nous verrons plus loin (section I-1|2-3-2). Le codage prédictif ainsi décrit correspond à la 

modulation par impulsion et codage différentielle (MICD, ou DPCM en anglais) [O’NEA-66] 

[NETR-77]. 

- 35 -


L’efficacité d’une méthode prédictive est fortement liée à l’adéquation de la fonction de 

prédiction aux symboles à coder afin que les valeurs d’erreur de prédiction soient faibles. 

On peut rendre les méthodes différentielles et les méthodes prédictives irréversibles si on 

code les différences ou les erreurs de prédiction de façon approchée. Le débit maximal 

après codage dans le cas sans perte est égal à l’entropie de la séquence d’erreurs de 

prédiction. 

Dans ses systèmes numériques d’angiographie cardiaque, de type DCI ou Integris, la 

société Philips Medical Systems utilise depuis le début des années 90 un système basé 

sur la méthode DPCM pour le codage des images stockées sur disque dur. En raison des 

cadences d’acquisition et de visualisation très élevées en cardiologie (12.5 et 25 im/sec, 

voire 50 im/sec), le codage est réalisé par un matériel spécialisé. Un réglage de la 

machine, rend possible l’augmentation du taux de compression au-dessus du seuil de 

réversibilité (environ 2:1) et permet ainsi de gagner encore plus d’espace disque. Cela se 

fait en allouant moins de bits pour coder l’erreur de prédiction. 

Une méthode bien connue de type différentielle ou prédictive est la modulation delta 

(DM (1) ) [SCHI-70] [STEE-75]. C’est la plus simple de ces méthodes. On transmet le 

premier symbole, et on prédit chaque symbole comme étant égal à son prédécesseur. 

L’erreur de prédiction est codée sur 1 bit en ne conservant que l’information sur le signe 

de cette erreur. On décode chaque symbole en l’augmentant ou le diminuant d’un pas fixe 

par rapport à son prédécesseur, selon que l’erreur de prédiction était positive ou négative. 

Cette méthode est de fait irréversible. 

2.2.2. Méthodes par plages (Runlength coding) 

Une plage est une succession de symboles ayant la même valeur. Pour chaque plage 

rencontrée dans la séquence, on code sa valeur et le nombre de symboles qu’elle 

comprend. Pour que cette méthode soit utile, il faut que la longueur moyenne des plages 

soit suffisamment élevée. 

Le Runlength Coding (RLC) est utilisé par les fax dont les images sont binaires. Il est 

aussi largement utilisé dans les méthodes par transformation, comme par exemple JPEG: 

après avoir calculé les coefficients du domaine des fréquences et les avoir quantifiés 

(tronqués ou arrondis), on obtient un grand nombre de valeurs nulles, qui se prêtent bien 

au RLC. 

2.2.3. Codeurs entropiques 

Le but du codage entropique est de s’approcher le plus possible de l’entropie H 0 (équation 

I-1-1) de la séquence de symboles, en affectant les codes les plus courts possibles aux 

symboles de probabilité élevée et vice versa. Ces systèmes sont conçus de manière à ce 

que les codes résultants, bien que de longueur variable, puissent être décodés de façon 

unique. 

La première méthode de ce type a été l’algorithme de Shannon-Fano, résultant des 

réflexions sur la théorie de l’information de l’après-guerre. Après avoir classé par ordre de 

probabilité croissante les symboles, on les divise en deux parties dont la somme des 

probabilités est comparable. La première partie a un code débutant par 0, la deuxième 

partie par 1. On divise ensuite chaque partie de nouveau en deux et on rajoute de 

nouveau un 0 ou un 1, et ainsi de suite jusqu’à avoir des parties avec un seul symbole. 

Pour un symbole, le code résultant est constitué de la succession de 0 et 1 qui ont été 

affectés. 

1 DM: de l'anglais "Delta Modulation" 

- 36 -


Le codage de Huffman [HUFF-52] a rapidement remplacé le codage de Shannon-Fano 

car il est plus efficace. Le codage de Huffman a la particularité de produire des codes de 

préfixe unique, ce qui permet de les décoder sans ambiguïté. La façon de construire les 

codes binaires est différente de Shannon-Fano. On classe aussi par ordre de probabilité 

croissante les symboles. A l’inverse de la technique précédente, on part des deux derniers 

symboles dont la probabilité est la plus faible, et on les groupe en une partie à laquelle on 

affecte la probabilité résultante. On reclasse l’ensemble de probabilités obtenues et on 

regroupe de nouveau les parties de plus faible probabilité. On construit ainsi un arbre 

jusqu’à ce qu’il ne reste plus que deux probabilités. On part de celles-ci pour construire les 

codes binaires des symboles, comme illustré sur un exemple dans la Figure I-1.1. 

La table des codes doit être transmises avec les symboles codés, afin de l’utiliser pour le 

décodage. 

Pour une séquence de N symboles, un codeur de Huffman produit typiquement N codes 

dont la longueur est comprise entre 1 et N. En pratique, pour éviter les tables de codes 

trop longues lorsque N est grand, on utilise des tables tronquées. On choisit une valeur 

convenable de N 1


a) Construction de l'arbre binaire 

p 1 = 0.40 0.40 0.40 0.40 

p 2 = 0.20 0.20 1.00 

0.35 

p 3 = 0.15 0.15 

0.60 

p 4 = 0.15 

0.25 0.25 

p 5 = 0.10 

passe 1 passe 2 passe 3 passe 4 

0 

1 

0 

1 

b) Affectation des codes à 

l'arbre 

0 

0 . 

1 

1 

c) Table des codes résultants 

symbole probabilité code 

1 0.40 0 

2 0.20 100 

3 0.15 101 

4 0.15 110 

5 0.10 111 

Figure I-1.1 : Exemple de codage de Huffman pour des symboles de 

probabilité {0.40, 0.20, 0.15, 0.15, 0.10} 

2.2.4. Méthodes par dictionnaire adaptatif (Lempel-Ziv) 

Dans les méthodes par dictionnaire adaptatif, le codeur lit un groupe de symboles et 

recherche des équivalences avec des chaînes de symboles rencontrées dans un 

ensemble de symboles précédents. Le premier algorithme de ce type a été mis au point 

par Lempel et Ziv en 1977 [ZIV-77], et a donné lieu au programme LZ77. Celui-ci lit un flot 

de symboles et cherche des chaînes équivalentes dans une fenêtre de 4Ko précédant le 

flot d’entrée. Les équivalences sont remplacées par des codes. Les programmes PKZIP 

et Lharc sont basés sur le système LZ77. Lempel et Zip ont développé une nouvelle 

version de leur algorithme en 1978, LZ78, où le dictionnaire est construit à partir de tous 

les symboles précédemment rencontrés et non par une fenêtre.[ZIV-78] Le programme 

COMPRESS sous Unix utilise la méthode LZ78. Le succès de ces méthodes s’explique 

par la rapidité des calculs. 

2.2.5. Codage arithmétique 

Le codage arithmétique [RISS-76] [WITT-87] est un codage récent utilisant un modèle 

statistique, tout comme le codeur de Huffman. Contrairement à ce dernier, il produit un 

code pour une séquence de symboles tout entière, et non pas un code par symbole. 

Chaque nouveau symbole lu modifie de façon incrémentale le code de sortie. Ce code de 

sortie est un nombre à virgule flottante compris entre 0 et 1, dont le nombre de chiffres 

après la virgule correspond au nombre de symboles. Contrairement à Huffman, il n’est 

pas obligatoire que chaque code ait un nombre entier de bits. Par exemple un symbole de 

- 38 -


probabilité 0.9 a pour entropie 0.15, mais Huffman affectera probablement un code de un 

bit (ou plus), et la séquence codée aura un nombre de bits plus long qu’en théorie. 

Le codeur arithmétique est plus performant que le codeur de Huffman, mais il est plus 

complexe à implémenter. 

2.3. Méthodes avec pertes 

Tout comme les méthodes sans pertes, les méthodes avec pertes peuvent avoir pour 

domaine de travail le plan spatial ou le plan des fréquences. 

2.3.1. Sous-échantillonnage 

Le sous-échantillonnage consiste à ne conserver qu’une partie des données. Par 

exemple, si on ne stocke qu’un pixel de l’image sur deux, on obtient un CR de 4:1. 

L’image reconstruite s’obtient par interpolation, par exemple en remplaçant chaque pixel 

manquant par la moyenne de deux pixels adjacents. Cette méthode extrêmement simple 

est à employer avec précaution car la distorsion n’est pas contrôlée. 

2.3.2. Quantification scalaire 

La quantification scalaire consiste à remplacer un nombre très grand de symboles par un 

nombre restreint de codes. C’est une opération irréversible très largement employée en 

compression. Par exemple, le fait d’arrondir des nombres flottant à l’entier le plus proche 

est une quantification scalaire. En général, un quantificateur scalaire est une fonction en 

escalier. L’intervalle de toutes les valeurs possibles de symboles d’entrée est divisé en n 

intervalles adjacents appelés intervalles de décision. Chaque symbole appartient à l’un de 

ces intervalles, et sa valeur codée correspond au numéro de son intervalle. Tous les 

symboles d’entrée appartenant à un même intervalle sont codés et reconstruits avec la 

même valeur. La valeur reconstruite est déduite directement des bornes de l’intervalle 

d’entrée. Pour cela on essaie d’adapter le mieux possible la position des bornes des 

intervalles de décision et la règle de reconstruction aux propriétés de la séquence de 

symboles. Tout le problème consiste à minimiser la distorsion introduite par la 

quantification tout en restreignant au maximum le nombre de codes. Un rappel 

bibliographique sur la quantification scalaire et une étude du quantificateur scalaire 

uniforme sont donnés au chapitre I-6. 

2.3.3. Quantification vectorielle 

La quantification vectorielle [GERS-82] [GRAY-84] [GERS-92] découpe la matrice de 

symboles (pixels ou coefficients du plan des fréquences) en petits blocs. Chaque bloc est 

codé par son indice dans un dictionnaire de blocs types. Le codage consiste à repérer 

dans le dictionnaire des mots-codes disponibles celui qui ressemble le plus au bloc 

d’entrée. Le critère consiste en général à minimiser l’erreur quadratique. Le décodage 

consiste simplement à remplacer l’indice par le mot-code correspondant dans le 

dictionnaire. La création du dictionnaire de bloc types est une étape préalable et cruciale. 

Il est construit par apprentissage à l'aide d'un ensemble d'images type à comprimer, ou à 

l'aide d'un treillis qui utilise les propriétés de la distribution statistique des symboles à 

coder. Un dictionnaire n’est performant que pour la classe d’image avec laquelle il a été 

mis au point. 

• Principe général 

2.3.4. Méthodes par transformation 

- 39 -


Les méthodes par transformation figurent parmi les techniques de compression les plus 

employées. Elles permettent d’obtenir des taux de compression élevés tous en 

conservant une bonne qualité d’image. Ce sont des méthodes qui font appel 

successivement à plusieurs principes de compression. Elles sont utilisées par des 

standards internationaux pour le codage des images fixes et de la vidéo (voir paragraphe 

I-2.5 sur JPEG et I-1.6 sur MPEG). 

Le principe de la compression par transformation est de décomposer les pixels fortement 

corrélés de l’image en ensembles de coefficients spectraux partiellement décorrélés, dont 

l’énergie est concentrée dans un nombre restreint de coefficients. Ce compactage de 

l’énergie permet d’affecter en priorité aux coefficients spectraux les plus énergétiques un 

nombre de bits plus élevé qu’aux autres. 

Les méthodes par transformation suivent le schéma de fonctionnement présenté dans la 

Figure I-1.2. 

Etape de compression: 

image 

originale 

division en 

blocs transformation quantification 

Codage 

entropique 

séquence de 

bits 

Etape de décompression: 

séquence de 

bits 

décodage 

déquantification 

approchée 

transformation 

inverse 

recombinaison 

des blocs 

image 

reconstruite 

Figure I-1.2: Schéma de principe de la compression par transformation 

1. Division en blocs 

La première étape consiste à diviser l’image en blocs sur lesquels vont s’appliquer 

indépendamment les étapes suivantes. La principale raison de ce découpage est de 

limiter le nombre de pixels à traiter à la fois pour diminuer les temps de calcul et la 

complexité des circuits électroniques. Il peut résulter de cette division un effet visuel 

appelé effet de "blocs" : à des taux élevés la frontière des blocs devient visible car ils ont 

été comprimés indépendamment. La taille des blocs est variable selon les méthodes. Elle 

est de 8x8 pour JPEG et MPEG. Il peut être intéressant de choisir une taille de bloc plus 

élevée, selon les images [DING-95]. Dans la méthode DCT Full-Frame, l’image n’est pas 

divisée en blocs. 

2. Transformation 

La deuxième étape consiste à appliquer une transformation mathématique à chaque bloc. 

Le but de cette transformation est de décorréler les pixels, ce qui a pour effet en général 

de redistribuer l’énergie de l’image dans un nombre restreint des coefficients transformés. 

De cette façon, un grand nombre de coefficients transformés ont des très faibles valeurs, 

et peuvent être supprimés ou se voir allouer un nombre très faible de bits lors de l’étape 

suivante de quantification. La transformation fait passer d’un espace de nombres entiers, 

les pixels, à un espace de nombres flottants (voire de complexes) qui sont les coefficients 

du plan des fréquences, aussi appelé coefficients spectraux. 

Les deux motivations principales à l'utilisation d'une transformation sont: 

- 40 -


• l'obtention d'une représentation de l'image qui se prête bien à la quantification et au 

codage, 

• la possibilité d'ajuster les erreurs de quantification selon la sensibilité au système visuel 

humain. 

3. Quantification et codage 

La troisième étape est la quantification des coefficients transformés, afin de se ramener à 

un nombre limité de valeurs différentes. La quantification est souvent précédée d’une 

pondération psychovisuelle des coefficients, afin de préserver ceux auxquels l’oeil est le 

plus sensible. La quantification est la seule étape irréversible de tout le schéma de 

compression par transformation. Souvent, un quantificateur scalaire uniforme est 

employé. Un codage entropique est effectué sur les coefficients quantifiés, pour aboutir 

au flot binaire de sortie. En général, c’est le degré de quantification qui détermine le 

niveau de compression obtenu. Une quantification grossière donne une compression 

importante mais introduit une forte dégradation. 

• Les transformations 

Les transformations utilisées en compression d’image sont des transformations 

orthogonales. Ce sont des opérations séparables, c’est à dire que l’opération en deux 

dimensions est équivalente à deux opérations successives à une dimension, l’une 

horizontalement puis l’autre verticalement. Elles sont totalement réversibles. 

L’écriture sous forme matricielle d’une transformation 1-D est la suivante: 

⎡. 

⎢ 

⎢ 

⎢ 

⎢ 

y = T x = ⎢ 

⎢ 

⎢ 

⎢ 

⎢ 

⎣ 

. 

A1 

A 1 

A1 

. 

⎤ 

⎥ 

⎥ 

⎥ 

⎥ 

⎥ x 

⎥ 

⎥ 

⎥ 

. ⎥ 

⎦ 

(I-1.5) 

où x est le vecteur Nx1 des pixels d’une ligne de l’image originale, T est la matrice bloc 

diagonale de transformation, y est le résultat de la transformation: un vecteur de Nx1 

coefficients. La matrice A 1 est un bloc de bxb coefficients. Les blocs A 1 de la diagonale de 

T ne se recouvrent pas ('non-overlap'). 

x = T -1 y = T *T y 

(I-1.6) 

La transformation inverse s’écrit: 

En compression d’image, les matrices de transformations sont réelles et orthogonales, 

c’est à dire T -1 = T *T , où T -1 est la matrice inverse de T, et T *T est la matrice conjuguée 

transposée de T. Il résulte des propriétés des matrices que T est unitaire. La matrice de 

transformation T est aussi considérée comme un ensemble de vecteurs colonnes qui 

forment une base dans l’espace à N dimensions. Ces vecteurs sont unitaires et 

orthogonaux. 

Une autre façon de représenter la transformation est de considérer que chaque élément 

y(k) du vecteur des coefficients transformés est obtenu par une combinaison linéaire des 

valeurs x(m) de l’image et des vecteurs de la base (k et m = 1, ..., N). Cette représentation 

- 41 -


est illustrée en 1-D par la figure I-1.3 (a). Inversement, chaque vecteur de données x(m) 

est le fruit de la combinaison linéaire des vecteurs de la base et des coefficients y(k), k=1, 

N. La décomposition de x(m) est illustrée figure I-1.3 (b). 

La quantification distord les valeurs y(k) en valeurs y^ 

(k). Les erreurs de quantification 

sont différentes d’un bloc à l’autre, et il se peut qu'une erreur positive soit introduite à la 

bordure d’un bloc alors qu’une erreur négative est introduite à la bordure adjacente du 

bloc voisin. Il en résulte une discontinuité entre les deux blocs de l’image reconstruite, 

comme le montre la figure I-1.3 (b). 

échantillons 

bloc 

bloc 

^ 

Y 1,1 x 

^ 

+ 

Y 1,2 x 

+ 

n 

n 

^ 

Y 2,1 x 

^ 

+ 

Y 2,2 x 

+ 

n 

n 

+ 

Y 1,2 x 

+ 

n 

n 

Y 2,1 x 

+ 

Y 2,2 x 

+ 

n 

n 

^ + 

Y 1,8 x 

^ + 

Y 

n 2,8 x 

discontinuité 

bloc 1 

bloc 2 

n 

Y 1,8 

+ x 

n 

Y 2,8 

+ x 

(a) 

n 

Echantillons reconstruits 

(b) 

n 

Figure I-1.3: Transformation par bloc, quantification et effet de bloc 

Il existe de très nombreuses transformations orthogonales: transformée de Karhunen- 

Loeve, de Hadamard, transformée sinus, cosinus. Nous n'évoquerons dans ce qui suit 

que les plus importantes pour le présent travail. 

• Transformation de Karhunen-Loeve 

La transformation de Karhunen-Loeve (KLT 1 ) est optimale en terme de compactage 

d’énergie. Si on décidait de ne garder qu’un nombre limité de coefficients transformés, les 

coefficients KLT sont ceux qui contiendraient la plus grande fraction de l’énergie totale par 

rapport à toutes les autres transformations possibles. Malheureusement la matrice de 

transformation de la KLT est une fonction de l’image et il faut calculer la matrice de 

covariance de l’image pour obtenir la matrice de transformation T. De plus il n’existe pas 

d’algorithme de calcul rapide de la KLT. Pour ces raisons, la KLT est très peu utilisée 

malgré sa supériorité théorique. 

1 KLT: de l'anglais "Karhunen-Loeve Transform" 

- 42 -


• Transformation Cosinus 

La transformation cosinus discrète (DCT 1 ) 1D d’un vecteur x de longueur N donne un 

autre vecteur y de N coefficients, selon la définition: 

Avec k = 1, 2, ..., N-1 

y(k) = 

N −1 

2 2 1 

N ck xm ( m+ 

) k 

( ) ∑ ( )cos[ π ] 

2N 

m= 

0 

(I-1.7) 

c(0)=1/ 2 

c(k)=1 k ≠ 0 

La transformation cosinus discrète (DCT) d’un bloc x de NxN pixels donne un autre bloc X c 

de NxN coefficients, selon la définition: 

X c (k,l) = 

N −1 

N −1 

4 2 1 2 1 

2 

N ckl xmn ( m+ ) k ( n+ 

) l 

( , ) ∑∑ ( , )cos[ π ]cos[ π ] 

(I-1.8) 

2N 

2N 

m= 

0 

n= 

0 

Avec k, l = 1, 2, ..., N-1 

c(0,0)=1/2 

c(0,l)=c(k,0)=1/ 2 pour k ≠ 0 et l ≠ 0 

c(k,l)=1 ailleurs 

Par convention pour toutes les transformations, on appelle composante continue DC 2 le 

coefficient X c (0,0). Ce coefficient est proportionnel au niveau de gris moyen de l’image ou 

du bloc avant transformation. On appelle composantes AC 3 toutes les autres valeurs. 

La transformation cosinus a été introduite par [AHME-74] et a fait l’objet de beaucoup 

d’études et d’applications de la compression dans tous les domaines d’imagerie, y 

compris le médical. Contrairement à la transformation KLT, la matrice de transformation 

DCT est complètement indépendante de l’image. 

L’efficacité de la DCT en terme de compactage d’énergie a été comparée à celle de la 

KLT par [CLAR-85] et [AKAN-92]. En pratique, pour les images montrant une forte 

corrélation inter-pixels, l’efficacité de la DCT est quasi-semblable à celle de la KLT. [RAO- 

90] a démontré l’équivalence asymptotique des deux transformations. 

Il existe de nombreux algorithmes rapides de calculs de la DCT, qui diminuent le nombre 

d’opérations nécessaires par rapport à une application brute de l’équation (I-1.7), souvent 

en passant par la FFT [MADI-78]. 

La DCT peut être calculée sur des blocs de l’image (transformation par bloc), ou sur 

l’image tout entière (transformation Full-Frame). 

• Transformation LOT 

La transformation Lapped Orthogonal Transform (LOT) a été introduite pour pallier les 

effets de blocs qui apparaissent à faibles débits avec les méthodes à base de 

transformation par bloc. Les coefficients spectraux sont calculés en utilisant une fenêtre 

de pixels qui déborde du bloc à calculer. Il ne s’agit pas de blocs qui se chevauchent, 

mais d’un mode de calcul qui utilise l’information contenue dans les pixels voisins du bloc 

1 DCT: de l'anglais "Discrete Cosine Transform" 

2 DC: de l'anglais "Direct Componant", composant continu 

3 AC: de l'anglais "Alternative Componant", composants alternatifs 

- 43 -


en cours. Ce sont les vecteurs de base de la transformation qui chevauchent les blocs 

voisins. Souvent, ce chevauchement est de 50%, c’est à dire que pour transformer un 

bloc de NxN pixels, les vecteurs de base utilisés ont une taille de (N+N/2)x(N+N/2). En 

choisissant les vecteurs de base pour qu’ils s’annulent à leurs extrémités, la quantification 

des coefficients LOT ne peut pas générer de discontinuité au niveau des bords des blocs. 

Ceci est illustré par la Figure I-1.8. 

La transformation LOT a été introduite par [CASS-89]. [MALV-89] a proposé une structure 

LOT qui peut se calculer à partir de la DCT, ce qui a permis la mise au point d'un 

algorithme rapide. 

2.3.5. Codage sous-bandes 

Le codage sous-bandes (SBC 1 ) utilise également une représentation assimilable à une 

représentation par transformation de l’image. Celle-ci est filtrée de façon à générer un 

ensemble de sous-images ou sous-bandes, qui contiennent chacune une gamme limitée 

des fréquences de l’image de départ. Les sous-images étant de bande de fréquence 

limitée, il est possible de les sous-échantillonner. La Figure I-1.4 montre la décomposition 

d’une image en quatre sous-bandes, la première correspondant aux basses fréquences 

(approximation de l'image), la deuxième aux hautes fréquences colonnes (détails 

horizontaux), la troisième aux hautes fréquences lignes (détails verticaux), la quatrième 

aux hautes fréquences lignes et colonnes (détails diagonaux). Après décomposition en 

sous-bandes et sous-échantillonnage, les sous-images résultantes sont codées avec des 

stratégies adaptées à leur contenu énergétique. Tout comme les méthodes par 

transformation, on tend à privilégier les basses fréquences qui sont riches en énergie, et à 

coder plus grossièrement les hautes fréquences en prenant en compte la sensibilité de 

l’oeil humain. Les méthodes de codage couramment employées sur les sous-bandes sont 

la DPCM pour la sous-bande basse fréquence, et la quantification vectorielle pour les 

autres sous-bandes [BARL-94]. 

Les deux éléments clés d'un schéma de codage sous-bandes sont: 

• Le choix des bancs de filtres pour la décomposition sous-bandes 

• Le choix de(s) la technique(s) de codage appliquée(s) aux sous-bandes. 

Un avantage du codage sous-bandes réside dans la possibilité de transmission 

progressive, qui permet de reconstruire l’image comprimée en basse résolution (la sousbande 

basse fréquence) et d’ajouter progressivement les sous-images de détail si 

l’utilisateur désire plus de finesse. 

1 SBC: de l’anglais “SubBand Coding”, codage sous-bande 

- 44 -


H 0 

H 1 

H 0 

H 1 

2 

2 

2 

2 

Bande 0 

Bande 1 

Bande 2 

Bande 3 

H 0 2 

x(n) 

H 1 2 

Figure I-1.4: Exemple de décomposition sous-bandes. H0: filtre passe bas, H1: filtre 

passe haut 

2.3.6. Ondelettes 

La décomposition en ondelettes est une extension de la décomposition en sous-bandes, 

avec une manière particulière de choisir les filtres. La décomposition en ondelettes aboutit 

à une image de détails, et une image basse résolution. Cette dernière est à nouveau 

décomposée en une image de détail et une image basse résolution, et ainsi de suite. Plus 

on avance dans la décomposition, plus l’échelle de “grossissement” est importante, et 

plus les fréquences sont basses. Les sous-images ainsi obtenues peuvent être codées 

avec des stratégies différentes. La méthode de décomposition en ondelettes présente des 

qualités dites de “régularité” des filtres de décomposition qui sont plus avantageuses que 

celles des filtres usuels de décomposition sous-bandes. De plus, les filtres générés par 

des ondelettes préservent l’avantage de transmission progressive. Ces atouts expliquent 

l’engouement que rencontrent actuellement les ondelettes dans la communauté 

universitaire de la compression des images. 

2.4. Autres méthodes 

2.4.1. Méthodes par contour 

La méthode par contour consiste à séparer l’image en deux images complémentaires: une 

image de contours (contenant les hautes fréquences) et une image de fond (contenant les 

basses fréquences). Une stratégie de codage appropriée est appliquée sur chacune de 

ces deux images. 

2.4.2. Méthodes texturales 

La méthode texturale consiste à repérer dans l’image des zones ayant des 

caractéristiques voisines, c’est à dire des textures semblables. On code le type de texture 

et ses paramètres caractéristiques. On reconstruit l’image en régénérant synthétiquement 

les textures. 

2.4.3. Fractales 

Les méthodes fractales reposent sur l’idée que l’ont peut identifier des objets 

mathématiques de type fractal dans l’image. Ceux-ci sont composés de façon récursive 

de copies d’eux-mêmes. Le codage fractale consiste à repérer des zones de l’image qui 

peuvent être déductibles par une transformation géométrique d’une autre zone de taille 

- 45 -


différente (dite zone père). Le fichier comprimé comporte les caractéristiques des pères et 

des transformations associées aux zones qu’il peut engendrer. Les temps de calculs pour 

la phase de compression sont extrêmement longs, alors que ceux de la phase de 

décompression sont très courts [JACQ-93]. 

2.5. Standard pour les images fixes: JPEG 

2.5.1. Principes généraux 

Dans la fin des années 80, le comité Joint Photographic Experts Group (JPEG) a 

sélectionné en tant que standard mondial pour le codage des images fixes en couleurs 

une méthode de compression basée sur un schéma par transformation DCT. La 

recommandation JPEG [PENN-93] comprend trois sections principales. La première 

concerne la ligne de base de l’algorithme de compression d’image avec perte, la 

deuxième est un ensemble de caractéristiques étendues pour élargir le champ 

d’application du standard (entrée à 12bpp, transmission progressive, codage 

arithmétique), la troisième spécifie de façon indépendante une méthode sans perte 

utilisant une méthode prédictive et adaptative de type DPCM en conjonction avec un 

codeur de Huffman. La présente section ne traite que de la ligne de base. 

2.5.2. Descriptif résumé et illustré de l'algorithme JPEG avec perte 

Les étapes de l’algorithme JPEG sont présentées ci-après. 

Etape 1. L’image est divisée en blocs de 8x8 pixels, chaque bloc est transformé par DCT. 

La formule de transformation DCT utilisée est: 

X c (k,l) = ckl 7 7 

( , ) 

( 2m+ 1) 

k ( 2n+ 

1) l 

∑∑ xmn ( , ) cos[ π ] cos[ π ] 

4 m= 0 n= 

0 

16 

16 

Prenons par exemple un bloc extrait de l’image LENA [RABB-91]. 

Le bloc original est: 

xmn ( , ) = 

⎡139 144 149 153 155 155 155 155⎤ 

⎢ 

144 151 153 156 159 156 156 156 

⎥ 

⎢ 

⎥ 

⎢150 155 160 163 158 156 156 156⎥ 

⎢ 

⎥ 

⎢159 161 162 160 160 159 159 159⎥ 

⎢159 160 161 162 162 155 155 155⎥ 

⎢ 

⎥ 

⎢161 161 161 161 160 157 157 157⎥ 

⎢162 162 161 163 162 157 157 157⎥ 

⎢ 

⎥ 

⎣⎢ 

162 162 161 161 163 158 158 158⎦⎥ 

Sa transformée, après avoir arrondi les coefficients fréquentiels à l’entier le plus proche , 

donne: 

- 46 -


⎡1260 −1 −12 −5 2 −2 −3 1 ⎤ 

⎢ 

−23 −17 −6 −3 −3 0 0 −1 

⎥ 

⎢ 

⎥ 

⎢ −11 −9 −2 2 0 −1 −1 0 ⎥ 

⎢ 

⎥ 

7 2 0 1 1 0 0 0 

X c (k,l) = ⎢ − − 

⎥ 

⎢ −1 −1 1 2 0 −1 1 1 ⎥ 

⎢ 

⎥ 

⎢ 2 0 2 0 −1 1 1 −1⎥ 

⎢ −1 0 0 −1 0 2 1 −1⎥ 

⎢ 

⎥ 

⎣⎢ 

−3 2 −4 −2 2 1 −1 0 ⎦⎥ 

On voit que la DCT a pour effet de concentrer l’information en très peu de coefficients 

fréquentiels correspondant aux basses fréquences, et que les autres coefficients de haute 

fréquence ont des valeurs très faibles. 

Etape 2. Les coefficients fréquentiels sont normalisés. 

Une matrice de normalisation composée d’entiers sur 8 bits est utilisée pour pondérer les 

coefficients. Chaque coefficient de la matrice transformée est divisé par la valeur 

correspondante de la matrice de normalisation. Les coefficients normalisés sont obtenus 

par la formule: 

⎡ X( k, 

l) 

⎤ 

X( k, l) 

= int⎢ 

⎥ 

⎣qQk . ( , l) 

⎦ 

 

Où X( k l) 

, est le coefficient DCT normalisé, 

int(x) est la fonction d'arrondi à l'entier le plus proche, 

X(k,l) est le coefficient DCT de position (k,l) du bloc, 

q est le pas de quantification, 

Q(k,l) est la matrice de normalisation. 

La normalisation est équivalente à une quantification scalaire. 

Le pas de quantification est une valeur entière qui sert à régler le degré de quantification 

du bloc. Plus le pas est grand, plus grande sont la compression, et aussi la distorsion. 

Dans les applications courantes du standard, les valeurs de q utilisées en pratique sont 

comprises entre 1 et environ 25. Le pas peut être modifié d'un bloc à l'autre afin d'adapter 

localement la compression, par exemple pour ajuster le taux final sur l'image entière en 

régulant le débit local par un buffer de sortie du codeur. 

La matrice de normalisation sert à pondérer les coefficients DCT afin d'adapter le degré 

de quantification de chaque coefficient en fonction de la sensibilité du système visuel au 

bruit de quantification. Ainsi, l'œil nu est peu sensible au bruit introduit dans les hautes 

fréquences et les valeurs de Q(k,l) correspondant aux fréquences élevées seront plus 

fortes que pour les basses fréquences. Dans le cas d’une image couleur, par exemple 

RGB+L, 4 matrices différentes de normalisation différentes peuvent être utilisées pour les 

composantes couleur et luminance. 

Une des matrices de normalisation de la luminance fournie par le standard est: 

- 47 -


Qkl ( , ) = 

⎡16 11 10 16 24 40 51 61 ⎤ 

⎢ 

12 12 14 19 26 58 60 55 

⎥ 

⎢ 

⎥ 

⎢14 13 16 24 40 57 69 56 ⎥ 

⎢ 

⎥ 

⎢ 

14 17 22 29 51 87 80 62 

⎥ 

⎢18 22 37 56 68 109 103 77 ⎥ 

⎢ 

⎥ 

⎢24 35 55 64 81 104 113 92 ⎥ 

⎢49 64 78 87 103 121 120 101⎥ 

⎢ 

⎥ 

⎣⎢ 

72 92 95 98 112 100 103 99 ⎦⎥ 

Dans notre exemple, les coefficients normalisés sont : 

⎡ 79 0 − 1 0 0 0 0 0⎤ 

⎢ 

−2 −1 0 0 0 0 0 0 

⎥ 

⎢ 

⎥ 

⎢−1 −1 0 0 0 0 0 0⎥ 

⎢ 

⎥ 

 

X ( C 

k , l )= ⎢ 

0 0 0 0 0 0 0 0 

⎥ 

⎢ 0 0 0 0 0 0 0 0⎥ 

⎢ 

⎥ 

⎢ 0 0 0 0 0 0 0 0⎥ 

⎢ 0 0 0 0 0 0 0 0⎥ 

⎢ 

⎥ 

⎣⎢ 

0 0 0 0 0 0 0 0⎦⎥ 

La même matrice de normalisation est appliquée à tous les blocs de l’image. Elle est 

transmise avec les coefficients comprimés en tant que frais généraux de codage. Le choix 

de la matrice de normalisation est laissé libre à l’utilisateur. Le comité JPEG a effectué un 

travail considérable en vue de trouver expérimentalement des matrices qui fournissent les 

meilleurs résultats possibles visuellement en pondérant les coefficients selon leur 

importance perceptuelle. 

Etape 3. Le coefficient DC normalisé est codé. 

Par un système de DPCM, le coefficient DC est codé en utilisant la valeur DC du bloc 

précédant. L’ensemble de coefficients DC de tous les blocs de l’image est ensuite codé 

par un codeur de Huffman. 

Etape 4. Les coefficients AC sont réarrangés par une méthode zigzag. 

L’énergie est concentrée dans les coefficients en haut à gauche de la matrice 

transformée. On réordonne les coefficients afin d’obtenir un vecteur 1D qui range 

approximativement les coefficients par ordre décroissant d’énergie. Comme de nombreux 

coefficients de X^ 

correspondant aux fréquences élevées sont nuls on obtient des grandes 

plages de zéros, qui se prêtent bien au codage RLC. 

Le réarrangement zigzag se fait comme indiqué 

- 48 -


Figure I-1.5: Réarrangement zigzag des blocs normalisés JPEG. 

Dans l’exemple utilisé plus haut, le réarrangement zigzag aboutit au vecteur: 

[ 79 0 -2 -1 -1 -1 0 0 -1 EOB] 

Le symbole EOB 1 est place juste après la dernière valeur non nulle. Comme les blocs ont 

toujours 64 coefficients, il n’est pas nécessaire de préciser la longueur de la plage de 

zéros finissant le bloc réarrangé. 

Etape 5. Les vecteurs zigzags sont codés par RunLength et Huffman. 

Seuls les coefficients non nuls sont codés, mais d’une façon qui prend en compte le 

nombre de zéros qui les précèdent. Pour chacun de ces coefficients, on obtient un code 

composite fait de deux codes: un code de longueur fixe et un code de longueur variable. 

Le code de longueur fixe est composé de 8 bits, sa représentation binaire est 

‘ZZZZCCCC’. Les quatre bits de poids fort ZZZZ servent à représenter la longueur de la 

plage de zéros qui précède le symbole courant, les quatre bits de poids faible CCCC 

servent à représenter la catégorie dont fait partie la valeur absolue du coefficient. La 

catégorie c est l’intervalle délimité par des puissances de deux dont fait partie le 

coefficient. Pour une valeur absolue de coefficient appartenant à l’intervalle [2 c-1 et 2 c -1], 

la catégorie est c. Dans la norme JPEG, la valeur maximale de c est 10. Le code de 

longueur variable sert à préciser le signe du coefficient et sa position dans l’intervalle. Ce 

code a donc une longueur c. 

Dans notre exemple, le coefficient -2 est précédé de un zéro: ZZZZ=0001. Il a une valeur 

absolue comprise entre 2 2-1 =2 et 2 2 -1=3, donc sa catégorie est c=2, et se représente en 

binaire par CCCC=0010. Il a un signe négatif (représenté par un bit ‘0’ par convention) et 

il est la première valeur de l’intervalle [2,3]. Donc le code de longueur variable est 01. 

Les codes de longueur fixe sont codés par un codeur de Huffman, afin de gagner encore 

en compression. 

Pour coder une plage de zéros dont la longueur est supérieure ou égale à seize 

(ZZZZ=1111), on utilise un code ZZZZCCCC=11110000, et un ou plusieurs autres codes 

composites. 

L’ensemble de bits produits en mettant bout à bout tous les codes d’un bloc suit la 

syntaxe: 

1 EOB: symbole de fin de bloc, ‘End Of Bloc’ en anglais. 

- 49 -


code Huffman de la différence DC / code Huffman pour représenter ZZZZCCCC et code 

de longueur variable / ... / code Huffman pour représenter ZZZZCCCC et code de 

longueur variable / code Huffman pour EOB. 

Etape 6. Décodage. 

Le décodage se fait en appliquant les opérations inverses: décodage Huffman et RLC, 

réarrangement inverse du zigzag, dénormalisation par multiplication avec la matrice Q, 

DCT inverse. 

2.6. Standard pour séquences d’images: MPEG 

2.6.1. Principes généraux. 

Le groupe de travail Moving Pictures Experts Group (MPEG) a publié au début des 

années 90 un standard pour la vidéo qui comprend le codage des séquences d’images 

couleur et du son associe. La présente section ne s’intéresse qu’au codage d’images noir 

et blanc. 

Le schéma général de l’algorithme MPEG est le suivant: 

image 

originale 

compensation 

de mouvement 

transformation 

par bloc 

quantification 

et codage 

séquence 

de bits 

Figure I-1.6 : Principe simplifié du codage MPEG 

La méthode MPEG tire profit de la ressemblance des images successives dans une 

séquence d'image. La première hypothèse de base est que chaque image contient des 

objets en mouvement, dont la position peut être prédite par leur position dans l'image 

précédente par simple translation des pixels. Dans la méthode MPEG, l'image est 

découpée en zone de 16x16 pixels, les objets, dont on estime le mouvement. La 

deuxième hypothèse est que l'intensité lumineuse d'un objet en mouvement reste la 

même d'une image à l'autre. 

Dans chaque image, on distingue trois types de zones : 

• Les zones fixes, ne contenant aucune information à transmettre par rapport à l'image 

précédente, 

• Les zones compensables, qui se déduisent de l'image précédente par un vecteur de 

déplacement, et éventuellement une erreur de compensation grossièrement quantifiée 

(dans ce cas, il y a eu prédiction de la zone), 

• Les zones non compensables, pour lesquelles on transmet la différence pixel à pixel 

par rapport à l'image précédente. 

Il y a plusieurs façons de prédire une zone de l'image par estimation de mouvement : 

• La prédiction peut se faire à partir d'une image précédente (prédiction avant), 

• La prédiction peut se faire par interpolation (moyenne) entre l'image précédente et 

l'image suivante (prédiction bidirectionnelle). 

Le codage MPEG permet pour une même séquence d'image de choisir un 

ordonnancement des images spécifiant lesquelles feront l'objet d'une prédiction avant ou 

bidirectionnelle. Le standard définit trois types d'images : 

- 50 -


• Les images I ou Intra-codées : elles sont codées indépendamment des autres à un 

faible taux. Elles fournissent la référence pour les compensations de mouvement et 

prédiction. 

• Les images P ou Prédites : elles sont codées avec compensation de mouvement et 

prédiction à partir d'une image antérieure de type I ou P. Leur taux de compression est 

supérieur à celui des images I. 

• Les images B ou Bidirectionnelles : elles sont codées avec compensation de 

mouvement et interpolation par rapport à une image précédente et une image suivante. 

Leur taux de compression est le plus important. Elles ne sont jamais utilisées comme 

référence à une prédiction. 

L'utilisateur est libre de choisir l'ordonnancement des trois types d'image selon son 

application. La présence d'images B augmente le taux de compression mais implique lors 

du décodage de reconstruire des images postérieures à l'image courante. 

1 

2 

I 

B 

B 

P 

B 

B 

Prédictions bidirectionnelles 

3 

P 

4 

I 

Prédictions avant 

5 

6 

7 

8 

Figure I-1.7 : Exemple d'ordonnancement d'images dans une séquence MPEG. I : 

image Intra-codée, P: image Prédite, B : image interpolée Bidirectionnelle 

2.6.2. Descriptif résumé de l'algorithme MPEG. 

Etape 1. Choix de l'ordonnancement des images dans la séquence. 

Etape 2. Quantification des images P. 

L'image P (notée xt ( + τ )) à coder (par exemple l'image numéro 4 de la Figure I-1.7) est 

divisée en zones de 16x16 pixels appelées macroblocs. On se fixe une étendue maximale 

( me, ne) par rapport au centre du macrobloc autour de laquelle on recherchera un 

macrobloc similaire mais translaté dans l'image précédente (notée x(t)) utilisée pour la 

prédiction. Cela revient à trouver le vecteur translation ( mm, nn) qui minimise l'erreur 

quadratique : 

15 

15 

[ ] 

2 

D = ∑∑ xmnt ( 0 0 

+ τ ) − xm ( + mm0n+ 

nm0t) 

, avec m m


pixels correspondants. Ce macrobloc erreur est quantifié par une méthode similaire à 

JPEG, par transformation DCT de blocs de 8x8 pixels, puis quantification. Le standard 

MPEG propose plusieurs matrices de normalisation qui ont fait l'objet de tests 

psychovisuels moins extensifs que pour les matrices JPEG elles-mêmes. L'une des 

matrices de normalisation proposée est donnée ci-après. Elle fait apparaître que les 

coefficients de normalisations sont plus faibles que pour JPEG car ils sont destinés à des 

blocs d'erreurs dont les valeurs sont faibles. 

Qkl ( , ) = 

⎡ 8 16 19 22 26 27 29 34⎤ 

⎢ 

16 16 22 24 27 29 34 37 

⎥ 

⎢ 

⎥ 

⎢19 22 26 27 29 34 34 38⎥ 

⎢ 

⎥ 

⎢22 22 26 27 29 34 37 40⎥ 

⎢22 26 27 29 32 35 40 48⎥ 

⎢ 

⎥ 

⎢26 27 29 32 35 40 48 58⎥ 

⎢26 27 29 34 38 46 56 69⎥ 

⎢ 

⎥ 

⎣⎢ 

27 29 35 38 46 56 69 83⎦⎥ 

Après quantification, le macrobloc compensé est reconstruit lors de l'opération de codage 

elle-même. On cherche à savoir si la compensation de mouvement est réellement plus 

utile que de coder directement le macrobloc. Pour cela on compare la variance du 

macrobloc avec la variance du macrobloc compensé quantifié. La variance la plus faible 

indique la méthode de codage à choisir. Par conséquent, l'image P une fois codée sera 

composée de macroblocs compensés quantifiés, et de macroblocs directement 

quantifiés. 

Etape 3. Quantification des images B. 

On cherche le macrobloc le plus proche du macrobloc courant de l'image B à la fois dans 

l'image de référence précédente et l'image de référence suivante. Le macrobloc 

compensé est composé des valeurs de pixel moyennes entre les deux macroblocs de 

référence trouvés. Le reste de la compensation est identique à ce qui a été 

précédemment décrit pour les images P. 

Etape 4. Quantification des images I. 

Les images I sont quantifiées selon un principe similaire à la norme JPEG. 

Etape 5. Codage. 

Le codage des images quantifiées est très proche de celui de JPEG :réarrangement 

zigzag, DPCM sur les coefficients continus, RLC et Huffman sur les coefficients AC. La 

syntaxe du flot de bits final dépend du type de l'image. Elle comprend un indicateur du 

type d'image, un indicateur du type de macrobloc (compensé ou non), un codage 

différentiel du vecteur mouvement (si applicable), le code de l'erreur de compensation ou 

du bloc. 

2.6.3. Principaux artefacts. 

Les images comprimées par la méthode MPEG présentent des artefacts de blocs à des 

taux de compression élevés, tout comme la méthode JPEG. En effet, la quantification des 

erreurs après compensation de mouvement est également basée sur la quantification de 

bloc DCT 8x8. 

- 52 -


Visualisées individuellement, les images d'une séquence MPEG peuvent apparaître 

irrégulières dans leur qualité visuelle de part le fait que toutes ne sont pas codées de la 

même façon. (I, P, B) 

2.7. Méthode développée par Philips: MLOT 

En vue du travail d'évaluation d'images d'angiographies cardiaques comprimées qui fait 

l'objet de la partie II de la présente thèse, un algorithme spécifique a été mis au point par 

les laboratoires de la société Philips. Les contraintes et objectifs préalables à la mise au 

point de l'algorithme sont donnés dans le cahier des charges décrit l’introduction générale 

de ce mémoire. La raison majeure qui a motivé le développement d'une méthode 

spécifique, plutôt que l'utilisation des standards JPEG ou MPEG a été le problème des 

artefacts de blocs. L'algorithme mis au point par Philips sera dénoté MLOT dans la suite 

de cette thèse. Il s'agit d'une méthode intra-image. 

^ 

Y 1,1 

^ 

+ 

Y 1,2 

+ 

x 

x 

n 

n 

^ 

Y 2,1 

^ 

+ 

Y 2,2 

+ 

x 

x 

n 

n 

Y 

^ 

+ 

1,8 x 

Y 

^ + 

2,8 

n 

= = 

x 

n 

n 

+ 

n 

échantillons reconstruits 

n 

Figure I-1.8: Absence d'effet de bloc par la transformation Lapped Orthogonal 

Transform 

- 53 -


Les étapes de l'algorithme sont données ci-après. Le schéma général est le même que 

celui d'une méthode par transformation donnée en Figure I-1.2. 

Etape 1. Transformation par une fonction dérivée de la LOT : la MLT. 

Afin d'éviter les artefacts de blocs, il est nécessaire que les vecteurs de base de la 

transformation convergent progressivement vers zéro à leurs extrémités (Figure I-1.8). 

Cela n'est pas possible avec une transformation par blocs adjacents si la contrainte de 

réversibilité doit être conservée. Une classe de transformation qui permet d'éliminer les 

artefacts de blocs est la classe des Overlap Transforms. Un recouvrement de 50% des 

vecteurs de base est un bon choix en pratique. Au-delà, il se produit un artefact appelé 

'ringing effect' lorsque la quantification est importante. La représentation matricielle d'une 

telle 50%-Overlap Transform en 1D est : 

⎡. 

⎤ 

⎢ 

. 

⎥ 

⎢ 

⎥ 

⎢ AA 

1 2 

⎥ 

⎢ 

⎥ 

y = Tx = ⎢ 

AA 

1 2 

⎥x 

(I-1.9) 

⎢ 

AA ⎥ 

1 2 

⎢ 

⎥ 

⎢ 

. ⎥ 

⎢ 

⎥ 

⎣ 

. ⎦ 

En appliquant les contraintes imposées sur T par la propriété de réversibilité, et en 

appliquant une deuxième propriété avantageuse appelée linéarité de phase (pour obtenir 

des vecteurs de base symétrique en vue de respecter la réponse symétrique du HVS), on 

obtient une transformation dérivée des vecteurs de base de la DCT et de la DST 1 [MALV- 

90]. Mais les vecteurs de base de cette LOT, bien que nettement améliorés par rapport à 

la DCT, ne convergent pas parfaitement vers zéro à leurs extrémités. [YOUN-92] propose 

de modifier les facteurs d'échelle c(k,l) de certains vecteurs de base de la DCT employée 

pour calculer ceux de la transformation LOT. Il en résulte une nouvelle transformation 

appelée Modified Lot Transform (MLT). La MLT est parfaitement réversible, ses vecteurs 

de base convergent progressivement vers zéro, mais elle n'est pas orthogonale. 

Cependant, elle possède les caractéristiques de décorrélation nécessaires à la 

compression et s'avère très appropriée. Bien que pour coder un bloc de b pixels des 

vecteurs de base de longueur 2b soient nécessaires, le nombre d'opérations pour calculer 

une MLT n'est pas de 50% supérieur à celui d'une DCT mais seulement de 25% [MALV- 

90], [BREE-95]. Le calcul de la MLT utilisé dans l'algorithme MLOT est conduit de façon à 

donner des coefficients spectraux entiers. 

Le choix de la taille b de blocs se fait en fonction des propriétés de stationnarité des 

images à coder. 

Etape 2. Quantification et codage. 

La méthode MLOT fait appel à un quantificateur à zone morte 'dead-zone' dont les 

caractéristiques sont données dans [BREE-94]. Ce quantificateur est très proche du 

quantificateur uniforme à transition centrée 'midtread' (voir chapitre I-6). Il quantifie à zéro 

toutes les valeurs dans une zone morte autour de l’origine. En pratique, il s'agit de 

coefficients faibles et l'erreur de quantification introduite n'est pas perceptible. En 

revanche le gain en entropie est intéressant. 

1 DST : transformation sinus discrète, de l'anglais Discrete sine Transform. Cette transformation est de la 

même famille que la DCT. 

- 54 -


Les coefficients quantifiés sont pondérés en fonction du HVS par multiplication avec une 

matrice dérivée des travaux de [SAKR-77]. La méthode MLOT utilise en option une 

deuxième pondération adaptée aux post-traitements des angiographies coronaires. 

Les coefficients quantifiés et pondérés sont réarrangés par un balayage zigzag, puis 

codés. Les coefficients continus sont codés séparément par un nombre de bits fixe. Les 

coefficients AC sont codés par une combinaison de RLC et VLE similaire à l'algorithme 

MPEG-2. 

Etape 3. Variante pour la transmission progressive. 

Pour pouvoir reconstruire une image basse résolution (basse qualité) à partir d'une partie 

seulement du flot de bits de l'image comprimée, un codage hiérarchique a été employé. 

Lors de l'opération de balayage zigzag d'un bloc quantifié, les coefficients réordonnés sont 

divisés en segments. Dans la méthode MLOT, quatre segments ont été définis, le premier 

correspondant aux basses fréquences, et les autres aux fréquences moyennes et neutres. 

En ne reconstruisant pour chaque bloc que le premier segment, on obtient une image 

basse résolution, que l'on peut progressivement affiner en reconstruisant les segments 

suivants. 

Etape 4. Contrôle du taux de compression. 

Afin d'obtenir avec précision la taille finale souhaitée pour l'image comprimée, une courbe 

d'évolution du nombre de bits engendré par le codage successif des segments et des 

blocs est déterminée à priori. La quantification du premier segment du premier bloc est 

réalisée avec un pas de quantification prédéfini. Le nombre de bits produits est comparé 

avec un nombre cible correspondant à la courbe d'évolution attendue. Le pas de 

quantification du segment suivant est ajusté en fonction de l'adéquation constatée entre 

les nombres de bits réel et attendu. 

Etape 5. Variante pour la régénération du bruit de l'image. 

Lorsque le taux de compression est élevé, la quantification supprime les hautes 

fréquences des blocs de l'image. Dans le cas des angiographies cardiaques, les images 

ont au départ un contenu en bruit important, dû à la nature quantique des rayons X. 

L'observateur est habitué à des images bruitées, et la compression a un effet de lissage 

de l'image qui peut dérouter, bien que l'information clinique ait été correctement 

préservée. Un système de régénération de bruit a été développé, et a fait l'objet d'un 

dépôt de brevet. Il s'agit de mesurer l'écart entre le spectre de puissance du bloc quantifié 

et du bloc original. Le bruit supprimé par la quantification est modélisé, et les paramètres 

de modélisation sont transmis avec le bloc codé. Lors de la reconstruction, le spectre du 

bruit modélisé est ajouté aux coefficients spectraux avant la transmission inverse MLT. 

- 55 -

CHAPITRE I-2 

GENERALITES SUR LES 

IMAGES MEDICALES ET 

ANGIOGRAPHIQUES: 

ACQUISITION, COMPRESSION 

ET STANDARDISATION 

- 56 -

Chapitre I-2: Généralités sur les images médicales et angiographiques 

1. Compression des images médicales 

1.1. Tendance en radiologie 

L’imagerie médicale numérique ([NEWE-90]) concerne environ 30% des examens 

radiologiques. Elle recouvre une grande diversité dans les principes physiques mis en jeu 

(rayons-X, ultrasons, résonance magnétique nucléaire, émission de positron, médecine 

nucléaire) et dans les différentes applications médicales (radiographie d’urgence, 

procédures interventionnelles...). Une méthode de compression bien adaptée à l’une des 

modalités d’imagerie médicale ne l’est pas forcément pour une autre. Ou, tout au moins, 

une méthode peut demander des adaptations différentes selon les modalités. 

Une motivation majeure des recherches en compression d’images médicales vient de la 

proportion croissante d’examens acquis numériquement. Il faut les stocker, les 

communiquer et les visualiser malgré la masses de donnée requise. Les examens 

directement acquis numériquement sont par exemple le scanner, l’IRM, l’angiographie. La 

présence dans un même établissement de films conventionnels et d’images numériques 

pose des problèmes pratiques. La tendance est de numériser aussi les examens non 

digitaux à l’origine, en numérisant les films argentiques ou en utilisant des plaques de 

phosphore (systèmes CR 1 ) à la place des cassettes pour films traditionnels. Toutes les 

images numériques peuvent être archivées, communiquées et visualisées à l’aide de 

réseaux numériques tels que les PACS 2 . La viabilité économique des PACS a été difficile 

à prouver lors de leur introduction à la fin des années 80. Mais leur émergence et la 

tendance irréverssible vers les solutions numériques ont fortement motivé l’étude de la 

compression d’image. 

[RABB-91] explique de façon didactique quelques-unes des méthodes de compression 

applicables à l’imagerie médicale. [WONG-95] passe en revue de façon exhaustive les 

motivations, contraintes, applications et travaux de compression sur des images 

médicales. 

Il est frappant de constater le faible nombre d’études consacrées aux algorithmes 

standards tels que JPEG avant 1995. Au delà d’un taux de 10:1, la communauté médicale 

et scientifique a eu tendance a considérer que les artefacts de blocs étaient rédhibitoires. 

Les méthodes de compression qui ont fait l’objet des principaux développements et 

d’évaluation dans le médical sont énumérés ci-après. 

• La Full-Frame DCT 

Les travaux de l’UCLA [LO-85], [CHAN-89], montrent que des images numériques de 

main et de poumon comprimées jusqu’à un taux de 20:1 ne font pas l’objet de 

dégradation de performance diagnostique [SAYR-92]. 

• La décomposition sous-bandes 

[ROMP-91], [AKRO-92], [MOLL-92], [AKRO-93]. 

• Les ondelettes 

1 CR: Computed Radiography 

2 PACS: Picture Archiving and Communication System 

- 57 -


Cette technique fait actuellement l’objet d’un nombre important de publications. [MAND- 

92], [MAND-93] fait part de bons résultats visuels sur des images de résonance 

magnétiques. Parmi les travaux récents, on peut citer [BRAD-97] sur des images de 

thorax. 

[BENO-97] applique une compression à base d’ondelette dans le cadre du projet Cardio- 

Média, qui a pour objectif la création d'un prototype de dossier coronarien sur carte 

optique afin de faciliter le suivi clinique des patients traités par angioplastie. L’algorithme 

présenté utilise une transformation en ondelettes et une quantification vectorielle adaptée 

des coefficients d'ondelettes. Son originalité repose sur la phase d'apprentissage qui 

permet de disposer d'un algorithme de compression/décompression rapide adapté à la 

modalité médicale "angiographie". Une évaluation subjective par consensus de la qualité 

diagnostique des images comprimées a permis de retenir un taux de compression de 12 

qui répond aux contraintes matérielles et médicales du projet. 

• La quantification vectorielle 

Stanford est un haut lieu de cette technique. Les travaux publiés dans [RISK-89], [RISK- 

90], [COSM-93], [COSM-94], font état de bons résultats diagnostiques en scanner et en 

IRM jusqu’à des taux de 30:1. 

[AKRO-92], [AKRO-93] a utilisé des blocs de formes variables pour s’adapter au 

propriétés d’images radiologiques. 

Actuellement, on cherche à évaluer les limites d’utilisation des méthodes standards. Bien 

que donnant des résultats moins bons que les méthodes citées précédemment, elles 

présentent l’avantage de disposer de logiciel et matériels commercialisés peu onéreux, 

disponibles sur des ordinateurs standards. 

Des travaux récents visent à rendre JPEG plus adapté aux images médicales, [DING-95] 

[DING-96]. 

Un certain effort commence à être perçu pour évaluer jusqu’à quel taux JPEG fournit des 

résultats acceptables. 

1.2. Tendance en cardiologie 

L’intérêt porté par la communauté cardiologique à la compression d’image est plus récent 

qu’en radiologie. Cela provient peut-être du fait que l’archivage et l’utilisation de supports 

d’échanges tels que le Compact Disc n’est envisageable que depuis deux ou trois ans. Un 

examen volumineux en radiologie occupe environ 30 MO 3 , tandis qu’en cardiologie, un 

examen courant occupe plus de 500 Mo. 

Considérant d’emblé le problème de l’échange des images et de la compatibilité des 

media en cardiologie, les chercheurs, médecins et industriels portent une grande attention 

aux avantages des standards. 

Les principaux travaux de compression en cardiologies sont ceux sur les méthodes 

MLOT, JPEG et MPEG évalués dans cette thèse ([BREEU-94], [KONI-97], [KIRK-97]), 

ceux de [EPST-94] portant sur des simulations de thrombus, et ceux de [RIGO-96] portant 

sur les mesures quantitatives avec JPEG. 

3 Mo: Mega octet 

- 58 -


2. Standards d’images médicales 

2.1. Pourquoi un standard 

Le besoin d’un standard pour les images médicales est apparu avec l’essor des media 

numériques et des réseaux d’images. Les différents constructeurs d’imagers numériques 

avaient tous dans les années 80 des mises en oeuvre propriétaires. La communauté 

médicale a activement oeuvré à l’établissement d’un standard pour pouvoir échanger des 

examens numériques au sein d’un établissement, ou entre institutions. Même si un long 

chemin a été parcouru, l’inter-opérabilité entre machines n’est pas encore aujourd’hui une 

question complètement évidente en pratique. 

2.2. Historique des standards ACR-NEMA et DICOM 

En 1985, un comité composé de radiologues et d’ingénieurs, l’ACR-NEMA 4 , a crée le 

premier standard d’images médicales. Celui-ci était essentiellement basé sur un protocole 

pour échanger les images avec les informations qui lui sont associées (identification du 

patient et de l’examen, paramètres liés à l’acquisition ou à la visualisation de l’image). 

Malgré des mises à jour progressives, ce standard présentait quelques faiblesses et ne 

permettait pas toujours l’échange dans de bonnes conditions. 

En 1992-93, le standard ACR-NEMA a été modifié en profondeur pour déboucher sur le 

standard DICOM 3 5 [NEMA-96], [HIND-94]. L’apport capital de ce standard est lié à trois 

de ces caractéristiques fondamentales: 

• il repose sur un modèle de données, ce qui permet de lier les paramètres cliniques, les 

paramètres techniques et l’image avec une sémantique, 

• il est orienté objet, à chaque modalité d’imagerie correspond une IOD 6 qui spécifie 

l’objet-image et ses propriétés, 

• il intègre des services, ce qui permet de définir des règles pour communiquer, stocker, 

rechercher, imprimer un objet. 

Le format DICOM a maintenant deux volets: l’un axé sur les réseaux, l’autre axé sur les 

media. Pour le stockage sur un medium digital, chaque spécialité dispose d’un profile 

d’application 7 , qui associe un medium particulier avec une IOD. Par exemple en 

angiographie, le support standardisé pour l’échange est le Compact Disc. 

DICOM est donc un standard dont le champ d’application est plus vaste que la simple 

définition d’une syntaxe pour écrire un fichier, et dont la vocation est d’offrir une fondation 

aux fonctionnalités liées à l’échange des images entre systèmes hétérogènes (scanners, 

IRM, consoles de travail...). 

2.3. DICOM et la compression 

La notion de compression a fait son apparition dès 1989, avec l’intégration de quelques 

champs de données dédiés à une compression éventuelle de l’image. 

Depuis, de nombreuses possibilité de coder les images ont été intégrées dans le 

standard, incluant compression avec et sans perte. 

4 ACR: American Colledge of Radiology, NEMA: National Electrical Manufacturers Association 

5 DICOM: Digital Imaging and COmmunication in Medicine 

6 IOD: Image Object Definition 

7 profile d’application, an anglais: application profile 

- 59 -


Mais introduire la compression dans un standard médical n’a d’intérêt que pour des 

applications le justifiant. 

Deux applications de la compression dans DICOM concernent à l’heure actuelle le 

stockage sur medium en échographie et en angiographie. Depuis quelques temps déjà, 

les constructeurs d’échographes proposent un archivage sur disque optique magnétique 

ou sur cassette numérique, et utilise un compression MPEG. Cette approche est 

conforme au standard. En 1995, le CD a été introduite comme le support standard 

d’échange en angiographie. Le CD cardiologique est basé sur une compression sans 

perte de type JPEG, et peut être étendu par du JPEG avec perte. Deux constructeurs 

(Philips et Siemens) ont opté pour cette extension. En sus des images codées sans perte, 

leurs disques contiennent les images codées avec perte, afin de pouvoir visualiser les 

images dynamiquement directement depuis le disque. 

Dans ces deux applications qui font appel à la compression, les examens sont constitués 

de séquences d’images: la quantité de donnée est importante, et la visualisation 

dynamique est nécessaire. 

3. Standards médicaux et standards industriels 

Il est vraisemblable que l’intégration de la compression dans le standard DICOM va 

s’intensifier dans les années à venir. La problématique d’un algorithme dédié au médical 

ou d’un standard de l’industrie informatique et grand public (tel que JPEG ou MPEG) 

devra être résolue. 

Là encore, l’approche des radiologues et des cardiologues diffèrent. 

L’ACR étudie actuellement la définition d’un nouvel algorithme de compression, le mieux 

adapté possible aux images médicales. Au moment de la rédaction de ce mémoire, un 

algorithme à base d’ondelettes est envisagé. Quant à l’ACC, évalue le champ 

d’application de JPEG sur l’interprétation visuelle et sur les mesures QCA. 

Pour des applications autres que les systèmes d’acquisition (angiographie, scanners, 

IRM), il est très peu probable que les constructeurs médicaux mettent en œuvre des 

algorithmes spécifiques. En particulier, pour les cartes électroniques qui sont nécessaires 

à certaines applications (décompression temps réel), les coûts de développements sont 

trop élevés. Les investissements d’une réalisation matérielle ne sont pas en proportion 

avec la diffusion en petite série des systèmes médicaux. De plus, un matériel dédié est 

moins pratique pour l’utilisateur, qui doit mettre en place un configuration spécifique sur 

son ordinateur. Enfin, les technologies informatiques évoluent beaucoup plus vite que les 

cycles de vie des produits médicaux. L‘utilisation croissante de systèmes informatiques 

standards par les constructeurs d’imagerie laisse un champ plus important à l’utilisateur 

pour faire évoluer sa configuration. 

La paradigme de la méthode de compression médicale basée sur un algorithme 

spécifique ou un standard industriel a été au coeur de toutes les réflexions sous-jacentes 

à cette thèse. L’évolution des performances informatiques entre la conception de notre 

projet et la fin de sa réalisation a complètement bouleversé nos attentes vis à vis de la 

compression en angiographie cardiaque. Le projet était axé au départ sur la réalisation 

d’un matériel pour l’acquisition temps-réel des images au cours de l’examen. En effet, les 

disques durs suffisamment rapides pour un acquisition à 25 im/sec étaient alors 

extrêmement onéreux et l’évolution des prix et performances encore lente. Un simple 

ordinateur permettant une visualisation dynamique des angiographies valait alors environ 

un million de francs, à cause du disque dur temps réel. Un investissement lourd pour un 

système d’angiographie pouvait se justifier. Deux ans après le début du projet, la 

- 60 -


tendance était différente, le prix des disques temps réel commençait à chuter. En 

parallèle, l’accent était mis par les cliniciens sur les supports d’échange et sur les réseaux. 

L’application de la compression se déplaçait donc de l’acquisition vers la communication 

des images et leur visualisation dynamique. Les résultats des développements et des 

évaluations restaient donc encore un sujet d’intérêt primordial. Mais l’application s’était 

déplacée du système d’acquisition des images vers le support d’échange et la console de 

visualisation. 

4. Principe et particularités de l’angiographie cardiaque 

L’angiographie cardiaque est une modalité d’imagerie médicale à base de rayons X. Elle 

requiert un équipement sophistiqué à cause notamment de la cadence élevée nécessaire 

pour photographier le coeur en mouvement, et des positions de caméra complexes 

indispensables à l’appréciation sous plusieurs angles de vue de ces artères et cavités 

(Figure I-2. 1). 

Figure I-2. 1: Equipement d’angiographie cardiaque 

Un synoptique des éléments constituant la chaîne d’imagerie est donné à la Figure I-2. 2. 

Nous n’aborderons pas leurs caractéristiques en détail, mais traiterons de façon 

simplifiée, qualitative et non exhaustive de ceux qui ont un impact majeur sur les 

propriétés des images et éventuellement sur la compression. 

Tous les éléments de la chaîne jouent un rôle sur la propriété des images générées. Les 

phénomènes qui interviennent sont complexes. Les éléments ayant une influence 

significative dans le cadre de nos travaux sont principalement le tube à rayons X , et le 

patient. 

Le tube à rayons X émet un faisceau de rayons X polychromatique par bombardement 

d’une anode par des électrons. La dose radiogène par image est faible en angiographie 

cardiaque. D’une part le tube radiogène est soumis à des charges thermiques énormes 

pour tenir des cadences de 25 à 50 im/sec., et d’autre part il y a des limites vis à vis de 

l’exposition du patient et du personnel. La dose est d’environ 8µR par image, ce qui est de 

loin inférieur à toutes les autres modalités par rayons-X. Les images d’angiographies 

cardiaques sont très bruitées car peu de photons X participent à leur génération. Le 

rayonnement X a une nature quantique qui explique l’effet de “moutonnement quantique” 

observé sur les images. 

- 61 -

N A 


Les rayons X sont transmis à travers le corps du patient. Selon les tissus traversés, les 

rayons sont plus ou moins absorbés. Les os absorbent fortement les basses énergies et 

sont particulièrement visibles sur les radiographies. Les muscles ont une atténuation 

voisine de l’eau, et la graisse une atténuation un peu inférieure. Ni le coeur, ni les 

vaisseaux sanguins n’ont une atténuation suffisante pour être visibles en radiologie. Pour 

cette raison, il est indispensable d’injecter sélectivement un produit de contraste opaque 

aux rayons X au moment de l’acquisition des images. L’”épaisseur” (distance parcourue 

par les rayons X dans l’organisme) du patient a un impact majeur sur la qualité des 

images produites et la visibilité des vaisseaux cardiaques. Plus cette épaisseur est 

importante, moins il y aura de photons au niveau de l’amplificateur de luminance, et donc 

plus l’image sera bruitée. Pour un même patient, il y a des angles de vues obliques qui 

entraînent une épaisseur particulièrement importante. Il peut donc y avoir une variabilité 

assez importante dans le bruit des images selon la taille du patient, et selon les angles de 

vue sur un même patient. 

Tube radiogène 

Patient 

Amplificateur 

de 

luminance 

Caméra 

radio cinéma 

Miroir semitransparent 

Caméra TV 

CA N Processeur C 

Ecran de visualisation 

Disque 

Figure I-2. 2: Synoptique de la chaîne d’acquisition d’image en angiographie 

cardiaque numérisée. 

[LIEN-95] explique à l’aide d’une modélisation de la chaîne d’imagerie et 

d’expérimentation que l’entropie différentielle de l’image diminue si la dose X s’accroît. 

L’auteur montre aussi que l’entropie augmente avec le niveau de gris. 

Notons que la résolution spatiale engendrée par la matrice de l’image joue un rôle moins 

prépondérant qu’on ne pourrait le penser. La résolution la plus employée reste 512x512 

(et de plus en plus on évolue vers du 1024x1024). La notion de résolution spatiale 

correspond à la taille du plus fin détail que l’on peut distinguer. La résolution d’un système 

512x512 avec un champs d’amplificateur de luminance de 16cm est de 300µm environ. 

Elle est inférieure à la résolution du film de radio-cinéma qui est de 25 à 200µm selon la 

géométrie du système d’acquisition. Mais en pratique, la résolution en contraste est très 

- 62 -


importante en angiographie cardiaque. Un petit détail ne peut être perçu que si son niveau 

de gris est suffisamment différent de ce qui l’entoure, surtout si l’image est bruitée. En fait, 

l’apport de la numérisation en cardiologie tient principalement à l’amélioration du contraste 

des vaisseaux, et ce malgré une perte en résolution spatiale. Cette amélioration est due à 

des traitements numériques, en particulier de renforcement de contours. 

En compression, on constate que les images 1024x1024 n’ont pas une entropie de 

beaucoup plus faible que les images 512x512. Elles sont donc plus faciles à comprimer 

car elles contiennent plus de redondance. 

5. Quelques propriétés des images d’angiographies 

cardiaques 

[BREE-92] a observé les propriétés de quelques angiographies cardiaques en 

comparaison d’images vidéo typiques. Toutes les images testées étaient codées au 

départ avec 8bpp. Nous avons extrait quelques éléments de ce rapport. 

• Spectre de fréquences 

Le spectre de fréquences horizontales a été mesuré selon la formule: 

S h (k) = 10. log 10 [ 1 M 

∑ | Fl 

( i, k)| dB 

M i= 

1 

où F l (i,k) est le k ième élément de la FFT de la i ème ligne de l’image, et où k=1, ..., N/2 

Le spectre de fréquences verticales est défini de façon analogue. 

- 63 -


télévision 

angiographie 

angiographie 

télévision 

(a) 

(b) 

(c) 

(d) 

Figure I-2.3: Spectres de fréquences de deux images de télévision et trois 

angiographies. (a) et (b): angiographies non renforcées. (c) et (d): angiographies 

renforcées. - d’après [BREEU-92] 

Les angiographies ont des spectres de caractéristique “passe-bas”, et leur énergie à 

presque toutes les fréquences est inférieure à celle des images TV. Le renforcement de 

contour rehausse les fréquences basses et moyennes, dont l’énergie reste inférieure à 

celle des images TV. 

Une compression qui supprime les basses et moyennes fréquences des angiographies 

s’avérera peu appropriée car ces fréquences ont un contenu énergétique important pour 

de telles images, notamment avec le renforcement de contour. 

• Distance de corrélation 

La distance de corrélation entre deux signaux x(n) et y(n) est définie par 

E[( x− 

E( x)).( y− 

E( y))] 

ρ = 

2 2 

E[( x− 

E( x)) ]. E( y− 

E( y)) ] 

où E est l’opérateur de l’espérance mathématique. 

- 64 -


(a) 

(b) 

(c) 

Figure I-2. 4: Corrélation entre pixels en fonction de leur distance horizontale et 

verticale. (a) Image de télévision. (b) Angiographie non renforcée. (c) Angiographie 

renforcée. - D’après [BREEU-92] 

La corrélation des angiographies est très élevée. A des distances de 20 pixels, elle est 

encore supérieure à 0.9, alors qu’elle est d’environ 0.5 sur une image de télévision. Le 

renforcement de contour diminue la corrélation, mais elle reste forte en comparaison 

d’une image TV (0.85 à 20 pixels). 

La compression par blocs de 8x8 semble peu appropriée aux angiographies. Une 

méthode avec des blocs plus large, ou en pleine image semble préférable. 

• Entropie 

L’entropie donne une indication du niveau maximal de compression sans perte. 

L’entropie spatiale (formule I-2.2) des angiographies est de l’ordre de 2.6 à 3.2 bpp. Les 

images de télévision ont une entropie bien supérieure, de l’ordre de 6 à 7 bpp. Après 

renforcement, les angiographies ont une entropie plus forte, de l’ordre de 4.7 à 5.7 bpp. 

On peut s’attendre à des taux de compression sans perte de l’ordre de 2.5 à 3 sur les 

image non renforcées, et d'environ 1.5 sur les images renforcées. 

L’entropie temporelle peut être déterminée de façon analogue à l’entropie spatiale. On 

commence par déterminer l’histogramme des différences entre les pixels de même 

position sur des images successives dans une séquence, et on applique la formule I-2.2. 

Pour une image angiographique non renforcée, l’entropie temporelle est de 4.2, avec 

renforcement cette entropie devient 5.6, en comparaison l’entropie temporelle d’une 

image TV est de 6.1. 

- 65 -


• Conclusions 

Ces mesures sur les images donnent plusieurs indications: 

- Les angiographies contiennent peu d’information. Elles devraient pouvoir être 

comprimées à des taux d’environ 8:1 avec une bonne qualité perceptuelle, compte tenu 

que les images TV peuvent l’être à un taux de 4:1 environ. 

- Les angiographies non renforcées doivent pouvoir être comprimées à un taux plus 

important que les angiographies renforcées. 

- La corrélation intra-images est plus importante que la corrélation inter-image. Compte 

tenu de cette remarque, des résultats d’entropie temporelle, et du fait que le déplacement 

des vaisseaux est très important d’une image à l’autre, il est peu probable que les 

méthodes inter-compression donnent de meilleurs résultats que les méthodes intraimages. 

Cette remarque a été validée par la suite avec l’emploi des standards MPEG et 

JPEG. Aucun bénéfice n’a été constaté avec MPEG. 

- La corrélation spatiale des angiographies est très élevée, suggérant qu’un découpage en 

blocs de 8x8 pixels est probablement inapproprié et que des blocs beaucoup plus larges 

ou une approche pleine image est préférable. 

Ces observations font partie des éléments importants pour sélectionner les méthodes 

FFDCT et MLOT comme candidates pour ce projet. 

- 66 -

CHAPITRE I-3 

ALLOCATION DES BITS DANS LA 

TECHNIQUE FULL FRAME DCT 

- 67 -

Chapitre I-3: Allocation de bits avec la Full-Frame DCT 

Présentation 

L’étape clé de toute méthode de compression avec perte contrôlée d’information est la 

quantification. Dans le cadre d’une méthode par transformation, les choix déterminants 

sont celui du quantificateur et celui de la stratégie d’allocation des bits. Le quantificateur 

scalaire est un bon candidat de par son efficacité et sa simplicité. Nous avons essayé 

d’améliorer l’allocation de bits proposée par [CHAN-89b] en développant une méthode 

plus adaptée aux angiographies. Nous avons découpé le plan de la DCT de l’image en 

zones circulaires. Ce type de découpage suit au mieux la répartition énergétique des 

coefficients DCT, et permet d’allouer un nombre fixe de bits à des zones d’énergie 

voisine. Nous nous sommes appuyés sur un modèle statistique de la distribution des 

coefficients dans ces régions pour prédire l’erreur de quantification dans un algorithme 

itératif d’allocation des bits. Ce modèle nous a de plus permis d’optimiser le pas de 

quantification. 

Ces travaux ont fait l’objet de l’article [BERE-94], présenté à SPIE Medical Imaging, dont 

le texte est reproduit ci-dessous. 

Optimal Bit Allocation for Full Frame DCT coding schemes 

Application to Cardiac Angiography. 

ABSTRACT 

This paper reports on a lossy compression method applicable to cardiac angiography. Full 

Frame DCT coding has been investigated, using an optimized bit allocation and 

quantization scheme. We compared it to the standard JPEG method in the environment of 

a cardiac angiography system with dedicated visualization devices and post-processing. 

At a compression ratio 12:1, the image quality appeared to be better than the JPEG baseline 

compression. Owing to the principle of our method, no blocking effect is induced, 

whereas this is a critical drawback of the JPEG algorithm. Furthermore, the sharpness of 

fine details is better preserved. 

1 - INTRODUCTION 

Cine-film is still the most commonly used medium for recording and transmitting X-ray 

cardiac angiograms, despite the fact that digital systems are now widely spread. Indeed, 

the improvement of diagnosis and the development of interventional procedures - such as 

Percutaneous Transluminal Coronary Angioplasty - has been facilitated by digital 

enhanced displays and immediate reviewing. However in practice, except for some still 

image cases, full patient data cannot be digitally archived: the amount of digital data per 

patient is much too high: 1000 to 3000 images at a resolution of 512x512 pixels coded on 

8 bits per pixel (and up to 1024x1024x10 bits). Thus, image data compression is critical in 

the perspective of a fully digitized data handling scheme. 

The objective of this work is to reach a compression ratio (CR) of about 12:1. The method 

we propose here is a lossy compression scheme, seeing that for theoretical reasons 

lossless compression schemes can only achieve low compression ratios which do not 

- 68 -


fulfill our objective. Given the required CR, the whole problem is to find the best 

compromise between the information we accept to lose and the perceptual image quality 

as well as the accuracy of the diagnosis. 

Among lossy data compression techniques, block-based transform coding have become 

popular. The Joint Photographic Experts Group (JPEG) [1] of the International 

Standardization Organization (ISO) has standardized a compression scheme based on 

the Discrete Cosine Transform (DCT). It yields good image quality at high compression 

ratios. Unfortunately, in the viewing conditions of a digital angiography system, artifacts 

induced by the block decomposition of the image become visible at compression ratios of 

8 to 12:1. Full Frame Discrete Cosine Transform (FF-DCT) is a good candidate to 

overcome the blocking effect. 

Section 2 describes the optimal bit allocation algorithm, quantization and coding schemes 

that we have considered for FF-DCT coding. Results are presented in Section 3. We 

compressed images from a digital cardiac angiography system and we compared the 

performance of our algorithm with the JPEG one. 

2-1 Full Frame DCT coding scheme 

2- CODING OF THE DCT COEFFICIENTS 

Some Full Frame DCT schemes have been reported for the coding of radiological images 

[2-4]. In our work, we have looked for an algorithm adapted to the statistical properties of 

the DCT of cardiac angiograms. Figure 1 shows the block diagram of a Full Frame DCT 

coding system. 

image 

Ö (pixels) 

Full Frame 

DCT 

coding 

quantization 

Ö Ö RLC/VLC Ö 

Ï 

compressed file 

(bits) 

number of bits 

step size 

lossless 

lossy 

lossless 

Figure 1 :Block diagram of a Full Frame DCT coding scheme 

In this kind of compression methods the pixel grey levels are first reversibly transformed to 

a frequency domain representation by FF-DCT. The quantization of the DCT coefficients 

is the key issue for achieving high compression ratios yet maintaining an acceptable 

image quality. Chan & al. [3] proposed to divide the DCT transformed image in a large 

number of rectangular zones. Their number of bits assigned to the coefficients of each 

zone was lowered from the DC to the high frequencies, with a decrease of one bit per 

zone. 

In our method, we have developed an optimal bit allocation and quantization method that 

minimizes the quantization error. We have proven that dividing the FF-DCT plane in 

circular zones leads towards an optimal approach for the compression of cardiac 

- 69 -


angiograms. A truncated Laplacian analytical model is used to design an optimal uniform 

quantizer. For an a priori number of bits per coefficient and with the observed dynamics 

and variance of a zone, the optimal quantization step is computed, together with the 

minimum quantization error. This evaluation is used in an integer bit allocation algorithm. 

We have chosen a bit allocation based on the theory of marginal analysis. After the 

quantization procedure, the remaining redundancy of the quantized DCT coefficients is 

reduced by Run Length Coding (RLC) and Variable Length Coding (VLC). In the next 

subsections, we will discribe in detail the steps of this compression scheme. 

2-2 Normalized DCT coefficients 

In the DCT-II transform formula [5] the dynamic range of the transformed coefficients is 

larger than that of the image pixel grey levels. Let "a" be the maximum pixel grey level in 

the image. If the image is properly scaled and coded with 8 bits per pixel, then a = 255. 

For an NxN image, it can be shown that the DCT coefficients X(k, l) are bounded as 

follows : 

X(0, 0) ≤ N . a 

- 2 N 2N .a ≤ X(0, l) and X(k, 0) ≤ . a k ≠ 0 and l ≠ 0 

2 

2 

- 2N . a ≤ X(k, l) ≤ 2N . a k ≠ 0 and l ≠ 0 

We divide each coefficient by the normalization matrix given thereafter in order to have the 

same dynamic range for all of the DCT coefficients : 

Q(k, l) = N k = 0 and l = 0 

= 4 N 

2 

k = 0 and l ≠ 0, or k ≠ 0 and l = 0 

= 4N k ≠ 0 and l ≠ 0 

This normalization is done just after the transform and is completely reversible. Clearly, 

the decoded DCT coefficients will be de-normalized in the decompression scheme. 

In practice, this operation is not necessary if we incorporate it in the FF-DCT and inverse 

FF-DCT algorithm. It can be noted that the maximum values of the normalized DCT 

coefficients are much smaller than their theoretical bound. Then, a small number of bits 

(less than 8 in our situation) can be allocated to the normalized DCT coefficients. 

- 70 -


2-3 Zonal splitting of the DCT plane 

In general, high values of the DCT coefficients are concentrated in low "frequency bands" 

of the DCT domain. We have observed the repartition in the DCT plane in the case of 

cardiac angiograms. The variance of each normalized DCT coefficient has been computed 

for an image series. The contour plot of these variances is given in Figure 2. It shows that 

the DCT coefficients are distributed in circular zones and dicrease from the DC to high 

frequencies. This dicrease is logarithmic. 

Figure 2 : Contour plot of the logarithm of the normalized variances σ 2 (k, l) / σ 2 (0, 0) of 

the DCT coefficients of a cardiac angiogram series. Plot levels are -10 dB, -20 dB, -30 dB, 

-40 dB. 

After dividing the previously shown variance map in circular zones, we observed how the 

variances themselves were distributed in the zones. The variance of the variances on a 

series of normalized DCT coefficients is very low in each circular zone. Only small peaks 

can be observed for some high frequencies. We concluded that a constant bit allocation 

and a constant quantization step can be applied to all the coefficients of a zone. 

Furthermore, it is interesting to preserve the directionality in the DCT plane. For this sake, 

the DCT plane has also been split in upper diagonal and lower diagonal sub-zones. They 

contain respectively the vertical and the horizontal frequency features. It can be noted that 

preserving directionality is the basic idea of subband coding and directional codeword in 

subband vector quantization [6]. 

By allocating a small number of bits to sub-zones with a low variance, the compression 

ratio can be increased. In practice, with zones positioned logarithmicly (511-256), (256- 

128), (128-64), (64-32)... the number of zones is small and some of them have a very 

large number of coefficients. It follows that the compression ratio is very difficult to control. 

For this reason we chose to divide the DCT plane in a linear way, as shown in Figure 3. 

- 71 -


012 4 8 16 32 64 ... 448 480 511 

Figure 3 : Circular and directional splitting of the DCT domain 

2-4 Uniform optimal quantizer 

The quantizer is a staircase function that maps many input values into a small number of 

output levels. We applied a uniform optimal quantizer to each zone. Let [m i - Ai, m i + Ai] 

be the range of the DCT coefficients of a zone "i", where m i is the mean value of that zone 

and A i is half the dynamic range. We denote the dynamic range D i = 2 A i and we have D i 

≤ a (see section 2-2). A value X(k, l) that lies in [m i + δ ij , m i + δ ij+1 ] is mapped into the 

reconstruction levels r ij, where δ ij is the set of increasing decision levels, j = -L i /2, ..., 1, ..., 

L i /2 - 1 and L i = 2 bi ; b i is the number of bits allocated to the quantizer of zone i . Given a 

fixed number of bits b i , the uniform quantizer is determined completely by the size of the 

quantizer step q i . This step size is constant for all values of j : q i = δ ij - δ ij-1 = r ij - r ij-1 . 

Thus a uniform quantizer can easily be implemented and a small amount of overhead 

data is needed for the coder: only the values b i , q i and m i of each zone have to be 

incorporated to the compressed file. Figure 4 shows the characteristic of our optimal 

uniform quantizer. 

OUTPUT 

X* 

(L/2 -1)qi + qi/2 

quantization 

step qi 

- L/2 qi + qi/2 

mean m i 

INPUT 

DCT coef. X 

of zone "i" 

Figure 4 : Characteristic of the optimum uniform quantizer 

- 72 -


In order to build an optimal quantizer we minimize the mean square distortion error. This 

error is given by : 

Ai 

ε 2,i = (X - X*) 2 p i (X) dX (1) 

∫ 

− Ai 

where p i (X) is the probability distribution of the DCT coefficients in the zone "i" and 

X* the quantized value of X. 

The quantization error depends on the probability density of the normalized coefficients. 

The AC ones are usually modeled by a Laplacian density. This model is realistic for the 

high frequency zones where the variance of the DCT coefficients is small. However this 

approach is quite coarse for low frequencies where the variances reach high values. A 

better matched model is the truncated Laplacian density defined by : 

p i (X) = c i e -αi|X| (2) 

where 

c i = Erreur! [1- e -αiAi ] -1 (3) 

and the variance of the distribution is related to A i and αi by: 

σ 2,i = Erreur! [1 - A i . c i e -αiAi ( A i αi + 2 ) ] 

(4) 

We evaluate αi by solving equation (4). Then equation (2) is incorporated into (1). The 

distortion error is minimized by solving the following non-linear equation : 

Erreur! = 0 

The result is the optimal quantization step q i . Thus the quantization error of a zone i of n i 

coefficients can be evaluated by incorporating q i into (1), which results in the minimal 

error. The error of a zone becomes : E i = n i ε 2,i min 

Figure 5 shows the relevance of this model: we have plotted the quantization step q i and 

the resulting Peak to Peak Signal to Noise Ratio (PPSNR) versus the variance σ 2,i for a 

Laplacian (A i = infinite) and for a truncated Laplacian (A i = 2.5) distribution. The variances 

of this plot range from Erreur!*0.025 to Erreur!*0.25. The quantity Erreur! is the variance 

of a random variable uniformly distributed in the dynamic range. The values we observed 

in practice are in the range displayed in Figure 5. The improvement of the PPSNR gained 

by a truncated Laplacian model versus a non-truncated one is of about 1 dB in our 

situation. 

- 73 -


Figure 5 : Quantization step and PPSNR versus the variance of DCT coefficients for a 

Laplacian model (A i = infinite) and a truncated Laplacian model (A i = 2.5), with L i = 2 3 = 8 

quantization steps. The truncated Laplacian model is an improvement for cardiac 

angiograms. 

2-5 Integer bit allocation 

We have allocated the bits b i to each zone using the theory of marginal analysis [7]. The 

total number of bits allocated to the DCT plane is 

B = Erreur! x cr , where N is the size of the image, b is the number of bits per pixel, cr is 

the lossless compression ratio introduced by RLC/VLC. This compression ratio is 

evaluated experimentally. The allocation algorithm is the following : 

Start the allocation with b i = 0 for all the zones, i = 1 to Z (Z is the total number of 

zones). 

Compute q i , E (0),i = ε 2 (0),i min * n i i = 1 to Z 

Set k = 0 

loop : Allocate temporarily one supplementary bit to each zone 

Compute q i , E (k),i , i = 1 to Z 

Compute the marginal return ∆E i = E (k-1),i - E (k),i i = 1 to Z 

Allocate definitively the bit in the zone j where the marginal return is maximum : 

∆E j = max (∆E i ) , b j = b j + 1 

k = k + 1 

Continue to loop untill B bits have been allocated. 

In the final loop, the allocation of one supplementary bit to a zone with a large number of 

coefficients may exceed the total number of bits B. The resulting CR is less than 

expected. If it is needed to control precisely the CR, one must reduce B and start again 

the final allocation loop after splitting the zone that yielded an excess of bits. This process 

can be automated. 

2-6 Coding of the quantized DCT coefficients 

After quantization of the Full Frame DCT zones, the remaining redundancy is removed by 

Run Length Coding (RLC) and Variable Length Coding (VLC). We have used a coder 

- 74 -


derived from the JPEG baseline [1]. The coefficients of each zone are first formatted into a 

1D-vector using a zig-zag ordering suited to circular blocks as shown in Figure 6. 

6 

5 

Figure 6 : Example of zig-zag scanning of the Full Frame DCT circular and directional 

zones number 5 and 6 

Non-zero coefficients are described by two elements: firstly a composite 8-bits value and 

secondly a variable length value. We have chosen a composite value of the form 

"ZZZZZCCC" in binary notation. The three least significant bits define the category of the 

quantized coefficient. Three bits are sufficient for our AC coefficients. A quantized number 

of which the absolute value is in the range [2 k-1 , 2 k - 1[ belongs to the category k, with 0 

≤ k ≤ 7 . The five most significant bits are used for coding the number of zeros preceding 

the encoded coefficient. These 8-bits run length values are then the input of a modified 

Huffman coder. The second element of variable size specifies the sign of the value (1 bit) 

and its magnitude in its own category k (k-1 bits). Each coded value is a Huffman code 

followed by a k-bits second element. We have coded separately the DCT zones with this 

technique. 

3-1 Experiments 

3 EXPERIMENTAL RESULTS AND DISCUSSION 

We have applied our Full Frame DCT based coding scheme to 512x512x8bits images 

from a clinical cardiac angiography system. We focused on a test sequence of 24 images 

of a left coronary artery. 

The quantization and allocation procedure described in Sections 2-4 and 2-5 can be used 

in two different ways : either the optimal quantization step and the number of bits per zone 

are evaluated for each individual image, according the statistics of its DCT circular zones. 

Or an average statistic is evaluated from a set of images, and the same bit allocation and 

quantization steps are used for several images. 

The first approach (noted hereafter FF-DCT1) yields the best image quality but takes 

some computational time. The second approach (noted FF-DCT2) runs faster and 

requires less overhead data because the bit allocation and quantization steps are fixed for 

all angiograms. 

We have compressed images from our test series at a compression ratio close to 12:1 

with scheme FF-DCT1 and scheme FF-DCT2. An example of bit allocation and 

quantization steps is given in Table 1 for FF-DCT1. We compared the result with the 

JPEG coded images at the same compression ratio. The Root Mean Square Error 

- 75 -


(RMSE) and the PPSNR have been computed. Results are given in Table 2. We also 

compared the visual image quality on a black and white monitor. In order to stick to the 

clinical environment, an enhancement filter was applied to the images before the data 

compression. Indeed, angiographic images are always presented in an enhanced mode. 

The filter is an unsharp masking. This pre-enhancement is less favourable than 

compressing the raw images in terms of CR versus image quality. Indeed, enhancement 

increases medium frequencies. 

Zone 

"i" 

Position 

Number of coef. Nber of 

n i bits b i 

- 76 - 

Quant. step q i 

0 0-0 1 16 1.97e-3 

1 1-1 (vertical) 1 16 1.77e-4 

2 1-1 (horizontal) 1 16 8.94e-5 

3 2-3 (vertical) 5 5 1.33e-1 

4 2-3 (horizontal) 3 2 2.34e-1 

5 4-7 .. 18 4 1.18e-1 

6 4-7 .. 16 5 8.39e-2 

7 to 14 8-15/ 16-31/ 32-63/ 64- 

95 

77/ 71/ 300/ 289/ 1209/ 

1186/ 2014/ 1991 

4 5.01e-2/ 5.51e-2/ 2.23e-2/ 2.49e-2/ 

1.18e-2/ 1.38e-2/ 6.52e-3/ 6.82e-3 

15 to 18 96-127/128-159 2811/ 2789/ 3623/ 3600 3 7.45e-3/ 8.00e-3/ 5.33e-3/ 5.77e-3 

19 to 25 160-191/192-223/224- 

255/256-287 

4424/ 4401/ 5234/ 5212/ 

6035/ 6012/ 6832 

2 6.05e-3/ 6.59e-3/ 5.29e-3/ 5.08e-3/ 

4.31e-3/ 3.80e-3/ 3.67e-3 

26 to 30 256-287/ ... / 320-351 6810/ ... / 8419 1 4.17e-3/ 3.91e-3/ 3.64e-3/ 3.43e-3/ 

3.17e-3 

31 to 38 352-383/ ... / 448-479 9253/ ... / 11639 0 - 

39, 40 480-511 40825/ 40652 2 1.96e-3/ 2.02e-3 

Table 1 : Example of allocated bits and optimal quantization steps with FF-DCT1 for a 

compressed coronary arteriogram (CR=12:1). 

Compressio 

n Ratio 

RMSE 

PPSNR (dB) VISUAL 

blocking 

effect 

QUALITY 

blur of small 

vessels 

JPEG 12 4.78 34 yes quite visible 

FF-DCT1 12 4.42 34.5 no just 

noticable 

FF-DCT2 11.5 11.9 26.0 no just 

noticable 

Table 2 : Measurements and observations from an image coded with JPEG, FF-DCT1, 

and FF-DCT2 (CR=12:1) 

3-2 Discussion 

At a compression ratio of about 12:1, the quality of Full Frame DCT coded images is very 

close to the originals. The perceived image quality is better than for the JPEG coded 

frames. The best PPSNR and visual quality results from FF-DCT1 scheme where the 

statistical data of individual images is incorporated in the quantization process. 

With FF-DCT2 scheme, where an average statistic from several images is used, the 

PPSNR is lower than that of JPEG coded images. However, there is almost no visual 

difference between the two types of DCT coded frames. Some unsharpness compared to 

the original is just noticable on small vessels. With JPEG however, the unsharpness is 

more visible and blocking effect is prominent. These conclusions are shown in Table 2. 

They confirm that PPSNR is not a sufficient measurement in order to compare 

compressed images and originals. Figure 7a displays an enlarged part of an original


image. The same part is shown in Figure 7b after JPEG. Figure 7c shows the FF-DCT1 

result. Figure 8a and 8b are the error images multiplied by 30 of JPEG and FF-DCT1 

respectively. 

(a) 

(b) 

(c) 

Figure 7: (a) Enlarged part of an original enhanced image - (b) enlarged part of a JPEG 

coded image (CR=12) - (c) enlarged part of a FF-DCT1 coded image (CR=12) 

(a) 

(b) 

Figure 8 : (a) error image x 30 of the JPEG coded image - (b) error image x 30 of the FF- 

DCT1 coded image 

- 77 -


3-3 Perspectives 

Promising results have emerged from our Full Frame DCT coding method and its optimal 

quantization. 

In the FF-DCT1 scheme, quantization step and number of bits are computed for each 

image. This yields a very satisfactory image for the target CR 12:1. Improvements will be 

implemented: 

- weighting of the Full Frame DCT coefficients regarding the Human Visual System 

sensitivity, 

- deeper study of the effect of the clinically used post-processing and especially edge 

enhancement. 

In FF-DCT2 scheme, an average statistics is used to build a fixed quantizer valid for all 

images. More experiments will be carried out in order to find the best possible one. 

Finally, we will chose between scheme 1 and 2 and perform a clinical evaluation of the 

perceptual and diagnostic image quality with a team of cardiologists. 

4- CONCLUSION 

For the coding of cardiac angiograms, conventional and standard compression methods 

do not fulfill our targets : 

- lossfree techniques do not yield sufficient compression ratios, 

- lossy standards, and especially JPEG, are block based and the image quality at 

compression ratios 12:1 suffers from two defects. Blocking artifacts are visible both in the 

background and on the edge of large vessels. Moreover, the sharpness of small vessels 

is not well preserved. 

In order to overcome these difficulties, we have optimized the bit allocation and 

quantization in the Full Frame DCT coding scheme. As indicated in the results, the 

proposed schemes out-performs the JPEG technique regarding perceptual quality at 

compression ratio 12:1. There is no blocking effect and the sharpness of fine details is 

better represented. 

AKNOWLEDGEMENTS 

We would like to thank Philips Medical Systems, Best, the Netherlands for its support and 

for its contribution to this work, especially Dr H. Haas, Dr P. Zwart, and Dr M. Breeuwer 

from Philips Research, Eindhoven, the Netherlands. 

REFERENCES 

- 78 -


[1] W.B. Pennebaker and J.L. Mitchell, JPEG Still Image Data Compression Standard, 

Van Nostrand Reinhold, 1993. 

[2] S.C. Lo and H.K. Huang, "Radiological Image Compression: Full-frame Bit Allocation 

Technique", Radiology, Vol. 155, pp 811-817, 1985. 

[3] K.K. Chan, S.L. Lou and H.K. Huang, "Radiological Image Compression Using Full- 

Frame Cosine Transform with Adaptive Bit-Allocation", Computerized Medical Imaging 

and Graphics, Vol. 13, N°2, pp153-159, 1989. 

[4] S.C. Lo & al., "Full-Frame Entropy Coding for Radiological Image Compression", SPIE 

Image Capture, Formatting, and Display 1991, Vol. 1444, pp 265-271, 1991. 

[5] K.R. Rao and P. Yip, Discrete Cosine Transform: Algorithms, Advantages, and 

Applications, Academic Press, 1990. 

[6] N. Akrout, C. Diab, R. Prost, R. Goutte, M. Amiel, "Subband Directional Vector 

Quantization in Radiological Image Compression", Proc SPIE Medical Imaging 1992, 

Vol.1653 (6), pp 203-212. 

[7] A. Segall, "Bit Allocation and Encoding for Vector Sources", IEEE Trans. Inform. 

Theory IT-22, n°2 pp 162-169, 1976. 

- 79 -

CHAPITRE I-4 

COMPRESSION FULL-FRAME DCT ET 

RENFORCEMENT DE CONTOUR 

- 80 -

Chapitre I-4: Compression FF DCT et renforcement de contour 

Présentation 

Dans ce chapitre nous abordons la problématique du renforcement de contour et de la 

compression. Dans la pratique, il est nécessaire de pouvoir disposer à la fois de la version 

non renforcée et de la version renforcée de l’image. La version renforcée est celle 

préférée par les experts médicaux pour la visualisation. La version non renforcée sert 

principalement aux mesures quantitatives. Alors, faut-il comprimer l’image avant ou après 

le renforcement? 

Nous avons montré que l’on obtient de meilleurs résultats en comprimant l’image déjà 

renforcée, nous avons étudiés plusieurs stratégies basées sur le schéma renforcement 

puis compression. Tout d’abord, nous avons développé un renforcement directement 

dans le domaine DCT, afin de réaliser les deux opérations en même temps. Ensuite nous 

avons mis en place un filtre inverse de dé-renforcement de contour (également dans le 

domaine DCT), afin de pouvoir revenir à l’image non renforcée après la compression. 

Nous avons cherché à améliorer la qualité de l’image comprimée et dé-renforcée avec 

une méthode de restauration régularisée. 

Nous montrons qu’il existe un large éventail de possibilité d’adapter compression et posttraitements 

en vue d’optimiser la qualité des images pour une application donnée. 

Ces travaux ont fait l’objet de l’article [BERE-95], présenté à SPIE Medical Imaging, dont 

le texte est reproduit ci-dessous. 

Unsharp Masking and its Inverse Processing Integrated 

in a Compression/Decompression Scheme. 

Application to Cardiac Angiograms. 

ABSTRACT 

Image data compression can be useful for storage or transmission of cardiac 

angiograms. In clinical systems, images are recorded in a "raw" format, and are 

usually processed with an edge enhancement filter to improve the visibility of medical 

information. The raw images are needed for other processing including quantitative 

measurements, and their enhanced version is used for display. We report on a 

compression scheme based on Full-Frame DCT which allows the integration of 

enhancement in the codec. We investigated whether the raw or the enhanced image 

should be compressed. We studied an inverse filter and integrated it in the 

decompression process, so that a non-enhanced image can be derived after 

enhancement and compression. The de-enhancement filter acts as a low pass filter 

for the quantization noise. We proposed to improve the inverse filter using a 

regularized signal restoration technique. 

Keywords: Image compression and filtering, inverse filtering, optimal bit allocation, 

X-Ray medical images. 

1- INTRODUCTION 

- 81 -


Images of the heart and of the coronary arteries are usually assessed on cine-film 

recordings. Even in digital catheterization laboratories, images are still not stored in a 

digital format due to technological and financial constraints: a standard cardiac angiogram 

comprises at least 1000 to 3000 images, representing 250 to 750 Mega Bytes for 512x512 

pixel images coded in 8 bits. Lossy image data compression is necessary to achieve fully 

digitized archiving of cardiac angiography, to enable images transmission via networks, or 

to allow dynamic viewing from a storage medium at the required frame rate: 15 to 30 

frames per second. 

On Digital Cardiac Imaging Systems, images are enhanced in order to outline the contours 

of vessels and ventricles. Edge enhancement filters improve the visibility of the diagnostic 

information. Unsharp masking is a usual filtering technique for this purpose. In general, 

the cardiologist reviews enhanced images, while the raw images are stored on disk and 

used for quantitative analysis (measurement of vessel narrowing, left ventricle function). 

The objective of this work was to reach compression factors of about 12:1, with 

reconstructed images of good visual and diagnostic quality. We developed a compression 

scheme conveniently allowing the incorporation of unsharp masking and its inverse filter. 

The compression algorithm is based on Full-Frame DCT [1]. Unsharp masking is usually 

processed in the pixel domain. We implemented it in the DCT domain. In the pixel domain, 

an inverse filtering for unsharp masking can be processed iteratively [2]. We propose a 

non iterative process in the DCT domain. The quality of the inverse filtered compressed 

image can be improved with incorporation of prior knowledge: both the quantization noise 

and the image regularity are measured and used in a regularized signal restoration 

technique [3]. 

2- SHOULD THE RAW IMAGE OR THE PROCESSED IMAGE BE COMPRESSED? 

A major issue is the choice of the image to be compressed: the raw image or the filtered 

one. Section 2-1 will describe the edge enhancement filter as it is implemented in digital 

cardiac angiography systems. We worked with images from a clinical Philips Medical 

Systems catheterization laboratory equipped with a Digital Cardiac Imaging (DCI) system. 

A primary scheme for compressing the digital angiograms stored on disk, i.e. the raw 

images, will be discussed in section 2-2. In this scheme, the raw-compressed images 

have to be enhanced for reviewing. Instead, we propose in section 2-3 to compress the 

already enhanced images. It follows that a de-enhancement filter should be available for 

computing a de-enhanced image from the enhanced-compressed one. Both the 

enhancement and the de-enhancement filters can be integrated in the 

compression/decompression scheme, as discussed in section 2-4 and 2-5 respectively. 

Finally, a regularization method for improving the performance of the de-enhancement 

filter is described in section 2-6. 

2-1 Edge enhancement filtering of digital cardiac angiograms 

In digital cardiac angiography systems, the images are processed in real time for 

enhanced viewing, in order to display anatomical features with an improved sharpness. 

The filter is an unsharp masking, using pixel convolution as follow: 

iuns = iraw + α x [ iraw - f * iraw ] (1) 

where iuns is the enhanced image; i raw is the original image; α is the 

enhancement factor, it can be adjusted by the cardiologists and has generally a 

- 82 -


default value of 5; * denotes the convolution operator; f is a low pass convolution 

mask, generally a 5x5 kernel with 1/25 values only. In formula (1), 

iraw - f * iraw is an image of the contours present in i raw , which added to i raw with 

a gain, results in a sharper image. Values of iuns above 255 and below 0 are 

clipped. Apart from clipping which seldom occurs, the enhancement is reversible. 

Formula (1) can be expressed as: 

iuns = h * iraw (2) 

where h is the equivalent enhancement filter. 

We studied a default filter of clinical systems, 

1 1 1 1 1 

with α=5 and f = 1 1 1 1 1 1 

25 x 1 1 1 1 1 

1 1 1 1 1 

1 1 1 1 1 

It follows that in our application, h = 

−1/ 5 −1/ 5 −1/ 5 −1/ 5 −1/ 

5 

−1/ 5 −1/ 5 −1/ 5 −1/ 5 −1/ 

5 

−1/ 5 −1/ 5 29/ 5 −1/ 5 −1/ 

5 

−1/ 5 −1/ 5 −1/ 5 −1/ 5 −1/ 

5 

−1/ 5 −1/ 5 −1/ 5 −1/ 5 −1/ 

5 

(3) 

The transfer function of h, given in figure 1(a), shows that this filter magnifies medium and 

high spatial frequencies. The transfer function is real and positive, this result will later be 

useful for implementing the inverse filter (section 2-5). 

(a) (b) 

Figure 1: (a) Transfer function of the periodized edge-enhancement mask 

(represented here on 32x32 samples). 

(b) Inverse of the transfer function of the enhancement mask 

- 83 -


2-2 Edge enhancement after data compression 

On clinical systems, a real time data compression is implemented to allow fast acquisition 

of the raw images and increase the storage capacity. The compression is reversible and 

can only achieve reduction factors of about 2:1 for this type of images [4]. We studied a 

similar scheme with lossy image compression, where images are first compressed and 

then enhanced (figure 2). 

Figure 2: Primary scheme for coding cardiac angiograms: first compression, then 

enhancement. 

In usual compression schemes (JPEG, Full-Frame DCT, Subband Coding), high 

frequencies are coarsely quantized since they contain few information. If the raw image is 

compressed, high frequencies are not well preserved, and unsharp masking of the 

decompressed image enhances the quantization noise. The compressed-enhanced image 

should not suffer from severe artifacts and should have a good perceptual quality. 

2-3 Edge enhancement before data compression 

Though the most straight-forward scheme is to compress raw images, we propose to 

compress images that are already enhanced, as shown in figure 3. The enhancement filter 

enhances medium and high frequencies. These frequencies will be preserved by any 

optimal bit allocation system. In the scheme of figure 3, achieving a high compression 

ratio may be difficult because of the higher energy of medium and high frequencies. If the 

enhanced image is compressed, a raw image should be derived from the decompressed 

image via inverse processing. Fortunately, an inverse filter can be implemented in order 

to compute the raw image from the enhanced one. As shown by its transfer function in 

figure 1(b), this inverse filter is low-pass and will reduce the quantization noise. 

- 84 -


Figure 3: An alternative scheme for coding cardiac angiograms: first enhancement, then 


2-4 Integration of the edge enhancement in the compression/decompression 

process 

We studied whether the edge enhancement filtering could be implemented in the DCT 

domain, allowing the integration of either post- or pre- enhancement in the compression 

process, according to the scheme of figure 2 or 3 respectively. Spatial convolution and 

point-by-point multiplication in the Discrete Fourier Transform (DFT) domain are strictly 

equivalent. We looked for a similar equivalence in the DCT domain. Filtering in the DCT 

domain has been investigated by Chen et al. [5] and Chitprasert and Rao [6]. Their 

approaches are helpful for filtering in the DCT domain but do not give the equivalence we 

are looking for. We checked that linear pixel-convolution can be implemented in the DCT 

domain under two conditions: the convolution filter must be real and even, and the image 

must be extended by a few zeros on its boarders. The result is given here for a onedimensional 

signal. As the DCT is separable - formula (13) -, the result can easily be 

deducted in two dimensions. 

Let {h(n); n = -L, -L+1, ..., 0, ..., L} be the impulse response of the even filter. The length of 

h is 2L+1. 

h is even, hence h(n) = h(-n) n=1, 2, ..., L. 

Let {x N (n); n=0, 1, ..., N-1} be a data sequence beginning and ending with zeros. We 

assume that x N (n)=0 for n=0, ..., P and for n=N-Q, ..., N-1, with P≥L and Q≥L. 

We are looking for a DCT implementation of the following linear convolution: y(n) = x N (n) * 

h(n). As the values of the extremities of x N (n) are zeros, the effective length of y(n) is N 

and not N+2L. We will not detail the demonstration here, it is easy to prove the following 

result: 

YC N(k) = HF 2N(k) x XC N(k) k = 0, 1, ..., N-1 (4) 

where YC N(k) is the N-points DCT of y(n); HF 2N(k) is the 2N-points DFT of the 

periodized impulse response of the filter h, 

HF 2N(k)∈R; and XC N(k) is the N-points DCT of x(n). 

The implementation of a DCT-convolution is advantageous for integrating edge 

enhancement in the DCT coding scheme. In practice short filters are used, L is very small 

compared to N. It is not necessary to pad the image boarders with zeros before 

processing because the resulting error is negligible. 

- 85 -


2-5 Integration of de-enhancement in the decompression scheme by inverse 

filtering 

We investigated how to compute a non-enhanced image from an enhanced one, 

especially if a raw image has to be derived from the enhanced-compressed one in the 

coding scheme of figure 3. The transfer function of the inverse enhancement filter exists 

and is shown in figure 1(b). Unfortunately, the size of the impulse response of the inverse 

filter is infinite. We have computed finite size approximations of the inverse filter on a 5x5 

pixel convolution mask. None was satisfactory. An alternative solution is to use an iterative 

process based on the fixed point theory, as proposed in [2]. This type of pixel 

implementation is also an approximation of the inverse filter. 

More effectively, we implemented the de-enhancement filter in the DCT domain. The DCT 

of a de-enhanced 1-D data sequence is simply: 

YC N(k) = XC N(k) / HF 2N(k) k = 0, 1, ..., N-1 (5) 

2-6 Improvement of the de-enhancement of compressed images by regularization 

De-enhancing a compressed image by inverse filtering results in an non smooth image 

because of the quantization noise in the data (see section 4). The unsmoothness of the 

image can reduce the accuracy of the vessel narrowing measurement. To overcome this 

difficulty, we studied this inverse problem with a least square filtering approach. 

In the pixel domain, the inverse problem can be formulated as follow: 

iuns_comp = h * iraw + υ (6) 

where iuns_comp is the pre-enhanced compressed image, h denotes the impulse 

response of the enhancement filter (3), and υ the random quantization noise. 

The noise is not correlated to the raw image but is not statistically independent of it. 

The de-enhancement is a restoration problem. It can be expressed as recovering iraw 

from its degraded observation iuns_comp , given the Point Spread Function (PSF) h of the 

degradation system and some a priori knowledge about the noise υ and the image iraw . 

An interesting derivation for solving equation (6) by constrained least square filtering is the 

Miller regularization approach. It provides a trade-off between fidelity to the data and 

smoothness [3]. The Miller regularization method can be considered in the more general 

context of estimation of unknown but bounded signals [7]: 

• iraw lies in the set Ωi of regular images with bounded roughness: 

d* i ² ≤ r² 

(7) 

where x ² denotes the energy of x, the operator d is a differential operator i.e. a 

high pass filter, and r² denotes a bound of the roughness of the image. 

The set Ωi is an ellipsoid, its center is the null vector (see [7]) 

.• υ lies in the set Ωv of bounded energy noise. 

v ² ≤ n² 

(8) 

The set Ωv is a sphere, its center is the null vector (see [7]). 

• The observed image iuns_comp specifies a set Ωi / which must contain i iuns _ comp 

raw 

iraw ∈ Ωi / iuns _ comp and Ωi / = {i: (i iuns _ comp 

uns_comp - h*i) ∈ Ωv} 

The set Ωi / iuns _ comp is an ellipsoid (see [7]) 

- 86 -


Let us consider both the sets Ωi and Ωi / iuns _ comp. Each set contains iraw , and i raw must lie in 

their intersection which is : 

Ωest = Ωi ∩Ωi / iuns _ comp 

This intersection is the smallest set which must contain iraw and which can be calculated 

from the available data. It is the best estimate set. In contrast with the usual estimation 

theory, the estimate is a set and not a single vector. In absence of a unique solution, a 

reasonable choice for a vector estimate iest is to define it as the center of Ωest. 

Unfortunately, Ωest is not an ellipsoid and the center cannot be easily computed. But a 

bounding ellipsoid containing Ωest can be found. The center of this ellipsoid is the estimate 

of iraw . 

Originally, this method was proposed with a matrix formulation. When the matrix 

associated to the PSF is a circulant block Toeplitz matrix, the problem can be formulated 

in the DFT domain [8]. In the DFT domain, equation (6) becomes: 

Iuns_comp (k,l) = H(k,l) x Iraw(k,l) + V(k,l) (9) 

where capital letters hold for the DFT of the corresponding minuscule in (6). 

The Miller estimate, the center of the ellipsoid Ωest is: 

H*( k, l) 

Iest(k,l) = Iuns_comp (k,l) 

(10) 

H*( k, l) H( k, l) + λD*( k, l) D( k, l) 

where λ = n ² 

and X* is the complex conjugate of X. (11) 

r² In our problem, both the energy of the noise n² and the bound of the roughness r² can be 

exactly computed. The regularization parameter λ can be transmitted with the overhead 

data of the compressed image file. For a given class of images, as angiograms, λ is 

approximately constant at a fixed compression ratio. Therefore, it is not necessary to 

compute the regularization parameter for each image. Implementing this regularization 

technique in the DCT domain is as easy as for the non-regularized de-enhancement 

(section 2-5) and can be derived from (10) and (4). One fourth of the 2Nx2N DFT of the 

filter transfer function and the NxN DCT of the image iuns are needed. 

In the DCT domain, equation (10) becomes: 

H* 2Nx 

2N( k, l) 

ICN est (k,l) = ICN uns_comp (k,l) 

H* 2Nx 2N( k, l) H2Nx 2N( k, l) + λD* 2Nx 2N( k, l) D2Nx 2N( k, l) 

(12) 

k = 0, 1, ..., N-1 and l = 0, 1, ..., N-1 

The differential operator d should be chosen such that the ellipsoids Ω i and Ωi / iuns _ comp 

intersect. A simple test for this intersection was proposed in [9]. 

In our implementation for compressed angiograms, 

we used: d = 1 − 2 1 

−2 4 −2 

1 −2 

1 

- 87 -


3-1 Block diagram 

3- FULL-FRAME DCT CODING AND DIRECTIONAL QUANTIZATION 

Figure 4 shows the conventional block diagram of transform coding systems. Block based 

transform is a widespread and efficient technique. It has been standardized by the Joint 

Photographic Experts Group (JPEG) [10] of the International Standardization Organization 

(ISO) for the coding of still pictures, and by the Moving Picture Expert Group (MPEG) [11] 

for the coding of video series. Block-based coding schemes gave disappointing results on 

cardiac angiograms because they introduce block artifacts. These artifacts are made more 

visible on cardiac angiography systems: the edge enhancement filter outlines the block 

boundaries. 

Figure 4: Block diagram of DCT coding. 

To overcome the problem of blocking artifact, we have chosen a Full-Frame DCT (FFDCT) 

coding scheme. Such schemes have been reported for coding radiological images [12]- 

[14]. We focused on the adaptation of our algorithm to the statistical properties of the Full- 

Frame DCT of cardiac angiograms, and we studied the interaction of the compression and 

the edge enhancement processes. 

3-2 Full-Frame DCT and zonal splitting 

In the first block of figure 4 diagram, the image is transformed. We have used a Full- 

Frame DCT transform from formula DCT-II of [15], with different normalization coefficients: 

Let x(m,n) be the image and XC (k,l) its Full-Frame DCT. 

N −1 

N −1 

XC (k,l) = 4 ( 2 1 ) 2n 

1 l 

( , ) ∑∑ ( , ) cos( π + ) cos( π ( + ) ) (13) 

N ckl xmn m k 

² 

2N 

m= 

0 n= 

0 

In DCT-II, c(0, 0) = 1 2 ; c(0, l) = c(k, 0) = 1 for k≠ 0 and l≠ 0; and c(k, l) = 1 for k, l =1, 2, 

2 

..., N-1. 

We have used c(0, 0) = 1 

1 

1 

; c(0, l) = c(k, 0) = for k≠ 0 and l≠ 0; and c(k, l) = for k, 

2N 

l =1, 2, ..., N-1. This normalization, computed in floating point, does not change the 

accuracy of the coefficients at all. It was meant to bring the dynamic of all DCT coefficients 

to the dynamic of the original image (256 levels per pixel), allowing easier interpretation of 

the DCT coefficients behavior. 

We observed the distribution of frequency components of cardiac angiograms in the DCT 

plane [1]. The DCT coefficients are distributed in circular zones and decrease from the 

DC to high frequencies, with a logarithmic decrease. Within circular zones, the DCT 

4N 

2N 

4N 

- 88 -


coefficients have in general low variances. Thus the same number of bits can be 

allocated to all coefficients of a circular zone, and the same quantization step can be 

applied. We observed the DCT of enhanced images. Since the transfer function of the 

enhancement filter is not symmetric (figure 1), and enhances horizontal and vertical 

frequencies more than diagonal frequencies, we chose to split the circular zones of the 

DCT plane in four directions, as shown in figure 7. Such a splitting is in agreement with 

the DCT coefficients statistics, with the effect of the enhancement filter, and the number of 

coefficient per zone is small enough for a good control of the compression ratio. 

3-3 Bit allocation, quantization and coding 

In usual transform schemes, a frequency dependent quantization is realized by multiplying 

the transformed coefficients by a matrix of weighing factors, and then rounding the 

weighed coefficients to the nearest integer. It results in a uniform midtread quantization of 

each coefficient. The underlying principle is to quantize accurately the high frequencies 

and to quantize more coarsely the medium and high frequencies because the human 

visual system is less sensitive to higher frequencies than to lower ones. All weighed 

transform coefficients are quantized with the same quantization characteristic, with a zonal 

or a fixed bit allocation per set of coefficients. We have built a quantizer for the circular 

and directional zones of the Full Frame DCT without any a priori on the importance of 

different frequency bands. The two characteristics of the quantizer of each zone are 

optimized: the number of bits and the quantization steps. The mean square distortion error 

of a zone is minimized, under the assumption of a density probability. The experimental 

distributions of the coefficients in the different zones can be approximated by a truncated 

Laplacian distribution for mid and high frequencies. We use this model for the AC 

coefficients, except for the first zones. Because they contain very few coefficients, we use 

a uniform distribution model for them. In addition, the DC and the 44 first AC coefficients 

were not quantized at all because of their importance for the quality of the reconstructed 

image. The last 4 high frequency zones were arbitrarily allocated zero bit and not 

incorporated in the optimized bit allocation process. The principle of our quantizer 

optimization is explained in [1]. We can evaluate the quantization step that minimizes the 

quantization error of a zone. Clearly, we have developed an optimal bit allocation and 

quantization method that minimizes the quantization error. A truncated Laplacian 

analytical model is used to design an optimal midtread uniform quantizer. For an a priori 

number of bits per coefficient and with the observed dynamics and variance of a zone, the 

optimal quantization step is computed, with the minimum quantization error. This 

evaluation is used in an integer bit allocation algorithm. We have chosen a bit allocation 

based on the theory of marginal analysis. After the quantization procedure, the quantized 

coefficients are formatted in a 1D-vector with a zigzag scanning adapted to the circularity 

of our blocks. The remaining redundancy of the quantized DCT coefficients is reduced by 

entropy coding. At present, we have not implemented a bit rate control, the optimization of 

the quantizer is re-adjusted manually with a different target compression ratio if needed. 

4- EXPERIMENTAL RESULTS AND DISCUSSION 

- 89 -


4-1 Results from simulations of the compression 

Firstly, to prove the soundness of our proposal - enhancement before compression -, we 

simulated the compression/decompression process by adding white noise in the DCT 

domain, as a simulation of the quantization noise. This simulation was applied on a 

128x128 part of a real image. White noise was added to the DCT of the raw image, and to 

the DCT of the enhanced image, so that the PPSNR becomes 20dB in both cases. The 

level of the added noise was a little exaggerated for the purpose of the demonstration. 

Figure 5 shows the PPSNR of the simulated compression before and after enhancement, 

figure 6 shows the resulting images. The enhancement after a simulated compression 

degrades strongly the image, the PPSNR drops down to 4.6dB. The post-enhanced image 

exhibits almost only noise. In the pre-enhancement scheme, the de-enhancement filter is 

used to compute an non-enhanced image. The non-optimized inverse filter improves 

significantly the PPSNR, from 20 to 33.8dB, because the noise is low-pass filtered. 

Visually, some sharpness remains (image 6). The regularized de-enhancement (image 7) 

is 2.1dB better than the non-regularized de-enhancement. The visual improvement, 

however, is interesting to notice: the regularized de-enhanced image is less blurred than 

the non regularized one. The error-image 7 of figure 6 shows less differences with the raw 

image than the error-image 6. Here, the error images are the absolute values of the 

differences between the raw image and the de-enhanced one, multiplied by a factor 20. 

This simulation shows that regularization improves the regularity of the restored image. 

Figure 5: PPSNR results of simulated compression in the post- and pre-enhancement 

schemes. 

- 90 -


Figure 6: Part of an image with simulated compression noise in the post- and preenhancement 

scheme. 

Image numbers refer to figure 5. 

4-2 Results on coded images 

We have tested the principles presented in section 2 and 3 on 512x512 images with 8 bits 

per pixel, recorded from clinical digital cardiac angiography systems. The results 

presented here were obtained on a left coronary image from the Cardiac Hospital, Lyon, 

France. The coronary image was compressed with our optimal bit allocation and 

quantization method, according to the post- and pre-enhancement schemes. The optimal 

bit allocations of the raw and the enhanced images are shown in figure 7. The 

quantization step of each DCT zone is also optimum. Even if the numbers of bits are 

identical in several zones, the quantization steps are all different. 

For a compression ratio of about 13:1, PPSNR results are given in figure 8. We fixed a 

similar CR for the post- and pre- enhancement coding, expecting the amount of the 

degradation to be different. The PPSNR2 of the raw compressed image (without 

enhancement) is rather high (47.5dB). The PPSNR3 of the compressed-enhanced image 

is 34.9dB; in contrast with the simulation, the PPSNR5 of the enhanced compressed 

image is only 34.7. The enhanced image is more difficult to compress but at a fixed bit 

rate, the optimization of the quantizer allows good results in term of PPSNR. Visually, the 

compressed-enhanced image is slightly better. The allocation of the enhanced image 

shows that more bits are allocated to medium and high frequencies, fewer to the low 

frequencies. In fact, many of the available bits are used to code the image noise. After deenhancement, 

the PPSNR is increased from 34.7 to 40.7dB. The improvement is real, but 

not as spectacular as in our simulation. 

- 91 -


(a) 

(b) 

Figure 7: (a) Bit allocation of the post-enhanced coronary image at CR=12.6. (b) Bit 

allocation of the pre-enhanced image at CR=12.8. (nq: no quantization). 

Figure 8: PPSNR results with FF-DCT post- and pre-enhancement schemes. 

To estimate the performance of our optimal Full-Frame DCT coding, we compared the 

FFDCT coded images with JPEG coded ones. At a compression ratio of 12.8, the PPSNR 

of the raw JPEG-compressed image is 46.1dB; the PPSNR of the compressed-enhanced 

image is 32.8dB; the PPSNR of the enhanced-compressed image is 33.5dB. These 

results are 1 to 2 dB less than with Full-Frame DCT coding. Visually, however, the JPEG 

- 92 -


coded image shows severe blocking artifacts, especially in the post-enhancement 

scheme. A pre-enhanced image with FFDCT and JPEG coding are shown in figure 9. 

Finally, the de-enhancement gives a very similar result without or with regularization on 

the Full-Frame coded images: 40.6 and 40.7dB respectively. The PPSNRs of this 

experiment are high and make the regularization improvement little visible. Using the 

simulated compression of a raw image at 47.5dB, like in section 4-1, the improvement of 

the PPSNR by regularization is 0.2dB. The technique of regularization, which involves no 

additional complexity, is more useful at higher CR. The regularized de-enhancement we 

implemented can be improved by finding experimentally a more appropriate operator d, or 

by mean of a Wiener optimal inverse filter. 

5- CONCLUSION 

In this paper, we proposed a new method for integrating post-processing in a lossy 

compression/decompression scheme. We studied the edge enhancement filter of clinical 

cardiac angiography systems and its incorporation it in a Full-Frame DCT codec. 

Choosing if the image should be enhanced before or after the compression is a important 

issue. Simulations of the quantization noise by adding white noise to the DCT show 

clearly that it is preferable to apply the enhancement before the compression (preenhancement 

scheme). In this scheme, a non-enhanced image must also be available 

after data compression: it is necessary for clinical applications to have both the enhanced 

and the non-enhanced image. We also incorporated the enhancement inverse filter in the 

DCT coding scheme and proposed an improvement by a signal restoration technique with 

regularization. The regularization is more effective when the compression distortion is very 

high, and can easily be implemented without additional complexity. Regularization should 

be effective in the quantitative analysis of the decompressed de-enhanced image because 

the estimation of vessel narrowing requires a regular image. This point has not been 

assessed yet. 

The results of the pre-enhancement scheme with Full-Frame DCT compression are 

promising, but not as demonstrative as on the simulations. Compressing the enhanced 

image is more difficult than compressing the raw ones because many bits are allocated to 

the high frequencies, which contents is magnified by the edge enhancement filter. We 

designed an optimal strategy for the bit allocation of pre-defined zones in the DCT plane. 

An optimal method for defining the zones is still under investigation. 

As a conclusion, with an optimal bit allocation, the enhanced image compressed at a 

compression ratio of 12 with FFDCT have a good PPSNR and visual quality, whereas the 

JPEG coded image shows blocking effect. 

ACKNOWLEDGMENT 

The authors wish to thank Hein Haas and Paul Zwart from Philips Medical Systems, and 

Marcel Breeuwer from Philips Research for their useful comments. 

- 93 -


REFERENCES 

[1] P. Béretta, R. Prost, M. Amiel, "Optimal Bit Allocation for Full-Frame DCT Coding 

Scheme - Application to Cardiac Angiography", SPIE Vol. 2164 Image Capture 

Formatting and Display, pp 291-311, 1994. 

[2] H. van Eeuwick, "The Influence of Edge Enhancement on Analytical Programs", 

Internal Report, Philips Medical Systems, XDB-048-816, 1990. 

[3] K. Miller, "Least Square Methods for Ill-posed Problems with a Prescribed Bound", 

SIAM J. Math. Anal., Vol. 1, n°2, pp 52-74, 1970. 

[4] P. Roos et al., "Reversible Intraframe Compression of Medical Images", IEEE 

Trans. on Med. Imaging, Vol. 7 n°4, pp 328-336, 1988. 

[5] W.H. Chen, S.C. Fralick, "Image Enhancement Using Cosine Transform Filtering", 

Proc. Symp. on Current Math. Problems in Image Science, Monterey, Ca USA, pp 186- 

192, 1976. 

[6] B. Chitprasert and K.R. Rao, "Discrete Cosine Transform Filtering", Signal 

Processing, Vol. 19, pp 233-245, 1990. 

[7] B.C. Schweppe, Uncertain Dynamic Systems, Englewoods Cliffs, N.J. USA, 

Prentice-Hall, 1986. 

[8] A.K. Kastaggelos, J. Biemond, R.W. Shafer and R.M. Mersereau, "A Regularized 

Iterative Image Restoration Algorithm", IEEE Trans. on Signal Processing, Vol. 39, 

n°4, pp 914-929, 1991. 

[9] R. Prost, J.L. Burdeau, S. Guilloteau and R. Goutte, "Regularized Myopic Image 

Deconvolution. Application to Aperture Synthesis in Radioastronomy". EUSIPCO-94, 

Edinburg, Scotland UK, 13-16 September 1994, Proc. Vol. 1 Theory and Applications, 

pp 307-310, 1994. 

[10] W.B. Pennebaker and J.L. Mitchel, JPEG Still Image Data Compression Standard, 

van Nostrand Reinhold, 1993. 

[11] Legal - "MPEG: a Video Compression Standard for Multimedia Applications", 

Communications of the ACR, Vol. 34 n°4, pp 47-58, 1991. 

[12] S.C. Lo and H.K. Huang , "Radiological Image Compression: Full-Frame Bit 

Allocation Technique", Radiology, Vol. 155, pp 811-817, 1985. 

[13] K.K. Chan, S.L. Lou and H.K. Huang, " Radiological Image Compression Using 

Full-Frame Cosine Transform with Adaptive Bit-Allocation", Computerized Medical 

Imaging and Graphics, Vol. 13 n° 2, pp 153-159, 1989. 

[14] S.C. Lo et al., "Full-Frame Entropy Coding for Radiological Image Compression", 

SPIE Vol. 1144 Image Capture Formatting and Display, pp 265-271, 1991. 

[15] K.R. Rao and P. Yip, Discrete Cosine Transform: Algorithms, Advantages and 

Applications, Academic Press, 1990 

- 94 -


(a) 

(b) 

(c) 

Figure 9: (a) Enlarged part of the original enhanced image; (b) Enlarged part of preenhanced 

FFDCT coded image (CR=12.8); (c) Enlarged part of pre-enhanced JPEG 

coded image (CR=12.8). 

- 95 -

CHAPITRE I-5 

ETUDE THEORIQUE DE LA ROBUSTESSE 

DU QUANTIFICATEUR UNIFORME 

OPTIMUM 

- 96 -

Chapitre I-5: Etude théorique de la robustesse du quantificateur uniforme optimum 

Présentation 

Après avoir mis au point et validé une méthode d’allocation de bits avec un découpage de 

la DCT en bandes circulaires, nous avons cherché à améliorer l’optimisation du 

quantificateur sur lequel repose cette allocation. Jusqu’alors, nos expériences étaient 

basées sur l’hypothèse que les bandes circulaires suivaient une distribution Laplacienne. 

Nous avons voulu développer une approche valide pour toute distribution de type 

Gaussienne généralisée. Nous avons aussi cherché à réaliser une quantification non pas 

adaptée à chaque image, mais fixe pour une classe d’images. Pour ce faire, il faut 

connaître l’impact d’un choix de quantificateur inapproprié à la distribution du signal afin 

de choisir au mieux les paramètres de distribution Gaussienne généralisée que l’on doit 

appliquer avec toutes les images. 

Une étude du quantificateur uniforme optimum était donc nécessaire, ainsi qu’une 

exploration des conséquences de la non adaptation du quantifieur. Le présent chapitre 

donne nos développements théoriques sur l’optimisation et la robustesse du quantifieur 

scalaire uniforme. 

Ces travaux ont fait l’objet de l’article [BERE-97], qui va être soumi à la revue Signal 

Processing, et dont le texte est reproduit ci-dessous. 

Robustness of Optimum Uniform Quantizers to a Mismatched Statistical 

Model. 

1. Introduction 

This paper gives a theoretical study of quantizer mismatch with scalar uniform quantizers. 

The current work was carried out in view of practical applications to transform image 

coding. The results are however applicable to the quantization of any waveform by a 

scalar uniform quantizer. 

The coding or compression of a digital signal facilitates its transmission and archive. 

Compression is often the only viable solution for transmitting large images over limited 

bandwidth channels, or for long term storage of large amount of data. A typical lossy 

compression system includes a signal transformation, commonly by discrete cosine 

transform or by filter banks, in order to decorrelate the signal and to compact its energy 

into a small number of coefficients. In such systems, called transform coding, the signal 

transformation is followed by quantization, a conversion of the transformed signal into a 

small number of levels. The quantization is non-invertible, and yields a lossy compression. 

The last operation of a transform coding system is an entropy coding that reduces the 

remaining redundancy of the quantized transformed coefficients. 

Quantization is the key operation of compression schemes because it must both preserve 

the features that are relevant to the end-user after signal reconstruction, and reduce the 

data rate (i.e. number of bits per signal sample). There are two main categories of 

quantizers: the scalar quantizer (SQ), and the vector quantizer (VQ). The SQ quantifies 

individual samples by mapping them into a limited set of values. In contrast, the VQ 

quantifies blocks of samples by mapping them into a limited set of blocks (called 

codewords). Vector quantization is an extension of scalar quantization to dimensional 

spaces higher than 1. In his fundamental work on rate-distortion theory, Shannon proved 

- 97 -


that a VQ can always achieve better coding performances than a SQ [SHAN-59]. In 

practice, VQ is complex to implement. It requires a training phase in order to determine 

the dictionary of output codewords based on a number of test images. The coding phase 

consists of matching the encountered waveform blocks with the closest codeword. Both 

operations are complex. Only the decoding phase is very simple. Because of VQ’s 

complexity and long coding times, SQ has been extensively studied [MAX-60], [GISH-68], 

[WOOD-69], [BERG-72], [GERS-78], [BERG-82], and utilized for image coding in the 

seventies and eighties. With the advance of computer technology, VQ was given more 

attention in the eighties and nineties [GERS-82], [GRAY-84]. However, scalar quantization 

recently regained attention with the contributions of [SHAP-93], [SAID-96], and remains 

widely used in transform coding because of its simplicity. Image coding standards 

extensively use scalar uniform quantizer, e.g. JPEG [PENN-93] and MPEG [LEGA-92]. 

With a scalar quantizer, the individual input samples are divided in threshold intervals, 

which boundaries are the threshold levels. All the values lying within a threshold interval 

are mapped into a single quantization level. The mapping of the input values into a limited 

number of quantization levels results in a distortion. Four types of scalar quantizers are 

principally considered in the literature. Their definition is given in the following. 

Definition 1: An N-level pdf-optimized quantizer is a quantizer that minimizes the average 

distortion for a fixed number of levels N. This is the Max-Lloyd quantizer [MAX-60]. The 

threshold and quantization levels are not uniformly spread over the input and the output 

range. 

Definition 2: An N-level minimum-distortion uniform-threshold quantizer is a quantizer that 

minimizes the average distortion for a fixed number of levels N, with uniform threshold 

levels and non-uniform quantization levels. 

Definition 3: An N-level minimum-distortion uniform quantizer is a quantizer that minimizes 

the average distortion for a fixed number of levels N, with both uniform threshold and 

uniform quantization levels. 

With the quantizers of definition 1, 2, and 3 the bit rate is not controlled. 

Definition 4: An N-level entropy-constrained optimum quantizer is a quantizer that 

minimizes the average distortion at a given bit rate. 

A minimum-distortion uniform quantizer followed by entropy coding gives better 

performance than the Max-Lloyd quantizer (without entropy coding) in terms of ratedistortion 

[JAIN-89 pp115-117]. Other advantages of the uniform quantizer are both the 

small amount of overhead data, and the simplicity of its implementation. For these 

reasons, we limited the scope of this work to the uniform quantizer. 

Two approaches are possible: either the quantizer is adapted to the properties of each 

input signal, or it is fixed for a class of signals. In the first approach, the quantization is 

adaptive, and the computational cost is high. The second approach, non-adaptive 

quantization, is the one addressed in this paper. A non-adaptive quantizer is designed for 

a class of signals which are assumed to have similar properties, and in particular the same 

probability density function (pdf). A major concern in practical applications of coding is the 

robustness of the quantizer regarding possible variation of the input-signals pdf. Our 

objective is to address this robustness with the uniform quantizer by studying the effect of 

a possible mismatch of the input pdf compared with the pdf expected in the quantizer 

design. We consider both minimum-distortion uniform quantizers (definition 3) and 

entropy-constrained optimum uniform quantizers (definition 4). We assume that the input 

signal follows a generalized Gaussian (GG) distribution, which covers a wide range of 

signals found in practical applications. Signal modeling by the GG pdf includes the 

Laplacian and the Gaussian pdf. GG pdfs are encountered in DPCM [CUTL-52], [JAIN- 

- 98 -


89], cosine transform [REIN-83], [MULL-93], [JOSH-95], [MOSH-96], wavelet transform 

[MALL-89], [BARL-94] or subband coding [WOOD-86], [WEST-88]. 

Although scalar quantizers have been widely studied in the years 1970-80, to our 

knowledge the robustness of the uniform quantizer has not yet been addressed. A 

detailed study of the robustness of the Max-Lloyd quantizer (definition 1) was reported in 

[MAUE-79], and used in [JAYA-84]. We found no study about the mismatch of uniform 

quantizers from definition 3 and 4. 

In this paper, we use the Mean Square Error (MSE) and the Signal to Noise Ratio (SNR) 

as measures of distortion. We present the deviation of the MSE and the SNR due to a 

quantizer designed with a pdf model that differs from the actual pdf of the input-signal. 

Section 2 gives the mathematical expression of the MSE and the entropy with a 

generalized Gaussian pdf, then the analysis of the uniform quantizer properties, and finally 

the analytical formulation of the rate-distortion optimization of entropy constrained uniform 

quantizers. In section 3, mismatch of the quantizer relative to the shape parameter of the 

input pdf, and mismatch relative to the variance are addressed. Finally, section 4 

summarizes our findings and discuss them in comparison to related works. 

2. Matched uniform quantizers with generalized Gaussian distributions 

2.1 Notation 

A scalar quantizer is a staircase function that maps the input values into a smaller range 

of output levels. The quantizer maps a continuous random variable X into a discrete 

random variable X ~ 

. The range of the input values is divided into N=L+1 adjacent 

intervals, which boundaries are the threshold levels t 0 , t 1 , ..., t N . The output belongs to a 

finite set of quantization levels {l 0 , l 1 , ..., l L}. If the i th input value x(i) lies between the 

threshold levels t j and t j+1 , then it is mapped into an output value x ~ (i)= l j. A uniform 

quantizer is defined by the number of threshold intervals N and the quantization step size 

q. The number of quantization levels is also equal to N. The threshold and the 

quantization intervals are all constant and equal to q. Midtread quantizers are symmetrical 

with a central quantization level l L/2 =0, their number of quantization levels is always odd. 

Midrise quantizers have an even number of quantization levels; they cannot reconstruct a 

zero-value because zero is a threshold level. We limited this study to scalar uniform 

midtread quantizers, an example of which is shown in figure 1. Extension to midrise 

quantizers would follow similar derivations. 

- 99 -


t 0=- ∞ 

l L=L.q 

t 1= 

-L/2.q+q/2 

t 2 l 2 

l 

.. 

l 3= 

l 0 =-L.q/2 

l 6= 

t 6=t L 

L/2q-q/2 

N=L+1=7 

t N=+ ∞ 

Figure 1: Characteristic of a midtread quantizer. 

x 

2.2 Mean Square Error of uniform quantizers with GG pdf 

The mean square error (MSE) of a quantizer is defined by: 

~ 

D(q) = ∫ ( x− 

x)² p( x) 

dx 

(1) 

where p(x) is the pdf of the input random variable X. 

Without lack of generality, we assume that X is a zero-mean random variable, with 

variance σ 2 . For a uniform midtread quantizer with N=L+1 quantization levels, with a 

quantization step q, the MSE is: 

D(q)= D g (q) + D o (q) (2) 

where 

D g (q) = 2 { 

L 

2 

∑ 

j= 

1 

( j−12 

/ ) q 

∫ [ x−( j−1) q]² p( x) 

dx+ 

( j−1) 

q 

and 

∞ L 

D o (q)= 2 ∫L ( x − q )² p ( x ) dx 

q 2 

2 

L 

2 

∑ 

j= 

1 

jq 

∫ ( x− 

jq)² p( x) 

dx} 

12 

( j− 

/ ) q 

The terms D g (q) and D o (q) refer to two different kinds of errors. D o (q) becomes important 

when extreme values of the input are saturated by the quantizer, i.e. the range of the input 

values exceeds the range of the quantizer threshold levels. This is commonly referred to 

as the overload distortion. This distortion is high if some input values that have a rather 

high probability are saturated. Conversely, D g (q) becomes high when the full range of the 

input values is quantized, but in a coarse manner. This is called the granular noise. 

Granular noise and overload distortion have a different impact on the perceptual 

annoyance in image coding. 

- 100 -


The input-signal may follow a great variety of distributions, and for a broad investigation of 

the quantization error we used the generalized Gaussian distribution 

p X (x) = K e −( x 

) β 

α 

(3) 

where 

β 

K = , α and β >0, and where Γ (x) is the gamma distribution. 

2αΓ( 1 β) Γ( 3 β) 

The variance of this pdf is σ² = α² 

. 

Γ( 1 β) 

Particular cases of the generalized Gaussian distribution are the Laplacian pdf: β=1, and 

the Gaussian pdf: β =2. When β → 0 , the distribution tends towards an impulse. When 

1 

β →∞, the distribution is uniform, it can easily be demonstrated that its height is 

2σ 

3 

and its width 2σ 

3. Similarly, when σ²→ 0 the distribution tends towards an impulse. 

When σ²→ ∞, the distribution becomes wider and wider, its amplitude tends towards zero. 

σ 2 =1 β=1 

(a) 

(b) 

Figure 2: Pdf of Generalized Gaussian distributions. 

Figure 2 gives plots of generalized Gaussian distributions for various values of β and σ². 

As shown in figure 2, the shape of the distribution can be modified by varying the 

parameter β without changing the variance. The parameter β is referred to as the shape 

parameter. In image transform coding based on Discrete Cosine Transform (DCT) or 

Subband Band Coding (SBC), the values of β encountered in practice are often in the 

range of 0.5 to 1. 

- 101 -


The quantization error D(q) can be derived by incorporating (3) into (2). The result is 

D(q)= D g (q) + D o (q) (4) 

where 

L 

D g (q) =2K α 2 

β j 

and 

∑ 

{α ² Γ( C)[ γ ( b , C) − γ ( b , C)] 

3 1 

= 1 

−2 α γ 

3 

−γ 

1 

jq Γ( D)[ ( b , D) ( b , D)] 

+ jq ² ² Γ( E)[ γ ( b3, E) −γ 

( b1, E)] 

+ 2qαΓ( D)[ γ ( b2, D) −γ 

( b1, D)] 

−( 2j −1) q² Γ( E)[ γ ( b2, E) −γ ( b1, E)] 

} 

D o (q) = 2K α β { α ² Γ ( C )[ − γ ( b , C )] 

1 4 

−LqαΓ( D)[ 1 −γ 

( b4 

, D)] 

Lq ²² 

+ Γ ( E )[ 1 −γ ( b4 

, E )] } 

4 

with 

Γ( 1 β) 

β 

α² = σ² 

, K = 

Γ( 3 β) 

2αΓ( 1 β) , 

C = 3/β, D = 2/β, E = 1/β, 

⎛ 

b 1 = ( j − 1 

⎜ 

) q ⎞ 

⎟ 

⎝ α ⎠ 

β 

; b 2 = 

⎛ ( j − 1 / 2 

⎜ 

) q ⎞ 

⎟ 

⎝ α ⎠ 

β 

⎛ 

; b 3 = jq 

β 

⎛ ⎞ 

⎜ 

⎜ ⎟ ; b 

⎝ α ⎠ 4 = ⎜ 

⎜ 

⎝ 

and where γ denotes the incomplete gamma function. 

Figure 3 illustrates the quantization error (4) as a function of the quantization step q, for a 

fixed number of levels N=15, with β =1, and σ ²=1. 

N=15 

β=1 

σ 2 =1 

L q 

2 

α 

β 

⎞ 

⎟ 

⎟ 

⎟ 

⎠ 

D 

Figure 3: Quantization error D as a function of the quantization step q. 

The quantization error reaches a minimum for a value of q denoted here q opt/D . The MSE 

is also a function of the number of steps N, of the shape parameter β, and of the variance 

σ². 

- 102 -


2.3 Minimum-MSE uniform quantizer 

The quantization step that minimizes the MSE is obtained by differentiating D(q) with 

respect to q and equating the result to zero. 

The differentiate of D(q) is: 

dD (q) 

dq 

where 

dD (q) 

g 

dq 

and 

dDo( q ) 

dq 

= 

dD (q) 

g 

dq 

L 

= 2 K α 2 

β j 

∑ 

= 1 

= 2 KL 

α 

β { L 2 

+ dD o( q) 

dq 

{ -2j αΓ( D)[ γ ( b , D) − γ ( b , D)] 

3 1 

+ j 2 2q Γ( E)[ γ ( b , E) − γ ( b , E)] 

3 1 

+ 2 α Γ( D)[ γ ( b2, D) − γ ( b1, D)] 

- (2j-1) 2q Γ( E)[ γ ( b , E) − γ ( b , E)] 

2 1 

q Γ( E )[ − γ ( b , E )] - αΓ( D)[ − γ ( b , D)] 

} 

1 4 

1 

4 

(5) 

Our equation allows the calculation of q opt/D for GG pdf with any value of the parameters. 

Usually books give tables of q opt/D for a set of values of N, and only for a few distributions 

like the Laplacian and the Gaussian ones [JAIN-89]. Formula (5) allows to determine the 

quantization step of the minimum-MSE uniform quantizer by solving the non-linear 

equation dD ( q ) =0. We used toolboxes of the MatLab ® package from MatWorks, which 

dq 

resolves non-linear equations by the Gauss-Newton method. 

Figure 3 shows that the penalty for choosing q too small compared with q opt/D is much 

more important than the penalty for choosing q too high. The overload and granularity 

error curves provide an insight to the penalties observed when q departs from q opt/D . The 

optimum quantization step is reached when the sum of the overload and granularity noise 

is minimal. Below q opt/D the overload error is dominant, and above q opt/D , the granularity 

error is dominant. The MSE increases more rapidely with increasing overload than with 

increasing granularity. 

If the quantization step q is not the minimum-distorsion value, overload distortion 

should be carefully avoided because it is more penalizing than granularity. In 

practical situations, it is preferable to over-estimate q as compared with q opt/D rather 

than under-estimate it. 

- 103 -


β=1 

σ 2 =1 

β=1 

σ 2 =1 

D 

(a) 

(b) 

N=15 

σ 2 =1 

N=15 

σ 2 =1 

D 

N=15 

β=1 

(c) 

(d) 

N=15 

β=1 

D 

(e) 

Figure 4: MSE and SNR as a function of the quantization steps, for different values 

of N, β, and σ². 

Figure 4 shows the MSE as a function of q, given various numbers of quantization levels N 

(figure 4-a), shape parameters β (figure 4-c), and variances σ 2 (figure 4-e). 

A plot of the Signal to Noise Ratio (SNR), 

with SNR = 10 log 10 (σ ²/MSE), is added as a companion of the MSE (figure 4-b, 4-d, and 

4-f). 

Figure 4-a & b show, as expected, that large values of N result in a low distortion. In 

addition, as q →∞, all the MSE curves for various values of N converge towards the 

same asymptotic curve. 

In spite of what a prime interpretation of the influence of β on q opt/D could suggest, figure 4- 

c & d show that the values of the optimal quantization step decrease as the shape 

parameter increases. One could have expected q opt/D to increase with β, in order to limit 

- 104 - 

(f)


the overload. However, when the shape parameter β increases, the pdf tends toward the 

uniform distribution, as seen on figure 2-a. For uniform quantizers with a uniform pdf, the 

whole input range is used, the saturation distortion tends toward zero. Thus, when β 

increases, the pdf-optimization procedure yields small values of q opt/D in order to limit the 

granularity distortion. When properly optimized, quantizers with large β pdf will perform 

better than quantizers with small β pdf. However, a quantization step different from q opt/D is 

more penalizing for large β than for small β. 

In practical situations, minimum-MSE uniform quantizers with input pdf of large 

shape parameters will perform better than with input pdf of small shape parameters. 

But the penalty for having a poor optimization of the quantization step is more 

important with large shape parameter pdfs. 

Concerning the influence of σ² on q opt/D , figure 4-e & f show that the values of the optimal 

quantization step increase as the variance increases. Pdfs with a large variance are widely 

spread but they do not tend towards a uniform pdf, their shape remains that of a 

generalized Gaussian distribution. The saturation has to be limited during the quantizer 

optimization process by having a large quantization step. Figure 4-f shows that uniform 

quantizers with various input pdf variance have all the same maximum SNR value. 

However, the penalty for poorly optimized quantizers is higher with small variances. 

In practical situations, minimum-MSE uniform quantizers having different variances 

perform identically in terms of SNR. But the penalty for having a poor optimization 

of the quantization step is more important with small variance pdfs. 

2.4 Entropy of uniform quantizers with GG pdf 

The entropy of the output of a quantizer is the minimum amount of information to be 

transmitted in order to be able to reconstruct the quantizer output with an arbitrarily small 

error. It is also referred to as the lower bound data rate, or bit rate for a given distortion. It 

is expressed in bits per sample (bps). It is given by: 

p 

p 

H Q = -∑ log ( ) bits/sample (6) 

i 

i 

2 

i 

Application of formula (6) to uniform midtread quantizers yields: 

H Q = -2 { 

where 

p j = 

p 0 = 

p ∞ 

= 

( j+ 

12 / ) q 

∫( j− 

12 / ) q 

q / 2 

∫ 

0 

∞ 

∫L− 

1 q 

2 

L 

− 

2 1 ∑ p p 

j 2 j 

j = 1 

pxdx ( ) 

pxdx ( ) 

pxdx ( ) 

log ( ) + p 0 log 2 (p 0 ) + p ∞ 

log 2 (p ∞ 

) } (7) 

- 105 -


Incorporating the pdf definition (3) into (7) results in: 

p j = K α Γ( )[ ( , ) ( , )] 

β E γ b E γ b E 

5 − 2 

p 0 = K α β Γ( E) γ ( b , E) 

6 

p ∞ 

= K α Γ( )[ ( , )] 

β E 1 − γ b E 7 

(8) 

with 

( j − / ) q 

b 2 = 

⎛ 1 2 

⎜ 

⎞ 

⎟ 

⎝ α ⎠ 

β 

( j + / ) q 

b 5 = 

⎛ 1 2 

⎜ 

⎞ 

⎟ 

⎝ α ⎠ 

β 

b 6 = 

⎛ 

⎜ 

⎝ 

q /2 

α 

⎛ L − 1 

β 

q 

⎞ 

⎞ 

⎜ 

⎟ b 

⎠ 7 = 

2 

⎟ 

⎜ ⎟ 

⎜ α ⎟ 

⎝ ⎠ 

β 

β=1 

σ 2 =1 

(a) 

N=15 

σ 2 =1 

Ν=15 

β=1 

(b) 

Figure 5: Entropy as a function of the quantization steps for different values of N, β, 

and σ². 

Figure 5 plots the entropy of formula (7) as a function of q, for different values of N, β, and 

σ². There is a value of q that maximizes the entropy, denoted q opt/R . 

As expected, the entropy of quantizers with a large number of levels N is greater than the 

entropy of quantizers with small N, and q opt/R decreases with increasing N. 

q opt/R increases with increasing β (on the contrary, q opt/D decreases with increasing β). The 

entropy of minimum-MSE quantizers increases with increasing β. 

q opt/R increases with increasing σ² (similarly, q opt/D increases with increasing σ²). The 

entropy of minimum-MSE quantizers is independant of σ². 

- 106 - 

(c)


2.5 Entropy-constrained uniform quantizer with GG pdf 

The quantization step of an entropy-constrained quantizer should minimize the distortion 

subject to a fixed entropy constraint H 0 . Using to the Lagrangian multiplier method, the 

solution of this problem minimizes the following functional: 

J(q) = D(q) + λ [H Q (q)- H 0 ] (9) 

By differentiating J(q) with respect to q and λ, equating the result to zero, and choosing λ 

so that H(q) = H 0 , the problem is to solve the system of non-linear equations: 

⎧dJ 

dD( q) dH( q) 

= 0⇒ + λ = 0 

⎪dq 

dq dq 

⎨ 

⎪dJ 

= 0⇒ Hq ( ) − H = 0 

⎩⎪ 

0 

dλ 

(10) 

After incorporating formulas (5) and (A1), from the appendix, into (10), we are able to 

resolve (10) for any a priori number of levels N, any fixed entropy H 0 , and any GG input 

pdf. We used MatLab ® toolboxes that resolve sets of non-linear equations with the Gauss- 

Newton method. 

Our approach results in a practical method for designing N-level entropy-constrained 

uniform quantizers (definition 4). Note that minimum-MSE uniform quantizers (definition 3) 

are designed simply by taking λ=0 and relaxing the constraint H(q)- H 0 .=0. 

The performance of an entropy-constrained optimum quantizer is assessed by its ratedistortion 

curve R(D). 

It is well known that for each pdf there exists a bound, called the rate-distortion bound 

R B (D), such that: 

R(D) ≥ R B (D) (11) 

The minimum bit rate needed to transmit a quantized signal is determined by the entropy 

of the quantizer output. This entropy H Q is given by: 

H Q ≈ H s - log 2 (q) (12) 

Where H s is the differential entropy of the source: 

+∞ 

H s = - ∫ px ( )log pxdx ( ) 

(13) 

−∞ 

2 

For minimum-MSE uniform quantizers, the uniform pdf yields the lowest possible 

distortion. According to the well-known formula of the distortion for uniform quantizers with 

a uniform pdf, we have: 

2 

D β =∞ 

≈ q β =∞ 

(15) 

12 

The entropy of the quantizer output can be bounded by H Q for q β =∞ 

. Incorporating (14) 

into (12) results in the Gish-Pierce asymptote of the rate-distortion performance. 

Figure 6 shows an example of R(D) curve for a 15-levels uniform quantizer with a 

Laplacian unity variance pdf (β=1 and σ²=1). The relation between the entropy R, the 

quantization step q, and the distortion D is shown on the figure. The R(D) curve (figure 6- 

b) has an optimum that is reached when the best compromise between the highest rate 

and the lowest distortion is achieved. This point corresponds to the optimum entropy- 

- 107 -


constrained uniform quantizer. Its quantization step is denoted q opt/R-D . Below or above this 

optimum quantization step, the distortion is higher (figure 6-b and c). For q> q opt/R-D the 

entropy is lower, and for q< q opt/R-D the entropy is higher which is less favorable to 

compression (figure 6-a). 

Similarly to minimum-MSE quantizers, for entropy-constrained quantizers it is 

preferable to over-estimate q as compared to q opt/R-D rather than to under-estimate it. 

4 

4 

3.5 

3.5 

3 

3 

2.5 

2.5 

2 

2 

1.5 

1 

1.5 

1 

Gish-Pierce 

lower bound 

0.5 

0 0.5 1 1.5 2 2.5 

(a) 

N=15 

β=1 

σ²=1 

0.5 

-40 -35 -30 -25 -20 -15 -10 -5 

2.5 

(b) 

2 

1.5 

1 

0.5 

0 

-40 -35 -30 -25 -20 -15 -10 -5 

Figure 6: Rate-distortion performance R(D) of matched uniform quantizers (6-b), 

correspondence with the curves R(q) (6-a), and q(D) ( 6-c). 

(c) 

- 108 -


6 

5 

4 

3 

2 

1 

0 

N=63 

GP: Gish-Pierce 

lower bound 

N=31 

N=15 

N=7 

β=1 

σ²=1 

N=3 

-1 

-60 -50 -40 -30 -20 -10 0 

(a) 

6 

6 

5 

4 

3 

β=3.0 

N=15 

σ²=1 

β=2.0 

β=1.0 

β=0.5 

GP β=3.0 

GP σ2=0.5, 1.0, 2.0, & 3.0 

5 

4 

3 

N=15 

σ²=1 

σ 2 =0.5, 1.0, 2.0, & 3.0 

2 

1 

GP β=2.0 

GP β=1.0 

2 

1 

0 

GP β=0.5 

0 

-1 

-60 -50 -40 -30 -20 -10 0 

-1 

-60 -50 -40 -30 -20 -10 0 

(b) (c) 

Figure 7: Rate-distortion performance R(D) of matched uniform quantizers. 

Figure 7 shows the rate-distortion performance of entropy-constrained uniform quantizers, 

given various values of N (figure 7-a), β (figure 7-b), and σ² (figure 7-c). 

As expected, large values of N result in entropy-constrained quantizers with a high entropy 

and a low distortion (figure 7-a). The R(D) performance is closer to the Gish-Pierce lower 

bound for large N. The difference between the lower bound is less than 0.5 bit with 63 

levels and more than 1 bit with 7 levels and less (β=1 and σ²=1). 

The performance of optimum entropy-constrained uniform quantizers increases with 

increasing β (figure 7-b). But the distortion increase, when one departs from the optimum, 

also increases with β. 

The performance of entropy-constrained uniform quantizers is independant of the 

variance, whether they are optimum or not. 

These observations are similar to the findings of section 2.3 for minimum-MSE quantizers. 

3. Mismatched uniform quantizers 

3.1 Mismatch relative to the shape 

Quantizer mismatch refers to practical situation of non-adaptive quantization when the 

input pdf is different from the pdf expected for the design of the quantizer. Shape 

mismatch occurs when the shape parameter β X of the input signal pdf differs from the 

- 109 -


shape parameter β Q used for the quantizer design (i.e. for determining the optimum 

quantization step 

q 

opt 

β Q 

). Various generalized Gaussian pdf shapes were given in figure 2-a 

with a fixed variance σ ²=1. Without lack of generality, unit variance pdfs will be 

considered throughout of the current section. 

3.1.1 Minimum-MSE uniform quantizers 

As a first insight regarding the effect of the shape parameter on the quantizer, figure 8 

gives the distortion as a function of β for MSE-optimized quantizers, i.e. when q opt/D is 

evaluated and used for each point of the curve. Figure 8 shows that the distortion of 

minimum-MSE uniform quantizers decreases with increasing β. 

D 

0.5 

0.45 

0.4 

0.35 

0.3 

0.25 

0.2 

0.15 

0.1 

0.05 

0 

0 0.5 1 1.5 2 2.5 3 3.5 

N=3 

N=7 

N=15 

N=31 

N=63 

80 

70 

60 

50 

40 

30 

20 

10 

0 

0 0.5 1 1.5 2 2.5 3 3.5 

N=63 

N=31 

N=15 

N=7 

N=3 

Figure 8: Distortion of matched minimum-MSE uniform quantizers as a function of 

the shape parameter β . 

Figure 9 illustrates the relative performance of uniform quantizers when the quantization 

step departs from the optimum, i.e. in case of mismatch relative to the shape parameter. It 

shows the distortion as a function of β, each curve being computed with only one value of 

q opt/D . Figure 9-b shows that when β X β Q , the SNR is slightly higher than expected. For β X much greater 

than β Q , the SNR reaches an asymptote. If the input pdf has a shape parameter higher 

than the quantizer shape parameter, the quantizer performance for this input pdf will be 

slightly better than expected because the input pdf is closer to the uniform pdf than the 

quantizer pdf itself. 

- 110 -


0.5 

0.45 

0.4 

0.35 

q opt/D , β=3 

N=15 

σ 2 =1 

22 

20 

18 

16 




D 

0.3 

0.25 

0.2 

0.15 



q opt/D , β=.5 

SNR 

14 

12 

10 

8 

q opt/D , β=.5 

0.1 

6 

0.05 

4 

0 

0 0.5 1 1.5 2 2.5 3 3.5 

beta 

2 

0 0.5 1 1.5 2 2.5 3 3.5 

beta 

Figure 9: MSE and SNR as a function of the shape parameter β for different values 

of q opt/D : shape mismatch. 

As an example using data from figure 9-b, if the quantizer was optimized for β Q =2, and the 

input is β X =0.5, then the expected SNR is 18.5 dB, but the observed SNR is only 8 dB. 

Choosing a model pdf with a too high shape parameter compared with the real input 

results in a poor quantizer performance compared with expection. If β Q =0.5, and β X =2, 

then the expected SNR is 11.5 dB, but the observed SNR is slightly higher: 13 dB. 

Choosing a too small shape parameter for the quantizer compared with observed 

input pdf parameters does not degrade the quantizer performance. It slightly 

increases it compared with expectation, but the global quantizer performance 

remains relatively poor. 

The study of the quantizer robustness in terms of SNR when the input shape parameter 

deviates from its expected is of major interest. Figure 10 shows the deviation ∆β/β about 

the MSE-optimum β Q , assuming that a SNR deviation of ± 0.5 dB is acceptable. A 

deviation of -0.5 dB is observed when β X β Q . A small deviation of β X is enough to yield a loss of 0.5dB, especially for small input 

pdf shape parameters β X . Clearly, the robustness increases with β. This finding is in 

accordance with the discussion of figure 4-c&d, and 8. 

0.25 

0.2 

0.15 

0.1 

0.05 

0 

-0.05 

-0.1 

-0.15 

0.5 1.0 2.0 3.0 

β 

N=15 

σ²=1 

+0.5dB 

-0.5dB 

Figure 10: Range of the shape parameter for a deviation of +/-0.5dB 

3.1.2 Entropy-constrained uniform quantizers 

This section addresses the relative performance of matched and mismatched entropyconstrained 

quantizers with respect to the shape parameter. 

- 111 -


In figure 11-a, the quantizer is matched for a Laplacian pdf (β=1). When the targeted 

entropy is above the optimum point of the matched quantizer, it is favorable to have an 

input pdf with β X >β Q because the real entropy is comparable to expectations, and the 

distortion is much lower. Here, β X β Q does 

not make much difference. Having β X


1 

0.9 

β=1 

N=3 

60 

55 

N=63 

0.8 

0.7 

50 

45 

N=31 

D 

0.6 

0.5 

40 

35 

N=15 

0.4 

30 

0.3 

N=7 

25 

N=7 

0.2 

0.1 

0 

0 0.5 1 1.5 2 2.5 3 3.5 

N=15 

N=31 

N=63 

20 

15 

10 

0 0.5 1 1.5 2 2.5 3 3.5 

N=3 

Figure 12: Distortion of minimum-MSE quantizers as a function of the variance σ ². 

The value of the input pdf variance does not influence the SNR performance of 

minimum-MSE uniform quantizers. This can obviously be also deducted from section 

2.3 and figure 4-e & f. 

This results is known [JAIN-89], but the equation (4) does not shoew an obvious linear 

relationship between the distostion and the variance. 

Figure 13 illustrates the relative performance of uniform quantizers when the quantization 

step departs from the optimum. It shows the distortion as a function of σ ², each curve 

being computed with only one value of q. Figure 13-b shows that whenσ ² X ≠σ ² Q , , the 

SNR is lower than at the optimal point σ ² X =σ ² Q . The penalty for under-estimating the 

variance is slightly higher than the penalty for over-estimating the variance because the 

overload distortion rises very rapidely when the variance is greater than expected (see 

figure 3 and 4). 

0.6 

0.5 

0.4 

q opt/D , σ 2 =.5 

16 

15 

14 

13 

q opt/D , σ 2 =3 

q opt/D , σ 2 =2 

D 

0.3 

0.2 

0.1 

0 

0 0.5 1 1.5 2 2.5 3 3.5 

s2 

q opt/D , σ 2 =1 

q opt/D , σ 2 =2 

q opt/D , σ 2 =3 

SNR 

12 

11 

10 

9 

8 

7 

6 

0 0.5 1 1.5 2 2.5 3 3.5 

s2 

q opt/D , σ 2 =1 

q opt/D , σ 2 =.5 

Figure 13: Distortion as a function of the variance σ² for different values of q opt/D . 

As an example using data from figure 13-b, if σ ² Q =2, and σ ² X =0.5, then the expected 

SNR is 15.5 dB, but the observed SNR is only 11.3 dB. If σ ² Q =0.5, and σ ² X =2, then the 

expected SNR is also 15.5 dB (because the minimum-MSE quantizer performance is 

independent of the variance), but the observed SNR is only 10.3 dB. 

- 113 -


All matched minimum-MSE quantizers perform the same regarding the variance. 

Mismatch of the quantizer relatively to the input variance is always penalizing 

especially if the input variance is smaller than the variance of the quantizer. 

3.2.2 Entropy-constrained uniform quantizer 

This section addresses the relative performance of matched and mismatched entropyconstrained 

quantizers with respect to the variance. 

Figure 14 shows the rate-distortion of the entropy-constrained quantizer with a variance 

mismatch, when the quantizer design is matched σ²=1. 

Variance mismatch has no effect on the performance of entropy-constrained 

quantizers. The only difference lies on the existence of points on the R(D) curve. When 

σ ² X


for determining minimum-MSE and entropy-constrained quantizers. With our quantizer 

design method, it is possible to study in detail the properties of minimum-MSE and 

entropy-constrained quantizers. Particularly, quantizer mismatch, when the input pdf 

differs from the pdf used for the quantizer design has not been extensively studied dispite 

its practical interest for memoryless source coding or non-adaptive quantization. [MAUE- 

79] reported results for mismatched Max-Lloyd quantizers. He found that the quantizer 

shape parameter should be chosen as a lower bound to the input shapes (β Q ≤ β X ) and 

that variance mismatch is not very critical. [JAYA-84] gives results of mismatch for nonuniform 

and uniform minimum-MSE quantizers, only with 4 levels. He suggests that in 

these conditions, the performance of uniform and non-uniform quantizers are very similar, 

and that the difference would be more significant at higher bit rates. 

Our results are in agreement with the previous findings, and extend them to more pdfs, 

more bite-rates, and to entropy-constrained quantizers. They lead to practical conclusions 

for the design of uniform midtread quantizers: 

• Influence of the shape parameter 

Let us assume that the input pdf shape parameters β X lies in an interval [β Xmin , β Xmax ]. If 

the quantizer is designed with β Q =β Xmin , i.e. the input shape parameter is always larger 

than the quantizer shape parameter, then the quantizer output distortion is lower than 

expected. The approach yields better performance than expected, but is conservative 

(better performance could be achieved for the highest values of β X ). In this situation, the 

quantizer mismatch corresponds to quantization steps always higher than the minimum- 

MSE optimum, and granularity error is important. The R(D) performance of an entropyconstrained 

quantizer with β Q =β Xmin is globally robust to shape mismatch, or gives better 

performance than expected. Conversly, if β Q =β Xmax the distortion will be higher than 

expected for small shape parameters. Here, the poor optimization results in a too small 

quantization step compared with the minimum-MSE, and the overload distortion is 

important. The R(D) performance of an entropy-constrained quantizer with β Q =β Xmin is not 

very robust to shape mismatch, yielding higher distortions than expected especially at 

higher rates. Under-estimating the shape parameter of the quantizer is penalizing, 

over-estimated it is slightly advantageous. The robustness of entropy-constrained 

quantizers increases with decreasing bit-rates. 

• Influence of the variance 

Let us assume that the input pdf variance σ 2 X lies in an interval [σ 2 Xmin , σ 2 Xmax ]. If the 

quantizer is designed with σ 2 Q = σ 2 Xmin , i.e. the input variance is always larger than the 

quantizer variance, then the quantizer output distortion is higher than expected. The 

approach yields worse results than expected, and worse than if σ 2 Q = σ 2 Xmax. In this 

situation, the quantizer mismatch corresponds to a quantization step always smaller than 

the minimum-MSE optimum, and overload error is important. The R(D) performance of an 

entropy-constrained quantizer with σ 2 Q = σ 2 Xmin or σ 2 Q = σ 2 Xmax is robust to variance 

mismatch. If σ 2 Q = σ 2 Xmax the distortion will be higher than expected. Here, the poor 

optimization results in a too large qiantization step compared with the minimum-MSE, and 

granularity distortion is happening. Mismatch of the quantizer relatively to the input 

variance is always penalizing. The entropy-constrained quantizers are robust to 

variance mismatch. 

- 115 -

Chapitre I-6: Application de l’étude de robustesse du quantificateur 

CHAPITRE I-6 

APPLICATION DE L’ETUDE DE LA 

ROBUSTESSE DU QUANTIFICATEUR 

UNIFORME A LA COMPRESSION 

D’IMAGES PAR FF-DCT 

- 116 -



La quantification adaptative de chaque image est une opération coûteuse en temps de 

calcul. Il est intéressant de trouver une allocation de bits et des pas de quantification qui 

puissent être utilisés avec toute une classe d’images. Ceci nécessite une quantification 

robuste à la non-adaptation 1 des images par rapport au modèle statistique qui a été utilisé 

pour déterminer les paramètres de quantification. Nous avons expérimenté les résultats et 

recommendations déduits de notre étude de la robustesse du quantificateur scalaire 

uniforme avec des images d’angiographie dans notre approche de compression FF-DCT. 

Les point suivants ont été validés expérimentalement: 

• Apport du quantificateur uniforme optimisé par rapport au quantificateur uniforme non 

optimisé. 

• Robustesse de l’optimisation en utilisant les paramètres d’une image voisine de 

l’image quantifiée. 

• Robustesse du quantificateur modélisé à partir d’un ensemble d’images et effet de la 

non-adaptation. 

2. Ensemble d’images test 

Quatre images représentatives d’artères coronaires gauches ont été utilisées. Elles ont 

été choisies parmi les angiographies des campagnes d’évaluation. Les quatre images ont 

été renforcées avant la compression. 

Pour des raisons pratiques et de simplicité de mise en oeuvre, nous avons extrait une 

sous-image de 256x256 pixels à partir de chacune des images test. Tous les traitements 

ont été réalisés avec le logiciel Matlab de MathWorks. 

Parmi ces quatre images, deux sont des images successives dans une même séquence, 

(images dénommées TO et TT). Les deux autres appartiennent à des patients différents 

(images RU et SA). Toutes les quatre sont des artères coronaires gauche avec une lésion 

significative. 

1 Le terme non-adaptation est notre traduction de l’anglais “mismatch” 

- 117 -


image originale TO 

image originale TT 

image originale RU 

image originale SA 

Figure I-6.1: Images test (images 256x256 sur 8 bits, extraites d’images 512x512) 

3. Méthode de compression 

3.1. FFDCT 

La DCT Full-Frame a été effectuée selon la formule (I-1.8), avec la normalisation donnée 

au chapitre I-3, section 2-2. Dans la définition de la DCT (I-1.8) (définition de JPEG), le 

coefficient de normalisation c(k,l) est tel que le maximum et le minimum possible du 

coefficient continu, ainsi que ceux des coefficients de la première ligne et de la deuxième 

colonne sont différents des maximum et minimum possibles pour les autres coefficients 

AC. La normalisation que nous avons introduite correspond à une modification de la 

définition de la DCT et donne des coefficients DCT qui ont tous le même maximum et 

minimum possibles. Cette définition est plus pratique pour les calculs d’optimisation basés 

sur l’énergie des différentes régions fréquentielles de la DCT, en permettant plus 

facilement des comparaisons. Elle donne un DC égal à la moyenne de l’image. 

3.2. Découpage circulaire 

Nous avons divisé chaque DCT 256x256 en 13 régions circulaires (voir chapitre I-3 et I-4, 

et figure I-3.3). La position des cercles et le nombre de coefficients des régions sont 

donnés dans la Table I-6. 1. Ces régions circulaires seront aussi dénommées “bandes 

circulaires” par la suite, par analogie avec la notion de sous-bandes de fréquences. 

- 118 -


n o ° 1 2 3 4 5 6 7 8 9 10 11 12 13 

region 

début 1 2 3 5 9 17 33 65 97 129 161 193 225 

fin 1 2 4 8 16 32 64 96 128 160 192 224 256 

nb 

coefs 

1 2 8 34 148 589 2395 400 

5 

7600 7223 8825 1044 

6 

26260 

Table I-6. 1: Position des rayons et nombre de coefficients des bandes circulaires 

(voir figure I-3.3). 

Nous n’avons pas redécoupé chaque région en zones de directionalité horizontale et 

verticale. Cela pourrait être fait sans difficulté. 

Chacune des bandes circulaires a été traitée comme un signal à quantifier, en utilisant les 

résultats de l’étude théorique du chapitre I-6 sur le quantificateur uniforme optimisé pour 

une distribution Gaussienne généralisée. Par rapport à nos précédentes expériences de 

compression FF-DCT (chapitre I-3 et I-4), nous abordons ici une méthode qui prend mieux 

en compte la distribution réelle des régions de la DCT. 

3.3. Evaluation des paramètres de la distribution des régions 

Pour chaque région circulaire, une estimation des paramètres de la distribution observée 

a été calculée. Nous avons utilisé une Gaussienne généralisée, selon la définition (I-6.3). 

Les paramètres définissant une Gaussienne généralisée sont le paramètre de forme β et 

la variance σ 2 . Ces paramètres sont utilisés dans la phase d’allocation des bits, 

permettant le calcul du pas de quantification optimal et de l’erreur théorique minimale de 

quantification. 

• Estimation de la variance. 

La variance a été estimée à partir des coefficients (dénotés x i ) de chaque bande 

circulaire, selon l’estimateur sans biais 

σ 2 1 

− 

2 

= ∑( xi 

− x) 

N −1 

i 

• Estimation des paramètres β , α et K de la Gaussienne généralisée. 

Ces paramètres peuvent être déduits des moments d’ordre 1 et d’ordre 2 des coefficients 

de chaque région, selon l’approche présentée dans [MALL-89]. 

Les moments d’ordre 1 et d’ordre 2 d’une densité de probabilité p(x) sont définis 

respectivement par: 

+∞ 

2 

m 1 = ∫ | xpxdx | ( ) et m 2 = ∫ x p( x) 

dx 

−∞ 

+∞ 

−∞ 

(I-6.1) 

En insérant dans (I-9.1) la définition de p(x) donnée par la formule (I-6.3), on trouve: 

m 1 = 2K α 2 

β 

Γ( 2 

β 

) et m 2 = 2K α 3 

3 

β Γ( β ) (I-6.2) 

On en déduit: 

β = F -1 ( m 2 

1 

) avec F(u) = 

mN 

2 

2 2 

Γ( ) 

u 

3 1 

Γ( ) Γ( ) 

u u 

(I-6.3) 

- 119 -


et α = 

1 

m2Γ( ) 

β 

3 

NΓ( ) 

β 

K peut être calculé à partir de β et α (formule (I-6.3)). 

La Figure I-6. 2 montre quelques-uns des histogrammes estimés par cette méthode en 

comparaison avec les histogrammes observés. 

0.05 

0.05 

0.04 

0.03 

0.02 

0.01 

0 

-0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 

0.045 

0.04 

0.035 

0.03 

0.025 

0.02 

0.015 

0.01 

0.005 

0 

-0.15 -0.1 -0.05 0 0.05 0.1 0.15 

région 5 région 7 

0.05 

0.045 

0.04 

0.035 

0.03 

0.025 

0.02 

0.015 

0.01 

0.005 

0 

-0.04 -0.03 -0.02 -0.01 0 0.01 0.02 0.03 

0.04 

0.035 

0.03 

0.025 

0.02 

0.015 

0.01 

0.005 

0 

-0.015 -0.01 -0.005 0 0.005 0.01 0.015 0.02 

région 9 région 11 

Figure I-6. 2: Histogrammes réels (ligne continue) et estimés (ligne brisée) des 

bandes circulaires n o 5, 7, 9, et 11 de l’image TO. 

- 120 -


• Distribution des régions des images test 

Les paramètres des distributions des régions circulaires des quatre images test sont 

donnés dans les Tables I-6.2, (a) à (d). 

TO nbcoef moyenne var beta 

1 1 1.27E+02 0.00E+00 0.00E+00 

2 2 -1.32E+00 1.56E+01 1.00E+00 

3 8 3.81E-01 3.28E+00 9.15E-01 

4 34 5.99E-02 9.43E-02 1.18E+00 

5 148 1.23E-02 2.03E-02 2.27E+00 

6 589 -2.11E-03 5.24E-03 1.40E+00 

7 2395 -2.90E-04 9.19E-04 1.47E+00 

8 4005 2.89E-04 2.32E-04 1.68E+00 

9 5600 -5.11E-05 7.83E-05 1.71E+00 

10 7223 -1.42E-05 3.43E-05 1.71E+00 

11 8825 1.83E-05 1.87E-05 1.93E+00 

12 10446 2.77E-05 1.35E-05 1.95E+00 

13 26260 3.75E-05 1.30E-05 1.95E+00 

(a) 

TT nbcoef moyenne var beta 

1 1 1.28E+02 0.00E+00 0.00E+00 

2 2 -1.33E+00 1.62E+01 1.00E+00 

3 8 3.53E-01 3.34E+00 9.36E-01 

4 34 6.10E-02 9.23E-02 1.09E+00 

5 148 1.64E-02 2.02E-02 2.19E+00 

6 589 -2.37E-03 5.62E-03 1.44E+00 

7 2395 -1.52E-04 9.56E-04 1.43E+00 

8 4005 -1.89E-05 2.38E-04 1.61E+00 

9 5600 1.55E-04 7.61E-05 1.64E+00 

10 7223 -6.29E-05 3.26E-05 1.79E+00 

11 8825 1.98E-05 1.85E-05 1.94E+00 

12 10446 2.44E-05 1.35E-05 1.93E+00 

13 26260 -2.06E-05 1.28E-05 1.93E+00 

(b) 

RU nbcoef moyenne var beta 

1 1 9.39E+01 0.00E+00 0.00E+00 

2 2 2.51E-01 3.00E-01 1.00E+00 

3 8 4.72E-01 1.48E+00 1.25E+00 

4 34 -2.66E-02 1.27E-01 1.38E+00 

5 148 6.21E-03 1.92E-02 1.10E+00 

6 589 -1.45E-04 2.06E-03 1.06E+00 

7 2395 -7.03E-05 1.26E-04 1.08E+00 

8 4005 4.76E-05 1.75E-05 1.71E+00 

9 5600 -3.79E-05 6.73E-06 1.94E+00 

10 7223 1.30E-06 3.46E-06 1.83E+00 

11 8825 -2.50E-05 1.89E-06 1.98E+00 

12 10446 2.02E-07 1.23E-06 1.89E+00 

13 26260 -1.53E-06 9.06E-07 1.78E+00 

(c) 

SA nbcoef moyenne var beta 

1 1 8.03E+01 0.00E+00 0.00E+00 

2 2 -3.22E+00 3.11E+01 1.00E+00 

3 8 3.47E-01 1.28E+00 6.72E-01 

4 34 1.11E-01 1.72E-01 1.69E+00 

5 148 1.79E-02 4.51E-02 1.24E+00 

6 589 -1.44E-03 3.54E-03 1.45E+00 

7 2395 1.74E-04 8.08E-04 1.65E+00 

8 4005 -2.42E-05 3.12E-04 1.92E+00 

9 5600 6.97E-05 1.85E-04 1.96E+00 

10 7223 1.27E-04 1.18E-04 1.73E+00 

11 8825 -1.76E-04 6.68E-05 1.81E+00 

12 10446 5.28E-05 3.85E-05 1.94E+00 

13 26260 3.70E-07 3.23E-05 1.88E+00 

Tables I-6.2: Tables de paramètres des bandes circulaires circulaires des quatre 

images test. (a): TO, (b): TT, (c): RU, (d):SA. 

(d) 

Le coefficient de la région 1 est la composante continue, c’est à dire la moyenne de 

l’image (voir notre normalisation de la DCT). 

On constate que les moyennes de deux images de la même séquence (TO et TT) sont 

supérieures à celles des deux autres images (RU et SA). En effet, on voit sur la Figure I- 

6.1 que TO et TT sont globalement plus claires que RU et SA. 

Dans ce groupe d’images test, les paramètres de forme β sont voisins de 1 pour les 

basses et moyennes fréquences (distribution de type Laplacienne), et sont voisins de 2 

pour les hautes fréquences (distribution de type Gaussienne). Nous avons observé sur 

d’autres images des β allant de 0.5 à 2.5 et plus. 

- 121 -


3.4. Allocation marginale et quantificateur ‘midtread’ uniforme 

La quantification a été réalisée comme suit. 

• Le coefficient continu n’a pas été quantifié. Il est transmis en virgule flottante sur 32 

bits. 

• Les régions 2 et 3, dont le nombre de coefficients est trop faible pour évaluer des 

statistiques, ont été quantifiées sur 10 bits. La quantification de ces régions s’est faite 

sans optimisation, en prenant pour pas de quantification q=2 10 /(max-min), où max et 

min représentent les coefficients maximum et minimum de la région. 

• Les régions 4 à 13 ont été quantifiées avec un quantificateur uniforme optimal de type 

minimum-MSE (voir chapitre I-6). Nous avons procédé à une allocation marginale 

selon le principe décrit au chapitre I-4, mais en utilisant la formulation de l’erreur de 

quantification avec distribution gaussienne généralisée du chapitre I-6. 

3.5. Calcul du taux de compression 

L’étape finale de codage entropique n’a pas été réalisée. Nous avons calculé l’entropie 

d’ordre zéro de l’ensemble des coefficients quantifiés et l’avons utilisée dans le calcul du 

taux de compression. 

4. Résultats 

4.1. Apport du quantificateur optimisé par rapport au quantificateur non 

optimisé 

La première image (TO) a fait l’objet d’une allocation de bits en utilisant l’approche 

minimum-MSE. Les bits alloués (b) et les valeurs du pas de quantification optimum (q) 

pour les différentes régions circulaires sont données dans la Table I-6.3. Ces paramètres 

ont été employés dans la quantification. 

La même image a été quantifiée avec le même nombre de niveaux de quantification que 

précédemment, mais en utilisant des valeurs de q non optimales pour les régions 4 à 13. 

Ces valeurs correspondent à un quantificateur uniforme sur toute la dynamique du signal: 

q=2 b /(max-min). 

La Figure I-6.3 donne un comparatif des courbes PPSNR en fonction du taux de 

compression. La qualité visuelle est illustrée par la Figure I-6.4. Sur un écran, on voit qu’à 

partir d’un taux de 12:1, les images comprimées sont moins nettes que l’original. Les 

images comprimées avec q non-optimum sont nettement plus floues que les images 

comprimées avec q optimum. Au delà d’un taux de 20:1, les images comprimées avec q 

non optimum ont une texture modifiée, de type alvéolaire. 

TO adaptatif CR 7.4 CR 11.6 CR 15.6 CR 19.6 

# region nbcoef nb bits q nb bits q nb bits q nb bits q 

- 122 -


1 1 32 - 32 - 32 - 32 - 

2 2 10 - 10 - 10 - 10 - 

3 8 10 - 10 - 10 - 10 - 

4 34 10 0.00439 8 0.01446 8 0.01446 8 0.01446 

5 148 7 0.00756 6 0.01404 6 0.01404 6 0.01404 

6 589 6 0.00951 6 0.00951 5 0.01689 5 0.01689 

7 2395 5 0.00687 4 0.01218 4 0.01218 3 0.02160 

8 4005 3 0.01040 3 0.01040 3 0.01040 2 0.01908 

9 5600 3 0.00602 1 0.01291 1 0.01291 1 0.01291 

10 7223 1 0.00858 1 0.00858 0 - 0 - 

11 8825 1 0.00809 0 - 0 - 0 - 

12 10446 0 - 0 - 0 - 0 - 

13 26260 0 - 0 - 0 - 0 - 

Table I-6.3: Résultats de l’allocation de bits et de l’optimisation du quantificateur 

pour TO selon une quantification adaptative 

33 

q OPTIMISE VS q NON OPTIMISE 

32 

PPSNR en dB 

31 

30 

29 

28 

27 

5 10 15 20 25 30 35 

taux de compression 

Figure I-6.3: Courbe PPSNR en fonction du taux de compression. +: TO avec q 

optimum, X: TO avec q non optimum. 

Avec un q non optimal utilisant toute la dynamique de chaque région, on obtient des taux 

de compression de 9.6, 15.1, 15.7, 31.4. Ils sont supérieurs à ceux demandés. La 

performance en terme de PPSNR est de 1 à 2 dB inférieure, comme le montre la Figure I- 

6.3. 

- 123 -


(a) 

(b) 

(c) 

Figure I-6.4: (a) Image TO comprimée avec q optimal, taux=15.6, PPSNR=30.8.(c) 

Image d’erreur correspondante multipliée par 20. (b) Image TO comprimée avec q 

non optimal, taux=15.7, PPSNR=28.8.(d) Image d’erreur correspondante multipliée 

par 20. 

(d) 

On remarque dans la Figure I-6.4 que les images comprimées présentent un artefact 

circulaire dans le coin supérieur gauche. Celui-ci provient d’une trop brusque transition 

entre valeurs quantifiée/reconstruites des coefficients de deux régions circulaires 

adjacentes dans les basses fréquences, et d’un nombre de bits insuffisants dans les très 

basses fréquences (10 bits). Ceci est dû au fait que, contrairement aux travaux des 

chapitres I-3 et I-4, nous n’avons pas incorporé les bandes circulaires de basses 

fréquences dans l’allocation. Compte tenu de leur faible nombre de coefficients, une 

allocation avec un modèle uniforme au lieu d’une Gaussienne généralisée s’était avéré 

efficace, et éviterait la transition brusque entre des zones à 10 bits (choisis arbitrairement 

ici) et des zones allouées de façon optimales . 

4.2. Vérification de la stabilité des caractéristiques statistiques des images 

d’une même séquence associée à la robustesse du quantificateur. 

Nous avons utilisé les paramètres statistiques de l’image TT pour effectuer l’allocation des 

bits. Les résultats (nombre de bits et valeurs de q) ont été utilisés pour quantifier l’image 

TO. Ainsi, nous pouvons vérifier si les caractéristiques des images d’une même séquence 

- 124 -


sont stables, et si l’allocation d’une image de la séquence est satisfaisante sur les autres 

images de la séquence. Les résultats de l’allocation sur TT sont donnés à la Table I-6.4. 

La Figure I-6.5 montre la courbe PPSNR en fonction du taux de compression pour l’image 

TO quantifiée de façon non adaptative, en utilisant les paramètres de l’image TT. Les 

performances de la quantification adaptative et non-adaptative sont identiques. 

Les taux de compression sont comparables, et les images décomprimées sont de qualité 

visuelle identique. 

TO selon TT CR 7.5 CR 11.7 CR 15.3 CR 19.8 

# region nbcoef nb bits q nb bits q nb bits q nb bits q 

1 1 32 - 32 - 32 - 32 - 

2 2 10 - 10 - 10 - 10 - 

3 8 10 - 10 - 10 - 10 - 

4 34 9 0.00855 9 0.00855 7 0.01534 8 0.01534 

5 148 7 0.00772 6 0.01430 6 0.01430 6 0.01430 

6 589 6 0.00962 6 0.00962 6 0.00962 5 0.01714 

7 2395 5 0.00710 4 0.01255 4 0.01255 3 0.02220 

8 4005 3 0.01068 3 0.01068 3 0.01068 2 0.01947 

9 5600 3 0.00600 1 0.01175 1 0.01175 1 0.01175 

10 7223 1 0.00919 1 0.00919 0 - 0 - 

11 8825 1 0.00812 0 - 0 - 0 - 

12 10446 0 - 0 - 0 - 0 - 

13 26260 0 - 0 - 0 - 0 - 


pour l’image TT, utilisés pour quantifier TO. 

- 125 -


ADAPTATIF VS NON ADAPTATIF SELON IMAGE PROCHE 

33 

32 

PPSNR en dB 

31 

30 

R 

29 

28 

27 

5 10 15 20 25 30 35 


Figure I-6.5: Courbe PPSNR en fonction du taux de compression. +: TO avec 

quantification adaptative, x: TO avec quantification non-adaptative selon les 

paramètres de TT. 

4.3. Quantificateur modélisé à partir d’un ensemble d’images: effet de la 

non-adaptation 

La quantification adaptative d’une image permet d’obtenir la meilleure performance 

possible, mais elle est coûteuse en temps de calcul. Dans la pratique, il peut être 

souhaitable d’adopter une table fixe de paramètres de quantification et de l’appliquer à 

toutes les images. Les résultats théoriques sur l’effet de la non-adaptation du 

quantificateur fournissent des indications précieuses sur la façon de choisir les 

paramètres de forme et la variance du quantificateur afin de limiter au mieux l’effet de la 

non-adaptation. Ces indications sont valides dans le cadre d’un signal unique. Dans la 

compression FF-DCT, il faut quantifier simultanément un ensemble des signaux (les 

bandes circulaires). Nous avons voulu vérifier si les résultats théoriques étaient utilisables 

dans ce cadre. 

A partir des paramètres de distributions (paramètre de forme β et variance σ 2 ) des quatre 

images, nous avons constitué selon deux approches différentes une table de paramètres, 

en vue de l’allocation marginale. 

• La première approche consiste à prendre pour chaque région le plus petit β rencontré 

parmi les quatre images, et le plus grand σ 2 . Ainsi, on aura tendance à toujours surestimer 

β et sous-estimer σ 2 . Nous avons vu dans le chapitre I-6 qu’en cas de nonadaptation, 

cette situation est la moins défavorable. Il est intéressant d’observer si cela 

se vérifie en pratique alors que l’image est quantifiée à partir de nombreuses régions 

fréquentielles, donc de plusieurs signaux quantifiés différemment. 

• La deuxième approche consiste à prendre les β maximum et les σ 2 minimum. Ainsi, 

on aura tendance à toujours sous-estimer β et sur-estimer σ 2 . Nous avons vu dans le 

chapitre I-6 qu’en cas de non-adaptation, cette situation est la plus défavorable. 

- 126 -


TO avec β min. CR 8.8 CR 12.7 CR 15.3 CR 22.5 

et σ 2 max. 

# region nbcoef nb q nb q nb q nb q 

bits 

bits 

bits 

bits 

1 1 32 - 32 - 32 - 32 - 

2 2 10 - 10 - 10 - 10 - 

3 8 10 - 10 - 10 - 10 - 

4 34 9 0.01168 8 0.02096 8 0.02096 8 0.02096 

5 148 8 0.01060 7 0.01883 7 0.01883 7 0.01883 

6 589 6 0.01202 5 0.02073 5 0.02073 5 0.02073 

7 2395 4 0.01442 4 0.01442 3 0.02459 3 0.02459 

8 4005 3 0.01224 3 0.01224 2 0.02230 1 0.02284 

9 5600 3 0.00936 1 0.01834 1 0.01834 1 0.01834 

10 7223 1 0.01593 1 0.01593 1 0.01593 - - 

11 8825 1 0.01332 - - - - - - 

12 10446 - - - - - - - - 

13 26260 - - - - - - - - 

(a) 

TO avec β min. CR 6.2 CR 8.9 CR 12.3 CR 16.1 

et σ 2 max. 

# region nbcoef nb q nb q nb q nb q 

bits 

bits 

bits 

bits 

1 1 32 - 32 - 32 - 32 - 

2 2 10 - 10 - 10 - 10 - 

3 8 10 - 10 - 10 - 10 - 

4 34 8 0.01056 8 0.01056 8 0.01056 8 0.01056 

5 148 8 0.00394 8 0.00394 8 0.00394 8 0.00394 

6 589 7 0.00324 7 0.00324 6 0.00582 6 0.00582 

7 2395 5 0.00238 5 0.00238 4 0.00428 4 0.00428 

8 4005 3 0.00275 3 0.00275 3 0.00275 1 0.00771 

9 5600 3 0.00170 1 0.00498 1 0.00498 1 0.00498 

10 7223 1 0.00312 1 0.00312 - - - - 

11 8825 1 0.00269 - - - - - - 

12 10446 - - - - - - - - 

13 26260 - - - - - - - - 

(b) 


pour l’image TO, avec paramètres de distribution dérivés de quatre images. (a): β 

minimum et σ 2 maximum. (b): β maximum et σ 2 minimum. 

Les résultats de l’allocation sur TO selon les deux approches précédemment décrites sont 

donnés dans la Table I-6.5 . 

La Figure I-6.6 montre la courbe PPSNR en fonction du taux de compression pour l’image 

TO avec quantificateur adaptatif, et en utilisant les paramètres des quatre images selon 

les deux façons. 

La performance du PPSNR en fonction du taux de compression est la meilleure pour 

l’image quantifiée de façon adaptative, puis pour l’image quantifiée en prenant les valeurs 

minimum des β rencontrées sur plusieurs images (perte de 1 dB), puis pour l’image 

quantifiée en prenant les β maximum (perte supérieure à 2 dB). On constate que les taux 

obtenus avec la deuxième approche sont plus faibles que ceux escomptés. 

- 127 -


En terme de PPSNR, la différence entre les deux approches non-adaptative est de l’ordre 

de 1 dB. En revanche, la qualité visuelle d’une approche qui ne tire pas partie 

avantageusement de la théorie est très fortement dégradée. L’approche la plus 

“judicieuse” aboutit à un léger flou à partir d’un taux de 12:1 et la qualité est peu différente 

de celle obtenue avec l’approche adaptative. L’approche la moins “judicieuse” aboutit à 

une image très floue avec perte caractérisée des fins vaisseaux et des contours. La 

Figure I-6.7 illustre ce résultat. 

La mise en application de la non-adaptation dans le cadre d’une quantification de la FF- 

DCT, selon notre approche de bandes circulaires, vérifie bien la théorie développée à 

partir du quantificateur optimum optimisé sur un signal. 

ATIF VS NON ADAPTATIF SELON beta min (x) et max (*) de 4 

33 

32 

PPSNR en dB 

31 

30 

29 

28 

27 

5 10 15 20 25 30 35 


Figure I-6.6: Courbe PPSNR en fonction du taux de compression. +: TO avec 

quantification adaptative, x: TO avec quantification non-adaptative (β min. et σ 2 

max), *: TO avec quantification non-adaptative (β max. et σ 2 min). 

- 128 -


(a) 

(b) 

(c) 

(d) 

Figure I-6.7: (a) TO avec quantification non-adaptative (β min. et σ 2 max), taux=15.3, 

PPSNR=29.8; (c) Image d’erreur correspondante multipliée par 20. (b) TO avec 

quantification non-adaptative (β max. et σ 2 min (c) taux=16.1, PPSNR=28.6; (d) Image 

d’erreur correspondante multipliée par 20. 

- 129 -


5. Discussion 

La théorie de la robustesse du quantificateur uniforme minimum-MSE dans le cas d’une 

non-adaptation de la distribution du signal d’entrée a été appliquée dans le cadre d’une 

compression FF-DCT. 

Dans les conditions de nos expériences, nous avons pu valider les point suivants: 

• Apport du quantificateur uniforme optimisé par rapport au quantificateur uniforme non 

optimisé. 

L’optimisation du pas de quantification apporte un gain de 1 à 2 dB en terme de PPSNR, 

et une amélioration sensible de la qualité visuelle. De cette optimisation résulte un 

écrêtage des valeurs les plus extrêmes des bandes circulaires, et une quantification plus 

fine des valeurs autour de la moyenne. Théorie et pratique confirment l’intérêt de 

l’approche. 

• Robustesse de l’optimisation en utilisant les paramètres d’une image voisine de 

l’image quantifiée. 

La quantification non-adaptative d’une image en prenant pour paramètres de 

quantification ceux obtenus de façon adaptative sur une image de la même séquence 

donne d’excellents résultats. Pour des images voisines, la quantification non-adaptative 

est robuste. 

• Robustesse du quantificateur modélisé à partir d’un ensemble d’images et effet de la 

non-adapatation. 

Pour quantifier une classe d’images de façon non-adaptative, en prenant une table de 

paramètres de quantification fixe, la théorie de la robustesse du quantificateur uniforme 

fournit les lignes directrices afin de mettre au point le quantificateur. Par rapport à une 

image avec quantification adaptative, la quantification non-adaptative peut engendrer des 

pertes de plus de 2 dB. En optimisant le quantificateur avec les valeurs de β minumum et 

celles de σ 2 maximum, on limite cette perte à 1 dB ou moins. Ce faible écart en terme de 

PPSNR est accompagné d’une différence de qualité d’image majeure. Un mauvais choix 

des paramètres du quantificateur aboutit clairement à une image fortement dégradé. Par 

conséquent, un choix judicieux de paramètres de quantification non-adaptative permet un 

gain de qualité substantiel et n’engendre aucun surcoût en terme de calcul. 

Ces résultats sont très prometteurs pour la mise au point de tout système de 

quantification optimum d’images transformées. Il serait intéressant de mettre en œuvre 

nos algorithmes sur une plus grande base d’images de dimension 512x512. 

- 130 -

CHAPITRE I-7 

CONCLUSION DE LA PARTIE 

COMPRESSION 

- 131 -

Chapitre I-7: Conclusion de la partie compression 

Introduction 

La première partie de ce mémoire a été consacrée aux méthodes de compression pour 

les angiographies cardiaques. 

Nous avons étudié plusieurs éléments algorithmiques propres aux méthodes par 

transformation. Nous les avons illustrés à l’aide d’une approche Full-Frame DCT, en 

utilisant au mieux les caractéristiques des angiographies cardiaques. Les points d’intérêts 

majeurs de nos travaux concernent l’adaptation de la quantification et la prise en compte 

du renforcement de contour. 

Adaptation de la quantification 

Nous avons cherché à développer une quantification des coefficients de la DCT adaptée à 

une classe d’images . A partir de résultats d’allocation de bits sur quelques images, on 

peut mettre au point un découpage en régions, une allocation des bits et un pas de 

quantification fixes pour toutes les images d’une même classe. Cette approche est moins 

coûteuse en calculs que l’adaptation de la quantification à chaque image. Dans ce dernier 

cas l’approche sera dite adaptative. 

Nous avons cherché à répondre à deux questions: 

• Quelle est la meilleure approche de l’adaptation ? 

• Quel est l’impact de paramètres de quantification mal adaptés à l’image réelle? 

Comment guider le choix des paramètres de quantification pour limiter cet impact? 

Quantification adaptée 

Prenant en compte la répartition énergétique de la DCT Full-Frame d’angiographies 

cardiaques, nous avons découpé le plan DCT en zones fréquentielles circulaires. Nous 

avons ajouté une notion de ‘directionalité’ en découpant ces zones en bandes circulaires 

de ‘directionalité’ horizontales, obliques et verticales. Chacune de ces bandes circulaires a 

été quantifiée séparément. 

L’allocation des bits a été faite par une méthode d’allocation marginale, qui alloue 

progressivement les bits disponibles aux bandes circulaires pour lesquelles ces bits 

contribuent le plus à abaisser l’erreur de quantification. Le calcul de l’erreur de 

quantification a été effectué selon une approche optimale pour un quantifieur scalaire 

uniforme. Les paramètres estimés de la distribution statistiques des coefficients de 

chaque bande circulaire sont utilisés dans le calcul de cette erreur d’après modèle. 

L’utilisation d’une allocation marginale sur des bandes circulaires circulaires de la DCT 

Full-Frame permet d’obtenir des images comprimées ayant un PPSNR de 1 à 2 dB 

supérieur à ceux de JPEG, présentant une qualité visuelle meilleure (moins de perte des 

fins détails, pas d’artefacts de blocs). 

Le choix du modèle statistique de la distribution des bandes circulaires est primordial dans 

le calcul de l’erreur de quantification. La plupart des auteurs utilisent un modèle Gaussien 

ou Laplacien [REIN-83], [JAIN-89]. Nous avons constaté qu’une distribution Gaussienne 

généralisée était plus appropriée aux bandes circulaires. Les paramètres de forme 

observés varient de 0.5 à 2.5, selon les images et les bandes circulaires. 

- 132 -


Nous avons développé une formulation analytique de l’erreur de quantification avec 

une Gaussienne généralisée et un quantificateur scalaire uniforme. Cette formulation est 

très riche en applications. Elle permet d’évaluer le pas de quantification optimal (celui qui 

minimise l’erreur pour un nombre de bits donnés), et d’étudier l‘impact de la nonadaptation 

du signal réel au quantificateur. Ce deuxième point sera évoqué dans le 

paragraphe sur la quantification non adaptative. 

Nous estimons que cette formulation, utilisée dans l’allocation marginale, permettrait 

d’améliorer encore les premiers résultats mentionnés plus haut (de 1 à 2dB supérieurs à 

JPEG), pour lesquels un modèle Laplacien avait été utilisé sur toutes les bandes 

circulaires. 

Nous avons pu mettre en évidence que l’utilisation d’un pas de quantification optimal (qui 

écrête le signal), par rapport à un pas non optimal (qui utilise toute la dynamique du 

signal) permet de gagner 1 à 2 dB sur une image 256x256 extraite d’une image 512x512. 

Quantification non adaptée 

Nous avons utilisé la formulation analytique de l’erreur de quantification dans une étude 

théorique. Cette étude porte sur l’impact de la non adaptation d’un quantifieur scalaire 

uniforme midtread modélisé par une Gaussienne généralisée avec un signal observé. 

Nous avons exploré l’impact d’une quantification non adaptée au paramètre de forme et 

à la variance du signal observé par rapport au modèle utilisé lors de l’optimisation du 

quantificateur. L’impact a été mesuré en terme de MSE et SNR. Deux types de 

quantificateurs ont été envisagés: le quantificateur d’erreur quadratique minimum, et le 

quantificateur de caractéristique débit-distorsion optimale. 

Nous avons mis en évidence le résultat suivant: 

• Une sous-estimation du paramètre de forme augmente le SNR par rapport à celui 

attendu , une surestimation du paramètre de forme est très pénalisante, elle réduit 

fortement le SNR. 

• Une sous-estimation de la variance est pénalisante, une surestimation de la variance 

est moins pénalisante. 

Ces résultats nous ont permis de choisir aux mieux les paramètres des quantificateurs 

pour une quantification non adaptative. Nous proposons de prendre un ensemble 

d’images test (ou d’apprentissage), et d’observer les paramètres de forme et les variances 

de leurs bandes circulaires dans la FFDCT. En retenant les paramètres de forme 

minimum, et les variances maximales , on compose une série de données à utiliser dans 

l’allocation marginale. Les résultats de cette allocation peuvent être utilisés avec toute 

image de la classe d’images étudiée. 

Nous avons vérifié expérimentalement cette approche avec quatre images 

d’angiographies 256x256 extraites d’images 512x512. Nous avons constaté que la 

quantification non adaptative selon notre approche induit une perte de 1dB (par rapport à 

l'approche adaptive), alors qu’une quantification non adapatative sans précaution induit 

une perte de 3 dB. La qualité visuelle avec une quantification non adaptative sans 

précautions est très médiocre, alors que celle obtenue avec une quantification non 

adaptative selon notre approche est très bonne. 

Prise en compte du renforcement de contour 

Dans les systèmes d’angiographie cardiaques, les images sont stockées sur disque de 

façon brutes, mais elles sont présentée à l’écran avec des post traitements. Le traitement 

- 133 -


le plus important est un filtre de renforcement de contour. Celui-ci est un filtre de 

convolution de type Laplacien. Il augmente l’énergie des basses et moyennes 

fréquences de l’image. Il a une interaction défavorable avec la compression car il a 

tendance à rehausser non seulement les contours, mais aussi à rendre plus visible les 

éventuels artefacts de compression. 

Nous avons étudié les questions suivantes: 

• Est-il possible de réaliser ce filtre de convolution dans le domaine DCT? Est-il possible 

de réaliser le filtre inverse? 

• Vaut-il mieux comprimer l’image avant ou après le renforcement de contour? 

• Comment améliorer le scénario renforcement puis compression? 

• Comment améliorer le scénario compression puis renforcement? 

Réalisation du renforcement et de son filtre inverse dans le domaine DCT 

Nous avons utilisé [CHIT-90] [MART-93] [MART-94] une formulation analytique pour 

réaliser un filtre de convolution linéaire réel et pair par une multiplication dans le domaine 

DCT. Pour réaliser le filtre inverse (ce qui n’est pas évident à faire dans le domaine pixel) 

[EEUW-90], [BERE-92], il suffit d’effectuer une opération de division, de façon analogue. 

Choix de la compression avant ou après le renforcement 

Nous avons constaté, par simulation et expériences sur des images réelles, qu’il est 

préférable de comprimer une image déjà renforcée. Une image brute comprimé puis 

renforcée est moins bonne visuellement qu’une image brute renforcée puis comprimée. 

Scénario 1 : renforcement puis compression 

Dans le scénario où l’image est renforcée puis comprimée, il faut avoir la possibilité de 

dé-renforcer l’image. Les images non-renforcées sont en effet nécessaires pour d’autres 

traitements, comme par exemple les mesures quantitatives. 

Nous avons utilisé le filtre inverse du renforcement mis en œuvre dans le domaine DCT. 

Nous avons introduit une connaissance a priori sur la régularité de l’image afin 

d’améliorer le résultat du dé-renforcement sur une image comprimée. Cette approche de 

restauration d’image est surtout utile quand la compression introduit de fortes distorsions. 

Elle permet d’améliorer la régularité de l’image en vue de logiciels de détection de contour 

notamment. La même approche a été utilisée par [DING-96] et [PROS-97] avec une 

compression JPEG, où les résultats sont plus spectaculaires compte tenu de la plus 

grande “irrégularité” introduite par JPEG. 

Scénario 2 : compression puis renforcement 

Dans le scénario où l’image est comprimée puis renforcée, on risque d’avoir une qualité 

visuelle moyenne. Nous proposons de quantifier l’image brute avec les paramètres de 

l’image déjà renforcée. Ainsi, l’image brute comprimée a des caractéristiques appropriées 

pour le renforcement. Ces fréquences basses et moyennes auront été correctement 

préservées. Cette approche est valable dans le cas adaptatif en multipliant la DCT par le 

masque de renforcement avant d’évaluer les données nécessaires à l’allocation de bits. 

Cette approche est aussi valable dans le cas de l’adaptation à une classe d’images (les 

angiographies), en cherchant une table d’allocation sur des images test renforcées. 

- 134 -


Perspectives 

Notre approche de compression à base de Full-Frame DCT donne des résultats 

préliminaires prometteurs. Il serait intéressant de comprimer un plus grand nombre 

d’images à l’aide d’un logiciel complet allant jusqu’au codage entropique, et d’évaluer la 

qualité des images obtenues. 

Voici quelques améliorations à apporter: 

• Le découpage optimal du plan DCT 

Il est possible d’améliorer notre découpage empirique par un découpage en bandes 

circulaires dont les coefficients ont une énergie la plus voisine possible. 

• L’intégration des propriétés du système visuel humain. 

Le découpage en bandes circulaires circulaire avec une ‘directionalité’ se prête très bien à 

une pondération psycho-visuelle. L’approche développée par [SENA-95] a été envisagée. 

• Le contrôle du taux de compression 

Notre système d’allocation marginale ne permet qu’un contrôle approximatif du taux de 

compression. Il est envisageable d’utiliser une deuxième passe d’allocation. Après avoir 

établi le nombre de bits, l’utilisation de l’optimisation débit-distorsion du chapitre I-5 peut 

servir à obtenir le taux désiré. Une autre approche peut consister à réaliser le codage des 

premières bandes circulaires, et d’adapter l’allocation par boucle de retour. 

Conclusion 

Avec une connaissance précise des conditions d’utilisation des images, il existe de très 

nombreuses possibilités d’améliorer les performances des systèmes de compression par 

rapport aux systèmes standards d’usage général. 

Nos travaux sur l’optimisation du quantificateur et l’impact de la non-adaptation du signal 

peuvent être appliqués à toute autre compression avec un quantificateur uniforme, par 

exemple en sous-bandes. Ils peuvent aussi être étendus aux quantificateurs vectoriels 

sur treillis. 

Nos travaux d’adaptation au renforcement de contour, de restauration appliquée à la 

compression peuvent aussi s’appliquer à d’autres systèmes de compression avec DCT. 

- 135 -

PARTIE II 

Evaluation de la qualité 

d’angiographies cardiaques 

comprimées 

- 136 -

CHAPITRE II-1 

ETUDE BIBLIOGRAPHIQUE DES 

METHODES D’EVALUATION D’IMAGES 

COMPRIMEES ET PROPOSITION D’UNE 

NOUVELLE APPROCHE ADAPTEE AUX 

EXAMENS ANGIOGRAPHIQUES 

- 137 -

Chapitre II-1: Etude bibliographique des méthodes d’évaluation et proposition d'une 

nouvelle approche pour angiographies 

1. Bibliographie sur l’évaluation d’images comprimées 

1.1. Introduction 

Depuis la fin des années quatre-vingt, de nombreuses études sur l'évaluation d'images 

radiologiques comprimées ont été réalisées. Elles ont influencé de façon sensible 

l'acceptation par la communauté médicale de l'idée d'une modification irréversible des 

images médicales numériques. Au début du présent travail, cette idée n'était envisagée 

que dans les milieux de la recherche. 

Face au potentiel considérable du stockage et de la transmission numériques, on est 

passé en quelques années de l'idée inacceptable à l'application en routine dans plusieurs 

domaines. C’est en effet l’implémentation par certains constructeurs de compressions 

sans perte dans leurs produits qui a réellement démocratisé la compression dans le 

monde médical, avant que des comités scientifiques ou médicaux ne se prononcent sur 

ses limites d’application. Par exemple les échographies sont communément archivées 

avec une compression MPEG sur disques optiques ou cassettes numériques. Les CD 

cardiologiques contiennent chez deux constructeurs (Philips et Siemens) un format JPEG 

avec perte pour la visualisation dynamique directe. 

Il n'en reste pas moins une grande crainte de perdre de l'information diagnostique. C'est 

pourquoi la multiplication des études d'évaluation confirmant l'absence ou l’existence 

d’une perte d'information diagnostique devrait permettre de dissiper ce genre 

d'appréhension et de cibler les tâches, les algorithmes et les taux limites pour des 

applications où la compression est appropriée. 

1.2. Liste des principales méthodes d'évaluation 

On rencontre principalement cinq grandes approches pour juger la qualité d'images 

comprimées: 

• une quantification objective par SNR ou toute autre mesure basée sur un calcul à partir 

des pixels, 

• une analyse basée sur des critères d'appréciation visuelle / subjective (image jugée de 

plus ou moins bonne qualité) 

• une analyse de la fidélité diagnostique basée sur la méthodologie ROC (Receiver 

Operating Curve) 

• une analyse de la fidélité diagnostique non basée sur la méthode ROC (courbes 

sensibilité et PVP en fonction du débit) 

• une analyse sur la modification de mesures quantitatives calculées par logiciel (par 

exemple le degré de sténose) 

Le présent travail se situe principalement dans le cadre des deux dernières approches. 

Les paragraphes suivants introduisent ces méthodes et les principaux travaux qui s’y 

réfèrent. L'approche basée sur les mesures quantitatives fera l’objet du chapitre II-4. 

- 138 -



1.3. Quantification objective de la qualité par mesures de type SNR 

La manière traditionnelle de comparer les performances d'un algorithme de compression 

consiste à afficher des courbes de la distorsion (MSE ou SNR) par rapport au débit 

exprimé en bpp. Cette approche simple est utile lors de la mise au point d'un algorithme, 

mais n'est pas suffisante pour le valider. En effet, le SNR n'est pas basé sur les propriétés 

du système visuel humain. Certaines méthodes de compression introduisent des artefacts 

qui dégradent l'image d'un point de vue perceptif, alors que le SNR reste bon, ou vice 

versa. 

De nombreux travaux tentent de déterminer un critère objectif qui reflète correctement 

l'appréciation d'un observateur humain. [ESKI-95] étudie 12 mesures discrètes et 

bivariées différentes basées sur les écarts entre la distribution des pixels de l'image 

originale et de l'image comprimée. Après avoir demandé à des observateurs de classer 

par ordre de préférence les images tests obtenues avec plusieurs méthodes de 

compression (JPEG, Wavelet) et plusieurs taux de compression, il établit un score moyen 

basé sur les rangs (selon l'ordre de préférence). Une corrélation calculée entre ce score 

moyen et chaque mesure objective permet d'identifier les scores qui reflètent le mieux 

l'appréciation visuelle dans les conditions de cette étude. La MSE donne les meilleurs 

résultats et fait partie des mesures qui donne globalement la meilleure corrélation avec le 

score visuel. Un autre volet de la même étude évalue l'utilité de mesures graphique, 

comme par exemple l'histogramme des différences entre l'image originale et l'image 

comprimée. De toute évidence, plus l'histogramme est pointu et centré sur l'origine, moins 

la distorsion introduite par la compression est importante. 

Les mesures calculées ou les mesures graphiques donnent une première indication de la 

qualité d'image, mais n'indiquent rien sur la nature des artefacts rencontrés, ni sur 

l'adéquation de l'image pour un usage donné, et dans cette étude ne permettent pas de 

comparer les algorithmes entre eux. 

Dans un contexte d'images médicales, [ECKS-95] a évalué l'effet de méthodes de 

compression (JPEG, Full Frame DCT, Wavelet) sur la détection d'objets de faibles 

contrastes ajoutés synthétiquement sur des images médicales. Les valeurs données par 

deux critères objectifs, la MSE et la NNND 1 (mesure reflétant les artefacts de blocs, 

introduite par [HO-93]) avec les résultats des expériences de détection sont comparés. 

Cette comparaison montre que l'utilisation exclusive des mesures objectives conduirait à 

des conclusions erronées, car au delà d'un certain taux de compression les trois 

méthodes de compression testées donnent toutes des résultats médiocres pour la tâche 

de détection, alors que les mesures objectives indiquent que certains algorithmes 

surpassent les autres. 

1.4. Appréciation visuelle subjective de la qualité d’image 

Une manière simple d'évaluer la qualité subjective d'images comprimées est de demander 

à des observateurs leur appréciation de la qualité d'image. Il peut s'agir d'une appréciation 

de la qualité cosmétique, ou dans le domaine médical d'une appréciation de "l'utilité 

diagnostique" de l'image. 

1 NNND: Normalized Nearest Neighbor Difference 

- 139 -



Dans le cadre de l'évaluation diagnostique d'images radiologiques comprimées par VQ 2 , 

[COSM-93a] a demandé à des radiologues de donner leur appréciation subjective sur une 

échelle de 1 à 5: excellente, bonne (utilisable pour le diagnostic), passable, mauvaise 

(difficile à utiliser), très mauvaise (inutilisable). Les scores de qualité par rapport au débit 

sont affichées pour un ensemble d'images comprimées. Un exemple de ces courbes est 

donné à la figure II-1.11. L'auteur a développé un modèle permettant de prédire la qualité 

visuelle ainsi que des mesures de fidélité diagnostique à partir du SNR. Mais beaucoup de 

travail reste à faire avant que ce type de modèles ne soient validés pour suffisamment de 

modalités d'imagerie médicale et de méthodes de compression. 

Figure II-1.1: Exemple de courbe montrant la qualité subjective en fonction du débit 

des images comprimées. 

D’après [COSM-93a]. 

Nous avons connaissance (mais n’avons pas trouvé de publication) d’une méthode basée 

sur la visibilité de la compression. En faisant alterner sur un écran l'image originale et 

l'image comprimée, on demande aux observateurs d'identifier si il y a une différence 

perceptible entre les deux images. On détermine ainsi des seuils de visibilité de la 

compression. La notion de “visibilité de la compression présente un certain intérêt. Il nous 

parait possible de définir une gradation dans l’effet visuel de la compression: perte 

d’information au sens technique mais sans effet visible, perte d’information visible mais 

sans effet diagnostic, et enfin perte d’information diagnostique. 

D'une manière générale, le SNR donne une première indication utile sur la performance 

d'une méthode de compression. Il n'indique pas la nature des artefacts introduits. Il est 

difficile de prédire la qualité subjective à partir du SNR. La qualité subjective elle-même 

n’est pas simple à appréhender et à mesurer de manière reproductible car elle dépend du 

contexte, de l’observateur, de la tâche à effectuer... La validation et l'évaluation des 

méthodes de compression serait grandement simplifiée si une mesure objectives pouvait 

rendre fidèlement compte de la qualité visuelle ou de l'utilité d'une image comprimée pour 

une tâche donnée. Malheureusement et malgré des études complexes sur le sujet, une 

telle mesure n'existe pas. 

2 VQ: Vector Quantization 

- 140 -



1.5. Indices diagnostics de la performance du couple observateur/test 

diagnostic 

1.5.1. Notion de "gold standard" 

Un grand nombre d'études de compression sont basées sur l'existence d'un test 

diagnostic qui indique le diagnostic formel de chaque patient de l'expérimentation. Par 

exemple, si on veut évaluer l'effet de la compression sur le diagnostic de fractures du 

poignet à partir de clichés radiologiques, on utilise une scintigraphie osseuse comme 

méthode de contrôle posant le diagnostic “vrai”. La scintigraphie est dans ce cas le test 

diagnostic de référence, ou le "gold standard". 

1.5.2. Indices diagnostics: sensibilité, spécificité, PVP, PVN 

Dans le cadre d'une décision médicale binaire (patient pouvant être soit normal soit 

anormal), quatre situations peuvent se produire, selon que l'observateur prenne l'une 

ou l'autre décision par rapport à la réalité établie par le gold standard. Ces situations 

sont résumées dans la table II-1.1. 

Patients 

Effectivement 

anormal 

Effectivement 

normal 

Réponse de anormal VP FP 

l'observateur normal FN VN 

Table II-1. 1: Test diagnostic 

- VP 3 : Patients effectivement anormaux recevant réponse 'anormal' de l'observateur: nombre de Vrai 

Positifs 

- FN 4 : Patients effectivement anormaux recevant réponse 'normal' de l'observateur: nombre de faux 

négatifs 

- FP 5 : Patients effectivement normaux recevant une réponse 'anormal': nombre de faux positifs 

- VN 6 : Patients effectivement normaux recevant une réponse 'normal': nombre de vrais négatifs 

Quatre indices diagnostics peuvent être déduits des résultats du test: 

La sensibilité (Se), Se = 

La spécificité (Sp), Sp = 

La valeur prédictive positive (PVP 7 ), PVP = 

La valeur prédictive négative (PVN 8 ), PVN = 

Toutes ces valeurs sont comprises entre 0 et 1. 

VP 

VP + FN 

VN 

VN + FP 

VP 

VP + FP 

VN 

VN + TN 

3 TP: True Positive 

4 FN: False Negative 

5 FP: False Positive 

6 TN: True Negative 

7 PVP: Predictive Value Positive 

8 PVN: Predictive Value Negative 

- 141 -



Dans un test diagnostic, il n'est pas suffisant de compter le pourcentage de réponses 

correctes pour deux raisons: 

- En cas de prévalence très faible de la pathologie, par exemple pour une pathologie 

atteignant 5% de la population, une réponse systématiquement négative donnerait un test 

juste à 95%. Les valeurs de Se, Sp, PVP et PVN sont liées à la prévalence selon le 

théorème de Bayes, et leur utilisation résout ce problème. 

- Un pourcentage de réponses correctes ne donne aucune indication des taux de faux 

positifs et de faux négatifs, qui ont eux aussi une implication clinique importante. 

Pour valider un test clinique, il est nécessaire d'utiliser à la fois un indice qui rende compte 

de la capacité du couple observateur/test à détecter correctement les cas effectivement 

anormaux, et un indice qui rende compte de la capacité du couple observateur/test à ne 

pas considérer comme anormaux des cas qui sont normaux. Il est classique d'utiliser à cet 

effet la sensibilité et la spécificité (ou la PVP). 

1.6. Fidélité diagnostique par la méthodologie ROC 

1.6.1. Historique 

La méthode ROC est très largement employée pour valider des algorithmes de 

compression sur des images médicales. Elle bénéficie d'un consensus général, et elle est 

considérée comme la méthode de référence dans la communauté radiologique. Elle est 

beaucoup moins connue de la communauté cardiologique, sans doute parce que peu de 

travaux n'ont encore porté sur la compression d'images d'angiographies cardiaques, et 

parce que la méthode ROC n'y est pas applicable de façon aussi évidente, comme nous 

le verrons plus loin. 

La méthode ROC a été développée initialement dans le cadre de la théorie de détection 

des signaux. Ses premières applications ont été dans le domaine des radars. Le but est 

de pouvoir régler le radar avec le meilleur compromis entre sa sensibilité et sa spécificité. 

La sensibilité correspond au fait que les objets présents dans le ciel soient bien détectés 

lorsqu'ils sont effectivement présents. La spécificité correspond au fait que des objets ne 

soient pas détectés s'ils sont effectivement absents. Il est clair qu'en réglant une 

sensibilité trop forte, on risque de confondre du bruit avec des objets réels, et qu'en 

réglant une spécificité trop forte, on risque de manquer des objets effectivement présents. 

La méthode ROC a été employée avec succès dans les années soixante en psychologie 

et psychophysique. Lusted a mis en avant ses avantages dans l'étude de la décision 

médicale [LUST-76]. Swets et Metz ont publiés plusieurs articles de base pour expliciter la 

théorie et guider les expérimentateurs dans l'utilisation de la méthode ROC pour les 

applications médicales [SWET-78], [METZ-86], [METZ-89]. 

- 142 -



1.6.2. Principe 

• Notion de seuil de décision 

La façon de discriminer le "normal" de ‘l’anormal" n'est pas stricte et absolue dans le 

domaine médical. Différents médecins peuvent placer différemment la limite entre le 

normal et l'anormal. En pratique, le médecin travaille inconsciemment avec un modèle de 

densité de probabilité des cas normaux et anormaux suivant des courbes gaussiennes, 

selon la figure II-1.2. Selon son expérience, le médecin place un seuil de décision 

correspondant à sa limite entre le normal et l'anormal. Les valeurs de Se et Sp dépendent 

de deux phénomènes: la position du seuil de décision que se fixe le médecin, et la 

capacité inhérente du test de séparer les populations normales et anormales (selon que 

les courbes de gauss de la figure II-1.2 se chevauvent ou sont distinctes). 

distribution des cas 

normaux (négatifs) 

distribution des cas 

anormaux (positifs) 

FP 

VP 

Figure II-1.2: Modèle de décision médicale 

• Génération d'une courbe ROC 

Une courbe ROC affiche des couples (Se, 1-Sp). Pour obtenir plusieurs de ces couples, 

on fait varier (artificiellement) le seuil de décision. L'approche la plus courante en 

radiologie est de poser une question faisant appel au degré de confiance que 

l'observateur a de voir ou non la pathologie cherchée dans les clichés: pathologie 

présente de façon certaine (1), probable (2), cas litigieux (3), pathologie absente de façon 

probable (4), certaine (5). Cela conduit à une réponse sur 5 niveaux. A partir de cette 

réponse, on construit 4 couples (Se, 1-Sp), en simulant des seuils de décisions qu'aurait 

pu avoir l'observateur si la réponse avait été strictement binaire. Par exemple, lorsqu'un 

observateur répond (3), on peut considérer que toutes ses réponses (1), (2), et (3) dans le 

cadre d'une réponse binaire auraient été positives, et toutes ses réponses (4) et (5) 

auraient été négatives. En additionnant les réponses (1), (2), et (3), on trouve une 

sensibilité. On peut déduite la spécificité du cumul des réponses (4) et (5). On en déduit 

un point (Se, 1-Sp) correspondant au seuil de décision sous-jacent au niveau de réponse 

(3). Les quatre couples ainsi définis, additionnés aux couples (0,0) et (1,1) forment les 

point de la courbe ROC. Il existe plusieurs manière de faire passer une courbe par ces 6 

points. La plus couramment employée repose sur des statistiques paramétriques [METZ- 

89]. Un exemple de courbe ROC est donné à la figure II-1-3. 

- 143 -



Figure II-1.3: Exemple de courbe ROC. D’après [MACM-91]. 

Lorsque la courbe ROC est proche du coin supérieur gauche, le test diagnostic a une 

bonne capacité à distinguer les cas normaux et anormaux. On peut établir une courbe 

ROC à partir d'un ensemble d'images originales, et une deuxième courbe à partir des 

images comprimées. Si la compression diminue la performance diagnostique du test, la 

deuxième courbe sera en dessous de la première. Une méthode courante pour comparer 

deux courbes ROC est de tester la différence entre les valeurs des aires sous la courbe 

[HANL-82]. 

• Contraintes de la méthode ROC 

- "gold standard" 

La méthode ROC, ou toute méthode utilisant l'un des quatre indice diagnostic présenté 

plus haut, implique un gold standard fournissant un diagnostic de référence. Le gold 

standard est censé être un test diagnostic plus sûr que le système diagnostic en cours 

d'évaluation. Cette approche implique l'existence d'un gold standard, ce qui n'est pas 

toujours évident. Dans le cadre de l'angiographie cardiaque par exemple, l'examen n'est 

effectué qu'après une série de tests diagnostics (ECG de repos, ECG d'effort, 

scintigraphie...). Lorsque ces examens n'ont pas permis de poser un diagnostic ou de 

trouver une thérapeutique appropriée, une angiographie cardiaque est réalisée. 

L'angiographie cardiaque serait donc plutôt un gold standard en elle-même. Il en va de 

même pour de nombreux examens radiologiques. Pour résoudre ce problème, une 

approche couramment employée est de faire appel à un groupe d'experts auquel on 

demande d'établir un diagnostic sur les images étudiées. Soit on leur demande de porter 

leur jugement séparément, et on ne garde que les images pour lesquelles tous les experts 

portent le même diagnostic. Soit on leur demande d'analyser les images tous ensemble et 

de se mettre d'accord. 

Il est également possible de considérer que le gold standard est constitué par la réponse 

de chaque observateur sur les images originales. Dans ce cas, on de dispose pas d'une 

référence diagnostique extérieure supposée plus fiable. On peut alors uniquement 

comparer la performance diagnostique sur les originaux et les comprimés, sans connaître 

son lien avec le diagnostic vrai. On peut évaluer une différence entre les diagnostics sur 

les originaux et les comprimés, on ne peut pas juger si une éventuelle différence 

correspond à une amélioration ou une dégradation de la performance diagnostique. 

- tâche binaire 

- 144 -



Les outils d'analyse ROC sont essentiellement appropriés pour des tâches diagnostiques 

binaires (normal/anormal). La méthode ROC traditionnelle n'est pas applicable dans le 

cas d'un diagnostic impliquant de multiples anormalités sur une même image. [CHAK-90] 

a développé une méthode permettant d'analyser un diagnostic comprenant plusieurs 

anormalités par image. Cette méthode n'a pas fait l'objet de beaucoup d'applications. 

- tâche non courante 

Un inconvénient majeur de la méthode ROC est qu'elle ne repose pas sur une tâche 

diagnostique courante, principalement à cause du système de score basé sur un degré de 

confiance qu'une anormalité est présente ou non. Il est nécessaire d'éduquer les 

observateurs à répondre à une telle question. 

1.6.3. Etudes de compression d'images radiologiques à base de 

méthode ROC 

De nombreux travaux basés sur la méthode ROC ont montré une bonne fidélité 

diagnostique pour des modalités radiologiques telles que le scanner, la résonance 

magnétique, la radiographie numérisée. Ils montrent que des taux allant de 10:1 à 28:1 

avec des méthodes de compression par transformation n'introduisent pas de dégradation 

de la fidélité diagnostique [SAYR-92], [MACM-91], [BRAM-89], [ISHI-90], [WILH-91]. 

1.7. Fidélité diagnostique par d'autres méthodes 

Une série d'études très pertinente sur l'évaluation de la fidélité diagnostique d'images 

comprimées a été réalisée par Cosman et al. avec une compression VQ 9 [COSM-93a], 

[COSM-93b], [COSM-94]. La tâche diagnostique de l'une de ces études consiste à 

détecter des nodules sur des clichés pulmonaires de scanner. Cette tâche est non binaire 

car un cliché peut présenter plus d'un nodule. Trois observateurs ont effectué leur 

diagnostic dans des conditions proches de la routine, interprétant chacune des 30 images 

dans sa version originale et comprimée selon 6 taux. Le gold standard est obtenu par 

consensus entre les 3 observateurs sur les images originales. L'analyse statistique 

consiste a évaluer des courbes Se et PVP en fonction du débit. Les courbes sont 

obtenues par ajustement quadratique de courbes splines. Des intervalles de confiance 

basés sur des méthodes non-paramétriques “bootstrap” ont été évalués. Un exemple de 

résultat d’évaluation selon cette approche est donné dans la figure II-1.4. 

Les raisons qui ont poussé l'auteur a ne pas utiliser la méthode ROC sont les suivantes: 

• respecter la tâche diagnostique courante 

• utiliser un diagnostic non binaire (raison de l'utilisation de la PVP au lieu de la Sp car il 

n'est pas possible de savoir combien de nodules sont effectivement absents, autrement 

dit la notion de TN n'est pas applicable dans le cas d'une tâche non binaire) 

• s'affranchir des hypothèses de données gaussiennes sous-jacentes aux analyses 

ROC. 

9 VQ: Vector Quantization, voir chapitre I-2 

- 145 -



Figure II-1.4: Exemple de courbe de sensibilité en fonction du débit. Tâche 

diagnostic: détection de nodules sur des scanners pulmonaires, méthode de 

compression: VQ. 

D’après [COSM-93a] 

2. Protocole expérimental de nos évaluations diagnostiques 

Dans le paragraphe précédant, nous avons vu les différentes méthodes rencontrées dans 

les travaux sur l'évaluation d'images comprimées. Notre protocole d’évaluation 

diagnostique d’angiographies cardiaques comprimées repose sur des bases différentes. 

Nous allons voir en quoi consiste les tâches diagnostiques courantes en angiographie, et 

comment nous avons construit un protocole expérimental ainsi que des analyses 

statistiques qui leur correspondent le mieux possible. 

2.1. Choix du type d’examen 

Divers procédures de divers types peuvent être pratiquées avec un système 

d'angiographie cardiaque, au cours desquelles un ensemble de séquences d'images sont 

acquises. On distingue parmi ces procédures: les examens diagnostics, les interventions 

(angioplastie, pose de stent), les examens pédiatriques, les cathétérismes droits etc... Les 

aspects techniques et médicaux des examens de cathétérismes cardiaques au cours 

desquels sont réalisés les angiographies sont décrits dans [BERE-92] et dans des 

ouvrages spécialisés (par exemple [KERN-91]). 

Nous avons limité nos études à des procédures diagnostiques d'adultes. Il s'agit de 

l'examen le plus pratiqué et il comporte un ensemble complet de séquences permettant 

de visualiser le ventricule gauche (ventriculographie), les artères coronaires droite et 

gauche (coronarographie). D'une manière très simplifiée, on recherche principalement des 

défauts de contractilité du ventricule gauche, et des rétrécissements ou des occlusions 

des coronaires. Les examens interventionnels sont plus focalisés sur une lésion et 

présente un éventail de séquences moins complet et moins semblables d'un cas à l'autre. 

Nous n'avons retenus que des cas diagnostics complets. Ils comprenaient donc une ou 

deux incidences (angle de vue) du ventricule gauche, trois à cinq incidences permettant 

de visualiser l'artère coronaire droite, et trois à cinq séquences pour l'artère coronaire 

gauche. 

- 146 -



Nous n'avons pas pratiqué de sélection particulière des cas inclus dans l'étude. Les seuls 

critères d'exclusion étaient le caractère non complet de l'ensemble des séquences dans 

l'examen. Nous n'avons pas cherché à constituer un échantillon particulier de patient 

quant à l'âge, les antécédents, les indications, ou les pathologies. Nous avons simplement 

collecté au hasard les films digitaux dans les institutions de Lille et de Houston avec 

lesquelles nous avons travaillé. 

2.2. Tâche diagnostique 

2.2.1. Tâche d’interprétation visuelle uniquement 

L'interprétation visuelle d'une angiographie cardiaque comporte deux volets: l'analyse de 

la contractilité du ventricule gauche, et l'analyse d'anormalités sur les artères coronaires. 

Nous nous sommes limités dans nos études à cette interprétation visuelle. Cette tâche 

comporte une détection, une localisation et une classification. Nous n'avons pas inclu de 

tâche relative à la décision thérapeutique sur le patient. Après une angiographie, il peut 

être orienté par exemple vers un traitement médicamenteux, une intervention, un pontage. 

Ce type de décision n’a pas été intégrée dans notre étude car elle est influencée par 

l'ensemble du dossier clinique du patient. Notre étude ne porte que sur la partie 

angiographique de ce dossier. 

Une description incomplète et simplifiée de l'interprétation d'un examen va être donnée 

dans le paragraphe suivant, puis nous aborderons l'influence des tâches diagnostiques 

particulières au domaine de l’angiographie cardiaque sur notre méthodologie d'évaluation. 

2.2.2. Ventriculographie 

Le ventricule gauche est la pompe principale du système sanguin, éjectant le sang dans 

les artères du corps. Le muscle cardiaque (le myocarde) est irrigué par les artères 

coronaires. La figure II-1.5 montre un schéma du coeur et de ses artères. En cas 

d'irrigation insuffisante d'un segment de ventricule par une artère malade, le muscle 

souffre, produisant une douleur ou un infarctus du myocarde. Si le défaut d'irrigation 

persiste plus de 6 heures, le muscle du segment ventriculaire correspondant meure. On 

parle de nécrose. 

- 147 -



Figure II-1.5: Schéma du coeur et des artères coronaires. 

Lors d'une ventriculographie, un produit de contraste opaque aux rayons X est injecté 

dans le ventricule gauche pendant qu'une séquence d'image est acquise. La séquence 

permet de voir la pompe ventriculaire en action. La figure II-1.6 montre deux images du 

ventricules gauche correspondant à la phase de remplissage (diastole) et à la phase 

d’éjection (systole). Si un segment ventriculaire est atteint, il ne se contracte pas 

normalement, réduisant le quantité de sang éjectée à chaque battement de cœur. 

L'interprétation visuelle d'une ventriculographie consiste à vérifier si les segments du 

ventricule se contractent normalement. 

(a) 

Figure II-1.6: Image angiographique du ventricule gauche, projection OAD (oblique 

antérieur droit). (a) Fin de diastole, (b) fin de systole. 

La division du ventricule en plusieurs segment correspond à certaines nomenclatures 

médicales (segment antérieur, inférieur, latéral, apical, septal). La classification des 

anormalités suit aussi une terminologie établie. Le segment peut être normal, 

- 148 - 

(b)



hypokinétique (contraction faible), akinétique (pas de contraction), hyperkinétique 

(contraction d'amplitude plus importante que la normale). La segmentation du ventricule et 

les anormalités sont illustrées dans la figure II-1.7. 

Figure II-1.7: Segmentation du ventricule gauche et illustration de quelques 

anormalités. D’après [KERN-91]. 

2.2.3. Coronarographie 

La coronarographie consiste à injecter dans l'artère coronaire droite ou gauche un produit 

de contraste opaque aux rayons X pendant que les images sont acquises. On obtient une 

séquence qui montre le remplissage des artères par le produit de contraste. 

L'interprétation visuelle de la coronarographie consiste à vérifier que chaque segment 

d'artère coronaire est bien ouvert et qu’il se remplit normalement. En cas d'obstruction par 

une plaque d'athérome, la sténose (ou rétrécissement) altère la progression du sang. 

Il existe plusieurs nomenclatures des artères coronaires. Nous avons choisi un système 

international recommandé par L'American Heart Association (AHA). Ce système est utilisé 

en routine à Lille, et il est bien connu des cardiologues de Houston. La nomenclature AHA 

est illustrée par le schéma d’artères coronaires de la figure II-1.8. 

- 149 -



N o abbr. F nom Français abbr. A nom Anglais. 

1 D1 Droite proximale RCAp Right coronary artery proximal 

2 D2 Droite moyenne RCAm Right coronary artery mid 

3 D3 Droite distale RCAd Right coronary artery distal 

4 RV&IVP Rétro ventriculaire & interventriculaire RCApda 

postérieure 

5 TC Tronc commun LMCA Left Main Coronary Artery 

6 IVAp Inter ventriculaire antérieure prox. LADp Left anterior descending prox. 

7 IVAm Inter ventriculaire antérieure moyenne. LADm Left anterior descending mid.. 

8 IVAd Inter ventriculaire antérieure distale. LADd Left anterior descending distal 

9 Diag1 Diagonale 1 Diag1 Diagonal 1 

10 Diag2 Diagonale 2 Diag2 Diagonal 2 

11 CXp Circomflexe prox. LCXp Left circumflex prox. 

12 Marg1 Marginale 1 OM1 Obtuse marginal 1 

13 CXd Circomflexe distale LCXd Left circumflex distal 



16 PT IVA Pontage IVA graft LAD 

17 PT Diag1 Pontage diagonale 1 graft D1 

18 PT Marg Pontale marginale graft OM 

19 PT D Pontage droite graft RCA 

Figure II-1.8: Segmentation des artères coronaires selon la nomenclature du 

CASS 10 . 

L’interprétation visuelle de la coronarographie consiste à passer en revue les segments de 

coronaires, à évaluer leur degré d’anormalité . Des éventuelles sténoses peuvent avoir un 

impact sur la qualité de l’irrigation du muscle cardiaque. Un score fréquemment utilisé 

pour qualifier le segment d’artère est le pourcentage de sténose. Il indique de combien de 

pour cent l'artère est rétrécie par rapport aux segments sains adjacents. Cette valeur peut 

être quantifiée par un logiciel de mesure (voir chapitre II-6), mais au préalable les 

cardiologues l’estiment à l'œil nu. En pratique, l’interprétation des coronarographies est 

principalement basée sur une estimation visuelle. La figure II-1.9 montre un exemple de 

coronarographie de l’artère droite et de l’artère gauche en illustrant la segmentation des 

vaisseaux. 

10 CASS: Coranary Artery Surgery Study [CASS-81] 

- 150 -



D1 

TC 

IVAp 

IVAm 

CXp 

IVAd 

D2 

CXd 

OM1 

D3 

D3 

(a) 

Figure II-1.9: Exemple de coronarographies. (a) Artère coronaire droite présentant 

une lésion sévère sur le segment D3. (b) Artère coronaire gauche normale. 

Nous avons choisi de ne pas utiliser le pourcentage de sténose dans notre travail 

d’évaluation. La première raison est qu'il y a une ambiguité entre le pourcentage de 

réduction en diamètre et en surface. Les logiciels donnent l'une ou l'autre valeur, mais les 

cardiologues ne sont pas toujours conscients de celui qu'ils emploient. Il n'y a pas de 

consensus implicite sur la question. [FLEM-91] a observé dans une expérience sur 

quelques fantômes que les cardiologues n'ayant pas d'expérience de l’analyse 

quantitative avaient tendance à “voir” un pourcentage en surface, tandis que les 

cardiologues expérimentés “voyaient” un pourcentage en diamètre. Il y a un effet 

d'apprentissage dû à la pratique des mesures QCA, ce qui modifie la façon d'évaluer 

visuellement les sténoses. Cette ambiguité aurait pu attirer une imprécision purement due 

aux observateurs dans nos évaluations. La deuxième raison de ne pas utiliser le 

pourcentage de sténose est que l'échelle de 0 à 100% est bien plus fine que ce que 

l'observateur humain ne peut discriminer. En général, les cardiologues utilisent l'échelle 

par palier de 10% en 10% dans leur réponses. [FLEM-91] et [BERT-93] on pu observer 

qu'en fait l'interprétation visuelle du pourcentage de sténose est de distribution multimodale 

(alors que les valeurs mesurées par logiciels sont de distribution gaussienne). 

Dans ces deux études, les observateurs ont tendance a employer uniquement des valeurs 

autour de 0, 50 et 100% pour [FLEM-91], et de 30 et 70% pour [BERT-93] (qui a la 

particularité de porter sur des cathétérismes interventionnels). 

A la place du taux de sténose en pourcentage, nous avons utilisé un score basé sur une 

échelle ordinale de 0 à 5: 

• 0 (normal), 

• 1 (irrégularités), 

• 2 (



de forme elliptoïdale ou irrégulière, ce qui nécessite de la voir sous plusieurs angles avant 

de pouvoir se déterminer. 

2.3. Protocole expérimental 

Nos expériences d'évaluation ont pour but de déterminer si la compression modifie 

significativement l'interprétation visuelle des angiographies cardiaques. Nous nous 

sommes fixé comme contrainte de respecter le plus possible la façon normale de 

travailler. Ces principes ont été appliqués dans nos deux évaluations diagnostiques, à Lille 

et à Houston. 

En particulier, l’expérimentation devait être basée sur: 

• des tâches diagnostiques usuelles 

• des conditions matérielles usuelles. 

En conséquence, nous avons mis au point un protocole expérimental basé sur la 

visualisation d’examens complets (et non pas de séquences ou d’images isolées). 

L’interprétation a été consignée sur un questionnaire diagnostic (annexe A). 

Le système de visualisation employé pour nos expérience était un système DCI de 

Philips. A Lille comme à Houston, un DCI dédié aux recherches cliniques était disponible. 

La figure II-1.10 montre un console avec ses écrans et son interface utilisateur. 

Figure II-1.10: Console de visualisation utilisée pour les évaluations diagnostiques. 

Le dispositif est strictement identique aux systèmes cliniques. La roue permet de 

faire défiler les séquences. 

Les tâches diagnostiques sur lesquelles nous devons tester l'influence de la compression 

diffèrent en plusieurs points de celles rencontrées dans les études de compression en 

radiologie: 

• Le diagnostic d'un examen d’angiographie se fait sur un ensemble de séquences, et 

non sur une seule image comme dans les évaluation de radiologie. 

• Les tâches diagnostiques des études radiologiques sont des tâches de détection 

uniquement (présence d'une fracture, de nodules, cas anormal ou non). Nous avons à 

faire à une tâche qui combine une localisation, une détection et une classification. Nous 

n'avons pas trouvé dans les expériences publiées de protocole expérimental et de 

méthode statistique directement applicable à notre cas. 

- 152 -



• Le diagnostic est constitué non pas d’une réponse de type binaire, mais d’une réponse 

catégorielle par segment de ventricule, et d’une réponse ordinale par segment de 

coronaire. 

Ces particularités rendent difficile l’emploi de méthodes basée sur les indices 

diagnostiques de type sensibilité et spécificité. 

Nos études ont été basées sur l’estimation de la concordance intra- et inter-observateurs 

entre les interprétations visuelles de ventriculographies et coronarographie avec ou sans 


3. Principaux outils statistiques utilisés 

3.1. Méthodologie basée sur la concordance 

3.1.1. Types de concordances évaluées 

Nos protocoles expérimentaux et nos analyses statistiques sont basés sur l'évaluation de 

la concordance (ou la reproductibilité, ou son contraire la variabilité) entre les diagnostics 

effectués par les observateurs avec ou sans compression. Les différentes concordances 

qui peuvent être estimées sont illustrés par la figure II-1.11. On distinguera: 

• les concordances inter-compression, 

• les concordances inter-observateurs, 

• les concordances intra-observateurs, qui seront aussi appelés intra-compression 

INTER 

OBSERVATEURS 

{ 

observateur 2 

observateur 1 

INTER 

COMPRESSION 

{ 

originaux 

comprimés 

réplication 1 réplication 2 

{ 

INTRA 

OBSERVATEUR 

Figure II-1.11: Types d'accord possibles 

- 153 -



Les principaux modes de comparaison des concordances ont été les suivants. 

• Concordance inter-observateurs 

La concordance inter-observateurs sur les originaux est comparée à la concordance interobservateurs 

sur les images comprimées. 

• Concordance inter-compression 

La concordance d’un observateur sur les originaux est comparée à la concordance avec 

une lecture sur les originaux et une lecture sur les images comprimées. 

• Concordance intra-observateurs 

L'approche inter-compression expliquée ci-dessus est en même temps une approche 

intra-observateur. 

La concordance intra-observateur avec entre les deux réplications sur les originaux est 

comparée à celle entre les deux réplications sur les images comprimées. 

3.1.2. Reproductibilité des observateurs dans l'interpétation de 

coronarographies 

De nombreux travaux font état d’une reproductibilité très pauvre de l’interprétation visuelle 

des coronarographies diagnostiques à partir de ciné-film. [DERO-77] observe un écart 

type de 18% sur l’estimation du taux de sténose par un observateur, à partir d’une étude 

avec 11 observateurs et 10 artériographies. [DETR-75] indique un degré d’accord interobservateur 

qui varie entre 100% et le pur hasard. [VAS-85] trouve un écart type de 14% 

sur les interprétations par 4 observateurs de 36 lésions vues sur des images statiques. 

D‘autres études font état d’une reproductibilité quelque peu meilleure. [SCOB-84] trouve 

un écart type de 7%. [TRAS-84] observe que 2 observateurs ont un jugement concordant 

dans 86% des cas à partir de 340 segments de coronaires. Dans [SANM-78], 4 

observateurs établissant en commun un consensus tombent d’accord dans 95% des cas 

sur 186 segments de coronaires, même si l’écart type entre 2 lectures est de 14%. 

[BEAU-90] et [FLEM-91] ont montré que l’expérience de l’observateur n’a pas d’influence 

significative sur la variabilité. 

Il est difficile de comparer ces études entre elles car elles sont basées sur des protocoles 

expérimentaux et des analyses statistiques différentes. Bien qu’on n’y trouve pas une 

claire indication de la limite tolérable de désaccord, un consensus semble établi qui 

contre-indique l’emploi de l’interprétation visuelle comme seul critère de mesures pour les 

protocoles de recherche clinique. 

Deux types de recommandations ont été émises pour pallier ce problème dans la 

recherche: l’interprétation par un groupe de lecteur ou le moyennage de plusieurs 

réponses [KUSS-92], et les mesures quantitatives par logiciel ([BEAU-90], [BERT-93]...). 

Il n’en reste pas moins que l’interprétation visuelle est la méthode diagnostique primaire, 

et qu’elle est pratiquée par les cardiologues individuellement dans une majorité 

d’institutions. Les concertations avec plusieurs experts ne concernent en général que les 

cas difficiles. Les mesures quantitatives ne sont effectuées que sur des lésions qui ont été 

identifiées visuellement comme potentiellement significatives. 

Il nous est donc paru incontournable d’étudier l’effet de la compression sur les 

interprétations visuelles, et de limiter le plus possible les sources de variabilités. Nous 

pensons que deux éléments de notre protocole expérimental contribuent à limiter cette 

variabilité: 

• L’utilisation d’un score dont l’échelle et la sémantique reflètent bien l’analyse mentale 

de l’expert. Un écart de 15% sur une même sténose n’a pas forcément d’impact sur la 

décision médicale, mais une classification de la sténose en tant que significative 

- 154 -



(50%) induira un traitement différent. Le score que nous 

avons employé est basé sur échelle suffisamment détaillée pour décrire le segment, et 

correspondant à un nombre de grades suffisamment limité pour que l’observateur 

puisse les distinguer (contrairement à une échelle sur 100%). 

• L’emploi de précautions quant à la localisation des segments de coronaires. Nous 

pensons que la détection d’une lésion sur une image est peu sujette à variation, mais 

qu’en revanche une imprécision importante est liée à la dénomination du segment de 

coronaire concerné. Il est fréquent de décaler de quelques millimètres la limite entre 

un segment proximal et moyen par exemple. Nous avons pris soin que les 

observateurs de nos études aient une approche rigoureuse de la localisation des 

segments de coronaire. C’est le cas des médecins de Lille qui établissent dans leur 

pratique clinique un compte rendu donnant un grade à chaque segment. Dans notre 

deuxième campagne d’évaluation avec Houston, nous avons même fait en sorte que 

la délimitation des segments soit fixe pour chaque angiographie, et employée de la 

même façon avec les images originales et comprimées. 

3.2. Estimation statistique de la concordance 

Nous allons présenter les outils statistiques employés dans nos analyses de données, 

dans la mesure où ils ne sont pas fréquemment rencontrés dans les études médicales ou 

sur la compression. 

3.2.1. Concordance par test de kappa 

Le coefficient de kappa est un mesure de concordance pour données catégorielles. Il se 

rapporte à la différence entre la concordance observée et la concordance aléatoire 

[COHE-60], [FLEI-81]. 

Sa définition est: 

κ = p p 0 

− 

c 

, où p 0 est le taux de concordance observé 11 , et p c est la concordance 

1− 

pc 

aléatoire 12 . 

Première interpétation catégorie 1 catégorie 2 total 

\ deuxième 

interpétation 

catégorie 1 p 11 p 12 p 1. 

catégorie 2 p 21 p 22 p 2. 

Total p .1 p .2 100% 

Table II-1.2: Exemple de tableau de contingence pour comparer deux interprétations 

selon une réponse à deux catégories. 

Les taux de concordances observé et aléatoire se déduisent d’un tableau de contingence, 

dont un exemple est donné à la table II-1.2 pour un score à k=2 catégories (par exemple 

normal/anormal): 

p 0 = Erreur!p ii 

11 taux de concordance observé, en anglais: overall proportion agreement 

12 concordance aléatoire, en anglais: agreement from chance alone 

- 155 -



p e = Erreur!p i. p .i 

[FLEIS-81] donne des tests pour si une valeur de κ est nulle, et pour comparer plusieurs 

valeurs de κ. Ces tests ont été employés pour les réponses d’interprétation visuelles des 

ventriculogrammes. 

3.2.2. Coefficient de corrélation de concordance de Lin 

• Nuages de points (analyse graphique) 

Avant l’utilisation de tout calcul statistique plus ou moins sophistiqué, nous avons cherché 

à visualiser les données de façon simple et informative. 

Si l’observateur répétait exactement la même réponse lors de deux interprétations 

différentes sur le même patient, alors toutes les paires de réponses seraient égales. En 

affichant les réponse de la première interprétation sur un axe et les de la deuxième 

réponse sur l’autre axe, on obtiendrait une série points passant tous sur la droite 

d’identité. Plus les résultats de premières et deuxièmes réponses sont différents, et plus le 

nuage de points est dispersé autour de la droite d’identité. Un exemple de diagramme en 

nuage de point d’après les données de l’évaluation QCA est donné à la figure II-1.12. 

5.5 

5 

4.5 

4 

3.5 

3 

2.5 

2 

1.5 

1 

Dref - Originals 

0.5 

1 2 3 4 5 

Figure II-1.12: Exemple de graphe en nuage de points, avec les données de 

l’évaluation QCA. 

• Statistique associée au graphique en nuage de points 

Deux méthodes sont très fréquemment employées pour quantifier le degré d’accord entre 

deux séries de réponses: le test de Student pour données appariées, et le coefficient de 

corrélation de Pearson. Ces deux approches apportent une information différente de celle 

que nous recherchons. 

Le test de Student pour données appariées est un test d’hypothèse sur l’égalité des 

moyennes de deux séries de mesures effectuées sur un même échantillon. En général, si 

la concordance des mesures est bonnes, les moyennes sont égales, mais cela n’est pas 

toujours le cas. La figure II-1.13 (a) montre des exemples d’interprétations erronées 

auxquelles ce test peut conduire, en concluant à des moyennes égales. 

Le coefficient de corrélation de Pearson quantifie le degré de linéarité qui relie les deux 

séries de mesures. Il se peut que les paires de mesures passent bien par une droite, 

donnant un coefficient proche de 1, mais que cette droite ne soit pas la droite d’identité. 

De tels exemples sont illustés par la figure II-1.13 (b). 

- 156 -



(a) 

(b) 

Figure II-1.13: Exemples de cas où le test de Student (a) et le coefficient de 

corrélation de Pearson (b) sont peu appropriés pour évaluer la concordance. 

• Coefficient de corrélation de concordance de Lin 

Ces constatations ont motivé la recherche d’un paramètre plus approprié au problème de 

la concordance entre deux séries de mesures. [LIN-89] a développé un coefficient de 

corrélation de concordance, qui mesure le degré avec lequel les paires de mesures 

passent par la droite d’identité. 

- 157 -



Le coefficient de corrélation de concordance de Lin est défini par: 

2σ 

12 

ρ c = 

2 2 

2 

σ + σ + ( µ − µ ) 

1 

2 

1 

2 

(II-1.1) 

où σ 1 et σ 2 sont les variances de la première et de la deuxième série de mesures, 

respectivement 

σ 12 est la covariance 

µ 1 et µ 2 sont les espérances mathématiques 

Son estimation à partir des échantillons est donnée par: 

2S12 

r c = 

2 2 

2 

S + S + ( Y − Y ) 

1 

2 

1 

2 

(II-1.2) 

où 

N 

Y, − j = 1/N ∑ 

S j , ² = 1/N 

S 12 = 1/N 

i= 

1 

N 

∑ 

i= 

1 

N 

∑ 

i= 

1 

Y ij 

(Y ij - Y, - j )² , j=1, 2 

(Y i1 - Y, - 1 ) (Y i2 - Y,- 2 ) 

r c est un estimateur sans biais de ρc , avec une hypothèse de distribution gaussienne des 

populations. La distribution de rc est asymptotiquement gaussienne avec pour espérance 

mathématique ρc et pour variance: 

V(r c ) = Erreur! [ (1-ρ²) ρc ² (1-ρ c ²)/ρ² + 4ρ c 3 (1-ρc )u²/ρ - 2ρ c 4 u 4 /ρ² ] 

(II-1.3) 

σσ 1 2 

avec u=(µ1-µ2)/ 

et ρ : coefficient de corrélation de Pearson 

Dans nos évaluations diagnostiques, nous avons utilisé ces définitions du coefficient de 

corrélation de concordance sur les scores de sévérité des lésion coronaires, en calculant 

des estimations de ρ c avec la formule (II-1.2), des estimations d’intervalles de confiance à 

partir de la définition (II-1.3) de la variance. 

Dans l’évaluation QCA, nous avons également utilisé des coefficients de Lin. L’estimation 

du coefficient et de son intervalle de confiance s’est faite à l’aide d’une technique de 

“bootstrap”. 

• Technique du “bootstrap” 

Nous avons observé que la distribution des mesures n’était pas gaussienne et que la taille 

des échantillons est relativement petite (N=37). Aussi avons-nous utilisé la méthode du 

bootstrap pour estimer la valeur du coefficient de Lin ainsi qu’un intervalle de confiance 

sur cette estimation. 

- 158 -



Le bootstrap permet d’estimer un paramètre sans faire d’hypothèse quant à la distribution 

de la population sous-jacente. Le principe est de ré-échantillonner les mesures un nombre 

de fois N b (N b très grand), et de calculer le paramètre N b fois. La moyenne de ces N b 

calculs du paramètre fournit une estimation de celui-ci. Le ré-échantillonnage consiste à 

tirer au hasard N valeurs avec remise parmi les N mesures. Par exemple, si on disposait 

de 5 valeurs 2, 1, 10, 3, 2, un ré-échantillonnage pourrait être 1, 10, 3, 3, 1, ou bien 10, 3, 

1, 2, 1, etc... L’idée sous-jacente est de simuler le fait de disposer de N b échantillons dans 

la population. Nous avons utilisé la médiane des N b valeurs du paramètre comme 

estimation du paramètre (avec N b =1000). [MOON-93] donne plusieurs façon d’estimer un 

intervalle de confiance par la méthode du bootstrap. Nous avons utilisé la valeur limite des 

percentiles 5% et 95% comme bornes de l’intervalle de confiance de l’estimateur Par cette 

approche bootstrap pour l’estimation des paramètres de Lin, aucune hypothèse n’est faite 

sur la distribution des mesures QCA. 

3.2.3. Graphiques des différences en fonction des moyennes 

Une façon de mettre en évidence l’étroitesse de l’accord entre deux mesures est de 

représenter la différence des paires de mesures en fonction de la moyenne de ces paires. 

Cette méthode graphique a été décrite par [ALTM-83] & [BLAN-86]. 

Cette approche très simple et très informative a été utilisée dans l’évaluation QCA (par 

exemple figure II-4-3). 

Nous avons représenté par une droite horizontale la moyenne générale de toutes les 

différences entre les paires de mesures. La droite de moyenne est encadrée de deux 

droites correspondant à un intervalle de tolérance. La notion d’intervalle de tolérance est 

similaire à celle utilisée dans l’industrie pour l’acceptation ou le refus de pièces. C’est une 

notion différente de l’intervalle de confiance. Nous nous sommes basés sur la norme 

AFNOR (NF X06-032) concernant les intervalles statistiques de dispersion. 

Un intervalle statistique de dispersion 13 est un intervalle contenant, avec une probabilité 1- 

α (appelée aussi niveau de confiance), une fraction au moins égale à p des valeurs de 

mesure. Nous avons utilisé des intervalles bilatéraux. Les limites de tolérances L i et L s se 

calculent selon la formule: 

L i = x − - k n,p,1-α σ et L s = x − + k n,p,1-α σ 

Les valeurs de k n,p,1-α sont lues dans des tables. 

Nous avons défini de tels intervalles à partir des données sur les images originales, pour 

définir les limites tolérées des différences entre les deux réplications. Nous avons 

conservé les mêmes limites de tolérance sur les comparaisons impliquant les images 

comprimées, pour voir si la compression induit une dispersion au delà des limites de 

tolérance. 

3.2.4. Analyse de la variance 

L’analyse de la variance 14 (ANOVA) permet de comparer les moyennes de plusieurs 

populations. Certaines ANOVA sont des extensions du test de Student à plus de deux 

populations. L’ANOVA suppose que tous les populations ont la même variance et que les 

échantillons sont indépendants. 

Nous avons utilisé ce type de méthode statistique dans l’évaluation QCA. 

13 Intervalles statistiques de dispersion, en anglais: statistical tolerance interval 

14 Analyse de la variance, en anglais: ANalysis Of Variance (ANOVA) 

- 159 -



• Analyse de la variance pour mesures répétées 15 

L’ANOVA pour mesures répétées doit être utilisée quand la même variable est mesurée 

plusieurs fois sur les mêmes sujets. Dans notre étude de QCA, la mesure est répétée 

avec des traitements différents sur les mêmes images de coronaires. Dans le cas des 

mesures répétés, la condition d’indépendance des échantillons est remplacée par une 

condition de sphéricité. 

Nous avons utilisé le programme 2V du logiciel BMPD. Les facteurs sur lesquels ont porté 

l’analyse étaient le facteur réplication (deux niveaux: réplication1 et réplication2) et le 

facteur compression (quatre niveaux: pas de compression, compression avec taux de 5, 

8, ou 12:1) 

Le logiciel 2V donne une valeur p pour tester si les items suivants sont significatifs: 

- facteur réplication 

- tendance linéaire entre les niveaux du facteur compression 

- tendance quadratique 

- tendance cubique 

- interaction entre la réplication et la tendance linéaire 

- interaction entre la réplication et la tendance quadratique 

- interaction entre la réplication et la tendance cubique 

- interaction entre la réplication et la compression globalement. 

Si la condition de sphéricité n’est pas vérifiée, 2V fournit des coefficients rectificatifs des 

valeurs de p affectées. 

• Test de Friedman 

Nous avons une ANOVA particulière dans l’évaluation QCA: l’ANOVA de Friedman à deux 

critères de classification 16 . Nous avons utilisé le programme 3S du logiciel BMDP. Le test 

de Friedman fait partie des méthodes statistiques non-paramétriques. De ce fait, il n’est 

pas basé sur une hypothèse de distribution normale des population sous-jacentes. Ce test 

est une extension du test des signes pour plus de deux variables appariées. Le test de 

Friedman est basé sur les rangs. A chaque niveau de traitement, les valeurs du paramètre 

mesuré sont ordonnés et la somme des rangs des mesures est calculée. Une valeur de 

type chi-2 est déduite de ces sommes, permettant le test d’identité des différents 

traitements 

15 Analyse de la variance pour mesures répétées, en anglais: repeated measures ANOVA 

16 En anglais: Friedman’s two way ANOVA 

- 160 -

CHAPITRE II-2 

PREMIERE ETUDE D’EVALUATION 

DIAGNOSTIQUE 

- 161 -

Chapitre II-2: Première étude d’évaluation diagnostique 

Préliminaires 

L’application de la compression avec perte dans le domaine médical requiert une évaluation 

sur le contenu diagnostic des images comprimées. Nous avons conduit une première 

campagne d’évaluation basée sur les interprétations diagnostiques d’angiographies 

complètes avec ou sans compression. 

Ces travaux ont fait l’objet d’une rédaction en anglais en vue de leur communication au sein 

de la Société Philips, et en vue d’une publication qui sera soumis dans les prochains mois 

dans une revue cardiologique. 

Cette étude a été présentée au congrès de la Société Européenne de Cardiologie en Août 

1995. 

Lossy Data Compression of Digital Cardiac Angiograms: Clinical 

Evaluation of the Image Quality. 

1. INTRODUCTION 

The assessment of images of the heart or of the coronary arteries for diagnostic purposes or 

to determine the feasibility of therapeutic interventions is usually based on cine-film 

recordings. Even when the catheterization laboratory images were originally digitized, they 

are still not stored in a digital format due to technological and financial constraints: a standard 

cardiac angiogram comprises 1000 to 3000 images, representing 250 to 750 Mega Bytes for 

512x512 pixel images coded in 8 bits. Image data compression is necessary to achieve fully 

digitized archiving of cardiac angiography and to enable images to be transmitted via 

networks. 

Real time lossless data compression has already been available for several years on the 

Philips Digital Cardiac Imaging (DCI) system. It doubles the disk capacity of the angiography 

system. But this additional capacity is still not sufficient to store the daily work load of a 

catheterization laboratory. Lossfree compression is generally associated with reduction 

factors or compression ratios (CR) of 2:1 for this type of image [ROOS-88]. This means that 

two compressed images can be stored on the same disk space as one single non 

compressed image. For full storage of patient image data, we estimated that a compression 

ratio of 8 to 16:1 was necessary. Such CRs are only possible with lossy data compression 

methods, implying that the image is irreversibly changed. One must therefore ensure in 

clinical conditions that the diagnostic quality of cardiac angiograms is not altered after lossy 

data compression . 

We performed a study on 18 patients to evaluate whether cardiac angiograms after lossy 

compression could replace the originals in the working catheterization laboratory 

environment. Two compression algorithms were assessed with a reduction factor of 12:1: the 

- 162 -


standard MPEG technique, and a scheme based on the so called MLOT transform specially 

developed for this study. Two observers reviewed separately the digital films. Each patient 

angiogram was displayed at least three times in the course of the study, in its original, MPEG 

compressed, and MLOT compressed version. The interpretation was performed using the 

standard procedures of the Service d'Hémodynamique in the Hôpital Cardiologique, Lille, 

France. 

2. MATERIALS & METHODS 

2.1. Patient selection 

The full digital cardiac angiograms of 18 patients were acquired from a mono-plane DCI 

system. Each angiogram included a ventriculogram and a coronary angiogram. Only 

diagnostic procedures were studied. Purely interventional procedures were not included. If a 

diagnostic procedure was followed by an intervention, the intervention images were removed. 

Patients with normal coronary arteries, with single, double, or triple vessel disease were 

studied. 

2.2. Image selection 

In Lille, a diagnostic examination follows a standardized format. The left ventriculogram is 

obtained in the 9" Image Intensifier (I I) mode with a Right Anterior Oblique 30° projection 

(RAO-30); sometimes a Left Anterior Oblique 45° (LAO-45) is also performed. The left 

coronary artery is filmed in the 7" I I mode in six projections: RAO-30, RAO-15/Ca15 (Ca 

means caudal), RAO-10/Cr15 (Cr means cranial), RAO-10/Cr40, LAO-55/Cr25, and LAO 90. 

The right coronary is viewed in the 7" I I mode in three projections: LAO-90, LAO-45, RAO- 

45. Sometimes artery segments are magnified in 5" I I mode or filmed in other projections in 

order to further assess a lesion. The film speed is always 12.5 images per second for both 

the LV and coronary imaging. We removed some images of no diagnostic use such as those 

with no contrast medium, resulting in an average number of images per patient of 580, 

ranging from 430 to 740; this is rather low compared to many catheterization laboratories 

where the acquisition speed is higher. Images were exported from a DCI system into a Sun 

platform with the PMSnet TM networking. They were converted from their ACR-NEMA format to 

Unix files and stored on digital tapes. 

2.3. Image processing 

All images from the 18 patient angiograms were compressed and reconstructed with the 

MPEG and MLOT algorithms, at a compression ratio of 12:1 We will later refer to MPEG 12 or 

MLOT 12 compressed images or angiograms. In this paper the word "compressed" refers to an 

image after it has been compressed and reconstructed. Strictly speaking, the compressed 

image is a binary file of small size that cannot be visualized; the reconstructed image is a 

pixel file with the same size as the original and which can be visualized. The words 

coded/coding are have here the same meaning as compressed/compression. 

Block-based transform coding is currently the most widespread lossy compression technique. 

Some standards are now commonly used. The Moving Picture Experts Group (MPEG) has 

proposed a video compression standard for multimedia applications [LEGA-91]. Briefly, the 

- 163 -


redundancy from one frame to the other is reduced by a block-based motion compensation; 

the spatial or intra-frame redundancy is reduced by quantizing the frequency components 

derived from a particular mathematical transform of the image pixels: the block Discrete 

Cosine Transform (DCT). A disadvantage of block-based compression lies in the fact that 

individual blocks become visible at high compression ratios. This is particularly true for 

medical images and cardiac angiograms because of the viewing conditions. The latter tends 

to enhance the contours of the vessels, and in the same time the block boundaries. To 

overcome the so-called "blocking effect" or "block artifact", a dedicated algorithm was 

investigated. It is an intra-frame coding based on the Modified Lapped Orthogonal Transform 

(MLOT) [BREE-94]. In the process of transforming the pixels from spatial gray values into 

frequency coefficients, some information from adjacent blocks is used. This does not 

generate blocking in the reconstructed image. In the development of the MLOT algorithm, the 

quantization of frequency coefficients has been adapted to the viewing conditions of the 

catheterization laboratory, and especially to the edge enhancement applied by default in the 

digital cardiac angiography DCI system. This edge enhancement is a convolution filter. It 

increases the medium and high frequencies of the image. This makes the vessel contours 

and the small vessels more visible, at the cost of increasing the visibility of the image noise 

and ... enhancing some compression artifacts. 

2.4. Observers and viewing sessions 

Non-compressed and compressed angiograms were interpreted by two observers: two 

experienced angiographers and interventionalists, one junior and one senior. The viewing 

sessions took place in the normal clinical environment. A viewing system was built and 

installed there for the study; it has exactly the same operator console and display devices as 

the catheterization laboratory DCIs. Typically, a viewing session took 45 minutes, the time 

needed to review, interpret and report on 9 patient angiograms. Of the 9 sets of patient 

images reviewed in a single session, some were original, some were MPEG 12 and some were 

MLOT 12 ; the observer was not informed which was which. In the course of the study, both 

observers interpreted separately the 18 original angiograms, the 18 MPEG 12 and the 18 

MLOT 12 ones. In addition, 5 original, 5 MPEG 12 , and 5 MLOT 12 angiograms were also 

reviewed a second time to analyse the intra-observer variability. Ideally we should have 

repeated all 18 originals, 18 MPEG 12 and 18 MLOT 12 angiograms but this was impossible for 

time constraints. About 35 000 images were handled for this study. Finally, 69 angiograms 

were interpreted by the two observers, resulting in a total of 138 interpretations. 

Observers were free to review each film at their own pace, to move forward and backward 

and change the speed. But changing the post-processing settings was not allowed, such as 

applying zoom, increasing the default edge enhancement, changing contrast and brightness. 

All these have an influence on the visibility of compression artifacts, especially for MPEG, 

and it would be a non-reproducible factor making the analysis of our data very difficult. 

2.5. Diagnostic task 

In interpreting the angiograms of this study, observers were asked to do the same diagnostic 

task as in the clinical practice at their Cardiology Department. A sheet was derived from the 

information recorded after every catheterization laboratory procedure. This sheet or 

diagnostic questionnaire included the interpretation of the left ventricle and the coronary 

arteries (see appendix). The cardiologists had to locate and grade the abnormalities of the LV 

and the coronary artery segments. The segments were classified using the CASS system 

- 164 -


currently used in the Department. No patient information was provided, the diagnostic 

questionnaires were filled in using the image information only. 

Briefly, the diagnostic tasks performed on the angiograms by cardiologists consists in 

assessing the Left Ventricle (LV) function, and the presence and severity of coronary 

disease. The ventriculogram shows the dynamics of the LV. If an LV segment does not 

contract properly, the ability of the heart to eject blood to the body is reduced. Doctors judge 

the contraction patterns of the LV walls. Absence of contraction is in many cases due to 

coronary disease. The coronary arteriogram shows the coronary arteries lumen. Doctors look 

for narrowing, partial or total occlusions of the main coronary branches. 

3. Statistical analysis 

3.1. Introduction 

Angiography is generally considered as the definitive procedure for coronary disease. The 

only standard available for assessing the diagnostic value of a compressed angiogram is the 

non-compressed angiogram. We compare a new imaging technique with an established one 

to see whether they agree sufficiently for the new to replace the former. Comparing the new 

technique with the "true" diagnostic is not possible. The main objective for the statistical 

analysis of the diagnostic questionnaires was to assess the degree of agreement between 

the compressed and the original angiograms. The protocole of this study is novator in many 

respects: review of digital angiogram on a catheterization laboratory system, not a computer; 

assessment of the diagnostic quality of full cardiac angiograms; use of the ordinary diagnostic 

tasks. We had to design a new approach in order to assess the impact of lossy data 

compression on the cardiologists' diagnostic from cardiac angiograms. An exam consists of 

diagnostic tasks, for the LV and the coronary artery. We have analyzed them separately. 

3.2. Analysis of the LV interpretations 

The LV segments assessed for the diagnostic questionnaire were the anterior, apical, inferior 

and lateral ones. For each segment, the observers had to classify wall motion as: "normal", 

"akinetic", "hypokinetic", "dyskinetic". This type of rating is categorial. An appropriate 

measurement of agreement for this type of data is the kappa introduced by [COHE-60] and 

described by [FLEI-81]. Kappa compares the degree of agreement between two ratings with 

the agreement from chance alone; it sample estimate is denoted here k,^. If there is complete 

agreement k,^=1; if the observed agreement is greater than chance k,^ >0; if it is less than 

chance k,^


3.3. Analysis of the coronary angiogram interpretations 

On each diagnostic questionnaire, the observers graded 15 coronary segments and 4 

possible grafts. The vessel diameter narrowing were graded from 0 (normal) to 5 (occlusion), 

with 3 sub-divisions for occlusion using the TIMI system. A correspondence of the grades and 

percent stenosis is given in table 7, section 3-3-1 

Like for the ventriculograms, we had to estimate the agreements between the interpretations 

of original and compressed films, or between the interpretations of observer 1 and observer 

2. The rating is here ordinal and will be treated like a numerical value. As explained in section 

3-3-1, we had to modify the grades into global scores for the main coronary branches. 

Nevertheless, the principle of the analysis remained unchanged. 

For comparing interpretations, the first step was to plot the data of one set of interpretations 

versus the data of the second set. If the interpretation of each patient were all identical, all 

the points would fall on the line of equality. A simple observation of the data on such a plot is 

very informative. 

The second step is to summarize the agreement gauged by the eye into an appropriate 

statistics. A natural approach seems to be the estimate of the Pearson correlation coefficient 

r but it is misleading here [BLAN-86], [LIN-89]. The Pearson correlation coefficient measures 

the strength of a linear relationship between two sets of grading, not the agreement between 

them. Another widespread method is the paired t-test. It evaluates whether the estimated 

means of the two sets of grading are equal, this may be true even with a very poor 

agreement. 

We chose a concordance correlation coefficient ρ c proposed by Lin [LIN-89]. It evaluates the 

degree to which pairs of grading fall on the line of equality. It is scaled between -1 and +1. +1 

is the perfect agreement, -1 the perfect reversed agreement, and 0 the absence of 

agreement (i.e. the grading are independent). We computed the estimates r c and derived the 

confidence intervals from the estimates of the variance s ² , rc under a gaussian assumption. 

4. RESULTS 

4.1. Image quality judgements 

Observers reviewed original and compressed angiograms. They were aware of this fact and 

had been informed of the purpose of the study. But to their surprise they were never able to 

tell whether a film was compressed or not, they could see nothing in the images that would 

make compression distinguishable, neither for MPEG, nor for MLOT. This is a very important 

qualitative result: in the default viewing conditions of the catheterization laboratory, MPEG or 

MLOT compression at a compression ratio of 12:1 were not detected by the doctors. 

A side item was asked in the diagnostic questionnaire: observers had to give their global 

opinion of the image quality on a three-point scale (good, average, poor). The grade "poor" 

was never used for any of the 138 diagnostic questionnaires, and the grade "good" was the 

most common. On 46 interpretations of the original angiograms, 7 were "average"; on 46 

interpretations of the MPEG 12 angiograms, 12 were "average"; and on the 46 interpretations 

of the MLOT 12 , 8 were "average". The MPEG 12 films seem to be slightly worse than the 

original and MLOT 12 ones, but this differences are not statistically significant (χ² test : 

- 166 -


p>0.10). The observed numbers of "average" on original, MPEG 12 or MLOT 12 are not 

statistically different. 

The opinion of the investigators, who have a technical background, provides an additional 

qualitative result. To their eyes the MPEG 12 films could be recognized because some 

blocking structures were clearly visible in the background of the images. This was probably 

not noted by the doctors as there is no diagnostic information in the background. During 

dynamic viewing it gave the impression of moving square patterns, and a horizontal and 

vertical texture could be seen on still frames. As the actual frequency contents of each block 

is different and as blocks are coded separately, one can see that some blocks are more 

blurred than others. Moreover, a slight haziness can be seen on MPEG 12 images for tiny 

vessels. It is harder to see in large vessels in the default viewing conditions. 

One can also detect that a film is MLOT 12 coded but this requires much closer attention. Only 

a very slight difference in the usual noise pattern or noise texture can be seen. 

If the default viewing conditions are changed, by applying zoom for instance, MPEG 12 images 

look poor: very "grainy" (blocking effect) and blurred, the contours of large vessels are not 

very well defined and would be difficult to draw in a quantization software. Zoomed MLOT 12 

images were of good quality, slightly lacking in definition. 

4.2. Left ventricle interpretations 

4.2.1. Introduction 

The two cardiologists assessed four LV segments (anterior, apical, inferior, lateral). The 

lateral segment is only seen in the LAO-45 projection which was performed in only 4 of the 18 

patient angiograms. Thus data for the lateral segments was not analyzed. The category 

"dyskinetic" was never used by the observer and will not appear in the analysis. 

Classification of abnormalities on medical images is subject to inter and intra-observer 

variability. We focused on assessing whether the possible variability caused by lossy data 

compression in the ventriculogram interpretations was comparable to the observer variability. 

4.2.2. Inter-observer agreement 

We firstly analyzed the inter-observers agreement resulting from the interpretations of the 

original angiograms by the two observers, as shown in table 1. We indicated “Npatient”, the 

number of patients interpreted for each LV segment; “Ndisag”, the number of disagreements; 

the kappa estimate, and “p”, the p-value from the test of independence. 

- 167 -


observer 1: original / observer 2: original 

LV segment Npatient Ndisag k,^ p 

Anterior 18 2 0.73


The kappa estimates are statistically significant (the agreement is beyond chance alone), 

except on the inferior segment when observer 1 interprets the originals and observer 2 the 

MPEG 12 films (p=0.089) . The kappa estimates seem globally smaller when one of the two 

interpretations was done on compressed films than when they were both on originals. For 

each LV segment, we tested whether the estimated kappa values from original and 

compressed interpretations were statistically significant. The results from these tests is given 

hereafter for the following sets of kappas: 

- k,^ from originals by both observers, k,^ from interpretations on originals by observer 1 and 

on MPEG 12 by observer 2, k,^ from interpretations on MPEG 12 by observer 1 and original by 

observer 2; 

the three underlying values of kappa are not statistically different (p>0.25); 

- k,^ from originals by both observers, k,^ from interpretations on originals by observer 1 and 

on MLOT 12 by observer 2, k,^ from interpretations on MLOT 12 by observer 1 and original by 

observer 2; 

the three underlying values of kappa are not statistically different (p>0.25); 

- k,^ from originals by both observers, k,^ from MPEG 12 by both observers, k,^ from MLOT 12 

by both observers; 

the three underlying values of kappa are not statistically different (p>0.25) 

There is no statistically significant difference in the inter-observer agreement from the original 

and the MPEG 12 films, or from the original and the MLOT 12 films, or from the original, 

MPEG 12 , and MLOT 12 films. 

In conclusion, the agreement between the two observers on the LV segments is globally good 

or average, and beyond chance alone. No statistically significant difference in the interobserver 

agreement was found, whether the observers both interpreted original angiograms, 

whether one of the two observers interpreted compressed angiograms (MPEG 12 or MLOT 12 ), 

or whether the two observers interpreted compressed angiograms (MPEG 12 or MLOT 12 ). 

4.2.3. Intra-observer agreement 

To complete the analysis of the LV diagnostic questionnaire, the intra-observer agreement 

could be assessed. Unfortunately the five repeated interpretations realized on the original 

angiogram is not sufficient to evaluate the intra-observer agreement on original angiograms 

(the problem is identical for the intra-observer agreement on the MPEG 12 and the MLOT 12 

angiograms). 

We have estimated the intra-observer agreement between the interpretation on originals and 

the interpretation on compressed angiogram, as shown in table 6. 

- 170 -


Observer 1: original / observer 1: MPEG 12 

LV segment Npatient Ndisag k,^ p 

Anterior 18 2 0.75


Diagnostic of the branch Score Max. grade of % stenosis 

the segments 

NORMAL 0 0 0 

NON SIGNIFICANT LESION 1 1 or 

2 

0-25% 

25-50% 

SIGNIFICANT LESION 2 3 or 

4 

50-75% 

75-99% 

OCCLUSION 3 5 TIMI 2 or 

5 TIMI 1 or 

5 TIMI 0 

slow perfusion of the distal bed 

incomplete opacification of the distal bed 

total occlusion 

Table 7 : Coronary branch scores and segments grades. 

Other scores based on the number of diseased segments or on a ponderation of the 

segments grades were tested but were of lesser diagnostic meaning. By grouping 15 

segments into 3 branches, we reduced the statistical power of the analysis. This is the price 

we paid for experimenting this new protocol and staying as close as possible to the clinical 

practice. We also switched from a scale of 8 grades to a scale of 4 scores. The objective was 

to focus on the major major steps of the diagnostic: first detect a lesion and then classify it as 

significant or not. The therapeutic incidence of this decision is high whereas a more refined 

classification of the lesion in grade 3 or 4 for example has little consequences. The analysis 

reported here is based on the 4-level score we designed. A sharper analysis could also be 

conducted by using the maximum segment grade of each branch instead of the score we 

designed. 

Like for the LV diagnostic questionnaires, we tried to assess whether the potential variability 

introduced by lossy data compression on the interpretation of coronary arteriograms is 

significantly higher than the observers' variability. 

4.3.2. Inter-observer agreement 

The inter-observer agreement on the interpretation of original coronary angiograms is an 

important information. It can be observed visually for each branch on a MLOT: the scores 

given by observer 1 on the x axis, and the scores given by observer 2 on the y axis. Ideally, 

all points should fall on the line of equality. The degree to which pairs of interpretation fall on 

this line is evaluated by the estimate of the Lin concordance correlation coefficient r c . For the 

three coronary branches, the inter-observer agreements on originals and their confidence 

interval are shown in table 8. We also indicate “N Mdisag ”, the number of so-called major 

disagreements (score 0 against score 1 is not a major disagreement), and “N Tdisag ”, the total 

number of disagreements (including score 0 against score 1). 

- 171 -


observer 1: original / observer 2: original 

Coro. branch N patient N Mdisag N Tdisag r c 

RCA 18 3 6 0.87±0.12 

LAD 18 1 3 0.91±0.08 

CX 18 4 7 0.74±0.20 

Table 8: Inter-observer agreement on the interpretation of original coronary arteriograms. 

The agreement between the two observers in their interpretation of original arteriograms is 

good. The agreement of the three coronary branches are not statistically different. 

Table 9 and 10 summarize the inter-observer agreements when one observer interprets the 

original angiograms and the second observer interprets the compressed angiogram. 

observer 1: original / observer 2: MPEG 12 

Coro. Branch N patient N Mdisag N Tdisag r c 

RCA 18 3 6 0.87±0.12 

LAD 18 1 3 0.91±0.08 

CX 18 4 7 0.74±0.20 

observer 1: MPEG 12 / observer 2: original 


RCA 18 3 6 0.85±0.14 

LAD 18 1 3 0.87±0.10 

CX 18 4 7 0.82±0.02 

Table 9: Inter-observer agreement for originals and MPEG 12 

observer 1: original / observer 2: MLOT 12 


RCA 18 3 6 0.93±0.06 

LAD 18 1 3 0.88±0.10 

CX 18 4 7 0.81±0.14 

observer 1: MLOT 12 / observer 2: original 


RCA 18 3 6 0.89±0.10 

LAD 18 1 3 0.85±0.12 

CX 18 4 7 0.86±0.12 

Table 10: Inter-observer agreement for originals and MLOT 12 

These tables show that the total number of major disagreements between the interpretations 

by the two observers range from 3 to 7 out 18 pairs of comparisons. The estimates of the 

concordance correlation coefficients r c are all in the same range, and no statistically 

significant difference can be observed. 

In conclusion, lossy compression did not change statistically the inter-observer agreements 

when one observer interpreted the original and the other interpreted the compressed 

angiograms. 

4.3.3. Intra-observer agreement 

The assessment of intra-observer agreement is a good complement to the preceding 

conclusion. We were not able to measure the intra-observer agreements on the original 

angiograms because the number of repeated interpretation was too small. Table 11 and 12 

show the intra-observer agreement when one observer interpreted the original films and the 

second observer interpreted the compressed films. 

- 172 -


observer 1: original / observer 2: MPEG 12 


RCA 18 0 1 0.98±0.02 

LAD 18 1 2 0.95±0.04 

CX 18 0 1 0.97±0.04 


Coro. branch N patient N Mdisag N tdisag r c 

RCA 18 0 1 0.98±0.12 

LAD 18 2 2 0.94±0.08 

CX 18 1 2 0.94±0.20 

Table 11: Coronary intra-observer agreements for observer 1. 

Observer 1: original / observer 2: MPEG 12 


RCA 18 3 5 0.86±0.12 

LAD 18 1 2 0.93±0.06 

CX 18 4 6 0.65±0.26 


Coro. branch N patient N Mdisag N tdisag r c 

RCA 18 0 2 0.94±0.06 

LAD 18 0 1 0.97±0.04 

CX 18 2 3 0.87±0.12 

Table 12: Coronary intra-observer agreements for observer 2. 

Table 11 indicates that the intra-observer agreements of observer 1 are very high when 

comparing one reading on originals versus one reading on compressed films. The 

concordance correlation coefficients r c for intra-observer agreements are higher than the 

inter-observer ones and have narrower confidence intervals. The intra-observer agreements 

of observer 2 vary with the coronary branch and the compression method. The agreement for 

the LAD is slightly higher than for the RCA and the CX. Furthermore, observer 2 agrees with 

himself less when one reading is on original and the other on MPEG 12 films. For the three 

branches, the intra-observer agreement of observer 2 with MPEG 12 is smaller than is 

agreement with MLOT 12 . This difference is however not significant. Agreements of observer 2 

are smaller than agreements of observer 1. 

As a conclusion, the intra-observer agreements are very high for observer 1. The intraobserver 

agreements of observer 2 are globally smaller, especially when one of his reading is 

made with MPEG 12 films. 

5. CONCLUSION 

This paper examined the diagnostic use of digital ventriculograms and coronary arteriograms 

after lossy image data compression. We assessed the performance of a standard algorithm, 

MPEG, and a dedicated algorithm, MLOT. MPEG has been proposed by the International 

Standardization Organization for multimedia applications and moving pictures. MPEG is 

widely used in the computer world and many software and hardware implementations are 

available. It has a major drawback due to its underlying principle: blocking artifacts are 

introduced by the block decomposition of the image and are made more visible in the 

angiograms, due to an edge enhancement processing. To overcome this problem, a new 

algorithm, MLOT, was developed by Philips Research. It enables higher compression ratios 

and is free of blocking artifacts. 

- 173 -


As there is no reliable measure to predict the visual quality of an image judged by an 

observer, the assessment of the diagnostic quality of compressed angiograms must be 

conducted. An evaluation study was done at the Lille Cardiology Hospital with the digital 

angiograms from 18 patients, and with two expert cardiologists. They interpreted the original 

and the compressed films blindly and separately. Two compression algorithms were applied: 

MPEG and MLOT, both at a compression ratio of 12:1. The study protocol was original 

because it was based on the ordinary clinical practice, which implied the use of complete 

angiograms (hundreds of images per case). A diagnostic questionnaire was used to record 

the observers’ interpretations on the left ventriculogram and the coronary arteriogram. The 

statistical analysis was based on measures of observers’ agreement. 

It is noteworthy that the observers were not able to detect the presence of compression on 

any of the reviewed films. 

The left ventricle agreements were measured with the kappa statistics. Inter-observer 

agreements were good or average, and above chance alone. No statistically significant 

difference were found for the inter-observer and intra-observer agreements with or without 


The coronary agreements were measured with a concordance correlation coefficient 

introduced by Lin [LIN-89]. Inter-observer agreements were good and intra-observer 

agreements were excellent. No statistically significant difference was found for the intraobserver 

agreements with or without compression. One of the two observer has slightly lower 

intra-observer agreements, especially with MPEG. 

This study gives promising results about the application of lossy data compression on cardiac 

angiograms. More studies should confirm these findings with a stronger focus on intraobserver 

agreement than our protocol allowed. Complementary type of work are: 

- apply the same type of protocol (addressing intra-observer agreements) at a different site 

(other acquisition equipment, other observers), 

- assess the influence of viewing parameters such as zoom, edge enhancement, contrast or 

brightness, 

- evaluate the results of quantitative coronary analysis on compressed images. 

- 174 -

CHAPITRE II-3 

DEUXIEME ETUDE D’EVALUATION 

DIAGNOSTIQUE 

- 175 -

Chapitre II-3: Deuxième étude d’évaluation diagnostique 

Préliminaires 

Pour compléter les résultats de la campagne d’évaluation dans un centre européen, nous 

avons travaillé avec un site américain. Nous souhaitions savoir si les premiers résultats se 

confirmeraient avec un autre système d’acquisition, et si la compression était tout aussi bien 

acceptée par les cardiologues outre Atlantique. Quelques nuances culturelles entre pays 

aboutissent à des préférences différentes quant aux paramètres d’acquisitions et de posttraitements 

utilisés. Par exemple aux Etats-Unis, le filtre de renforcement de contour des 

systèmes DCI est légèrement différent car les utilisateurs préfèrent une image un peu moins 

bruitée. 

Nous avons amélioré notre protocole expérimental en deux points: 

- une précaution du superviseur des sessions d’interprétation a permis d’éviter le problème 

de localisation anatomique des segments d’artères coronaires, 

- des interprétations répétées sur tous les originaux ont permis de mesurer les accords interobservateurs 

sur les originaux, qui constituent la référence. 

L’analyse des données de cette seconde campagne d’évaluation a été axée sur les accords 

intra-observateurs uniquement. 

Ces travaux ont fait l’objet d’une rédaction en anglais en vue de leur communication au sein 

de la Société Philips, et car ce document a servi de base pour une publication qui sera 

prochaînement soumise à Circulation [KIRK-97]. 

Cette étude a été présentée comme poster au congrès de l’American Colledge of Cardiology 

en mars 1997. 

Lossy data compression does not alter visual interpretation of 

digital coronary arteriograms 


Digitization of angiography images has become one of the key technologies enabling 

diagnostic and interventional procedures of catheterization laboratories. There is a general 

consensus about the advantages of digital imaging, [NISS-94], but cine-less cardiac 

catheterization departments remain a technological, financial, and legal challenge. In order to 

replace cine-film, a digital system must fulfill its three main functionality: archiving, dynamic 

review, and exchange. Technologies allowing the replacement of cine-film at a reasonable 

cost are emerging, but image data compression is currently a necessary step. Compression 

can reduce the number of bits required to represent a digital image, and therefore reduce the 

storage space, the access time from a medium, or the speed of transmission on a network. 

Lossless compression is completely reversible but only permits compression ratios (CR) of 

2:1 to 3:1, i.e. the coded bit stream of the compressed image occupies 2 to 3 times less 

storage space than the original pixel stream. Such CRs are insufficient for applications like 

dynamic review of angiographic sequences from current CD media, or transmission at a 

reasonable speed over standard computer networks. Lossy compression achieves higher 

CRs and is useful for fully digital cardiac catheterization laboratory departments, but changes 

the digital representation of the image in an irreversible manner. 

- 176 -


The key question addressed in this paper is whether a digital cardiac angiography case after 

lossy compression can be used for the clinical work based on visual interpretation. Though it 

is an open research topic [ESKI-95], [COSM-93b], there is no usable measure to predict the 

visual or diagnostic quality of an image. Therefore, statistical comparisons based on image 

interpretation by cardiologists with and without compression are necessary. We conjectured 

that for a reasonably chosen compression ratio, the objective degradation introduced by lossy 

compression does not alter the diagnostic content of images, and we conducted a 

reproducibility study based on the visual interpretation done by angiographers. 

In designing this study, our goal was to stay as close as possible to the normal clinical 

practice of diagnostic work in the catheterization laboratory. Case review and interpretation 

was done on exactly the same view station as in the routine work. We used complete patient 

angiograms that were reviewed and interpreted individually by observers. This is a unique 

design for a compression assessment study. To our knowledge, few compression studies 

were done on cardiac angiograms [ECKS-95], [RIGO-96]. These studies were based on 

sequences of images isolated from the complete case angiogram, or on static frames. 

Twenty four angiograms containing a left ventriculogram and a coronary arteriogram were 

reviewed by four angiographers. Two compression methods were assessed, the standard 

JPEG technique and an advanced technique called MLOT. For both methods, a compression 

ratio of 12:1 was used. We will refer to JPEG-12 and MLOT-12 for images compressed and 

reconstructed with JPEG at a CR of 12:1, and with MLOT at a CR of 12:1, respectively. The 

digital angiograms were compressed with JPEG and MLOT. Original, JPEG, and MLOT 

digital films were blindly presented to the angiographers. During several viewing sessions 

each observer reviewed and interpreted all angiograms four times with a different image 

treatment: once as Original, once as a Repeat of the original, once as JPEG-12 and once as 

MLOT-12. Statistical comparisons of intra-observer agreements without and with 

compression were derived from the LV-grams and coronary arteriogram interpretations. 

2. Methods 

2.1. Angiography 

The 24 angiograms selected randomly from the normal catheterization work were those of 14 

males and 10 females whose age ranged from 38 to 77 years (mean 57.2 ± 11.4). The BSA 

ranged from 1.52 to 2.37 m 2 (average 2.01 ± 0.2 m 2 ). 

The 24 angiograms were diagnostic procedures only, or combined diagnostic and 

interventional procedures out of which only the diagnostic runs were kept. All the digital films 

included a left ventriculogram and a coronary arteriogram. 

The digital angiograms were copied from two Philips bi-plane DCI systems. The DCI images 

were 512x480 pixels images with a depth of 8 bits/pixel. They were acquired at 30 

frames/sec. 

- 177 -


2.2. Images 

2.2.1. Images selection and transfer 

After the angiographic procedures, the images were reviewed on the DCI consoles by the 

study supervisor. He unselected runs of no clinical value for visual interpretation (i.e., missed 

injections, lead markers...) and images in the runs with no contrast medium at all. The 

purpose was to remove of the digital copies the completely irrelevant images and to save 

transfer time or computer storage capacity for the study. This did not result in “clinical 

compression”, or removal of clinical data, as only images with absolutely no inherent 

diagnostic information were removed. The selected images were transferred via a 

PMSnet/Ethernet link onto a Sun station where they could be copied on digital tapes. 

The digital tapes were sent to Philips Medical Systems laboratories in Best, The Netherlands. 

All the images of the angiograms were compressed and reconstructed. Four cases were 

created per angiogram: the Original, the Repeat, the JPEG-12 and the MLOT-12. 

2.2.2. Image treatments 

Various lossy data compression methods have been investigated over the past decade in the 

field of radiology imaging [WONG-95]. The choice of a compression technique is difficult. It is 

admitted that the JPEG image industry standard is not be the best solution for medical 

images. Compression methods better suited to this field are numerous, but suffer from 

absence of widely spread hardware and software implementations. We chose to evaluate the 

JPEG method, and to investigate a presumably better method for medical application that 

would be suitable for hardware implementation. 

JPEG or Joint Photographic Expert Group is an industry standard for still image compression 

[PENN-93]. It is a block-based compression method: the image is first divided into adjacent 

blocks of 8x8 pixels. Then blocks are compressed by applying particular mathematical and 

rounding techniques. At high compression factors, the block-based JPEG compression 

method yields visible block boundaries in the image, called blocking artifacts. JPEG was 

optimized for photographs of the consumer market, not for medical images. With cardiac 

angiography images, and in the viewing conditions of the cath lab systems, blocking artifacts 

are quite visible with JPEG at compression factors above 8:1. Three unfavorable conditions 

play a role in the visibility of the artifacts: the nature of the image itself (very different from 

photographs), the high luminosity output of the B/W medical monitors used on cardiac 

systems, and edge enhancement image processing used to make the vessel contours more 

visible. 

To overcome blocking artifact, a novel method called MLOT was developed [BREE-94]. The 

mathematical and rounding technique differs from JPEG because it uses information from 

adjacent blocks. In addition, we found that for cardiac angiographic images, the best block 

size was 32x32 and not 8x8. Several parameters in the MLOT method were optimized for 

cardiac angiography images, and can easily be adapted to other medical modalities [HEUS- 

95]. 

2.2.3. Film review 

After compression of the digital films, a randomization scheme was used in order to 

determine the content of the viewing sessions. Each viewing session contained 4 to 5 cases. 

Consecutive viewing sessions were separated by at least one week. All the cases of a 

- 178 -


session were from different patients, and the occurrence of a patient was not possible in two 

consecutive sessions, to avoid a learning effect. Amongst the cases of a session, some were 

Originals, Repeats, JPEG-12 or MLOT-12. One tape was created per session and labeled 

according to its session number. 

The tapes were sent to Houston where the supervisor and the observers were blinded about 

their content. The supervisor loaded the cases of each session tape on a DCI system and 

organized viewing sessions with the 4 observers separately. 

The review station hardware was a Philips DCI with exactly the same operator console and 

display monitors as the clinical DCI of the acquisition cath labs. The study DCI had some 

extra disc capacity, which was needed for the purpose of having 4 to 5 cases. 

During a session, the observer reviewed each digital film at his own pace. He could use the 

wheel of the DCI operating console to play forward, backward, or change the viewing speed. 

The observer was asked not to use the image post-processing (change edge enhancement, 

contrast, brightness, or zoom) as we found that they have a strong influence on the visibility 

of compression artifacts. Making artifacts more visible on some images, for some observers, 

was a possible source of bias. 

2.3. Data collected during review 

2.3.1. Segment classification 

The observers were asked to assess the degree of abnormality of LV and coronary 

segments. For the left ventricles, the wall segments were: anterior, apical, inferior, lateral, and 

septal. The LV wall motion was classified by observers as: normal, hypokinetic, akinetic, 

dyskinetic, or N/A. For the coronary arteries, the vessel segments were the 15 segments (no 

graft were present) of the CASS system [CASS-81]. Figure 1 illustrates the segments 

classification. The coronary segments were graded by the observers as: normal, irregular, 

mild, moderate, severe, occluded, or N/A. 

LMCA 

LAD pro 

LAD mid 

RCApro 

LCX pro 

LAD dis 

RCAmid 

LCX dis 

LCX OM1 

RCA dis 

RCA 

PDA 

Figure 1: Coronary vessel segmentation 

- 179 -


We had noticed, in a previous unpublished study [BERE-95b], that a very important 

discrepancy in the location of coronary segments is common with angiographers. This 

observer effect could greatly modify the results of this study for a reason independent of the 

compression. For example, if a lesion was scored severe on the RCA mid during a first 

review and then positioned on the RCA distal during a second review, the comparison of the 

two scores indicates high degree of disagreement (RCA mid: severe vs. normal, RCA distal: 

normal vs. severe). 

We chose a protocol free of observer location discrepancies to determine if the scoring of 

coronary lesions was modified by compression. During the review sessions, doctors pointed 

on the screen the location of the lesions they observed, and scored them. The supervisor 

recorded the lesion score and noted its location. Once the doctors had pointed all the lesions 

they would normally report in their routine diagnosis, the remaining segments were reviewed 

systematically and their score recorded. To remain consistent in the segment location of a 

patient, the supervisor made a map of the coronary tree by printing images from the main 

views and determining the anatomical location of segments. A single map per patient was 

used for the four occurrences of his film throughout the viewing sessions. 

2.3.2. Scoring sheet 

The study supervisor collected a scoring sheet for all the cases reviewed during a session. 

The sheet contained the LV-gram subjective image quality appreciation, the LV segments 

disease categories, the arteriogram subjective image quality, the artery segments disease 

scores. For both LV and coronary segments, the category N/A was used when the observers 

were not able to give a score: absence of adequate projection, poor contrast injection, poor 

image quality, etc... 

2.4. Data analysis 

Numerous compression studies in radiology are based on the Receiver Operating Curve 

(ROC) methodology [SWET-79], [METZ-86]. We did not chose this method because it 

involves a detection and/or classification task that differs a lot from the usual practice of 

cardiac angiogram interpretation, and because it partially addresses diagnostic tasks with 

multiple location and classification of disease. 

This compression study was based on the assessment of intra-observer agreements. We 

compared the interpretations of the four cardiologists by assessing Original vs. Repeat (O vs. 

R), Original vs. JPEG-12 (O vs. J), and Original vs. MLOT-12 (O vs. M) agreements. The O 

vs. R agreement values were used as a base of comparison, and represent the inherent 

observer agreements. They were compared to the O vs. J, and O vs. M agreements. The 

rational is the following: if compression modifies the diagnostic interpretation, the O vs. J or 

the O vs. M agreement values will significantly differ from the O vs. R value. 

The observer agreement values were derived from contingency tables. Observers’ 

agreements of the LV-grams interpretation were measured by the kappa statistic [COHE-50], 

[FLEI-81] because of the categorial nature of the data (normal, hypokinetic, akinetic, 

dyskinetic). The scoring of the coronary artery was a discrete numerical data (1=normal, 

2=irregular, 3=mild, 4=moderate, 5=severe, 6=occlusion). Proportion of agreement were 

measured. A concordance correlation coefficient proposed by Lin [LIN-89] was utilized. This 

coefficient indicates how two pairs of readings differ from the identity line i.e. from perfect 

agreement. A Lin coefficient of 1 denotes perfect agreement, of 0 total absence of 

agreement, of -1 perfect reversed agreement. In contrast, the Pearson correlation coefficient 

- 180 -


only indicated how two pairs of reading differ from a line: a Pearson coefficient of 1 despite 

systematic disagreement is possible. 

3. Results 

3.1. Ventriculograms 

3.1.1. Side by side comparisons. (O-J-L) 

Figure 2 shows side by side the enlarged part of a left ventricle image with the three following 

image treatments: original, JPEG-12, MLOT-12. In pilot experiments, we tried several 

compression factors. The JPEG images could be distinguished visually from the original for a 

compression of 8:1 and higher. In contrast, the MLOT was distinguishable from the original 

for compression factors of 12:1 and higher. Increasing the compression factor with JPEG 

makes the blocking artifacts more and more visible, and removes sharpness of vessel details. 

Increasing the compression factor with MLOT decreases the sharpness of fine details, and a 

slightly changes the texture of the background. We found that the JPEG image quality 

became quite degraded visually for compression factors of 16:1 and higher, and doctors who 

saw some examples did not feel satisfied by the visual appearance of such images, whereas 

MLOT was still acceptable. These visual and subjective preliminary tests led us to chose a 

compression factor of 12:1 for the study. 

(a) (b) (c) 

Figure 2: Comparison of an original (a), JPEG-12 (b), and MLOT-12 (c) image of left 

ventricle (enlarged). 

- 181 -


3.1.2. LV-gram quality and docs comments on perceptual quality 

Observers gave their subjective and perceptual judgment of the quality of ventriculograms. 

Table 1 gives the percentage of ventriculograms judged as “good”, “fair”, and “poor” by the 

four observers. The perceived quality of left ventriculogram is statistically independent of the 

image treatment (chi-2 test, p=0.42). 

LV-gram Original Repeat JPEG-12 MLOT-12 Average 

Good 88% 84% 86% 81% 85% 

Fair 6% 9% 4% 13% 8% 

Poor 0% 0% 0% 0% 0% 

N/A 6% 6% 9% 6% 7% 

Table 1: Perceptual quality of ventriculograms: percentage of segments judged good, 

fair, poor or N/A. For each treatment N=96 and for the average N=384 

In addition to scoring the image quality on the rough 3-points scale reported here, observers 

freely commented the quality of the films they were reviewing. Despite their blindness 

regarding compression, they could often tell that a film was compressed, especially with 

JPEG. However, non of the films reviewed was considered as inappropriate for diagnosis. 

Poor image quality was mainly reported as due to procedural imperfection, like inadequate 

view, poor contrast injection. Procedural errors were reported as more annoying than the 

compression artifacts. Some of the JPEG films were qualified as grainy, with square patterns, 

and sometimes with unsharp vessel contours. About the MLOT films, it was sometimes noted 

that there appeared to be a veil in the background. Globally, if any artifact was perceived, it 

was said to require additional attention to interpret the film, never to hamper the 

interpretation. 

3.1.3. Location of LV abnormalities 

The spectrum of abnormality categories for each LV segment on Original and Repeat films is 

given in Table 2. For each segment N=192 (4 doctors x 24 patients x 2 image treatments) 

and for the average N=960 (id x 5 LV segments). A large majority of LV segments were 

scored normal (66%). The inferior wall shows slightly more abnormalities than the others. 

LV Normal Hypokinetic akinetic Dyskinetic N/A 

Segment 

Anterior 66% 25% 4% 3% 3% 

Apical 66% 19% 4% 6% 4% 

Inferior 52% 30% 14% 1% 3% 

Lateral 77% 19% 1% 1% 3% 

Septal 68% 18% 4% 2% 8% 

Average 66% 22% 5% 2% 4% 

Table 2: Distribution of the LV categories of abnormality from Original and Repeat 

films. 

- 183 -


3.1.4. Distribution of abnormalities per image treatment 

Table 3 shows the proportion of abnormality categories for each image treatment. The 

observers were able to give a score for 92% to 98% of all uncompressed LV segments 

reviewed. If image compression yielded a fair amount of degradation of the image quality, a 

possible effect would be an increase of the number of non analyzable segments. The 

proportion of N/A segments is not significantly different for the four image treatments. An 

other possible effect of compression on LV assessment could be a change of the distribution 

of abnormalities distribution on compressed images. The LV category is independent of the 

image treatment (chi-2 test, p=0.43). 

LV Segment Original Repeat JPEG-12 MLOT-12 Average 

Normal 65% 67% 68% 66% 66% 

Hypokinetic 23% 22% 21% 22% 22% 

Akinetic 5% 6% 6% 4% 5% 

Dyskinetic 3% 2% 2% 1% 2% 

N/A 5% 3% 3% 7% 5% 

Table 3: Proportion of LV abnormality category per image treatment. 

3.1.5. Agreement tables 

Intra-observer agreements were derived from the reviewers’ interpretations, out of analyzed 

segments. We compared the intra-observer agreements between interpretations based on 

Original & Repeat (O&R) with the agreement based on Original & JPEG-12 (O&J), and 

Original & MLOT-12 (O&M) respectively. Table 4 gives the percentage of perfect agreement 

for each LV segment. 

- 184 -


LV 

O&R 

O&J O&M Average 

segment agreement agreement agreement 

Anterior 78.1% 84.4% 82.3% 81.6% 

Apical 78.1% 75.0% 82.3% 78.5% 

Inferior 72.9% 77.1% 77.1% 75.7% 

Lateral 83.3% 87.5% 82.3% 84.4% 

Septal 80.2% 72.9% 72.9% 75.3% 

Overall 

agreement 

78.5% 

(N=480) 

79.4% 

(N=480) 

79.4% 

(N=480) 

79.1% 

(N=1440) 

Table 4: Intra-observer agreement of the 4 observers per LV segment. 

The LV-gram agreements of Table 4 show that the observer agreements are high. The 

overall proportion agreements are 78.5%, 79.4%, and 79.4% for the O&R, O&J and O&M 

agreements respectively. The corresponding kappa values are 0.62, 0.63, 0.64, respectively. 

The three kappa values are significantly above chance alone, they indicate a good degree of 

observer agreement. They are not significantly different. The relatively low values of kappa 

compared to the overall proportion of agreement is an effect of the correction for chance 

alone introduced in the computation of the kappa coefficient. The distribution of LV diagnostic 

categories are unbalanced, the amount of normal segments greatly exceeds the amount of 

any other category. Unbalanced category distribution yields artificially low kappa values due 

to the "kappa paradox", reported in [FEIN-90], [CICC-90]. 

The LV data analysis shows that the observer agreements on LV interpretation are high, and 

not significantly modified by compression. 

3.2. Arteriograms 

3.2.1. Side by side comparisons (O-J-L) 

(a) (b) (c) 

Figure 3: Comparison of an original (a), JPEG-12 (b), and MLOT-12 (c) image a right 

coronary artery (enlarged). 

- 185 -


3.2.2. Coronary arteriogram quality and comments 

Table 5 shows the percentage of arteriograms judged as “good”, “fair’, and “poor”, and N/A by 

the four observers as they reviewed the arteriograms with each image treatment. The 

perceived quality of coronary arteriograms is statistically independent of the image treatment 

(chi-2 test, p=0.08). 

Cgram Original Repeat JPEG-12 MLOT-12 Average 

Good 83% 86% 76% 79% 81% 

Fair 15% 13% 18% 20% 16% 

Poor 0% 0% 4% 0% 1% 

N/A 2% 1% 2% 1% 2% 

Table 5: Perceptual quality of arteriograms 

3.2.3. Location of coronary arteries abnormalities 

The distribution of coronary arteries scores from Original and Repeat films is illustrated by 

Figure 4. For an easier interpretation of the graph, we used in Figure 4-a the category 

“insignificant” for irregular and mild lesions, and the category “significant” for moderate and 

severe lesions. Figure 4-b shows with more detail the spectrum of scores of abnormal 

segments. The graphs of Figure 4-a and -b show that the occurrence of abnormalities is 

higher for some coronary segment, in particular the LAD mid and prox, the RCA prox and 

mid. Some segments were more often classified N/A, in particular the LCX Marginal 3, the 

LAD Diagonal 2, the LCX Marginal 2, the RCA distal and PDA. 

RCA pro 

RCA mid 

RCA dis 

RCA pda 

LMCA 

LAD pro 

LAD mid 

LAD dis 

LAD D1 

LAD D2 

LCX pro 

LCX dis 

LCX OM1 

LCX OM2 

LCX OM3 

0% 20% 40% 60% 80% 100% 

N/A 

Significant 

Unsig 

Normal 

(a) 

(b) 

Figure 4: a) Location of CAD from Original and Repeat films. For each segment N=192, 

in total N=2880. 

- 186 -


3.2.4. Distribution of abnormalities per image treatment 

Table 6 gives the spectrum of coronary artery diseased for each image treatment. 

Original Repeat JPEG-12 MLOT-12 

Normal 46.0% 45.3% 43.7% 42.7% 

Irregular 23.4% 22.6% 24.0% 24.2% 

Mild 8.9% 9.5% 9.4% 9.4% 

Moderate 4.4% 4.5% 4.0% 4.9% 

Severe 4.3% 4.7% 5.1% 5.2% 

Occlusion 2.3% 2.4% 2.2% 2.2% 

N/A 10.7% 11.0% 11.7% 11.5% 

Table 6: Distribution of coronary artery segments grades. For each treatment, N=1440 

(24 cases x 4 reviewers x 15 segments) . 

The distribution of abnormalities is very unbalanced, and not gaussian. In the cases of this 

study, almost half of the scored segments are normal (44 to 46%), and two third are normal 

or irregular (67 to 69%). Compression does not significantly increase the number of N/A 

coronary segments. 

3.2.5. Differences of scores between image treatments 

In order to easily visualize possible modification of the observer interpretations due to 

compression, we plotted the distribution of differences between Repeat minus Original (R-O), 

JPEG-12 minus Original (J-O), MLOT-12 minus Original (M-O). The effect of compression is 

expected to appear if the distribution of the differences M-O or L-O departs from the 

distribution of R-O. 

All segments 

80% 

70% 

60% 

50% 

40% 

30% 

20% 

10% 

0% 

-5 -4 -3 -2 -1 0 1 2 3 4 5 

grade difference 

R-O 

J-O 

L-O 

Figure 5: Distribution of the differences R-O (N=1280), J-O (N=1270), and L-O (N=1274). 

Figure 5 shows that scoring differences between compressed and original sets, J-O and M-O, 

have the same distribution as the inherent intra-observer variability in visual scoring, R-O. 

- 187 -


The average of the differences R-O is not significantly different from the average of the J-O 

differences and from the average of the M-O differences (paired t-tests). These results show 

that the variability introduced by compression is not significantly different from the observers 

variability, and that compression does not yield over- or under-estimation of coronary lesions. 

Table 7 shows the percentage of perfect agreements for O&R, O&J, O&M. 

% agreement O&R O&J O&M Average 

Overall 60% 59% 58% 59% 

RCA 61% 59% 58% 59% 

LAD 60% 61% 58% 60% 

LCX 59% 58% 58% 58% 

Proximal 62% 64% 64% 63% 

Distal 59% 55% 53% 56% 

Observer1 74% 71% 70% 72% 

Observer 2 72% 74% 73% 73% 

Observer 3 62% 61% 62% 62% 

Observer 4 76% 73% 69% 73% 

Table 7: Agreement table for coronary segments scores 

The overall kappa values range from 0.48 to 0.51 and are not significantly different from 

another for O&R, O&J and O&M agreement (p>0.25). Like for the LV-gram data, the 

unbalance of the score distribution tends to artificially diminish the kappa value though the 

overall proportions of agreement are very high, due to the kappa paradox. The Lin 

concordance correlation coefficient confirm a high degree of overall agreement: 0.80±0.2, 

0.81±0.2, and 0.79±0.2 for O&R, O&J, O&M overall agreements respectively. Lin 

concordance correlation coefficients are not significantly different without or with compression 

for the overall agreements. Table 7 and Table 8 also give the agreements of the RCA, LAD, 

LCX coronary branches, of the proximal, distal segments, and of the observers individually. 

All these agreements are not significantly different for O&R, O&J, and O&M, except for the 

distal segments. The Lin concordance correlation coefficient of O&M agreement for distal 

segments is lower that the O&R agreement, at the limit of statistical significance. Independent 

of compression, the Lin values show that the intra-observer agreements differ between the 

coronary branches: the RCA agreements are significantly higher than the LAD agreements, 

which are higher than the LCX agreements (non significantly). The agreement of distal 

segments is higher (but not significantly) than that of proximal segments. One observer has 

significantly higher agreements than two others, one observer has significantly lower 

agreements than two others. 

In conclusion, we used a scoring system that reflects adequately the clinical implication and 

usual manner of interpreting coronary arteriograms, and that is free of an ambiguity raised by 

anatomical location and denomination. The intra-observer agreement in the interpretation of 

arteriograms based on original films is high. It is globally not significantly modified by data 


- 188 -


Lin coef O&R O&J O&M 

Overall 0.806 ± 0.0193 0.8127 ± 0.0187 0.789 ± 0.0208 

RCA 0.830 ± 0.0632 0.8627 ± 0.0515 0.834 ± 0.0615 

LAD 0.648 ± 0.1155 0.8115 ± 0.0701 0.597 ± 0.1329 

LCX 0.484 ± 0.1590 0.5504 ± 0.1419 0.529 ± 0.1471 

Prox 0.830 ± 0.0632 0.8627 ± 0.0515 0.834 ± 0.0615 

Dist 0.895 ± 0.0440 0.7883 ± 0.0841 0.722 ± 0.1056 

Obs1 0.835 ± 0.0333 0.8089 ± 0.0384 0.798 ± 0.0402 

Obs2 0.863 ± 0.0280 0.8614 ± 0.0284 0.825 ± 0.0350 

Obs3 0.736 ± 0.0504 0.7654 ± 0.0455 0.750 ± 0.0483 

Obs4 0.767 ± 0.0452 0.8023 ± 0.0393 0.769 ± 0.0450 

4. Discussion 

Table 8: Values of concordance correlation coefficients 

4.1. Major Findings 

With the sample of digital angiograms we acquired randomly for this compression study, with 

the chosen compression methods (JPEG and MLOT), and at a compression factor of 12:1, 

the main findings of this work can be summarized as follow: 

• In routine diagnostic arteriograms, the proportion of normal or insignificantly diseased 

segments exceeded greatly the proportion of significantly diseased segments: 78% and 

11% respectively. Some coronary segments were more often diseased than others: the 

LAD mid, the RCA mid, the RCA proximal and the RCA distal. 

• Compression did not significantly change the proportion of non analyzable segments. 

• The compression artifacts were often perceived, but they did not significantly change the 

subjective appreciation of image quality. The compressed cases were considered as 

suitable for diagnostic purposes by the four cardiologists. 

• Compression did not significantly change the observer agreements for LV segments wall 

motion. Compression did not significantly change the observer agreements for coronary 

stenosis, it did not yield a systematic over or under estimation of lesions. 

• A compression ratio of 12:1 gave promising results regarding the perceptual and 

diagnostic of JPEG and MLOT compressed images. 

We suspect that higher CRs would more clearly differentiate the two algorithm performance. 

We observed that JPEG-16 compression yielded a rather poor perceptual quality, which lead 

us not to choose such a high CR. We also observed that MLOT-16 images had an 

acceptable perceptual quality . It was reported in [RIGO-96] that JPEG-15 compression did 

not alter the diagnostic assessment of lesion severity. It is likely that diagnostic tasks can be 

adequately performed even if the perceptual quality is relatively poor. The influence of 

observer fatigue under such conditions remains unclear. 

- 189 -


4.2. Discussion of issues related to the method 

4.2.1. Interpretation of complete cases 

The rationale of this study was to evaluate the effect of compression on the routine diagnostic 

process of the cath lab work. We chose not to modify the normal working procedures and 

therefore based the study on the interpretation of complete digital cases. The drawback of 

this approach is to necessitate the handling of thousands of digital images for a relatively low 

number of different patients included in the study (24 patients). However, the number of 

assessed segments was high: 120 LV segments (24 patients x 5 LV segments), and 360 

coronary segments (24 patients x 15 coronary segments). In our protocol, we avoided several 

possible biases: the possible effect of changing the normal diagnostic task by for instance 

having interpretation of isolated runs or frames, of having a higher proportion of diseased 

segments than usual, of not seeing a segments from different views, of not having dynamics. 

4.2.2. Gold standard 

In most image compression studies for radiology ([COSM-94], [SAYR-92]), a “Gold Standard” 

is used. A gold standard is a diagnostic method which provides an ultimate diagnostic truth 

about the patients included in the study. For instance, a biopsy can be used to control the 

truth of diagnosis made for breast cancers with mammograms. No recognized method exists 

for checking coronary artery disease other than arteriography itself, which is still considered 

as the ultimate method of diagnostic. In such situations, a consensus from a panel of expert 

clinicians can be used as gold standard. We found that panel interpretation was a very 

unusual practice in our institution and that it would add to the timing and complexity of the 

study process. The drawback of not having a panel diagnosis as a true reference for cases 

interpretation is the following: if compression would modify observers’ interpretation, it cannot 

be said if it improves or degrades the diagnostic performance the of observers, it can only 

concluded about a significant change, or no significant change. 

4.2.3. Variability of observers’ visual interpretation 

Several authors reported that the observer variability for visual interpretation of coronary 

arteriograms is very high (DETR-75], [DERO-77], [SNAM-78], [TRAS-84], [KUSS-92]). In our 

study, we found very good intra-observer agreements. We think that it is due to two 

precautions in the study design. Firstly, the scoring system was not too detailed and was 

meaningful to the cardiologist. The percentage stenosis implies a much too detailed score 

with 100 possible grades, and there is an ambiguity about percentage diameter or area 

stenosis. The 6 grade scale we used is a natural one (normal, irregular, mild, moderate, 

severe, occluded). Secondly, we avoided a high discrepancy in our results by preventing in a 

non cumbersome way that observers vaguely locate the lesion they detected. Cardiologists 

very often vary the positioning of the same lesion between two adjacent segments. As these 

imprecision often have no major consequence on the decision, they are not given much 

attention in clinical routine. In studies comparing several diagnosis based on the same patient 

angiogram, a mechanism to avoid location shifts is useful. 

- 190 -


4.3. Need for complementary studies 

Confirmation of the findings of this work by similar studies based on complete angiograms 

would be very interesting, as our conclusions are only valid for a sample of 24 patients. Four 

observers represents reasonably well the population of cardiologists of our institution. [KUSS- 

92] showed that the precision of the averaging scores of several observers is not much 

increased above 3 observers. Before making final conclusions about the absence of effect of 

lossy compression on the cath lab work, complementary assessment could be done from 

visual interpretation of complete diagnostic and interventional cases, from visual 

interpretation of specific disease (i.e. severe lesions, concentric/non concentric, or ostial 

stenosis, thrombus, calcification, etc...), and also from quantitative analysis measurements. 

- 191 -

CHAPITRE II-4 

MESURES QUANTITATIVES SUR LES 

IMAGES COMPRIMEES 

- 191 -

Chapitre II-4: Mesures quantitatives sur les images comprimées 

1. Etude bibliographique des méthodes d’analyse 

quantitative des coronaires 

1.1. Brève description de l’analyse quantitative 

Les systèmes de QCA 1 sont des logiciels semi automatisés pour la mesure du degré de 

sévérité d’une lésion d’artère coronaire. La portion normale du vaisseau est comparée à la 

portion la plus rétrécie sur le segment à analyser. Les mesures portent sur les sections 

transversales du vaisseau. On obtient un pourcentage de sténose en diamètre ou en 

surface, au choix. Il est nécessaire de sélectionner une image qui met la lésion en 

évidence, avec une déformation géométrique minimale due à la projection. En effet, si le 

faisceau de rayon X n’est pas perpendiculaire au segment, on obtient des sections 

obliques qui donneront des résultats inexacts. 

1.2. Historique 

Les systèmes de mesures de coronaires sont apparus au débuts des années soixantedix, 

à partir d’une image de radiocinéma projetée sur un écran, filmée par une caméra et 

numérisée. Les premiers logiciels étaient basés sur l’approche par “calipers” [GENS-71], 

[SCOB-84]. L’observateur trace sur l’écran une ligne allant d’un bord du vaisseau à l’autre, 

et correspondant au diamètre à mesurer. Cette méthode s’est avérée imprécise [KATR- 

88], [KALB-90], elle sous-estime les lésions sévères et surestime les lésions moins 

sévères en comparaison avec les résultats obtenus avec des systèmes QCA qui vont être 

décrits dans le prochain paragraphe. Ensuite est venue la méthode des contours manuels 

à partir de deux vues orthogonales, supposant une géométrie ellipsoïdales [BROW-77], 

[McMA-79], [BROW-86]. Cette approche a aussi ses inconvénients [BROW-82]. Elle est 

limitée par sa lenteur et le fait qu’elle est basée sur l’appréciation visuelle pour le tracé du 

contour. Au milieu des années quatre-vingt sont apparu des systèmes qui détectent 

automatiquement les contours entre deux points indiqués par l’opérateur (système du 

CAAS [REIB-84]) ou dans une région d’intérêt sélectionnée (système ARTREK [LEFR- 

86]). 

Une analyse de la bibliographie des méthodes de mesure de coronaires est donnée dans 

[REIB-84], [HERM-92] 

1.3. Système QCA des appareils Philips 

Le logiciel de QCA utilisé dans notre étude de compression est basé sur le système du 

CAAS. C’est l’algorithme d’analyse disponible sur les systèmes d’angiographie cardiaque 

numérique de Philips [REIB-89]. L’opérateur indique deux points du vaisseau entre 

lesquels se situe la lésion à analyser. Le système calcule une ligne centrale. Ensuite il 

échantillonne de nouveau les données en segments rectilignes perpendiculaires à la ligne 

centrale. La courbe des niveaux de gris le long de ces segments est utilisée pour 

déterminer les bords du vaisseau. Une pondération de la dérivée première et de la 

dérivée seconde de ces courbes sert à l’évaluation des contours, en cherchant un tracé 

qui optimise certains critères (matrice de coût minimale). 

Les principales étapes du processus de mesure sont les suivantes: 

1 QCA: de l’anglais “Quantitative Coronary Analysis” 

- 192 -


• Etape de calibrage 

1. sélection par l’opérateur de l’image de calibrage 

2. sélection par l’opérateur d’un segment de cathéter (dont le diamètre est connu) en 

indiquant deux points sur le cathéter 

3. détection par l’ordinateur de la ligne centrale du cathéter 

4. détection par l’ordinateur des contours du cathéter 

5. indication par l’opérateur du diamètre réel du cathéter 

6. calcul par l’ordinateur du diamètre moyen du segment de cathéter 

7. calcul par l’ordinateur du facteur de calibrage exprimé en mm/pixel 

• Etape de mesure 

1. sélection par l’opérateur de l’image du vaisseau, dans la même séquence que l’image 

de calibrage 

2. sélection par l’opérateur du segment à analyser, en indiquant un point en amont et un 

point en aval de la lésion 

3. détection par l’ordinateur d’une ligne centrale 

4. facultatif: correction manuelle par l’opérateur de la ligne centrale 

5. détection par l’ordinateur des bords du segment 

6. facultatif: corrections manuelles par l’opérateur des contours automatiques 

7. détermination par l’ordinateur du diamètre le plus petit (diamètre d’obstruction), et du 

diamètre moyen en dehors de la zone rétrécie (diamètre de référence). 

• Quelques résultats fournis par le système 

1. diamètre de référence, en mm 

2. diamètre d’obstruction, en mm 

3. aire de la section d’obstruction et de référence, en mm 2 (en supposant une section 

circulaire) 

4. pourcentage de rétrécissement en diamètre, en % 

5. pourcentage de rétrécissement en surface, en % 

6. longueur d’obstruction, en mm 

Un résultat typique de mesure est illustré dans la figure II-4.1. 

- 193 -


Figure II-4. 1: Exemple de résultats de mesures QCA. 

1.4. Précision et limitations du système 

Le système du CAAS est considéré comme un dispositif de grande précision. Sa 

validation à partir de fantômes de dimensions connus donne une différence moyenne 

entre les valeurs mesurées et les valeurs vraies de 0.03 mm (justesse), et un écart type 

de ces différences de 0.13mm (précision) [REIB-94]. 

Une limitation propre à l’algorithme de tracé de contours est la tendance à sous-estimer 

les sténoses abruptes, si l’opérateur n’en corrige pas les contours. 

Une limitation inhérente à toute méthode semi-automatique provient de facteurs 

radiographiques. On peut citer la “pénombre” due au fait que la source radiogène n’est 

pas ponctuelle, le flou cinétique dû au mouvement des vaisseaux, les aberrations de la 

chaîne d’imagerie, les défauts d’exposition (surexposition ou sous-exposition). 

Une limitation est due à la forme de la lésion par rapport au modèle ellipsoïdal supposé. 

La lésion peut être excentrée et asymétrique. 

D’autres limitations sont due à l’opérateur humain lors de l’acquisition de l’image ou de la 

mesure elle-même. Il est nécessaire de choisir une projection appropriée, sans vaisseaux 

superposés, et où le segment de vaisseau à analyser est perpendiculaire au plan de 

l’image pour éviter des distorsions géométriques. Le choix de l’image dans la séquence et 

le positionnement des points autour de la lésion sont primordiaux. 

Pour restreindre les limitations dues au facteur humain entre les répétitions des mesures 

de notre étude, une approche rigoureuse dans la sélection des points délimitant la lésion 

a été utilisée. Cette approche est décrite dans l’annexe B. Il faut noter qu’un léger écart de 

positionnement de ces point entraîne des résultats de mesure assez différents. Dans la 

routine des examens angiographiques, la variabilité des observateurs est bien supérieure 

aux variabilités généralement mentionnées dans les études publiées, où les opérateurs 

sont formés et spécialisés dans la pratique des mesures. 

- 194 -


2. Méthodes pour tester un système de QCA 

• Fantômes 

La justesse des systèmes QCA est en général validée à l’aide de fantômes de dimensions 

connues [REIB-94]. Il s’agit de cylindres creux en Plexiglas, dont la lumière contient des 

rétrécissements, imitant la lumière des vaisseaux. Les cylindres sont remplis de produit de 

contraste opaque aux rayons X, placés dans un milieu aqueux pour reproduire 

approximativement les conditions d’un patient (rayonnement diffusé...), et font l’objet 

d’acquisition d’images. Les résultats des mesures sur ces images de fantômes de 

dimensions variées sont comparés avec les valeurs vraies. Une précision entre valeurs 

vraies et mesurées de l’ordre 0.10-0.13 mm est considérée comme bonne [REIB-94]. La 

précision est définie ici comme l’écart type sur les différences entre les valeurs vraies et 

les valeurs mesurées. 

Cette méthode serait idéale pour évaluer si la justesse des mesures était préservée sur 

des images comprimées. Malheureusement, son emploi n’est pas correct, bien qu’on la 

rencontre parfois. En effet, les images de fantômes ont des propriétés statistiques fort 

différentes des images réelles. Or, la compression par transformation est complètement 

dépendante des propriétés statistiques de l’image. En d’autres termes, pour un taux de 

compression donné, la nature et l’importance des artefacts introduits par la compression 

seront vraisemblablement complètement différentes sur une image de fantômes, et sur 

une image réelle de patient. Les résultats de justesse des mesures sur des images de 

fantômes comprimées ne permettraient en rien de porter des conclusions sur les résultats 

de justesse avec des images réelles. 

La seule approche possible pour évaluer l’effet de la compression sur les résultats de 

QCA est d’effectuer une campagne de mesures sur des images réelles. 

• Campagnes mesures 

Les campagnes de mesures consistent à sélectionner un certain nombre d’images, et à 

effectuer les mesures dans les différentes conditions que l’on cherche à comparer. Dans 

notre cas, nous cherchons à comparer les résultats sur des images originales, et les 

résultats sur les mêmes images ayant subi une compression. Par des méthodes 

statistiques descriptives et quantitatives, nous voulons évaluer si la fidélité des mesures 

est significativement modifiée par la compression ou non. 

Par cette approche, il n’est pas possible de comparer les valeurs mesurées avec les 

valeurs vraies qui sont inconnues (notion de justesse), mais seulement de vérifier si 

l’étroitesse entre l’accord sur plusieurs mesures est perturbée par la compression (notion 

de fidélité). 

Une fidélité inter et intra-observateur (écart type des différences entre deux mesures sur 

une images) de 0.2-0.3mm est considérée comme bonne [REIB-94]. 

3. Travaux de la littérature sur la QCA avec compression 

Il existe peu de travaux publiés sur l’effet de la compression sur les mesures de QCA. 

Nous avons connaissance principalement de deux études. 

[KONI-94] a étudié l’effet d’une compression avec perte à base de DPCM, avec des taux 

de 2 (sans pertes), et 3 et 4 (avec pertes). L’une de ses évaluations porte sur des 

fantômes, l’autre (la seule dont il sera fait mention ici) sur des images de patients 

- 195 -


contenant 40 lésions. Ses résultats ne montrent pas de différences significatives de la 

fidélité des mesures, dans des conditions de répétabilité (un même opérateur répète deux 

fois chaque mesure). La méthode de comparaison est basée sur la moyennes des écarts 

entre les deux séries de mesures sur les images d’un même type (comparaison intraobservateur). 

Cette moyenne pour les images originales est comparée avec la moyenne 

pour les images comprimées à l’aide d’un test de Student. Ces moyennes étaient de 

l’ordre de 0.01 à 0.04 mm. Leurs écarts types ont été comparés par un test de Fischer. 

Les écarts types étaient de l’ordre de 0.09 à 0.14 mm. De façon similaire, des 

comparaisons ont été effectuées entre la moyenne et l’écart type des écarts entre une 

première mesure sur les images originales, et une deuxième mesure sur les images 

comprimées (comparaison inter-compression). 

[RIGO-96] a évalué la corrélation avec les mesures de QCA sur 40 lésions entre les 

images originales et comprimées avec JPEG-15. L’algorithme de QCA employé repose 

sur une de détection de contour proche de celle du CAAS ([HERM-92], [CUSM-95]). Les 

résultats indiquent que la corrélation entre les images originales et les images 

comprimées est similaire à la corrélation entre une première mesure et une deuxième 

mesure sur les originaux. Les auteurs concluent que dans les conditions de leur étude, la 

compression n’a pas d’effet significatif sur les mesures. 

4. Méthode de notre étude de QCA appliquée sur des images 

comprimées 

Notre étude de QCA a fait l’objet d’une publication ([KONI-97]). 

4.1. Protocole expérimental 

Notre campagnes de mesures QCA sur des images comprimées s’est déroulés dans le 

cadre de l’AZL de Leiden. Les principaux éléments de notre protocole expérimental sont 

indiqués ci-après. 

• Opérateur 

Un opérateur expert de l’analyse quantitative a réalisé toutes les mesures. En 

comparaison avec les conditions cliniques de routine, le choix d’un tel opérateur limite les 

inconsistances fréquemment rencontrées quant au choix de l’image à utiliser au sein de la 

séquence, et au positionnement des deux points en aval et en amont de la lésion à 

analyser. 

• Système de mesure 

Le système de QCA utilisé dans cette étude était un système de recherche comportant 

exactement le même algorithme que le système DCI, mais avec une interface utilisateur 

différente. En particulier, le logiciel permet de connaître la position exacte des points 

donnés par l’opérateur, et d’entrer des points de coordonnées voulues. 

• Images 

Les images incluses dans cette étude proviennent d’un DCI et d’un Integris de l’Hôpital 

Cardiologique de Lille. Le recoupement entre les images de la campagne d’interprétation 

visuelle de Lille a malheureusement été restreint, car peu d’images se prêtaient aux 

mesures quantitatives. 

- 196 -


30 images ont été incluses dans cette campagne QCA, à partir desquelles 37 lésions ont 

pu être mesurées. 

• Traitements d’image 

Les images originales ont été comprimées avec la méthode JPEG (abréviation JP), et la 

méthode MLOT (abréviation LO), à des taux de 5, 8, et 12:1. Les mesures ont donc porté 

sur 7 lots d’images: les images originales OR, les images comprimées JP5, JP8, JP12, et 

LO5, LO8, LO12. 

• Réplications des mesures 

Chaque lot d’image a été mesuré à deux reprises, séparées par quelques semaines. 

• Calibrage 

Pour chaque image, la calibrage a été effectué une fois sur l’original lors de la première 

réplication. Les deux points donnés par l’opérateur le long du cathéter ont été réutilisés 

pour toutes les autres premières mesures, c’est à dire lors de la première mesure sur 

l’image correspondante avec chacun des traitements JP5, JP8, JP12, et LO5, LO8, LO12. 

Lors de la deuxième réplication, l’opérateur a de nouveau indiqué deux points pour la 

calibrage sur l’original. Ces points ont été réutilisés pour toutes les autres deuxièmes 

mesures avec chacun des traitements. 

Ainsi, les différences de calibrage qui peuvent survenir entre les originaux et les images 

comprimées sur la première réplication, ou sur la deuxième réplication ne peuvent être 

imputées qu’à une modification du contour du cathéter due à la compression. 

• Mesures 

Les mesures ont été effectuées en limitant au strict minimum l’interaction de l’opérateur. 

Seuls les points en amont et en aval de la lésion ont été indiqués. Aucune correction 

manuelle de la ligne centrale, ou du contour n’a été effectuée. 

Le même principe que pour la calibrage a été appliqué: réutilisation des points en amont 

et en aval de la lésion trouvée sur l’original et appliqués de nouveau sur les images 

comprimées. 

On voit que par un tel protocole, l’interaction entre l’opérateur et l’image n’a en fait 

réellement eu lieu que sur les originaux. Sur les images comprimées, l’opérateur n’avait 

pas à choisir de points sur l’image, mais juste à les entrer dans la machine et à laisser le 

résultat se calculer. 

Ainsi les différences de résultats de mesures observées peuvent être imputées à un effet 

de la compression sur la calibrage ou sur la détection des contours du vaisseau. 

4.2. Valeurs mesurées et analysées 

• Mesures sur lesquelles ont portées les analyses 

Pour la clarté de cet exposé, nous avons choisi de limiter le nombre de mesures par 

rapports à toutes celles fournies par le logiciel de QCA. Les résultats de QCA sur lesquels 

nous avons effectué nos analyses de données sont le diamètre de référence Dref, et le 

diamètre d’obstruction Dobs. Ce sont des valeurs très importantes pour le clinicien, à 

partir d’elles sont déduites le pourcentage de sténose exprimé soit en diamètre, soit en 

surface. 

• Comparaisons intra- et inter-compression 

Toutes les mesures de cette campagne QCA ont été effectuées dans des conditions de 

répétabilité, le même opérateur répétant chaque mesure deux fois. 

- 197 -


Dans les comparaisons intra-compression, nous avons utilisé, pour un lot d’images 

donné, une comparaison des résultats de la réplication 1 et de la réplication 2. 

Dans les comparaisons inter-compression, nous avons pris la moyenne des deux 

mesures sur les originaux, et nous l’avons comparé à la moyenne des deux mesures avec 

un traitement donné. 

• Résumé des méthodes d’analyses 

Notre analyse statistique a été basée sur des méthodes graphiques simples similaires à 

[GRIM-96], sur un coefficient de concordance [LIN-89], et sur l’analyse de la variance. 

On a donné au chapitre II-2 une liste des principales méthodes statistiques employées 

dans cette thèse. 

5. Résultats 

L’analyse des données a pour objectif de répondre principalement aux deux questions: 

1. La compression rend-elle les mesures moins exactes? Nous regarderons si en 

moyenne les valeurs mesurées sur les images comprimées sont significativement 

différentes des valeurs mesurées sur les images originales. 

2. La compression rend-elle les mesures moins précises? Nous regarderons si l’écart 

entre les mesures répliquées est en moyenne significativement différent avec les 

images comprimées et originales. 

5.1. Comparaisons inter-compression 

Dans cette section nous allons étudier si en moyenne les mesures effectuées sur les 

images originales diffèrent significativement ou non des mesures effectuées sur chacun 

des lots d’images comprimées. 

5.1.1. Graphes des différences par rapport aux moyennes 

Une première interprétation visuelle des données va être fournie par des graphes traçant 

les différences par rapport aux moyennes (figure II-4.2 et II-4.3). 

Cette méthode graphique a été proposée par [BLAN-86]. Chaque point du graphe 

correspond à une lésion. Dans cette section, la moyenne des deux mesures de la lésion 

sur l’image originale (“moyenne originale”) est comparée à la moyenne des deux mesures 

sur l’image comprimée (“moyenne comprimée”). Pour cela, la différence entre la moyenne 

originale et la moyenne comprimée est tracée en fonction de la moyenne de ces deux 

moyennes. 

En plus des points correspondant aux lésions, une droite horizontale indique la moyenne 

de toutes les différences. Si toutes les valeurs des moyennes comprimées étaient égales 

aux valeurs des moyennes originales, cette droite passerait par l’axe des origines. Cette 

droite de moyennes générale des différences est entourée de deux autres droites 

indiquant un intervalle de tolérance. La notion d’intervalle de tolérance est différente de la 

notion d’intervalle de confiance. Il s’agit de déterminer à partir des données sur les 

originaux une limite acceptable pour les écarts de moyennes. 

Les figures II-4.2 et II-4.3 montrent que les moyennes générales des écarts entre les 

moyennes comprimées et originales sont très voisines de zéro. On peut constater que les 

différences sont en dehors des bornes de tolérances pour 5 à 13 lésions sur 37, selon le 

traitement concerné. 

- 198 -


D’après cette interprétation graphique, la différence entre les moyennes comprimées et 

originales est quasi nulle, mais il y a une dispersion autour de cette moyenne qui dépasse 

parfois les bornes de tolérances. 

0.8 

Dobs, OR et JP5 

0.8 

Dobs, OR et LO5 

0.6 

0.6 

0.4 

0.4 

0.2 

0.2 

0 

0 

-0.2 

-0.2 

-0.4 

-0.4 

-0.6 

-0.6 

-0.8 

1 2 3 4 5 

-0.8 

1 2 3 4 5 

0.8 


0.8 


0.6 

0.6 

0.4 

0.4 

0.2 

0.2 

0 

0 

-0.2 

-0.2 

-0.4 

-0.4 

-0.6 

-0.6 

-0.8 

1 2 3 4 5 

-0.8 

1 2 3 4 5 

0.8 


0.8 


0.6 

0.6 

0.4 

0.4 

0.2 

0.2 

0 

0 

-0.2 

-0.2 

-0.4 

-0.4 

-0.6 

-0.6 

-0.8 

1 2 3 4 5 

-0.8 

1 2 3 4 5 

Figure II-4.2 Comparaisons inter-compression : Graphe des différences par rapport 

aux moyennes pour les diamètres d’obstruction 

- 199 -


0.8 

Dref, OR et JP5 

0.8 

Dref, OR et LO5 

0.6 

0.6 

0.4 

0.4 

0.2 

0.2 

0 

0 

-0.2 

-0.2 

-0.4 

-0.4 

-0.6 

-0.6 

-0.8 

1 2 3 4 5 

-0.8 

1 2 3 4 5 

0.8 


0.8 


0.6 

0.6 

0.4 

0.4 

0.2 

0.2 

0 

0 

-0.2 

-0.2 

-0.4 

-0.4 

-0.6 

-0.6 

-0.8 

1 2 3 4 5 

-0.8 

1 2 3 4 5 

0.8 


0.8 


0.6 

0.6 

0.4 

0.4 

0.2 

0.2 

0 

0 

-0.2 

-0.2 

-0.4 

-0.4 

-0.6 

-0.6 

-0.8 

1 2 3 4 5 

-0.8 

1 2 3 4 5 

Figure II-4.3 Comparaisons inter-compression : Graphe des différences par rapport 

aux moyennes pour les diamètres d’obstruction 

5.1.2. Coefficients de concordance de Lin 

Le coefficient de corrélation de concordance de Lin mesure avec quel degré les paires de 

mesures passent par la droite d’identité. 

Nous avons estimés les coefficients de Lin pour les comparaisons inter-compression à 

l’aide de la technique du bootstrap. Des intervalles de confiances à 95% sont aussi 

estimés par bootstrap. Comme les données ne suivent pas précisément une distribution 

gaussienne, cette approche statistique est utile. Le principe du bootstrap a été expliqué à 

la section 3.2.2 du chapitre II-1. 

- 200 -


Les figures II-4.4 et II-4.5 donnent les valeurs estimées des coefficients de Lin intercompression, 

ainsi que les valeurs des intervalles de confiance. On constate que toutes 

les concordances inter-compression sont très bonnes, et se situent entre 0.91 et 0.98. Les 

intervalles de confiance se chevauchant, il ne semble pas y avoir de différence 

significative entre les coefficients de Lin des différents traitements. 

Dobs Lin IC- IC+ 

OR/J5 0.962 -0.027 0.015 

OR/J8 0.967 -0.018 0.011 

OR/J12 0.919 -0.047 0.032 

OR/L5 0.942 -0.034 0.025 

OR/L8 0.946 -0.028 0.019 

OR/L12 0.945 -0.034 0.021 

Concordance Lin 

1.00 

0.98 

0.96 

0.94 

0.92 

0.90 

0.88 

0.86 

0.84 

0.82 

0.80 

Dobs - Inter-compression 

OR/J5 

OR/J8 

OR/J12 

OR/L5 

OR/L8 

OR/L12 

Figure II-4. 4: Coefficients de concordance de Lin inter-compression pour les 

diamètres d’obstruction. (IC-: valeur inférieure de l’intervalle de confiance, IC+: 

valeur supérieure) 

Dref Lin IC- IC+ 

OR/J5 0.962 -0.032 0.019 

OR/J8 0.967 -0.041 0.026 

OR/12 0.919 -0.040 0.025 

OR/L5 0.942 -0.036 0.023 

OR/L8 0.946 -0.029 0.017 

OR/L12 0.945 -0.058 0.031 


1.00 

0.98 

0.96 

0.94 

0.92 

0.90 

0.88 

0.86 

0.84 

0.82 

0.80 

OR/J5 

Dref - Inter-compression 

OR/J8 

OR/12 

OR/L5 

OR/L8 

OR/L12 

Figure II-4. 5: Coefficients de concordance de Lin inter-compression pour les 

diamètres de référence. (IC-: valeur inférieure de l'intervalle de confiance, IC+: 

valeur supérieure). 

- 201 -


5.2. Comparaisons intra-compression 

Dans cette section nous allons étudier les écarts entre les deux réplications de chaque 

traitement. Nous cherchons à savoir si la variabilité des mesures sur les images 

comprimées diffère de la variabilité sur les images originales. 

Cette analyse se fera par l’intermédiaire de comparaisons intra-compression (voir figure II- 

1-1). 

5.2.1. Graphes des différences par rapport aux moyennes 

Les graphes des différences entre les deux réplications de chaque traitement par rapport 

aux moyennes de ces deux réplications sont données dans les figures II-4.6 et II-4.7 Les 

intervalles de tolérances sont déterminés à partir des originaux, comme à la section 

5.1.1. 

D’après ces graphes, l’accord entre les deux réplications sur les originaux est très bon. 

Les points sont alignés le long d’une moyenne des différences très proche de 0. Pour les 

images comprimées, les points sont un peu plus dispersés autour de leur moyenne. On 

remarque une variabilité un peu plus importante avec JP5 et JP8 pour le diamètre 

d’obstruction. Pour JP8, un groupe de sept points a une première réplication nettement 

supérieure à la deuxième réplication, ce qui a pour effet d’augmenter la moyenne des 

différences. 

- 202 -


0.8 

Dobs, ORIGINAUX 

0.6 

1 point > borne sup 

0.4 

0.2 

borne sup: 0.251 

0 

moyenne écarts: 0.011 

-0.2 

borne inf: -0.219 

-0.4 

2 points < borne inf 

-0.6 

-0.8 

1 2 3 4 5 

0.8 

Dobs, JPEG-5 

0.8 

Dobs, MLOT-5 

0.6 

0.6 

0.4 

0.4 

0.2 

0.2 

0 

0 

-0.2 

-0.2 

-0.4 

-0.4 

-0.6 

-0.6 

-0.8 

1 2 3 4 5 

-0.8 

1 2 3 4 5 

0.8 

Dobs, JPEG-8 

0.8 

Dobs, MLOT-8 

0.6 

0.6 

0.4 

0.4 

0.2 

0.2 

0 

0 

-0.2 

-0.2 

-0.4 

-0.4 

-0.6 

-0.6 

-0.8 

1 2 3 4 5 

-0.8 

1 2 3 4 5 

0.8 

Dobs, JPEG-12 

0.8 

Dobs, MLOT-12 

0.6 

0.6 

0.4 

0.4 

0.2 

0.2 

0 

0 

-0.2 

-0.2 

-0.4 

-0.4 

-0.6 

-0.6 

-0.8 

1 2 3 4 5 

-0.8 

1 2 3 4 5 

Figure II-4. 6 Comparaisons intra-compression : Diagramme des différences par 

rapport aux moyennes, avec intervalles de tolérance, pour les diamètres 

d’obstruction. 

- 203 -


0.8 

Dref, ORIGINAUX 

0.6 

0.4 

0.2 

0 

-0.2 

-0.4 

-0.6 

-0.8 

1 2 3 4 5 

0.8 

Dref, JPEG-5 

0.8 

Dref, MLOT-5 

0.6 

0.6 

0.4 

0.4 

0.2 

0.2 

0 

0 

-0.2 

-0.2 

-0.4 

-0.4 

-0.6 

-0.6 

-0.8 

1 2 3 4 5 

-0.8 

1 2 3 4 5 

0.8 

Dref, JPEG-8 

0.8 

Dref, MLOT-8 

0.6 

0.6 

0.4 

0.4 

0.2 

0.2 

0 

0 

-0.2 

-0.2 

-0.4 

-0.4 

-0.6 

-0.6 

-0.8 

1 2 3 4 5 

-0.8 

1 2 3 4 5 

0.8 

Dref, JPEG-12 

0.8 

Dref, MLOT-12 

0.6 

0.6 

0.4 

0.4 

0.2 

0.2 

0 

0 

-0.2 

-0.2 

-0.4 

-0.4 

-0.6 

-0.6 

-0.8 

1 2 3 4 5 

-0.8 

1 2 3 4 5 

Figure II-4. 7 Comparaisons intra-compression : Diagramme des différences par 

rapport aux moyennes, avec intervalles de tolérance, pour les diamètres 

d’obstruction. 

- 204 -


5.2.2. Coefficients concordance de Lin 

Les figures II-4.8 et II-4.9 montrent les coefficients de Lin pour les accords intracompression. 

Dobs Lin borne itc- borne itc+ 

OR 0.962 -0.014 0.008 

JP5 0.962 -0.030 0.021 

JP8 0.967 -0.024 0.015 

JP12 0.919 -0.021 0.015 

LO5 0.942 -0.013 0.008 

LO8 0.946 -0.016 0.010 

LO12 0.945 -0.030 0.023 


1.00 

0.98 

0.96 

0.94 

0.92 

0.90 

0.88 

0.86 

0.84 

0.82 

0.80 

OR 

Dobs - Intra-compression 

JP5 

JP8 

JP12 

LO5 

LO8 

LO12 

Figure II-4. 8: Coefficients de concordance de Lin intra-compression pour les 

diamètres d’obstruction. 

Dref Lin borne itc- borne itc+ 

OR 0.962 -0.010 0.006 

JP5 0.962 -0.021 0.010 

JP8 0.967 -0.015 0.009 

JP12 0.919 -0.018 0.012 

LO5 0.942 -0.012 0.008 

LO8 0.946 -0.032 0.018 

LO12 0.945 -0.033 0.019 

Concordance lin 

1.00 

0.98 

0.96 

0.94 

0.92 

0.90 

0.88 

0.86 

0.84 

0.82 

0.80 

OR 

Dref - Intra-compression 

JP5 

JP8 

JP12 

LO5 

LO8 

LO12 

Figure II-4.9: Coefficients de concordance de Lin intra-compression pour les 

diamètres de référence. 

Les estimations des coefficients de Lin donnent des valeurs d’accords intra-compression 

excellentes. Tous les coefficients de corrélation de concordance sont supérieurs à 0.97 et 

sont relativement homogènes entre tous les niveaux de compression, que ce soit avec 

Dobs ou Dref. 

Il ne semble pas y avoir de différence significative entre les valeurs de concordance sur 

les images comprimées et originales. On constate que les intervalles de confiance pour 

quelques-unes des compressions sont moins étroits que ceux des originaux, par exemple 

pour JP5, JP8 et LO12 pour Dobs, et LO8 et LO12 pour Dref. 

5.2.3. Coefficients de variations 

Les coefficients de variations (CV) sont des indices de la variabilité de chaque paire de 

mesure (réplication 1 et réplication 2). Ils sont calculés selon la formule: 

CV = s , où s est l’estimation de l’écart type des deux mesures, et x− leur 

− 

x 

moyenne. 

- 205 -


Les 37 CV intra-compression pour chaque niveau de traitement ont été représentés à 

l’aide de diagrammes dits de ‘box-plot’ (figure II-4.10 et II-4.11). Les box-plots 

représentent la distribution des CV de chaque traitement par une boite. La boite contient 

50% des valeurs autour de la médiane. La médiane est indiquée par une barre horizontale 

dans la boite. Une ligne verticale indique l’étendue de la distribution, et les valeurs 

extrêmes ou aberrantes sont représentés par des croix. 

Ces diagrammes montrent que la distribution des coefficients de variation est plus étalée 

avec compression que sans, et de façon plus prononcée avec les Dobs. Toutefois, les 

médianes restent toutes très voisines de la médiane de CV sur les originaux. 

Nous avons testé si les niveaux de compression induisaient une différence significative 

des valeurs de CV à l’aide d’une ANOVA de Friedman à deux critères de classification 2 . 

Nous avons utilisé le programme 3S du logiciel BMDP. Les résultats des tests de 

Friedman pour MLOT et JPEG, avec Dobs ou Dref montrent que les traitements d’image 

n’ont pas un effet significatif sur les CV des mesures. 

Dobs, JPEG 

Dobs, MLOT 

0.25 

0.25 

coefficient de variation (%) 

0.2 

0.15 

0.1 

0.05 


0.2 

0.15 

0.1 

0.05 

0 

0 

1 2 3 4 

traitement image 

1 2 3 4 


Figure II-4.10: Box-plot des coefficients de variation avec les Dobs. Niveau 1: 

originaux; niveau 2: taux de 5; niveau 3: taux de 8; niveau 4: taux de 12 

Dref, JPEG 

Dref, MLOT 

0.25 

0.25 


0.2 

0.15 

0.1 

0.05 


0.2 

0.15 

0.1 

0.05 

0 

0 

1 2 3 4 


1 2 3 4 


Figure II-4.11: Box-plot des coefficients de variation avec les Dref. Niveau 1: 

originaux; niveau 2: taux de 5; niveau 3: taux de 8; niveau 4: taux de 12 

5.3. Analyse de la variance 

L’analyse de la variance permet de comparer les moyennes des réalisations des niveaux 

d’un facteur. Nous allons utiliser cet outil pour comparer entre elles les moyennes des 

mesures sur les originaux avec les moyennes des mesures à chaque taux de 

2 En anglais: Friedman’s two way ANOVA 

- 206 -


compression. Nous allons séparément étudier le facteur “compression JPEG”, et le 

facteur “compression MLOT”. Chacun de ces facteurs a quatre niveaux: 1 (originaux), 5, 

8, et 12. 

• Moyennes des réplications et des niveaux de compression 

Les figures II-4.12 et II-4.13 montrent les moyennes de la réplication 1 et de la réplication 

2 à chaque niveau de compression, ainsi que leur moyenne totale. 

On n’observe pas de tendance à la sous-estimation, ni à la surestimation des valeurs 

mesurées car il n’y a pas augmentation ou diminution systématiques des moyennes avec 

les niveaux de compression. 

Il n’y a pas de parallélisme entre l’évolution des moyennes des réplications selon le niveau 

de compression. Ceci indique la possibilité d’interactions entre les niveaux du facteur 

compression et les niveaux du facteur réplication. 

L’écart entre la moyenne de la réplication 1 et 2 semble plus importante avec JP 8 pour 

Dobs. Cet écart concorde avec la figure II-4.6, mais il n’est pas accompagné d’une 

variation inter-compression significative (figure II-4.4). 

L’analyse de la variance permet de vérifier si ces diverses observation correspondent à 

des variations significatives des moyennes. 

Dobs - JPEG 

Dobs - MLOT 

1.79 

1.79 

1.77 

1.77 

Moyenne 

1.75 

1.73 

1.71 

1.69 

OR J5 J8 J12 

Repl 1 

Repl 2 

Total 

Moyenne 

1.75 

1.73 

1.71 

1.69 

OR L5 L8 L12 

Repl 1 

Repl 2 

Total 

1.67 

1.67 

1.65 

1.65 

Figure II-4.12: Moyennes des réplications et moyennes totales pour chaque niveau 

de compression sur les diamètres d’obstruction. 

- 207 -


Dref - JPEG 

Dref - MLOT 

Moyenne 

3.44 

3.42 

3.40 

3.38 

3.36 

3.34 

3.32 

OR J5 J8 J12 

Repl 1 

Repl 2 

Total 

Moyenne 

3.44 

3.42 

3.40 

3.38 

3.36 

3.34 

3.32 

OR L5 L8 L12 

Repl 1 

Repl 2 

Total 

3.30 

3.30 

Figure II-4.13: Moyennes des réplications et moyennes totales pour chaque niveau 

de compression sur les diamètres de référence. 

• Analyse de la variance pour mesures répétées 

L’analyse de la variance permet de comparer globalement les moyennes des réplications 

et des niveaux de compression, et de tester si la différence observée entre les moyennes 

est significative. 

Quatre ANOVA pour mesures répétées ont été réalisées avec 2V de BMDP: une pour 

Dobs et JPEG, une pour Dobs et MLOT, une pour Dref et JPEG, une pour Dref et MLOT. 

Pour chacune, deux facteurs fixes et emboîtés 3 ont été définis: un facteur compression 

(par exemple MLOT) emboîté dans un facteur réplication. Les niveaux du facteur 

compression sont par exemple MLOT-1 (originaux), MLOT-5, MLOT-8, MLOT-12. Les 

niveaux du facteur réplication sont 1 et 2. Dans les ANOVA effectuées, aucun des 

facteurs et des interactions n’est significatif (p>0.05) pour Dobs avec MLOT et pour Dref 

avec JPEG et MLOT. Pour Dobs avec JPEG, l’interaction entre le facteur compression 

JPEG et le facteur réplication est à la limite d’être significative (p=0.06). L’écart entre les 

moyennes des deux réplications pour JP8 en est la cause. 

On en conclut que les moyennes des mesures pour chaque niveau du facteur 

compression ne sont pas significativement différentes, avec MLOT ou JPEG, pour Dref, et 

avec MLOT pour Dref. Un doute subsiste avec JPEG pour Dobs compte tenu d’une 

ANOVA à la limite d’être significative. 

6. Discussion 

6.1. Résultats des analyses de données 

Toutes les analyses graphiques tendent à montrer que les valeurs mesurées sur les 

images comprimées concordent avec les valeurs sur les originaux. Mais elles indiquent 

aussi que les dispersions intra-compressions sont un peu plus importantes sur les images 

comprimées que sur les originaux. Toutefois ces résultats ne sont pas statistiquement 

significatifs, comme l’attestent les coefficients de concordance de corrélation ou les 

analyses de la variance. 

3 En anglais facteurs emboités se dit: nested factors 

- 208 -


On n’observe aucune tendance systématique à une surestimation des valeurs, ou à une 

sous-estimation des valeurs du fait de la compression. On n’observe pas de différence 

claire entre les méthodes de compression JPEG ou de MLOT aux niveaux de 

compression 5, 8, ou 12. Il n’y a pas de tendance linéaire, quadratique ou cubique 

d’augmentation ou de diminution des valeurs mesurées lorsque le taux de compression 

augmente. 

Il est difficile de porter une conclusion catégorique sur nos travaux de QCA car certaines 

analyses sont justes à la limite d’être significatives. Aucune des différences testées entre 

les images originales et comprimée n’est significative, une seule en est à la limite 

(ANOVA pour mesures répétés avec JPEG pour Dobs). 

6.2. Aspects méthodologiques du protocole expérimental 

Toutes les mesures QCA ont été effectuées dans des conditions de répétabilité 

(comparaisons intra-opérateur). Ne disposant que d’un seul opérateur, il n’a pas été 

possible de travailler dans des conditions de reproductibilité (comparaisons interobservateurs). 

En vue d’améliorer le protocole et la méthode d’analyse de ce type de 

campagne d’évaluation, l’implication de plusieurs opérateurs est recommandable. 

6.3. Robustesse de la QCA à la compression 

Les résultats de cette étude ne sont valables que pour l’algorithme de QCA employé, et 

pour les méthodes de compression JPEG et MLOT, à des taux de compression de 5, 8, et 

12. Compte tenu de l’augmentation de variabilité non significative observée 

graphiquement, on peut se demander si pour des taux de compression plus importants, 

l’influence de la compression deviendrait significative. Il semble logique que cette 

influence se fasse sentir plus tôt avec JPEG, à cause des artefacts de blocks qui sont 

susceptibles de modifier les contours détectés par le système. 

7. Conclusion 

Nous avons observé une légère augmentation de variabilité des mesures sur les images 

comprimées par rapport aux originaux, mais les tests statistiques ne permettent pas de 

conclure à des différences significatives. Il semble utile de compléter ce travail par une 

étude incluant plus de lésions et plus d’un opérateur avant de conclure définitivement sur 

l’utilisation des images comprimées pour les mesures QCA. Au moment de la rédaction 

de ce mémoire, une telle étude est en cours sous l’égide de l’American College of 

Cardiology. 

Quelles que soient les conclusions qui seront portées, il faut garder en mémoire les 

nombreuses possibilités d’adapter le traitement de l’image comprimée lorsque l’on connaît 

les conditions d’utilisation de l’image. Ainsi, [DING-96] a montré qu’une régularisation de 

l’image JPEG, selon un approche similaire à celle développée au chapitre II-5, permet 

d’améliorer de façon significative la détection des contours sur des images très 

comprimées. 

- 209 -

CHAPITRE II-5 

CONCLUSION DE LA PARTIE 

EVALUATION 

- 210 -

Chapitre I-5: Conclusion de la partie évaluation 

1. Objet des évaluations 

La deuxième partie de ce mémoire a été consacrée à l’évaluation de la qualité 

d’angiographies cardiaques ayant subi une compression avec perte. 

Nous avons étudié l’impact des compressions MPEG, JPEG et MLOT à un taux maximum 

de 12:1 sur les interprétations visuelles (évaluations diagnostiques de Lille et Houston) et 

sur les mesures quantitatives (évaluation QCA de Leiden). 

Avant de synthétiser l’apport de ces expérimentations, nous allons évoquer les 

enseignements tirés en matière de la qualité subjective des images comprimées. 

2. Qualité subjective 

Les tests de qualité visuelle et les expériences d’évaluation ont été effectuées avec des 

moniteurs noirs et blancs médicaux. Il est utile de souligner l’importance des conditions de 

visualisation sur l’impression subjective pour une image originale, et sur la visibilité 

d’artefacts de compression. Les conditions de visualisation des systèmes d’angiographies 

sont parmi les plus exigeantes. 

2.1. Comparaison de JPEG, MPEG et MLOT 

Les observations subjectives recueillies au cours de ces années d’expériences avec 

ingénieurs et médecins nous permettent de conclure à une supériorité incontestée en 

matière de qualité visuelle de la méthode MLOT par rapport aux standards JPEG et 

MPEG. A un taux de 12:1, JPEG et MPEG présentent des artefacts de blocs alors que 

MLOT se distingue peu de l’original. A un tel taux, les trois algorithmes ont une qualité 

visuelle bien acceptée par les médecins. A partir de taux de 16:1, JPEG et MPEG 

présentent des artefacts de blocs importants et une perte de netteté. Les commentaires 

des médecins nous avaient incités à ne pas considérer un tel taux pour ces algorithmes 

dans nos évaluations. En revanche, MLOT présente des artefacts légers: une modification 

de la texture du bruit principalement. 

2.2. Visibilité de la présence de la compression selon les observateurs 

L’appréciation de la qualité d’image subjective dépend beaucoup de la spécialité de 

l’observateur. Les jugements portés par les développeurs d’algorithmes ou les ingénieurs 

(les “techniciens”) étaient différents de ceux des médecins (les “cliniciens”). En particulier, 

une grande attention a été portée par les techniciens sur les artefacts de blocs. Il s’est 

avéré que les cliniciens étaient beaucoup moins gênés que prévu. Comme les 

angiographies cardiaques sont par nature des images très bruitées, un niveau relatif 

d’artefacts semble tolérable dès lors que les ventricules et les vaisseaux présentent un 

bon contraste. 

Cette remarque confirme qu’il est indispensable d’évaluer la qualité des images 

comprimées avec leurs utilisateurs finaux. 

A des taux de 12:1, l’une des deux équipes médicales impliquées dans les évaluations 

subjectives ne s’est jamais aperçu que les images étaient comprimées, que ce soit avec 

MPEG ou MLOT, même en faisant porter l‘attention sur une zone ‘artéfactée’. Dans l’autre 

équipe, les médecins arrivaient en général à reconnaître la présence de la compression, 

assez souvent pour MLOT et très souvent pour JPEG. Cette différence peut être due aux 

- 211 -


conditions d’acquisition et de visualisation d’un site à l’autre, et à une connaissance 

inégale sur les aspects techniques du traitement de l’image entre les deux équipes. 

Il n’est pas pareil de porter un jugement qualitatif sur une image, et de pouvoir établir un 

diagnostic correct. Dans l’équipe qui reconnaissait les images comprimées (en les jugeant 

légèrement moins bonnes que des originaux), les interprétations visuelles diagnostiques 

n’étaient pas significativement différentes avec ou sans compression. 

2.3. Effet des post-traitements 

Quelques expérimentations pilotes ont mis en évidence l’impact majeur de certains posttraitements 

sur la visibilité des artefacts de compression. Le principal post-traitement dont 

l’utilisation doit être surveillée en combinaison avec la compression est le renforcement de 

contour. Ensuite viennent le zoom et le réglage du contraste. 

3. Evaluations diagnostiques 

3.1. Conditions expérimentales 

Nous avons cherché à savoir si la performance diagnostique concernant les tâches 

d’interprétation visuelle des angiographies était modifiée par la compression, avec JPEG, 

MPEG et MLOT à un taux de 12:1. 

Nous avons tenté de placer les observateurs dans des conditions identiques à celles dans 

lesquelles ils établissent normalement leur diagnostic, en leur demandant d’effectuer des 

tâches correspondant à leurs pratiques courantes. En conséquence, notre protocole 

expérimental a été basé sur des examens complets comportant plusieurs centaines 

d’images chacun, visualisé sur un système identique aux systèmes cliniques. Nous avons 

enregistré l’interprétation visuelle complète des angiographies, impliquant la localisation et 

la classification d’anormalités sur 3 à 5 segments de ventricule gauche et 15 segments 

d’artère coronaires. 

3.2. Méthode statistique et variabilité des observateurs 

La méthodologie statistique a été basée sur l’estimation de concordances interobservateur, 

intra-observateur et inter-compression. 

Nous avons constaté des concordances inter- et intra-observateur bonnes à excellentes. 

De nombreux travaux font état d’une variabilité importante des interprétations visuelles sur 

les films de radio-cinéma ([KUSS-92]). Nous pensons qu’une approche rigoureuse pour la 

localisation des segments d’artères coronaires est indispensable à ce genre d’étude et 

qu’elle nous a permis de limiter le problème. Dans notre première campagne d’évaluation, 

ce problème a été observé malgré une attention portée sur le sujet. Nous l’avons résolu 

en créant un score global par artère principale à partir des réponses sur tous les 

segments. Dans la deuxième étude, une cartographie des coronaires de chaque patient a 

été établie à partir des images réelles, et utilisée pour toutes les occurrences originales ou 

comprimées du même patient. Le deuxième élément de notre protocole qui contribue 

vraisemblablement à de bons accords est l’utilisation d’une réponse qui discrimine les 

anormalités coronaires de façon sémantique, au lieu d’une réponse basée sur un 

pourcentage de sténose. 

- 212 -


3.3. Principaux résultats 

Nos résultats montrent qu’il n’y a aucune différence significative des concordances sur les 

ventriculographies avec ou sans compression. Globalement, il n’y a pas de différence 

significative des concordances sur les coronarographies. Quelques analyses ont donné 

des concordances modifiées par la compression, mais les tests sont justes à la limite 

d’être significatifs. Dans la campagne d’évaluation de Lille, un observateur seulement 

présente une concordance inter-compression entre les originaux et MPEG inférieure aux 

autres concordances inter-compression pour les trois artères coronaires, mais pas de 

façon significative. Dans l’évaluation de Houston, la concordance globale intraobservateur 

des segments coronaires distaux uniquement est légèrement inférieure aux 

autres pour MLOT. Compte tenu de l’ensemble des résultats, nous pensons que ces 

observations ne correspondent pas à des phénomènes représentatifs. 

Les campagnes d’évaluation diagnostiques ne permettent pas de conclure à une 

modification significative de l’interprétation visuelle sur des angiographies comprimées. 

Ces résultats sont très positifs quant à l’application de la compression. Ils méritent d’être 

complétés par des études similaires. De plus , des évaluations axées sur des pathologies 

particulières (thrombus, dissection) seraient également utiles car les cas sélectionnés 

aléatoirement dans une population de patient de service d’hémodynamique en incluent un 

nombre assez faible. Au moment de la rédaction de ce mémoire, une étude multicentrique 

est en cours sous l’égide de l’ACC avec l’algorithme JPEG. Des séquences 

extraites d’examens et présentant des types d’anormalités précises ont été sélectionnées 

sur plusieurs sites américains et européens. Ils font l’objet d’une interprétation visuelle par 

des observateurs de plusieurs institutions. 

4. Evaluation QCA 

Nous avons cherché à savoir si les mesures quantitatives était modifiées par la 

compression, avec JPEG et MLOT à des taux de 5, 8 et 12:1. 

Nous avons observé une légère augmentation de variabilité des mesures sur les images 

comprimées par rapport aux originaux. Mais les tests statistiques ne permettent pas de 

conclure à des différences significatives. Il semble utile de compléter ce travail par une 

étude incluant plus de lésions et plus d’un opérateur avant de conclure définitivement sur 

l’utilisation des images comprimées pour les mesures QCA. Au moment de la rédaction 

de ce mémoire, une telle étude est en cours sous l’égide de l’American College of 

Cardiology, avec JPEG. 

Quelles que soient les conclusions qui seront portées, il faut garder en mémoire les 

nombreuses possibilités d’adapter le traitement de l’image comprimée lorsque l’on connaît 

les conditions d’utilisation de l’image. Ainsi, [DING-96] a montré qu’une régularisation de 

l’image JPEG, selon un approche similaire à celle développée au chapitre I-4, permet 

d’améliorer de façon notoire la détection de contours sur des images présentant de 

sévères artefacts de blocs. 

5. Perspectives 

L’évaluation de la compression appliquée aux angiographies cardiaques est un sujet 

d’actualité. Face à l’essor des solutions entièrement numériques des laboratoires de 

cathétérismes, la communauté cardiologique est à la recherche d’une réponse sur les 

limites d’applications de la compression avec perte. 

- 213 -


Les résultats de nos études sont très prometteurs, bien qu’ils méritent d’être complétés. 

Tout laisse à penser que les algorithmes standards à des taux moyens (8 à 12:1) vont 

être encore plus largement utilisés si les comités médicaux ad hoc se prononcent sur les 

tâches pour lesquels ils sont appropriés (diagnostic primaire, QCA, ou revue du dossier 

patient). On peut s’attendre à pouvoir travailler avec des taux supérieurs avec des 

méthodes dédiées telles que MLOT. 

- 214 -

BILAN ET PERSPECTIVES 

- 215 -

Bilan et perspectives 

Motivation de ces travaux 

Le fil d’Ariane de cette thèse a été une question riche de conséquences pour les 

laboratoires de cathétérismes cardiaques: peut-on utiliser la compression avec perte 

d’information contrôlée sur les angiographies? 

L’accès à des solutions entièrement numériques pour le plus grand nombre d’institutions 

passera par la digitalisation de tous les maillons de la chaîne d’imagerie: acquisition, 

stockage, visualisation dynamique, et échange. Bien sûr, le maillon le plus faible 

détermine la performance, ou le coût de l’ensemble. La compression est une solution 

prometteuse pour rendre la chaîne viable. Mais quelle méthode faut-il choisir, et comment 

valider ce choix? 

Face à ces deux interrogations, nos travaux ont porté en parallèle sur quelques aspects 

techniques de la compression, et sur l’évaluation de la qualité des images comprimées 

dans un contexte clinique. 

Synthèse de nos recherches 

Nos développements algorithmiques ont été validés dans le cadre d’une méthode à base 

de Full-Frame DCT. L’étude de l’adaptabilité de la quantification et de l’impact du 

renforcement de contour sur les images comprimées ont conduit à des résultats 

favorables par rapport au standard JPEG. 

Nos évaluations ont porté sur l’interprétation visuelle et sur les mesures quantitatives de 

sténoses avec les méthodes de compression standard JPEG et MPEG, et avec la 

méthode dédiée MLOT développée par Philips. Un taux maximum de 12:1 a été utilisé 

dans nos campagnes d’évaluation. A partir de protocoles expérimentaux basés sur les 

concordances inter-observateur, intra-observateur et inter-compression, nous avons pu 

observer que ni les interprétations visuelles, ni les mesures quantitatives ne présentent de 

différences significatives avec ou sans compression (dans les conditions de nos études). 

Ces résultats méritent d’être confirmés par d’autres travaux, notamment à cause de la 

limite de signification d’un petit nombre d’analyses détaillées des données avec MPEG et 

JPEG. 

Globalement, les résultats de ces expériences sont très prometteurs, car ils attestent que 

la compression est acceptable pour le travail du clinicien. 

Nous souhaitions mettre au point une nouvelle méthodologie d’évaluation de la 

performance diagnostique applicable en angiographie cardiaque. Effectivement, il est 

possible d’estimer, dans des conditions proches de la pratique clinique courante, la 

reproductibilité des observateurs avec ou sans compression. 

Nous nous attendions à pouvoir démontrer qu’une méthode de compression dédiée 

surpasse les méthodes standard JPEG et MPEG. Effectivement, la supériorité d’une 

méthode telle que MLOT est incontestable en matière de rapport signal à bruit et de 

qualité visuelle. Avec un peu plus de développement et le test sur une plus grande base 

d’images, nous pensons qu’il serait possible de donner le même type de confirmation 

avec la méthode à base de Full-Frame DCT. Nous estimons qu’à des taux supérieurs à 

ceux de nos évaluations diagnostiques et quantitatives, il est probable que MLOT 

surpasserait les standards d’un point de vue de la performance diagnostique, mais que 

jusqu’à un taux de 12:1, les standards sont également acceptables. 

- 216 -


Les résultats de nos travaux contribuent donc à montrer que la compression est viable 

pour les angiographies cardiaques, et qu’un algorithme dédié tel que MLOT est le choix le 

plus approprié en terme de performance. 

Critères de choix pour une méthode de compression: 

scientifiques ou pragmatiques? 

Mais d’autres considérations doivent aussi être intégrées lors de la sélection d’une 

méthode de compression. Le meilleur algorithme, même validé cliniquement, n’est pas 

forcément celui qui va s’imposer dans la pratique. Voilà un enseignement important relatif 

au contexte général de ce travail, et qui dépasse le cadre purement scientifique. 

Avant de se déterminer pour l’une ou l’autre méthode, trois questions doivent être 

clarifiées: 

1. A quoi vont servir les images comprimées? 

Lors des essais techniques d’un algorithme, il faut intégrer dès le départ les propriétés 

intrinsèques des images, les conditions de visualisation (moniteurs, traitements d’image), 

les tâches auxquelles sont destinées les images comprimées. Nous avons travaillé sur 

quelques-unes des nombreuses possibilités d’adapter la compression à ces éléments. 

2. Sur quoi vont être utilisées les images comprimées? 

Cette question nous ramène aux maillons de la chaîne numérique d’imagerie. Au début de 

ce projet, le stockage des images en temps réel pendant l’acquisition et leur restitution 

dynamique constituaient le maillon faible. Les disques durs utilisés étaient extrêmement 

onéreux, de capacité limitée, et présentaient une courbe d’évolution prix/performance très 

modérément rapide. Compte tenu de l’environnement complexe et propriétaire à l’intérieur 

d’un système d’angiographie cardiaque, il était légitime d’envisager un hardware de 

compression avec perte basé sur une méthode dédiée et sans compromis de qualité, 

ayant attesté de ses performances cliniques. Mais en quelque temps, l’évolution des 

performances des disques durs est devenue exponentielle, avec des prix en chute libre. 

La compression pour le maillon acquisition n’était plus justifiée. 

Les autres parties de la chaîne commençaient alors à poser un problème. Le compact 

disc s’est imposé pour remplacer le film de radio-cinéma en tant que médium numérique 

remplissant le même rôle (stockage, visualisation dynamique, échange). Lors de 

l’introduction par l’ACC en 1995 du compact disc cardiologique, les lecteurs de CD ne 

permettaient pas une visualisation dynamique directement depuis le disque. Il fallait 

transférer pendant 15 à 20 mn l’examen sur un disque dur avant d’avoir accès aux 

séquences dynamiquement. Le maillon faible devenait la visualisation depuis le médium. 

Conforté par les résultats préliminaires de nos campagnes d’évaluation sur le potentiel de 

la compression avec perte, Philips a ajouté un format comprimé avec JPEG sur son CD 

(en plus des images originales). Compte tenu de l’application de la compression sur des 

consoles de visualisation de prix modéré, un investissement dans un hardware dédié 

n’était pas envisageable et un hardware de décompression JPEG a été utilisé. D’autant 

plus que le problème apparaissait déjà comme temporaire avec l’apparition de lecteurs de 

CD toujours plus rapides. A cette époque, l’ACC a entrepris une série d’études pour 

valider les limites d’application de JPEG. La motivation principale était l’utilisation des 

images JPEG sur CD. 

Aujourd’hui, ce maillon ne pose plus de problème, car les lecteurs sont devenus 

suffisamment rapides. 

Mais l’essor des autoroutes de l’information motive une autre approche pour échanger 

des images entre institutions: pourquoi ne pas utiliser un modem, ou Internet? La faible 

- 217 -


bande passante des lignes de télécommunication est désormais le maillon faible. Compte 

tenu de la démocratisation des outils multimédia, un autre standard devient un sérieux 

candidat: MPEG. 

3. Comment évolue la technologie sur laquelle la compression est appliquée? 

L’historique abordé ci-dessus invite à considérer de près le maillon sur lequel est 

appliquée la compression. L’aspect temporaire ou non de sa faiblesse doit être anticipé. 

Pendant que le pôle d’intérêt pour la compression s’est déplacé de l’acquisition vers le 

médium, puis vers la ligne de communication, un besoin clair s’est révélé: celui 

d’employer des standards. Le coût de réalisation hardware d’un algorithme dédié est 

rédhibitoire pour un besoin qui s’avère temporaire, sur des consoles de travail de prix 

modéré, pour des petites séries. 

Quel avenir pour la compression en angiographie cardiaque? 

Le progrès des technologies pendant la durée de ce projet a été étonnant et a bouleversé 

les attentes par rapport à un système de compression en angiographie cardiaque. 

L’évolution des mentalités a aussi été remarquable. Au début de nos recherches, l’idée de 

la compression avec perte appliquée en routine était presque en avance sur son temps. 

Elle suscitait de la méfiance de la part du monde médical. L’accent était mis sur 

l’obtention de la meilleure qualité possible. Aujourd’hui, l’accent porte sur la fonctionnalité 

supplémentaire apportée par le numérique. 

Il nous semble que l’avenir de la compression en angiographie cardiaque est très 

prometteur. Il est vraisemblable qu’elle ne sera pas appliquée pour l’acquisition et 

l’archivage tant qu’une multitude d’études n’aura pas prouvé son innocuité et que la 

législation ne l’approuvera pas comme équivalente aux originaux. Mais on voit fleurir les 

applications avec télécommunication, dossiers patients numériques et multimédia etc... La 

démocratisation de la compression avec perte en cardiologie sera facilitée par 

l’incorporation d’algorithmes standards dans le format DICOM, par des travaux 

d’évaluation complémentaires de ceux présentés dans ce mémoire, par l’amélioration des 

performances des standards eux-mêmes. 

- 218 -

REFERENCES BIBLIOGRAPHIQUES 

- 219 -

[AFNO-73] AFNOR : " Statistique et Qualité : Traitement statistique des Données - 

Détermination d'un 

Intervalle Statistique de Dispersion " , NF X 06-032, 1973. 

[AHME-74] AHMED N., NATARAJAN T., RAO K.R. : " Discrete Cosine Transform " , 

IEEE Trans. on 

Computers, 1974,Vol C-23, p90-93. 

[AKAN-92] AKANSU A.N., HADDAD R.A. : " Multiresolution Signal Decomposition - 

Transforms, Subbands, Wavelets " , Morristown : Academic Press, 1992, 

376p. 

[AKRO-92] AKROUT N., DIAB C., PROST R., GOUTTE R., AMIEL M. : " Subband 

Directional Vector 

Quantization in Radiological Image Compression " , SPIE Medical Imaging, 

1992,Vol 1653, 

N° 6, p203-212. 

[AKRO-93] AKROUT N., PROST R., GOUTTE R. : " A Fast Algorithm for Vector 

Quantization in 

Radiological Image Compression " , SPIE Medical Imaging, 1993, Vol 1897, 

p259-265. 

[ALTM-83] ALTMAN D.G., BLAND J.M. : " The Analysis of Method Comparison Studies 

" , Statistician, 

1983,Vol 32, p307-317. 

[ARNE-79] ARNETT E.N., ISNER J.M., REDWOOD D.R., KENT K.M., BAKER W.P., 

ACKERSTEIN H., 

ROBERTS W.C. : " Coronary Artery Narrowing in Coronary Heart Disease : 

Comparison of 

Cineangiographic and Necropsy Findings " , Annals of Internal Medicine, 

1979,Vol 91, N° 3, p350-356. 

[BARL-94] BARLAUD M., SOLE P., GAIDON T., ANTONIONI M., MATHIEU P. : " 

Pyramidal Lattice 

Vector Quantization for Multiscale Image Coding " , IEEE Trans. on Image 

Processing, 1994,Vol 3, N° 4, p367-381. 

[BEAU-90] BEAUMAN G.J., VOGEL R.A. : " Accuracy of Individual and Panel Visual 

Interpretation of 

Coronary Arteriograms : Implications for Clinical Decisions " , J. Am. Col. 

Cardiol., 1990,Vol 16, N°1, p108-113. 

[BERE-94] BERETTA P.V., PROST R., AMIEL M. : " Optimal Bit Allocation for Full- 

Frame DCT Coding 

Schemes - Application to Cardiac Angiography " , SPIE Medical Imaging, 

- 220 -

1994,Vol 2164, p291-301. 

[BERE-95] BERETTA P.V., PROST R. : " Unsharp Masking and Its Inverse Processing 

Integrated in a 

Compression / Decompression Scheme - Application to Cardiac Angiograms 

" , SPIE Medical Imaging, 1995,Vol 2431, p233-244. 

[BERT-93] BERTRAND M.E., LABLANCHE J.M., BAUTERS C., LEROY F., MAC 

FADDEN E. : " 

Discordant Results of Visual and Quantitative Estimates of Stenosis Severity 

Before and 

After Coronay Angioplasty " , Catheterization and Cardiovascular Diagnosis, 

1993,Vol 28, p1-6. 

[BLAN-86] BLAND J.M., ALTMAN D.G. : " Statistical Method for Assessing Agreement 

between two 

Methods of Clinical Measurement " , The Lancet, 1986,Vol 8, p307-310. 

[BREE-92] BREEUWER M., HEUSDENS R., ZWART P. : " Data Compression of X-Ray 

Angiographic 

Image Sequences " , Eindhoven : Philips research, 1992, 27p,Technical note 

297/92. 

[BREE-94] BREEUWVER M., HEUSDENS R., ZWART P. : " Overlapped Transform 

Coding of Medical 

X-ray Images " , SPIE Medical Imaging, Newport Beach (CA), 1994, Vol 

2164, p264-275. 

[BREE-95] BREEUWER M., HEUSDENS R., GUNNEWIEK R.K., ZWART P., HAAS 

H.P.A. : " Data 

Compression of X-ray Cardio-angiographic Image Series " , International 

Journal of Cardiac Imaging, 1995,Vol 11, N° 3, p179-186. 

[BROW-77] BROWN B.G., BOLSON E.L., FRIMER M., DODGE H.T. : " Quantitative 

Coronary Arteriography : Estimation of Dimension, Hemodynamic Resistance, 

and Atheroma Mass of Coronary Artery Lesions 

Using the Arteriogram and 

Digital Computation " , Circulation, 1977,Vol 55, p329-337. 

[BROW-82] BROWN B.G., BOLSON E.L., DODGE H.T. : " Arteriographic Assessments 

of Coronary 

Arteriosclerosis : Review of Current Methods, theirs Limitations and Clinical 

Applications " , Arteriosclerosis, 1982,Vol 2, p1-15. 

[BROW-86] BROWN B.G., BOLSTON E.L., DODGE H.T. : " Quantitative Computer 

Techniques for 

Analysing Coronary Arteriograms " , Prog. Cardiovasc. Dis., 1986,Vol 18, 

p403-418. 

[CASS-89] CASSEREAU P.M., STAELIN D.H., DE JAGER G. : " Encoding of Images 

Based on a Lapped Orthogonal Transform " , IEEE Trans. Com., 1989,Vol 37, N° 2, 

- 221 -

p189-193. 

[CHAK-90] CHAKRABORTY D.P., WINTER L.H.L. : " Free Response Methodology : 

Alternate Analysis 

and a New Observer-Performance Experimental " , Radiology, 1990,Vol 

174, N° 3, p873- 881. 

[CHAN-89a] CHAN K.K., LOU S-L., HUANG H.K. : " Full-Frame Transform Coding of 

Cross-Sectional 

Images " , SPIE Medical Imaging, 1989,Vol 1091, p77-82. 

[CHAN-89b] CHAN K.K., LOU S-L., HUANG H.K. : " Radiological Image Compression 

Using Full-Frame 

Cosine Transform with Adaptive Bit-Allocation " , Computerized Medical 

Imaging & Graphics, 1989, Vol 13, N° 2, p153-159. 

[CHEN-76] CHEN W-H., FRALICK S.C. : " Image Enhancement Using Cosine 

Transform Filtering " , 

Proc. of the symp.on current math. pbs in im. scie, Palo Alto (CA), 1976, 

p186-192. 

[CHIT-90] CHITPRASERT B., RAO K.R. : " Discrete Cosine Transform Filtering " , 

Signal Processing, 

1990,Vol 19, p233-245. 

[CLAR-85] 

1985, 432p. 

CLARKE R.J. : " Transform Coding of Images " , London, Academic Press, 

[COHE-60] COHEN J. : " A Coefficient of Agreement for Nominal Scales " , Educ. 

Psychol. Meas., 1960,Vol 20, p37-46. 

[COSM-93a] COSMAN P.C., OEHLER K.L., RISKIN E.A., GRAY R.M. : " Using Vector 

Quantization for 

Image Processing " , Proceedings of the IEEE, 1993,Vol 81, N° 9, p1326- 

1341. 

[COSM-93b] COSMAN P.C. : " Perceptual Aspects of Vectors Quatization " , Thèse : 

Stanford University, USA, 1993, 116p. 

[COSM-94] COSMAN P.C., DAVIDSON H.C., BERGIN C.J., TSENG C-W, MOSES L.E., 

RISKIN E.A., 

OLSHEN R.A., GRAY R.M. : " Thoracic CT Images : Effect of Lossy Image 

Compression on 

Diagnotic Accuracy " , Radiology, 1994,Vol 190, N° 2, p517-524. 

[CUTL-52] CUTLER C.C. : " Differential Quantization of Communication Signals " , US 

Patent, 1952, N° 2605361. 

[DERO-77] DEROUEN T.A., MURRAY J.A., OWEN W. : " Variability in the Analysis of 

Coronary Arteriograms " , Circulation, 1977,Vol 55, N° 2, p324-328. 

- 222 -

[DETR-75] DETRE K.M., WRIGHT E., MURPHY M.L., TAKARO T. : " Observer 

Agreement in the Evaluating Coronary Angiograms " , Circulation, 

1975,Vol 52, p979-986. 

[DING-95] 

Compresion 

DING Y., BAUDIN O., BERETTA P., PROST R. : " Medically Adapted JPEG 

Scheme " , SPIE Medical Imaging, 1995,Vol 2431, p516-525. 

[ECKS-95] ECKSTEIN M.P., MORIOKA C.A., WHITING J.S., EIGLER N. : " 

Psychophysical Evaluation of the Effect of JPEG, Full-Frame DCT, Wavelet Image 

Compression on Signal Detection in Medical Image Noise " , Proc. SPIE, 1995, Vol 

2436, , p79-89. 

[EEUW-90] EEUWICK VAN H. : " The Influence of Edge Enhancement on Analytical 

Programs " , Best : Philips Medical Systems, 1990, 35p, Internal Report, Vol XDB- 

048-816. 

[ESKI-95] ESKICIOGLU A.M., FISHER P.S. : " Image Quality Measures and Their 

Performance " , 

IEEE Trans. Com., 1995,Vol 43, N° 12, p2959-65. 

[FLEI-81] FLEISS J.L. : " Statistical Methods for Rates and Proportions", 2 nd edition, 

New York : John Wiley, 1981, "The Measurement of Interrater Agreement",p214-224. 

[FLEM-91] FLEMING R.M., KIRKEEIDE R.L., SMALLING R.W., GOULD K.L. : " 

Patterns in Visual Interpretation of Coronary Arteriograms as Detected 

by Quantitative Coronary 

Arteriography", J. AM. COL. CARDIOL., 

1991, Vol 18, N° 4, p945-951. 

[GALB-78] GALBRAITH J.E., MURPHY M.L., SOYZA N. DE : " Coronary Angiogram 

Interpretation / Interobserver Variability " , J. Am. Med. Assoc., 1978,Vol 240, 

N° 19, p2053-2056. 

[GENS-71] GENSINI G.G., KELLY A.E., DACOSTA B.C.B., HUNTINGTON P.P. : " 

Quantitative Angiography : The Measurement of Coronary Vasomobility in the 

Intact Animal and Man " , Chest, 1971,Vol 60, p522-530. 

[GERS-82] 

Theory, 

GERSHO A. : " On the Structure of Vector Quantizers " , IEEE Trans. Inform. 

1982,Vol 28, N° 2, p157-166. 

[GRAY-84] GRAY R.M. : " Vectors Quantization " , IEEE ASSP Mag, 1984,Vol 1, N° 2, 

p4-29. 

[GRIM-96] GRIMAUD J., LAI M., THORPE J., ADELEINE P., WANG L., BAKKER G.J., 

PLUMMER D.L., 

TOFTS P.S., MCDONALD W.I., MILLER D.M. : " Quantification of MRI 

Lesion Load in Multiple Sclerosis : a Comparison of Three Computer-Assisted 

Techniques " , Magnetic Resonance Imaging, 1996,Vol 14, N° 5, p495-505. 

[HANL-82] HANLEY J.A., MC NEIL B.J. : " The Meaning and Use of the Area under a 

ROC Curve " , 

Radiology, 1982,Vol 143, p29-36. 

- 223 -

[HERM-92] HERMILLER J.B., CUSMA J.T., SPERO L.A., FORTIN D.F., HARDING 

M.B., BASHORE T.M. : " Quantitative and Qualitative Coronary Angiographic 

Analysis : Review of Methods, Utility, and Limitations " , Catheterization and 

Cardiovascular Diagnosis, 1992,Vol 25, p110- 131. 

[HIND-94] HINDEL R. : " Implementation of the DICOM 3.0 Standard - A Pragmatic 

Handbook " , Oak Book (IL) : Robert Hindel, Radiological Society of North 

America, 1994, 118p. 

[HO -91] HO B.K.T., CHAO J., WU C.S., HUANG H.K. : " Full-Frame Cosine 

Transform Image Compression for Medical and Industrial Applications " , 

Machine Vision and Applications, 

1991, Vol3, p89-96. 

[HO B-93] HO B.K.T., TSENG V., MA M., CHEN D. : " A Mathematical Model to 

Quantify JPEG Block 

Artifacts ", SPIE Medical Imaging, Newport Beach (CA), 

PACS : Design and Evaluation , 

1993, p22-27. 

[HUFF-52] HUFFMAN D.A. : " A method for the Construction of Minimum Redundancy 

Codes " , Proc. Institute of Radio Engineers, 1952,Vol 40, N° 9, p1089-1101. 

[ISHI-90] ISHIGAKI T., SAKUMA S., IKEDA D., ITOH Y., SUZUKI K.A., IWAI S. : " 

Clinical Evaluation of Irreversible Image Compression : Analysis of Chest Imaging with 

Computed Radiology " , Radiology, 1990,Vol 175, N° 3, p739-743. 

[JACQ-93] JACQUIN A.E. : " Fractal Image Coding : a Review " , Proceedings of the 

IEEE, 1993,Vol 81, N° 10, p1451-1465. 

[JAIN-89] JAIN A.K. : " Fundamentals of Digital Image Processing " , Englewood Cliffs : 

Prentice Hall, 1989, 569p. 

[KALB-90] KALBFLEISCH S.J., MCGILLEM M.J., PINTO I.M.F., KAVANAUGH K.M., 

DEBOE S.F., 

MANCINI G.B.J. : " Comparison of Automated Quantitative 

Coronary Angiography with Caliper Measurements of Percent 

Diameter Stenosis " , American Journal of Cardiology, 1990,Vol 65, 

p1181-1184. 

[KAST-91] KASTAGGELOS A.K., BIEMOND J., SCHAFER R.W., MERSEREAU R.M. : 

" A Regularized 

Iterative Image Restoration Algorithm " , IEEE Trans. Sig. Proc., 1991,Vol 

39, N° 4, p914- 928. 

[KATR-88] KATRITSIS D., LYTHALL D.A., COOPER I.C., CROWTHER A., WEBB- 

PEPLOE M.M. : " 

Assessment of Coronary Angioplasty : Comparison of Visual Assessment, 

Hand-Held Caliper Measurement and Automated Digital Quantification " , Catheterization 

and Cardiovascular Diagnosis, 1988,Vol 15, p237-242. 

[KERN-91] KERN M.J. : " The Cardiac Catheterization HandBook " , Saint Louis : Mosby 

Year Book, 1991, 512p. 

- 224 -

[KONI-94] KONING G., MEURS VAN B.A., HAAS H.P.A., REIBER J.H.C. : " Effect of 

Data Compression on Quantitative Coronary Measurements " , 

Catheterization and Cardiovascular 

Diagnosis, 1994,Vol 33, p1-11. 

[KONI-97] KONING G., BERETTA P.V., ZWART P., HEKKING E., REIBER J.H.C. : " 

Effect of Lossy Data Compression on Quantitative Coronary Measurements " , 

International Journal of 

Cardiac Imaging, 1997, Vol 13, p261-270. 

[KUSS-92] KUSSMAUL W.G., POPP R.L., NORCINI J. : " Accuracy and Reproducibility 

of Visual Coronary Stenosis Estimates Using Information from Multiple Observers " , 

Clin. Cardiol., 1992,Vol 15, p154-162. 

[LEGA-91] LEGALL D.J. : " MPEG : A video Compression Standard for Multimedia 

Applications " , 

Communications of the ACM, 1991,Vol 34, N° 4, p46-58. 

[LIEN-95] LIENARD J. : " Compression Réversible d'Images Angiographiques 

Numérisées " , Thèse : Université Paris XI, 1995, 93p. 

[LIN -89] LIN L.I. : " A Concordance Correlation Coefficient to Evaluate Reproducibility 

" , Biometrics, 

1989,Vol 45, p255-268. 

[LO -85] LO S-C.B., HUANG H.K. : " Radiologic Image Compression : Full-Frame 

Bit-Allocation 

Technique " , Radiology, 1985,Vol 155, p811-817. 

[LO -91] LO S-C.B., KRASNER B., MUN S.K., HORII S.C. : " Full-Frame Entropy 

Coding for Radiological Image Compression " , SPIE Medical Imaging, 1991,Vol 

1444, p265-271. 

[LUST-76] LUSTED L.B. : " Clinical Decision Making" in "Decision Making and Medical 

Care " , Dombal & Gremy (eds.), Amsterdam : North Holland Publishing, 1976, p77-97. 

[MADI-78] MADIHALLY, NARASIMHA J., PETERSON A.M. : " On the Computation of 

Discrete Cosine 

Transform " , IEEE Trans. Com., 1978,Vol 26, N° 6, p934-936. 

[MALL-89] MALLAT S.G. : " A Theory for Multiresolution Signal Decomposition : The 

Wavelet 

Representation " , IEEE Trans. Pattern Analysis & Machine 

Intelligenc, 1989,Vol 11, N° 7, p674-693. 

[MALV-89] MALVAR H.S., STAELIN D.H. : " The LOT : Transform Coding Without 

Blocking Effects " , 

IEEE Trans. Acoust. Speech Signal Processing, 1989,Vol 37, N° 4, p553- 

559. 

[MALV-90] MALVAR H.S. : " Lapped Transforms for Efficient Transform/Subband 

Coding " , IEEE 

Trans. Acoust. Speech Signal Processing, 1990,Vol 38, N° 6, p969-978. 

- 225 -

[MAND-92] MANDUCA M. : " A Wavelet Based Tool for Medical Image Compression " , 

Proc. SPIE, 

1992,Vol 1653, p495-503. 

[MAND-93] MANDUCA M. : " Interactive Wavelet-Based 2D & 3D Image Compression " , 

Proc. SPIE, 

1993,Vol 1987, p307-318. 

[MART-93] MARTUCCI S.A., MERSEREAU R.M. : " New Approaches to Block Filtering 

of Images Using 

Symmetric ConVol ution and the DST or DCT " , IEEE Trans. Signal Proc., 

1993,Vol , p259- 262. 

[MAUE-79] 

Mismatched 

MAUERSBERGER W. : " Experimental Results on the Performance of 

Quantizers " , IEEE Trans. Inform. Theory, 1979, Vol IT-25, N°4, p381-386. 

[MCMA-79] MCMAHON M.M., BROWN B.G., CUKINGNAN R. : " Quantitative Coronary 

Angiography of 

the Critical Stenosis in Patients with Unstable Angina and Single Vessel 

Disease with Collaterals " , Circulation, 1979,Vol 60, p106-113. 

[MCMA-91] MCMAHON H., DOI K., SANADA S., MONTNER S.M., GIGER M.L., METZ 

C.E., NAKAMORI N., YIN F-F, XU X-W, et al. : " Data Compression : 

Effects on Diagnostic Accuracy in Digital Chest Radiography " , Radiology, 1991,Vol 

178, N° 1, p175-179. 

[METZ-86] METZ C.E. : " ROC Methodology in Radiologic Imaging " , Investigative 

Radiology, 1986,Vol 

21, N° 9, p720-733. 

[METZ-89] 

Analysis in 

245. 

METZ C.E. : " Some Practical Issues of Experimental Design and Data 

Radiological ROC Studies " , Investigative Radiology, 1989,Vol 24, p234- 

[MILL-70] MILLER K. : " Least Square Methods for III-posed Problems with a 

Prescribed Bound " , 

SIAM J. Math. Anal., 1970,Vol 1, N° 2, p52-74. 

[MOLL-92] MOLL T., GENIN G., DIAB C., AKROUT N., PROST R., BREMON A., 

JACQUEMET P. : " 

Compressed Mammograms by Block Subband Coding. Medical Assessment 

in the Detection of Microcalcifications " , Proceedings of the IEEE, 1992, Vol 3, p1221- 

1223. 

[MOON-93] 

to Statistical 

[NEMA-96] 

MOONEY C.Z., DUVAL R.D. : " Bootstrapping - A Nonparametric Approach 

Inference " , Newbury Park (CA) : Sage Publications, 1993, 73p. 

NEMA : " NEMA Standards : Digital Imaging & Communications in Medicine 

- 226 -

" , Rosslyn (Virginia) : National Electrical Manufacturers Association, NEMA 

Standards Publication, N° PS 3.5-1996, 1996, 77p. 

[NETR-77] NETRAVALI A.N. : " On quantizers for DPCM Coding of Picture Signals " , 

IEEE Trans. 

Inform. Theory, 1977,Vol 23, p360-370. 

[NEWE-90] NEWELL J.D., KELSEY C.A. : " Digital Imaging in Diagnostic Radiology " , 

New York : 

Churchill Livingstone, 1990, 352p. 

[NISS-94] NISSEN S.E., Etall : " Cardiac Angiography Without Cine Film : Erecting a 

'Tower of Babel' 

in the Cardiac Catheterization Laboratory " , J. AM. COL. CARDIOL., 

1994,Vol 24, N° 3, p834-837. 

[NZOM-95] NZOMIGNI V. : " Compression sans Perte de Séquences d'Images 

Biomédicales " , Thèse : 

Université de Rennes I, 1995, 224p. 

[O'NE-66] O'NEAL J.B. : " Predictive Quantizing Systems (DPCM) for the Transmission 

of Television 

Signals " , Bell System Tech. J., may-june 1966, p689-719. 

[PENN-93] PENNEBAKER W.B., MITCHEL J.L. : " JPEG Still Image Data Compression 

Standard " , New York : van Nostrand Reinhold, 1993, 638p. 

[PROS-94] PROST R., BURDEAU J-L., GUILLOTEAU S., GOUTTE R. : " Regularized 

Myopic Image 

DeconVol ution. Application to Aperture Synthesis in Radio Astronomy " , 

EURIPCO-94, Edinburgh Scotland UK, Proc. Vol 1 Theories & Applications, 1994, 

p307-310. 

[PROS-97] PROST R., DING Y., BASKURT A.. : " JPEG Dequantization Array for 

Regularized Decompression " , IEEE Trans. Image Proc., 1997, Vol 6, N° 6, p883-888. 

[RABB-91a] RABBANI M., JONES P.W. : " Digital Image Compression Techniques " , 

Bellingham (WA) : SPIE Optical Engineering Press, 1991, 221p. 

[RABB-91b] RABBANI M., JONES P.W. : " Image Compression Techniques for Medical 

Diagnostic 

Imaging Systems " , Journal of Digital Imaging, 1991,Vol 4, N° 2, p65-78. 

[RAO -90] RAO K.R., YIP P. : " Discrete Cosine Transform - Algorithms, Advantages, 

Applications " , New York : Academic Press, 1990, 490p. 

[REIB-84] REIBER J.H.C., KOOIJMAN C.J., SLAGER C.J., et al. : " Coronary Artery 

Dimension from 

Cineangiograms : Methodology and Validation of a Computer Assisted 

Analysis Procedure" , IEEE Trans. Medical Imaginig, 1984,Vol MI-3, p131-144. 

- 227 -

[REIB-89] REIBER J.H.C., ZWET VAN DER P.M.J., LAND VON C.D., et al. : " On-Line 

Quantification of 

Coronary Arteriograms with the DCI System " , Medicamundi, 1989,Vol 34, 

N° 3, p89-98. 

[REIB-94] REIBER J.H.C., KONING G., LAND VON C.D., ZWET VAN DER P.M.J. : " 

Why and How 

should QCA Systems be Validated ?" in "Progress in Quantitative Coronary 

Arteriography " , Dordrecht NL : Kluwer Academic Publishers, 1994, p33-48. 

[RIGO-96] RIGOLIN V.H., ROBIOLO P.A., SPERO L.A., HARRAWOOD B.P., MORRIS 

K.G., FORTIN 

D.F., BAKER W.A., BASHORE T.M., CUSMA J.T. : " Compression of Digital 

Coronary 

Angiograms does not Affect Visual or Quantitative Assessment of Coronary 

Artery 

Stenosis Severity " , Am. J. of Cardiol., 1996, Vol 78, p131-135. 

[RISK-89] RISKIN E.A., LOOKABAUGH T.D., CHOU P.A., GRAY R.M. : " Variable 

Rate Vector 

Quantization for Medical Image Compression With Application to 

Progressive Transmission" , 

Proc. SPIE, 1989, Vol 1091, p110-120. 

[RISK-90] RISKIN E.A., LOOKABAUGH T.D., CHOU P.A., GRAY R.M. : " Variable 

Rate Vector 

Quantization for Medical Image Compression " , IEEE Trans. Medical 

Imaginig, 1990,Vol 9, 

p290-298. 

[RISS-76] RISSANEN J.J. : " Generalized Kraft Inequality and Arithmetic Coding " , IBM 

J. Res. Dev., 

1976,Vol 20, p198-203. 

[ROMP-91] 

Subband 

ROMPELMAN O. : " Medical Image Compression : Possible Applications of 

Coding" , Boston : Kluwer, 1991, p319-352. 

[ROOS-88] ROOS P., et al. : " Reversible Intraframe Compression of Medical Images " , 

IEEE Trans. on 

Medical Imaging, 1988,Vol 7, N° 4, p328-336. 

[ROOS-91] ROOS P., VIEGEVER M.A. : " Reversible Image Data Compression Based 

on HINT 

Decorrelation and Arithmetic Coding " , SPIE Medical Imaging, 1991,Vol 

1444, p283-290. 

[SAKR-77] 

Image 

SAKRISON D.J. : " On the Role of the Observer and a Distortion Measure in 

Transmission " , IEEE Trans. Com., 1977,Vol COM-25, N° 11, p1251-1267. 

- 228 -

[SANM-78] SANMARCO M.E., BROOKS S.H., BLANKENHORN D.H. : " Reproductibility 

of a Consensus 

Panel in the Interpretation of Coronary Angiograms " , Am. Heart J., 1978,Vol 

96, N° 4, p430-437. 

[SAYR-92] SAYRE J.W., ABERLE D.R., BOECHAT M.I., HALL T.R., HUANG H.K., HO 

B.K. : " Effect of 

Data Compression on Diagnostic Accuracy in Digital Hand and Chest 

Radiography " , SPIE 

Medical Imaging, 1992,Vol 1653, p232-240. 

[SCHI-70] SCHINDLER H.R. : " Delta Modulation " , IEEE Spectrum, 1970,Vol 7, p69- 

78. 

[SCOB-84] SCOBLIONKO D.P., BROWN B.G., MITTEN S., CALDWELL J.H., 

KENNEDY J.W., 

BOLSON E.L., DODGE H.T. : " A New Digital Electronic 

Caliper for Measurement of Coronary Arterial Stenosis : Comparison with Visual 

Estimates and Computer-Assisted Measurements " , American Journal of 

Cardiology, 1984,Vol 53, p689-693. 

[SEGA-76] SEGALL A. : " Bit Allocation and Encoding for Vector Sources " , IEEE 

Trans. Inform. 

Theory, 1976,Vol IT-22, N° 2, p162-169. 

[SENA-95] SENANE H., SAADANE A., BARBA D. : " Image Coding in the Context of a 

Psychovisual 

Image Representation with Vector Quantization " , Proc. IEEE International 

Conference on Image Processing ICIP-95, Washington, October 23-26 1995, Vol 1, 

p97-100. 

[SHAN-48] SHANNON C.E. : " A Mathematical Theory of Communication " , Bell System 

Technical Journal, 1948, Vol 27, N° 3, p379-423. 

[STEE-75] STEELE R. : " Delta Modulation Systems " , New York : John Wiley, 1975, 

320p. 

[SWET-79] SWETS J.A. : " ROC Analysis Applied to the Evaluation of Medical Imaging 

Techniques " , 

Investigative Radiology, 1979,Vol 14, N° 2, p109-121. 

[SWET-80] SWETS J.A. : " The Relative Operating Characteristic in Psychology " , 

Science, 1980,Vol 

182, p990-1000. 

[TRAS-84] TRASK N., CALIFF R.M., CONLEY M.J., KONG Y., PETER R., LEE K.L., 

HACKEL D.B., 

WAGNER G.S. : " Accuracy and Interobserver Variability of Coronary 

Cineangiography : 

A Comparison With Postmortem Evaluation " , J. AM. COL. CARDIOL., 

1984,Vol 3, N° 5, p1145-1154. 

- 229 -

[VAS -85] VAS R., EIGLER N., MIYAZONO C., PFAFF J.M., RESSER K.J., WEISS M., 

NIVATPUMIN T., WHITING J., FORRESTER J. : " Digital Quantification Eliminates 

Intraobserver and 

Interobserver Variability in the Evaluation of Coronary Artery Stenosis " , 

American 

Journal of Cardiology, 1985,Vol 56, p718-723. 

[VOGE-88] VOGEL R.A., LEFREE M.T., MANCINI G.B.J. : " Comparison of 35 mm Cine 

Film and Digital 

Radiographic Imaging for Quantitative Coronary Arteriography " , Progress in 

Digital 

Angiocardiography, 1988, p159-171. 

[WITT-87] WITTEN I.H., NEAL R.M., CLEARY J.G. : " Arithmetic Coding for Data 

Compression " , 

Communications of the ACM, 1987,Vol 30, N° 6, p520-540. 

[WONG-95] WONG S., ZAREMBA L., GOODEN D., HUANG H.K. : " Radiological Image 

Compression - 

A Review " , Proceedings of the IEEE, 1995,Vol 83, N° 2, p194-219. 

[WOOD-86] WOODS J.W., O'NEIL S.D. : " Sub-band Coding of Images " , IEEE Trans. 

Acoust. Speech 

Signal Processing, 1986,Vol 34, N° 5, p1278-1288. 

[YOUN-92] YOUNG R.W., KINGSBURY N.G. : " Video Compresion Using Lapped 

Transform for Motion 

Estimation/Compensation and Coding " , SPIE Visual Com. & Im. Proc., 

1992, p276-288. 

[ZIV -77] ZIV J., LEMPEL A. : " A Universal Algorithm for Sequential Data 

Compression " , IEEE 

Trans. Inform. Theory, 1977, Vol 23, N° 3, p337-343. 

[ZIV -78] ZIV J., LEMPEL A. : " Compression of Individual Sequences via Variable- 

Rate Coding " , 

IEEE Trans. Inform. Theory, 1978, Vol 24, N° 5, p530-536. 

Références soumises ou à paraître : 

[BERE-97] BERETTA P.V., PROST R. : “Robustness of Uniform Quantizers to a 

Mismatched Statistical Model “, Va être soumis à Signal Processing. 

[DING-96] DING Y., PROST R., BASKURT A., BERETTA P.V. : " JPEG Scheme 

Improvement : Blocking Artefacts Reduction and Robustness to Post-Processing " , 

Soumis à Sig. Proc. : Im. Com.,1996. 

[KIRK-97] 

KIRKEEIDE R.L., BERETTA P.V., ANDERSON H.V., SMALLING R.W., 

- 230 -

SCHROTH G., 

GOULD K.L., HAAS H.P.A., ZWART P. : " Lossy Data 

Compression does not Alter Visual Interpretation of Digital Coronary Arteriograms " , 

Va être soumis à Circulation. 

- 231 -

ANNEXES 

Questionnaires diagnostics des évaluations 

- 229 -

Viewing Session 

Session / Case _/_ Date 

MD 

start 

Tech 

End 

Ventriculogram 

The Vcntriculogram is: 

LV Hypcrtrophy: 

Vcntriculogram Image Quality: 

Regional Abnormalities: 

Normal Abnormal Abscnt 

No 

YCS 

Good Fair Poor 

Anterior 

Apical 

In fer ior 

Later al 

Scptal 

Abs 

Nor Akin Hypo Dysk Aneur 

Lvgram Comments 

Arteriogram 

The coronary artcriogram is: 

Coronary Dominance: 

Artcriogram Image Quality: 

Normal 

Right 

Good 

Left 

Fair 

Abnormal 

Absent 

Balanced 

Poor 

Cgram Comments 

Form 2: Philips/UT Image Compression Study: MD reviews 1

Coronary Segments 

RCode CAD Collat Calc Spasm Comment 

RCA pro 

RCA mid 

RCA dis 

Codes 

Review Codes CAD TIMI Flows Collateral Perfusion 

OK -Done 

Abs - Absent (anat) 

NA - Not Able 

(Visualization) 

Nor -Normal 0 - No Flow 0 - None 

Irr. - Irregular. mild 1 - Low Flow l-Poor 

Mild - Mild Sten (

FOLIO ADMINISTRATIF 

THESE SOUTENUE DEVANT L'INSTITUT NATIONAL DES SCIENCES APPLIQUEES DE LYON 

NOM : BEAUREPAIRE épouse BERETTA DATE de soutenance : 

Prénoms : Patricia Véronique le 21 novembre 1997 

TITRE : Compression d’image appliquée aux angiographies cardiaques : 

aspects algorithmiques, évaluation de la qualité diagnostique 

NATURE : Doctorat N° d'ordre : 97 ISAL 0107 

Formation doctorale : Génie Biologique et Médical 

Code B.I.U. Lyon : T 50/210/19 / et bis CLASSE : 

RESUME : 

La compression d'images avec perte présente aujourd'hui un intérêt majeur pour l'archivage et la communication des 

angiographies cardiaques. 

Notre travail porte sur les aspects algorithmiques d'une technique de compression adaptée à cette modalité d'imagerie 

médicale, et sur la validation de la qualité diagnostique d'images comprimées. 

Dans un schéma de compression à base de la transformation cosinus discrète de l’image (Full-Frame DCT) nous avons 

principalement étudié deux aspects : l'adaptivité et la robustesse de la quantification scalaire des coefficients du plan de la 

DCT d'une part, et la prise en compte de post traitements d'autre part : 

• Une étude théorique sur l'erreur de quantification nous a permis de déduire des règles pratiques pour définir des 

quantifieurs uniformes robustes aux variations des propriétés statistiques des images. 

• L'incorporation dans le domaine DCT d'un filtre de renforcement de contour nous a permis de développer un schéma 

de compression évitant le rehaussement d'artefacts générés par la combinaison de la compression et du post 

traitement. 

Ces deux aspects algorithmiques ont une portée générale, ils sont applicables à d'autres méthodes de compression. 

La validation de la qualité diagnostique d'images médicales comprimées ne peut pas être, actuellement, basée sur des 

paramètres mathématiques, mais uniquement sur une évaluation par des experts médicaux. 

Nous avons conduit des campagnes d'évaluation de la qualité diagnostique avec trois méthodes de compression à un 

taux maximum de 12:1 : le standard JPEG, le standard MPEG, et MLOT, une méthode dédiée développée par les 

laboratoires Philips. 

• Les deux premières campagnes d'évaluations ont porté sur l'interprétation visuelle diagnostique d’examens 

angiographiques complets, avec et sans compression. 

• La troisième a porté sur les résultats de mesures quantitatives automatisées de sténoses coronaires. 

Nous avons pu observer que, dans les conditions définies ci-dessus, la compression n’augmente pas significativement la 

variabilité des interprétations et des mesures, et préserve globalement la qualité diagnostique de l’image. . 

Les résultats de ces expériences sont très prometteurs car ils attestent que la compression est acceptable pour le travail 

du clinicien. Il existe un vaste champ d'application de la compression pour les angiographies cardiaques en développant 

des algorithmes dédiés ou en se basant sur des standards, en identifiant à l’aide d’évaluations cliniques leurs limites 

respectives d’application. 

MOTS-CLES : 

Laboratoire de recherche : 

Directeur de thèse : 

Président du jury : 

Composition du jury : 

compression, évaluation, angiographie cardiaque 

CREATIS 

Rémy PROST 

Pr M. AMIEL 

Pr M. AMIEL, Pr D. BARBA, Pr M. BERTRAND 

Pr R. GOUTTE, Dr H. HAAS, Pr. M. LAMURE, Pr. R. PROST

compression d'images appliquee aux angiographies cardiaques

Create successful ePaper yourself

Delete template?

Save as template?