01.07.2013 Views

Sabine Caussanel - EPHE

Sabine Caussanel - EPHE

Sabine Caussanel - EPHE

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

MINISTERE DE LA JEUNESSE, DE L’EDUCATION NATIONALE<br />

ET DE LA RECHERCHE<br />

ECOLE PRATIQUE DES HAUTES ETUDES<br />

Sciences de la Vie et de la Terre<br />

MEMOIRE<br />

présenté<br />

par<br />

CAUSSANEL <strong>Sabine</strong><br />

Pour l’obtention du diplôme de l’Ecole Pratique des Hautes Etudes<br />

CONTRIBUTION A L’ETUDE DU ROLE DE CKIP-1 DANS LA DIFFERENCIATION<br />

MUSCULAIRE REGULEE PAR PI3-K – IDENTIFICATION DES ARN MESSAGERS<br />

CORRESPONDANT AUX FORMES DE LA PROTEINE CKIP-1<br />

soutenu le 17 Novembre 2003 devant le jury suivant :<br />

EXBRAYAT Jean-Marie - Président<br />

VAYSSIERE Jean-Luc – Examinateur<br />

GOILLOT Evelyne – Examinateur<br />

DE KERCHOVE Alban - Examinateur<br />

Laboratoire de : Directeur : MIGNOTTE Bernard<br />

Génétique Moléculaire et Physiologique- CNRS UPRES- A8087 – Université Versailles/Saint-<br />

Quentin - mignotte@génétique.uvsq.fr<br />

Laboratoire de : Directeur : BRUN Gilbert<br />

Biologie des Régulations Cellulaires – UMR 5161 CNRS- Ecole Normale Supérieure de Lyon -<br />

egoillot@ens-lyon.fr<br />

CAUSSANEL <strong>Sabine</strong> – 17 Novembre 2003 – Pr.MIGNOTTE Bernard<br />

CONTRIBUTION À L’ÉTUDE DU RÔLE DE CKIP-1 DANS LA DIFFERENCIATION MUSCULAIRE<br />

RÉGULÉE PAR PI3-K - IDENTIFICATION DES ARN MESSAGERS CORRESPONDANT AUX DEUX<br />

FORMES DE LA PROTÉINE CKIP-1<br />

<strong>EPHE</strong> Banque de Monographies SVT 1


Au cours de l’étude du rôle de CKIP-1 dans la différenciation musculaire régulée par PI3-K dans la lignée de myoblastes<br />

C2C12, nous avons mis en évidence une nouvelle forme de la protéine CKIP-1. Cette forme a un poids moléculaire de 28kDa<br />

tandis que la protéine entière CKIP-1 a un poids moléculaire de 55kDa. Nous avons réalisé différents mutants de CKIP-1 et<br />

observé que cette forme courte semble correspondre à une protéine CKIP-1 initiée au niveau du deuxième ATG et par<br />

conséquent dépourvue de son domaine pleckstrine. Ce domaine est essentiel à la stimulation de la myogenèse par CKIP-1.<br />

Nous avons caractérisé les ARNm correspondant à ces deux formes en utilisant deux approches expérimentales différentes : la<br />

technique des ARN circulaires et la protection à la RNAse. Nous avons identifié trois populations de transcrits différents<br />

ayant des sites multiples d’initiation de la transcription. Deux d’entre elles ont des sites d’initiation de la transcription situés<br />

en aval du premier codon ATG initiateur.de la traduction et sont donc susceptibles de donner naissance à la forme courte de<br />

CKIP-1 initiée au deuxième ATG. L’analyse de la représentation de ces différentes populations de transcits suggère une<br />

représentation égale des deux protéines dans les cellules C2C12. Ceci a été confirmé en western blot. Ces résultats nous ont<br />

permis de déterminer deux régions pouvant jouer le rôle de régions promotrices. L’analyse de la séquence de ces régions a<br />

révélé des régions riches en GC pouvant correspondre à des régions promotrices de type GC riche dépourvue de boîtes<br />

d’initiation de la transcription comme la boîte TATA ou la boîte CAAT. De plus, cette région possède de nombreux sites Sp-1<br />

qui sont connus pour guider l’initiation de la transcription de gènes ayant des promoteurs dépourvus de boite TATA. En<br />

accord avec nos résultats, ce type de régions promotrices est fréquemment associé à de multiples sites d’initiation.<br />

Mot-Clefs : muscle, différenciation, CKIP-1, promoteurs, ARN messager, protéines.<br />

SOMMAIRE<br />

SOMMAIRE.... …………………………………………………………………………………...3<br />

LISTE DES ABRÉVIATIONS.... ………………………………………………………………...5<br />

INTRODUCTION... ………………………………………………………………………………7<br />

I- Régulation de la Transcription ……………………………………………………………...8<br />

1- Structure d’un gène……........ …………………………………………………………………..8<br />

2- Eléments régulateurs de la transcription dans le promoteur minimal………....... ……………...9<br />

2-1- Promoteur avec boîte TATA (ou boîte Goldberg-Hogness) …………………...... ….9<br />

2-1-1- Mise en place du complexe de pré-initiation de la transcription..... ……….9<br />

2-1-2- Les différentes boîtes pouvant être associée à la boîte TATA .. …………10<br />

2-1-3- Autres éléments initiateurs de la transcription pouvant être associés<br />

à la boîte TATA.. ………………………………………………………………..11<br />

2-1-4- Conclusion …….... ……………………………………………………….12<br />

2-2- Promoteur dépourvu de boîte TATA.... ……………………………………………12<br />

2-2-1- Boîte GC ……….…………………………………………………………12<br />

2-2-2- Rôle de l’Inr en absence de boîte TATA …….…………………………...13<br />

2-2-3- L’élément DPE (Downstream Promoter Element) …….…………………14<br />

2-2-4- L’élément BRE (IIB Recognition Element) ……….……………………..14<br />

2-2-5- Conclusion …………………………………………………………….….15<br />

3- Eléments régulateurs de la transcription dans le promoteur distal…….... ……………………15<br />

II- Maturation des ARN pré-messagers………………………………………………………16<br />

1- La coiffe……………………………………………………………………………………..............<br />

16<br />

<strong>EPHE</strong> Banque de Monographies SVT 2


2- La queue polyA……………………………………………………………………….... …….17<br />

3- L’excision-épissage des introns……………………………………………….... …………….17<br />

3-1- mécanisme d’excision-épissage constitutif………...... ………………………………….17<br />

3-2- mécanisme d’épissage alternatif………………………………………………..... ……..18<br />

3-3- Importance de l’épissage alternatif dans la myogenèse………………....... ……………..19<br />

3-3-1- Le facteur de trancription MEF2 et l’intégrine b1………....... ……………19<br />

3-3-2- Anomalie de l’épissage et pathologie musculaire……………………....…21<br />

3-3-2-1- Le gène MTMR1 (myotubularin-related 1) ……………….……21<br />

3-3-2-2- Les gènes IR (Insulin Receptor) et CIC-1 (chloride channel)..... .22<br />

4- Promoteurs alternatifs…….... ………………………………………………………………...23<br />

Utilisation du promoteur spécifique du muscle (pM) de l’Aldolase A………....... ……….23<br />

III- Régions Régulatrices de l’ARN messager …….………………………………………...24<br />

1- Interactions entre la coiffe, la séquence codante et la queue polyA…………………..... …….24<br />

2- Régulation par la coiffe et la queue polyA………..... ………………………………………...26<br />

3- Régulations par la région 5’UTR…..... ………………………………………………………..26<br />

3-1- IRES (Internal Ribosomal Entry Site)...... ………………………………………………27<br />

3-2- uORF (upstream Open Reading Frame)...... ……………………………………………28<br />

3-3- Présence de Structures Secondaires…...... ………………………………………………30<br />

4- Régulations par la région 3’UTR…..... ………………………………………………………..30<br />

4-1- CPE (Cytoplasmic Polyadenylation Element).... ……………………………………...31<br />

4-2- ARE (AU Rich Element).... ……………………………………………………………31<br />

4-3- Présence de Structures Secondaires...... …………………………………………………32<br />

5- Conclusion ………………...... ………………………………………………………………..33<br />

LISTE DES ABREVIATIONS<br />

+1 : site d’initiation de la transcription ou site de démarrage de la transcription<br />

3’UTR : 3’ UnTranslated Region<br />

5’UTR : 5’ UnTranslated Region<br />

A : adénine<br />

ADN : Acide DésoxyriboNucléique<br />

ADNc : Acide DésoxyriboNucléique complémentaire<br />

Apaf-1 : Apoptosis protease activating factor-1<br />

ARE : AU Rich Element<br />

ARN : Acide RiboNucléique<br />

ARNr : Acide RiboNucléique ribosomal<br />

ARNm : Acide RiboNucléique messager<br />

ARNt : Acide RiboNucléique de transfert<br />

ATG : codon d’initiation de la traduction<br />

<strong>EPHE</strong> Banque de Monographies SVT 3


AUF1 : AU Factor 1<br />

BRE : IIB Recognition Element<br />

C : Cytosine<br />

CBC : Cap Binding Complex<br />

CBP : Cap Binding Protein<br />

CF : Cleavage Factor<br />

CGRP : Calcitonin Gene Related Peptide<br />

CIC-1 : chloride channel-1<br />

CPE : Cytoplasmic Polyadenylation Element<br />

CPEB : CPE Binding protein<br />

CPSF : Cleavage Polyadenylation Specificity Factor<br />

CstF : Cleavage stimulating Factor<br />

CTF: CCAAT binding Transcription Factor<br />

CUG-BP: CUG-Binding Protein<br />

DM : Dystrophie Myotonique<br />

DPE : Downstream Promoter Element<br />

eIF4-(F, E, A, G) : eukaryotic translation Initiation Factor 4-(F, E, A, G)<br />

G : Guanine<br />

GMP : Guanosine Mono-Phosphate<br />

IGF : Insulin Growth Factor<br />

IGFBP-2 : Insulin-like Growth Factor-Binding Protein-2<br />

IgM : Immunoglobuline M<br />

IR : Insulin Receptor<br />

IRE : Iron Responsive Element<br />

IRES : Internal Ribosomal Entry Site<br />

IRP (1 ou 2) : Iron Responsive Protein (1 ou 2)<br />

MCK : Créatine Kinase Musculaire<br />

MEF2 : Myocyte-specific Enhancer-binding Factor 2<br />

MRF : Myogenic Regulatory Factor<br />

MSE : Muscle-specific Splicing Enhancers<br />

MTMR1 : myotubularin-related 1<br />

NLS : Nuclear Import Signal<br />

PABP (I ou II): PolyA Binding Protein (I ou II)<br />

PAP : PolyA Polymérase<br />

PI3-K : PhosphatidylInositol 3-Kinase<br />

PtdIns: PhosphatidylInositol<br />

R : purine (A, G)<br />

snRNA: small nuclear RNA<br />

T : Thymidine<br />

TAFs : TBP Associated Factors<br />

<strong>EPHE</strong> Banque de Monographies SVT 4


TBP : TATA Binding Protein<br />

TFII (A, B, D, E, F, H, J) : Transcriptional Factor II (A, B, D, E, F, H, J)<br />

TfR : Transferrine<br />

U : Uridine<br />

XIAP : X-linked Inhibitor Apoptosis Protein<br />

XLMTM : Myopathie Myotubulaire liée à l’X<br />

Y : pyrimidine (C, U, T)<br />

INTRODUCTION<br />

L’étude de l’expression des gènes nécessite de connaître toutes les zones de régulations<br />

possibles au niveau des gènes et par conséquent des ARN messagers. Il est surprenant de voir qu’un<br />

organisme contenant un nombre de gène défini comporte autant de régulations au niveau moléculaire<br />

et cellulaire. En effet, si l’on prend le cas de l’Homme qui n’a, d’après le séquençage du génome, que<br />

35 000 gènes, on comprend difficilement comment on peut arriver à une complexité moléculaire aussi<br />

grande. Cependant, il a été montré au cours du temps, qu’un même gène pouvait donner naissance à<br />

différents transcrits qui eux-mêmes pouvaient être à l’origine de la synthèse de plusieurs protéines<br />

différentes en fonction des conditions physiologiques et environnementales. Ceci sous-entend que<br />

cette complexité se situe en aval des gènes c’est-à-dire au niveau des étapes de la transcription et de<br />

la traduction.<br />

Effectivement, lors de la transcription d’un même gène, on peut aboutir à plusieurs messagers ;<br />

néanmoins la complexité s’accroît encore chez les Eucaryotes puisque l’on est confronté à une étape<br />

de maturation des messagers. Ainsi chaque pré-messager peut être initié à partir de plusieurs<br />

promoteurs et/ou subir différents épissages alternatifs. Ces étapes peuvent varier en fonction du type<br />

cellulaire ou tissulaire, des conditions physiologiques ou environnementales, ce qui augmente encore<br />

la complexité moléculaire. Cette diversité se poursuit lors de l’étape de traduction. Chaque messager à<br />

la possibilité de donner naissance à plusieurs protéines. La plupart du temps, l’initiation de la<br />

traduction se fait à partir d’un codon AUG. Or, il ne faut toutefois pas exclure les initiations<br />

exceptionnelles se faisant à partir de séquences permettant l’entrée des ribosomes de manière<br />

indépendante au codon AUG comme, par exemple les IRES. Ces deux phénomènes génèrent<br />

plusieurs isoformes protéiques à partir d’un même transcrit.<br />

Toutes ces diversités vont moduler la stabilité, la localisation et l’efficacité de la traduction des<br />

messagers.<br />

En résumé, la régulation d’un gène est contrôlée au niveau de:<br />

- la chromatine par des phénomènes de méthylation.<br />

- la transcription par sa région promotrice qui lui permet de fixer des facteurs de transcription<br />

modulant son expression.<br />

- la maturation des pré-messagers par la mise en place de la coiffe et de la queue polyA ainsi que les<br />

mécanismes d’épissage alternatif.<br />

- les initiations variables de la traduction<br />

- les différentes régulations des régions UTR (5’et 3’ UnTranslated Region)<br />

- les étapes post-traductionnelles.<br />

<strong>EPHE</strong> Banque de Monographies SVT 5


Dans la première partie de cette introduction, nous rappellerons brièvement les différentes étapes de la<br />

régulation de la transcription en utilisant des exemples précis concernant des gènes impliqués dans le<br />

développement et la pathologie du tissu musculaire. Lors de notre étude du gène CKIP-1, nous avons<br />

été confrontés à certains de ces processus de régulation de l’expression d’un gène. Ces résultats<br />

seront présentés et discutés après une présentation des mécanismes moléculaires de la différenciation<br />

musculaire dans lesquels CKIP-1 est impliqué.<br />

I – Régulation de la Transcription<br />

La transcription aboutit à la synthèse de l’ARN messager (ARNm) à partir du brin négatif de la<br />

molécule d’ADN. Cette étape a lieu dans le noyau des cellules eucaryotes.<br />

1- Structure d’un gène<br />

Un gène est généralement composé de quatre parties bien distinctes :<br />

- La première partie correspond au promoteur.<br />

Ce promoteur est composé d’un promoteur proximal (ou minimal) et d’un promoteur distal. Le<br />

promoteur proximal correspond à l’ensemble des éléments régulateurs permettant la fixation indirecte<br />

de l’ARN polymérase II. Les éléments régulateurs sont situés en amont du site d’initiation de la<br />

transcription et sont indispensables à sa reconnaissance. Le promoteur distal, quant à lui, possède des<br />

séquences reconnues par différents facteurs de transcription qui agiront comme des trans-activateurs<br />

ou des trans-répresseurs selon les signaux reçus par la cellule.<br />

- La seconde partie correspond à la région 5’ UTR.<br />

Elle est bornée par le site d’initiation de la transcription (+1) et le codon d’initiation de la traduction<br />

(ATG).<br />

- La troisième partie correspond à une séquence codante discontinue. Cette séquence<br />

contient des exons qui possèdent l’information génétique et codent pour la protéine ainsi que des<br />

introns qui s’intercalent entre les différents exons. Ces séquences seront transcrites mais pas traduites.<br />

Elles peuvent posséder des éléments régulateurs de la transcription (enhancers ou silencers).<br />

- La dernière partie du gène correspond à une région 3’ transcrite mais non traduite<br />

(3’UTR) qui se situe en aval de la séquence codante précédemment décrite. Cette partie contient la<br />

séquence génomique 5’AATAAA3’ appelée signal de polyadénylation qui sera interpretée par l’ARN<br />

polymérase comme un signal de fin de la transcription<br />

2- Eléments régulateurs de la transcription dans le promoteur minimal<br />

<strong>EPHE</strong> Banque de Monographies SVT 6


Parmi les plus fréquemment utilisés, on retrouve la boîte TATA présente dans la majorité des gènes.<br />

Cependant, certains promoteurs contiennent d’autres éléments permettant l’initiation de la<br />

transcription comme la boîte TATA : l’Inr, le DPE et le BRE. Dans certains promoteurs, aucun de ces<br />

sites remarquables n’est retrouvé.<br />

2-1- Promoteurs avec boîte TATA (ou boîte Goldberg-Hogness)<br />

La séquence de la boîte TATA est riche en A et T et son motif consensus est : 5’TATAAA3’. Cette<br />

boîte TATA est située à –30 nucléotides en amont du site d’initiation de la transcription. Ce motif<br />

TATA permet la fixation de l’ARN polymérase II sur l’ADN par l’intermédiaire de la protéine TBP<br />

(TATA Binding protein). Cette protéine appartient avec les TAFs (TBP Associated Factors) au<br />

complexe multiprotéique de pré-initiation de la transcription TFIID.<br />

2-1-1- Mise en place du complexe de pré-initiation de la transcription<br />

Lors de l’initiation de la transcription, le complexe multiprotéique TFIID (Transcriptional Factor II D)<br />

se fixe par l’intermédiaire de la protéine TBP (TATA-binding protein) sur la boîte TATA, constituée<br />

d’une séquence riche en T et A et située 30 nucléotides en amont du premier nucléotide qui sera<br />

transcrit. La fixation de ce complexe multiprotéique permet la reconnaissance du site de démarrage de<br />

la transcription par l’ARN polymérase II. Le complexe I, constitué de TFIID sur la boîte TATA,<br />

s’associe à TFIIB et génère le complexe II. L’addition de TFIIF à ce complexe permet l’entrée de<br />

l’ARN polymérase II en aval de la région TATA et permet la formation du complexe III. Ce nouveau<br />

complexe ainsi formé va permettre l’association de TFIIE et TFIIH pour faire le complexe V. Ces<br />

derniers auraient pour rôle de dénaturer la double hélice d’ADN au site d’initiation de la transcription<br />

grâce à leur activité hélicase. Cependant, des études récentes ont montré que l’entrée de TFIIH dans<br />

le cycle de transcription dépend de l’association du complexe III avec TFIIE et donc implique la<br />

présence d’un complexe intermédiaire (complexe IV) [1]. Ces études nous permettent juste de dire<br />

qu’une coopération entre TFIIE, TFIIH et le complexe de pré-initiation (complexe III) est<br />

indispensable pour former le complexe V. Ce dernier quand il est associé à TFIIJ forme le complexe<br />

VI. TFIIA, quant à lui, semble pouvoir s’associer avec tous les complexes intermédiaires de préinitiation.<br />

Des études ont montré que seule la présence du complexe I est nécessaire à l’association de<br />

TFIIA. TFIIA se lie donc de manière dépendante à TFIID en amont de la région TATA. Son effet<br />

semble être indirect sur la transcription et son rôle consiste probablement à induire un changement de<br />

conformation d’un état inactif de TFIID à un état actif.<br />

2-1-2- Les différentes boîtes pouvant être associées à la boîte TATA<br />

La boîte CCAAT se trouve en amont de la boîte TATA, entre la position –120 et la position -80<br />

nucléotides du site de démarrage de la transcription. La modification de cette boîte a permis de<br />

montrer qu’elle est indispensable pour accentuer la vitesse de transcription des gènes la contenant.<br />

<strong>EPHE</strong> Banque de Monographies SVT 7


Cette boîte peut se trouver sur le brin sens comme sur le brin antisens. Dans ce dernier cas, elle est<br />

alors sous sa forme complémentaire sur le brin sens, c’est-à-dire : 5’ATTGG3’. Sa séquence permet<br />

d’interagir avec un facteur trans-régulateur appelé CTF (CCAAT binding Transcription Factor) isolé<br />

de cellules de mammifères.<br />

La boîte GC est formée d’éléments riches en bases G et C. Si elle est présente, elle est localisée en<br />

principe entre la boîte TATA et la boîte CCAAT. Le motif riche en GC est généralement unique en<br />

présence d’une boîte TATA. Sa séquence permet la fixation du facteur de transcription Sp-1.<br />

Cependant la protéine Sp-1 ne se lie pas forcément de manière égale à toutes les boîtes GC [2]. En<br />

effet, ces séquences seraient sensibles à la méthylation au niveau de leur cytosine.<br />

2-1-3- Autres éléments initiateurs de la transcription pouvant être associés à la<br />

boîte TATA<br />

Certains promoteurs ayant une boîte TATA peuvent également posséder d’autres éléments initiateurs<br />

de la transcription<br />

L’élément initiateur Inr correspond à un motif qui chevauche le site d’initiation de la transcription<br />

et dont la séquence consensus est la suivante :<br />

5’YYA N(T/A)YY3’ chez les mammifères.<br />

+1<br />

N = nucléotides<br />

Y = pyrimidine<br />

Des études ont montré que l’Inr semble ne pas être important ni pour la localisation du site de<br />

démarrage de la transcription ni pour la direction de la transcription. Deux hypothèses ont été<br />

avancées. Dans la première, si l’affinité de liaison ADN-protéines est forte, l’Inr pourrait augmenter<br />

l’intensité du promoteur dans le cas d’une boîte TATA bien localisée et jouer le rôle d’activateur.<br />

Dans la seconde hypothèse, l’Inr serait reconnu comme un simple élément de la machinerie<br />

transcriptionnelle. Ainsi comme la boîte TATA facilite un haut niveau de transcription, l’Inr en aval<br />

de cette dernière conduirait à un très fort niveau basal de transcription [3]<br />

L’élément BRE (IIB Recognition Element)<br />

La séquence consensus du BRE est 5’(G/C)(G/C)(G/A)CGCC3’. Elle est immédiatement suivie du<br />

5’T de la séquence consensus 5’TATAA3’ constituant la boîte TATA [4]. Elle est reconnue par le<br />

facteur de transcription TFIIB par son motif hélice-boucle-hélice de liaison à l’ADN. Plus la<br />

séquence consensus est conservée in vitro, plus le facteur TFIIB se fixe à celle-ci pour permettre<br />

l’assemblage du complexe de pré-initiation et donc l’initiation de la transcription. Des études ont<br />

<strong>EPHE</strong> Banque de Monographies SVT 8


montré que l’interaction TFIIB-BRE pourrait jouer un rôle dans :<br />

- la détermination de l’activité globale transcriptionnelle du promoteur,<br />

- l’ordre d’assemblage du complexe de pré-initiation à un promoteur,<br />

- l’étape limitante dans l’initiation de la transcription d’un promoteur,<br />

- la sensibilité d’un promoteur envers des activateurs transcriptionnels<br />

spécifiques.<br />

BRE semble également être capable de déterminer la direction amont/aval de l’assemblage du<br />

complexe de pré-initiation ainsi que de l’initiation de la transcription en présence de l’interaction<br />

TBP-boîte TATA.<br />

2-1-4- Conclusion<br />

En conclusion, l’initiation de la transcription pour un promoteur avec une boîte TATA peut se faire<br />

par :<br />

(1) la boîte TATA seule, localisée en position –30 par rapport au site de démarrage de la transcription<br />

et reconnue par la TBP.<br />

(2) la boîte TATA en combinaison avec d’autres éléments :<br />

- l’élément initiateur Inr, localisé près de la position –1.<br />

- l’élément BRE (IIB Recognition Element), localisé en position –7 de la boîte TATA et reconnu par<br />

TFIIB.<br />

Toutefois, on ne peut pas écarter la possibilité que des séquences régulatrices présentes dans les<br />

promoteurs distaux puissent réguler spécifiquement la transcription par interaction avec la boîte<br />

TATA ou les éléments Inr ou BRE présents dans le promoteur proximal.<br />

2-2- Promoteur dépourvu de boîte TATA<br />

La boîte TATA n’est pas indispensable car la majorité des gènes constitutifs ou domestiques<br />

(housekeeping genes) n’en possèdent pas. Des études ont montré que des délétions ou des mutations<br />

de la boîte TATA n’abolissent pas totalement la transcription. Les deux effets observés sont : une<br />

diminution du taux de transcription et une perte de la fidélité du site d’initiation.<br />

2-2-1- La boîte GC<br />

En l’absence de boîte TATA, la séquence de type 5’GGGCGG3’, située de manière variable, et<br />

connue sous le nom de boîte GC semble pouvoir la remplacer. Le motif riche en GC est généralement<br />

répété plusieurs fois. Le facteur trans-régulateur le plus connu pour se fixer dessus est la protéine Sp-<br />

1. Ce facteur de transcription est un activateur ubiquitaire. Il est requis pour l’expression constitutive<br />

et inductible d’un grand nombre de gènes. Les études qui ont permis de mettre en évidence le rôle de<br />

Sp-1 ont été réalisé dans le virus SV40. Les auteurs ont montré que Sp1 lie sélectivement une<br />

<strong>EPHE</strong> Banque de Monographies SVT 9


séquence riche en GC, présente en 6 répétitions d’hexanucléotides dans le promoteur proximal du<br />

virus SV40 [5].<br />

Depuis, d’autres études ont montré qu’une grande variété de promoteurs cellulaires et viraux<br />

contenaient des boîtes GC et qu’elles pouvaient être activées par Sp-1 in vitro. Ces boîtes GC sont<br />

souvent retrouvées près de sites de liaisons à d’autres facteurs de transcription, suggérant que ces<br />

facteurs pourraient agir en coopération pour moduler la transcription. C’est le cas du promoteur à<br />

l’IGFBP-2 (Insulin-like Growth Factor-Binding Protein-2) [2] du rat qui tout en étant dépourvu de<br />

boîte TATA ainsi que de boîte CCAAT, possède cependant une région riche en GC dans sa partie<br />

proximale. Cette région contient quatre boîtes GC, dont trois sont très proches les unes des autres.<br />

Elles peuvent être toutes des sites potentiels de fixation du facteur de transcription Sp-1. Une étude a<br />

démontré que la fixation de Sp-1 aux trois plus proches boîtes GC était essentielle pour l’activité<br />

promotrice. Cependant, la fixation de facteurs de transcription à leur site consensus situés en amont<br />

est nécessaire pour l’expression du gène. Bien que des études aient démontré que Sp-1 est nécessaire<br />

pour atteindre un niveau basal de la machinerie transcriptionnelle et qu’il semble indispensable pour<br />

obtenir une activité maximale des promoteurs chez les mammifères, on ignore toujours si cette<br />

transcription est activement régulée dans les cellules de mammifères ou si elle est simplement<br />

influencée par la quantité de protéine Sp-1 contenue dans le noyau [6, 7].<br />

2-2-2- Rôle de l’Inr en absence de boîte TATA<br />

L’élément initiateur, Inr, en absence de boîte TATA, aurait pour rôle de guider l’ARN polymérase II<br />

vers un site de démarrage de la transcription et peut donc permettre l’initiation de la transcription à<br />

partir d’un site unique.<br />

L’Inr pourrait également influencer la direction de la transcription en absence de boîte TATA [3].<br />

L’initiation de la transcription par l’intermédiaire d’une séquence Inr fait intervenir le facteur TFIID<br />

[8].<br />

Les promoteurs dépourvus de boîte TATA n’ont pas tous un élément initiateur mais ils possèdent<br />

d’autres éléments activateurs capables de permettre l’initiation de la transcription :<br />

2-2-3- L’élément DPE (Downstream Promoter Element)<br />

Le DPE est un site de reconnaissance de TFIID fréquemment trouvé dans les promoteurs dépourvus<br />

de boîte TATA. En effet, parmi les 205 éléments régulateurs de la transcription chez Drosophila<br />

melanogaster, il a été estimé : que 29% des promoteurs contiennent une boîte TATA (sans DPE),<br />

26% contiennent un élément DPE (sans boîte TATA), 14% contiennent les motifs DPE et TATA et<br />

31% ne contiennent ni l’un ni l’autre. La séquence DPE est conservée de Drosophila melanogaster à<br />

l’Homme et semble être aussi commune que la boîte TATA.<br />

Sa séquence consensus est localisée entre la position +28 et +32: 5’(A/G)G(A/T)(C/T)(G/A/C)3’ [5].<br />

Par rapport au site d’initiation de la transcription. Des études ont montré une coopération entre les<br />

<strong>EPHE</strong> Banque de Monographies SVT 10


motifs Inr et DPE. Ainsi, une mutation dans le motif Inr ou dans le motif DPE entraîne une forte<br />

diminution de l’activité du promoteur. Il en est de même dans le cas d’une insertion ou d’une délétion<br />

de nucléotides dans ces deux motifs. Ces observations indiquent que la transcription basale<br />

dépendante de DPE implique une liaison coopérative de TFIID (et plus précisément de certaines<br />

TAFs) avec les motifs DPE et Inr [9]. De plus, il a été montré que si l’on inactive le motif TATA<br />

d’un promoteur, son activité transcriptionnelle est totalement restaurée si l’on ajoute à ce dernier la<br />

séquence DPE dans sa position originelle (à +28 nucléotides du site de démarrage de la transcription)<br />

[10].<br />

2-2-4- L’élément BRE (IIB Recognition Element)<br />

Le motif BRE, quant à lui, joue un rôle important en absence de boîte TATA car il interagit avec<br />

TFIIB. En effet, des études ont montré que cette interaction pourrait avoir un rôle dominant dans<br />

l’assemblage du complexe de pré-initiation de la transcription mais aussi dans l’initiation de la<br />

transcription d’un promoteur dépourvu de boîte TATA. De plus, lors d’une recherche dans des bases<br />

de données de promoteurs eucaryotes, le motif BRE apparaît à une fréquence significative dans des<br />

promoteurs sans boîte TATA [4].<br />

2-2-5- Conclusion<br />

En conclusion, l’initiation de la transcription pour un promoteur dépourvu de boîte TATA peut se<br />

faire par :<br />

- la ou les boîtes GC reconnue(s) par le facteur de transcription ubiquitaire Sp-1.<br />

- l’élément initiateur Inr combiné ou non avec l’élément DPE.<br />

- l’élément BRE, localisé en position –37<br />

Tous les promoteurs n’étant pas isolés, il est difficile d’estimer la représentation des différents motifs<br />

dans les promoteurs proximaux. Cependant, il est maintenant clairement établi que le promoteur<br />

proximal ne dirige pas seulement le démarrage de la transcription. Il joue également un rôle crucial<br />

dans la régulation de la transcription en collaboration avec le promoteur distal.<br />

3- Eléments régulateurs de la transcription dans le promoteur distal<br />

Le promoteur distal présente des séquences régulatrices spécifiques de chaque gène. Ces motifs<br />

spécifiques sont reconnus spécifiquement par des facteurs de transcription. Ces facteurs recrutent, par<br />

des interactions protéines-protéines avec d’autres facteurs de transcription et/ou des co-facteurs, la<br />

machinerie basale de la transcription et ainsi régulent la transcription<br />

Les séquences cis-régulatrices du gène qui permettent la fixation de facteur trans-régulateurs ont des<br />

effets sur la vitesse de la transcription. En effet, le taux de transcription du gène peut être<br />

<strong>EPHE</strong> Banque de Monographies SVT 11


usquement modifié positivement si l’on est en présence d’une séquence activatrice (enhancer) ou<br />

négativement si l’on est en présence d’une séquence inhibitrice (silencer). Ce mécanisme régulateur<br />

dépend le plus souvent de circonstances physiologiques. Il permet d’ajuster le taux de transcription<br />

aux besoins cellulaires.<br />

Les cellules répondent donc à des signaux (intra et extra-cellulaires) en activant ou réprimant certains<br />

gènes, ainsi qu’en modulant l’importance de la transcription des gènes actifs. La transcription d’un<br />

gène est donc régulée par les facteurs de transcription qui se fixent aussi bien sur le promoteur<br />

proximal que sur le promoteur distal. Cette régulation aboutit à la synthèse d’un ARN pré-messager.<br />

En effet, chez les eucaryotes, l’ARN subit une maturation post-transcriptionnnelle au niveau du noyau<br />

avant d’être traduit en protéine dans le cytoplasme.<br />

II- Maturation des ARN pré-messagers<br />

L’ARN messager chez les eucaryotes va subir de nombreuses modifications post-transcriptionnnelles.<br />

Les exons comme les introns sont transcrits pour donner une longue molécule d’ARN appelée<br />

transcrit primaire ou précurseur de l’ARNm (pré-ARNm). L’ARNm va se voir rajouté une coiffe dans<br />

sa région 5’, une série d’adénosines dans sa région 3’ et va subir un mécanisme d’excision-épissage.<br />

Ces modifications se font dans le noyau. Elles se déroulent au cours de l’étape de transcription et<br />

aboutissent à la maturation de l’ARNm. Elles sont dépendantes les unes des autres, comme nous le<br />

verrons dans le paragraphe III-1.<br />

1- La coiffe<br />

La mise en place de la coiffe ou ²capping² est la première étape de maturation du messager.<br />

La coiffe ou ²cap² est un 7-methyl-guanosine c’est-à-dire un GMP (Guanosine Mono-Phosphate)<br />

ayant un groupement méthyl sur l’atome d’azote en position 7.<br />

Elle se met en place dès le début de la transcription, avant que 30 nucléotides ne soient assemblés.<br />

Elle est reliée au premier nucléotide du transcrit primaire par une liaison phosphoanhydre. En effet, le<br />

groupement tri-phosphate du premier nucléotide est hydrolysé en di-phosphate par une ARN 5’ triphosphatase.<br />

Une guanylyltransférase catalyse la liaison GMP avec le premier nucléotide diphosphate,<br />

créant une liaison 5’-5’ triphosphate. Une méthyltransférase méthyle ensuite l’atome<br />

d’azote en position 7 du GMP.<br />

D’autres modifications peuvent également se produire, telle une méthylation de l’OH en 2’ des<br />

riboses situés sur les deux premiers nucléotides de l’extrémité 5’ du transcrit primaire. L’ARNm<br />

n’aura donc plus une extrémité 5’ phosphate libre. La coiffe protègerait ainsi l’extrémité 5’ des<br />

ARNm de l’attaque par des enzymes (phosphatases, nucléases). La coiffe joue également un rôle<br />

important dans la reconnaissance des ARN. Enfin, elle est nécessaire pour la liaison de la petite sousunité<br />

du ribosome qui assurera par la suite le processus de traduction.<br />

<strong>EPHE</strong> Banque de Monographies SVT 12


2- La queue polyA<br />

La polyadénylation s’effectue immédiatement après que le messager a été transcrit.<br />

En effet, une fois synthétisés, les ARN messagers sont clivés dans leur partie 3’ une vingtaine de<br />

bases en aval de la séquence AAUAAA. Cette séquence est reconnue par la protéine de clivage CPSF<br />

(Cleavage Polyadenylation Specificity Factor) et est suivie d’une seconde séquence riche en GU ou en<br />

U reconnue par une autre protéine de clivage CstF (Cleavage stimulating Factor). Ces facteurs, en<br />

association avec les protéines de clivages CFI et CFII (Cleavage Factor I and II) et la polyA<br />

polymérase (PAP), clivent l’ARN pré-messager et permettent l’addition d’environ 250 adénosines<br />

consécutives. Par la suite une protéine de 70kDa, la PABPII (PolyA Binding Protein II) se fixe sur la<br />

queue polyA. La queue polyA (associée à la PABP) semble jouer un rôle dans la stabilisation des<br />

messagers et dans l’initiation de la traduction [11, 12].<br />

3- L’excision-épissage des introns<br />

Elle consiste en l’élimination de toutes les séquences introniques du transcrit primaire. Ce mécanisme<br />

est commun à la grande majorité des ARN messagers. Le premier élément dans la connaissance des<br />

mécanismes de l’épissage fut la mise en évidence de séquences dinucléotidiques, appelées séquences<br />

consensus retrouvées aux extrémités des introns. Ces dinucléotides sont GU en 5’ et AG en 3’ de<br />

l’intron (règle de Breathnatch.R et Chambon.P). Des expériences de mutagenèse ont confirmé<br />

l’importance de ces séquences. De plus, des expériences d’épissage in vitro ont permis de montrer<br />

que l’intron formait une structure en lasso au cours de l’épissage.<br />

3-1- Mécanisme d’excision-épissage constitutif<br />

Les éléments qui jouent un rôle important lors de l’excision-épissage du transcrit primaire sont [12] :<br />

- La région 5’ de la jonction exon-intron qui possède la séquence consensus : AG/GURAGU<br />

(R= purines). La séquence dinucléotidique GU de l’intron est appelé site donneur d’épissage.<br />

- La région 3’ de la jonction intron-exon contenant un motif YAG/RNNN. La séquence AG se trouve<br />

dans l’intron et est appelé site accepteur d’épissage.<br />

- Le site de branchement du lasso qui est : CURA20HY. Il se trouve à peu près à 100 nucléotides en<br />

amont du site accepteur d’épissage. Dans ce motif, le nucléotide adénosine (A) suivi des<br />

pyrimidines (Y) est très conservé.Le mécanisme d’épissage peut être décomposé en 2 étapes de<br />

trans-estérification et nécessite aussi la présence de petits ARN de type snRNA (small nuclear<br />

RNA). Ces petits ARN agissent sous forme de complexes avec des protéines et sont alors<br />

nommés : snRNP (small nuclear RiboNucleoprotein Particles). Plusieurs types de snRNP existent,<br />

ils diffèrent par leur structure mais ils sont tous riches en uracile: U1, U2, U3, U4, U5, U6. Dans<br />

un premier temps, l’ARN U1 s’hybride au niveau du site donneur de l’ARN messager par<br />

<strong>EPHE</strong> Banque de Monographies SVT 13


homologie de séquence et en présence du facteur d’épissage de la famille des phosphoprotéines<br />

SR (Sérine Arginine): SF2. Cette fixation permet :- l’initiation de l’assemblage du "spliceosome"<br />

au niveau de l’intron à éliminer - la coupure en 5’ du G de la séquence consensus GU. L’ARN U2<br />

se fixe ensuite au niveau du site de branchement ; cette fixation nécessite un autre facteur<br />

protéique : U2AF (U2 small nuclear ribonucleoprotein Auxiliary Factor). L’extrémité 5’ libérée<br />

du site donneur subit une liaison phosphodiester un peu particulière avec le 2’OH du ribose de<br />

l’adénosine du site de branchement auquel s’est fixé l’ARN U2. A cette structure sont associés U4<br />

et U6. L’ARN U5 s’est fixé au niveau du site accepteur d’épissage. La première étape consiste<br />

donc en la formation du lasso à proprement parlé.Dans un second temps, le premier exon, bien<br />

que coupé, reste associé à l’intron via des protéines. La formation du "spliceosome" fait que<br />

l’extrémité 3’OH libre de l’exon se trouve en face du site accepteur. Une seconde réaction de<br />

trans-estérification va entraîner sa ligation à l’extrémité 5’ de l’exon suivant. La seconde étape du<br />

mécanisme d’épissage a donc pour but de raccorder puis fusionner les deux exons et d’induire la<br />

libération de l’intron sous forme de lasso [12, 13].<br />

3-2- Mécanisme d’épissage alternatif<br />

L’épissage est dit alternatif lorsque les messagers résultent de l’utilisation alternative de sites<br />

accepteurs et/ou donneurs d’épissage "faibles" pouvant conduire, après traduction, à des protéines<br />

différentes. Ces sites d’épissage "faibles" (par opposition aux sites d’épissage constitutifs) sont<br />

reconnus dans certaines conditions et conduisent à l’addition ou l’exclusion d’exon(s), la rétention<br />

entière ou partielle d’intron(s) ou d’exon(s). Ce mécanisme permet d’augmenter la capacité de codage<br />

des gènes et il se rencontre en particulier dans les gènes impliqués dans la physiologie du cerveau et<br />

du muscle.<br />

3-3- Importance de l’épissage alternatif dans la myogenèse<br />

3-3-1- Le facteur de transcription MEF2 et l’intégrine b1<br />

Les gènes MRF (Myogenic Regulatory Factor) de la famille MyoD régulent le programme de<br />

différenciation du muscle squelettique. Il existe quatre facteurs régulateurs du muscle (MRF) de la<br />

famille MyoD : la myogénine, MRF4, Myf5 et MyoD lui-même. Ces facteurs de transcription ont des<br />

motifs de type hélice-boucle-hélice (helix-loop-helix) qui se lient sur une séquence spécifique de<br />

l’ADN, appelée boîte E, après hétérodimérisation. Des expériences d’inactivation par recombinaison<br />

homologue chez la souris ont montré que MyoD et Myf5 ont des rôles partiellement chevauchant<br />

dans la détermination des cellules précurseurs du muscle, alors que la myogénine apparaît être<br />

essentielle pour la différenciation de ces cellules en cellules musculaires. Si des cellules non<br />

musculaires sont transfectées avec un des MRF, elles vont soit se transformer en cellules<br />

myogéniques soit ne pas exprimer le phénotype musculaire, tout dépend du type de cellules analysées.<br />

L’étude des cellules NIH3T3 [14] montrent qu’elles subissent une transformation myogénique<br />

<strong>EPHE</strong> Banque de Monographies SVT 14


incomplète après transfection avec les différents MRF. En effet, ces cellules transfectées sortent du<br />

cycle cellulaire et expriment les marqueurs moléculaires de la différenciation mais ne rentrent pas en<br />

différenciation terminale, c’est-à-dire qu’elles ne forment pas de myotubes multinuclés.<br />

L’incapacité à fusionner des cellules NIH3T3 transfectées par un membre de la famille MyoD est<br />

principalement due à l’impossibilité de générer, par épissage différentiel, les transcrits spécifiques du<br />

muscle comme la sous-unité de l’intégrine b1D et le facteur de transcription MEF2-D (Myocytespecific<br />

Enhancer Factor 2-D).<br />

Cette sous-unité b1D de l’intégrine est localisée dans le muscle squelettique au niveau de diverses<br />

structures d’adhésion où elle est en contact direct avec la taline et l’a-actinine [15]. Elle est associée<br />

dans le muscle squelettique adulte avec les sous-unités a7A et a7B de l’intégrine. Elle est exprimée<br />

après la fusion des myoblastes et son expression continue à augmenter pendant la croissance et la<br />

maturation des myotubes, par opposition avec l’isoforme b1A dont l’expression diminue pendant la<br />

myodifférenciation pour disparaître lorsque les myotubes différenciés arrivent à maturation (après la<br />

fusion des cellules). En effet, dans les myoblastes C2C12, b1A est progressivement remplacée par<br />

b1D. Le domaine cytoplasmique de la sous-unité b1D correspond à un épissage alternatif unique de<br />

50 acides aminés. Les 24 derniers acides aminés ajoutés par cet épissage sont codés par un nouvel<br />

exon du gène de l’intégrine b1. Parmi ces 24 acides aminés, 13 sont uniques et 11 sont conservés par<br />

comparaison avec l’isoforme b1A. Les deux isoformes possèdent deux motifs conservés NPXY à la<br />

même position. L’incapacité des cellules NIH3T3 surexprimant les MRF à fusionner est directement<br />

corrélée à un très faible niveau d’épissage alternatif de l’isoforme b1 D spécifique du muscle. Ces<br />

cellules présentent un épissage défectueux du gène MEF2-D.<br />

Le facteur de transcription MEF2-D appartient à la famille des Myocyte-specific Enhancer-binding<br />

Factor 2. Ce facteur de transcription se lie et active la transcription sous forme d’hétérodimères avec<br />

MEF2A et MEF2C, en reconnaissant une séquence d’ADN conservée riche en A/T :<br />

5’CTA(A/T) 4TA(G/A)3’. MEF2D lie cette séquence consensus avec une haute affinité et semble être<br />

un puissant activateur transcriptionnel. Ce facteur de transcription partage par la boîte MADS (qui<br />

permet la liaison à l’ADN et la dimérisation) et le domaine MEF2 une forte homologie d’acides<br />

aminés avec d’autres membres de la famille MEF2. L’ADNc codant MEF2D montre un cadre de<br />

lecture ouvert non interrompu de 514 acides aminés correspondant à une protéine de 55kDa.<br />

L’épissage alternatif de ce gène peut conduire à quatre transcrits : un sans les exon 1a et 1b ni l’exon<br />

2, un avec l’exon 1a, un avec l’exon 1b et un dernier avec l’exon 2. Ces différentes isoformes lient<br />

l’ADN de la même manière et ont des activités transcriptionnelles comparables dans les tissus où ils<br />

sont présents [16].<br />

Des études de son patron d’expression ont montré qu’il y avait prédominance du transcrit contenant<br />

l’exon 1b dans les myotubes C2C12 ainsi que dans le muscle squelettique. Les transcrits contenant<br />

l’exon 1a et l’exon 1b sont présents à des niveaux similaires dans le muscle cardiaque. Il a été montré<br />

que dans les cellules NIH3T3, l’épissage alternatif aboutissant à la forme MEF2D 1b spécifique du<br />

muscle est défectueux.<br />

<strong>EPHE</strong> Banque de Monographies SVT 15


En conclusion, les différentes isoformes de l’intégrine b1 et/ou du facteur de transcription MEF2 sont<br />

tissu-spécifiques et l’incapacité à générer les formes musculaires des ARNm de ces deux gènes dans<br />

les cellules NIH3T3 ne permet donc pas l’obtention du ²phénotype musculaire².<br />

L’épissage alternatif est donc un mécanisme qui génère une diversité protéique importante et présente<br />

une régulation complexe. Des anomalies de ce processus peuvent conduire à des disfonctionnements<br />

importants comme nous allons le voir dans le paragraphe suivant.<br />

3-3-2- Anomalie de l’épissage et pathologie musculaire<br />

3-3-2-1- Le gène MTMR1 (myotubularin-related 1)<br />

Le gène MTMR1 appartient à une famille de lipides phosphatases. Le premier membre de cette<br />

famille de gène, MTM1 code pour la myotubularine, une phosphatase spécifique du<br />

phosphatidylinositol 3-phosphate [PI(3)P]. MTM-1 est muté dans la myopathie myotubulaire liée à<br />

l’X (XLMTM) provoquant de sérieux désordres congénitaux qui affectent le muscle squelettique.<br />

MTM1 et MTMR1 sont homologues, adjacents sur le chromosome X et codent pour des protéines<br />

présentant 59% d’identité de séquence. Six isoformes d’ARNm de MTMR1 ont été mis en évidence<br />

par différents épissages alternatifs de trois exons (2.1, 2.2, 2.3) dans l’intron 2 du gène [17]. Les six<br />

isoformes issues des différents épissages alternatifs des trois exons supplémentaires sont :<br />

- A (absence des trois exons) et B (présence de l’exon 2.1). Ils sont ubiquitaires au stade<br />

embryonnaire.<br />

- C (présence des exons 2.1 et 2.2). Il est spécifique du muscle squelettique adulte.<br />

- D (présence des exons 2.1 , 2.2 et 2.3). Il se trouve dans le muscle et le cœur au stade embryonnaire<br />

tardif.<br />

- E (présence de l’exon 2.3) et F (présence des exons 2.1 et 2.3). Ils sont spécifiques du cerveau.<br />

L’isoforme C (contenant les exons 2.1 et 2.2) est majoritaire dans le muscle squelettique adulte et<br />

induite pendant la myogenèse aussi bien in vivo qu’in vitro. Les isoformes A et C de la protéine<br />

MTMR1 ont la même spécificité de substrat (PI(3)P) et montrent la même localisation sub-cellulaire.<br />

Buj-bello et col. ont montré que l’épissage alternatif conduisant à cette forme C spécifique du muscle<br />

est altéré dans une pathologie du muscle où de nombreuses pertubations d’épissages ont été décrites :<br />

la dystrophie myotonique (DM). Ceci aboutit à une réduction de cette isoforme et à la présence d’une<br />

nouvelle isoforme G. Dans des cellules ainsi que dans des tissus fœtaux DM, ce transcrit est anormal<br />

et ne contient que l’exon 2.2. Cet ARNm n’est pas affecté dans la myopathie myotubulaire liée à l’X<br />

(XLMTM). Cependant, l’importance de ce phénomène dans la pathologie DM n’est pas encore<br />

établie. D’autres défauts d’épissage ont été décrits pour les gènes IR (Insulin Receptor) et CIC-1<br />

(chloride channel) impliqués dans cette pathologie.<br />

3-3-2-2- Les gènes IR (Insulin Receptor) et CIC-1 (chloride channel)<br />

<strong>EPHE</strong> Banque de Monographies SVT 16


Chez les patients atteints de DM1, le transcrit du gène DMPK comporte des répétitions multiples de<br />

triplet CTG dans sa partie 3’UTR [18]. Ces ARNm mutants de DMPK contiennent jusqu’à milles<br />

répétitions CTG et la sévérité de la maladie est directement corrélée à la longueur de ces extensions.<br />

L’expression de DMPK dans les cellules DM1 est très faible. Il a été montré que la faible traduction<br />

de ces transcrits n’est pas due à un épissage défectueux mais à leur rétention dans le noyau. En effet,<br />

ces transcrits mutants sont accumulés au niveau du noyau et étroitement associés à la matrice<br />

nucléaire. Cette perte de fonction de DMPK dans les cellules DM1 est donc due à un mauvais export<br />

des ARNm et par conséquent à une traduction réduite de DMPK. Cependant, ce phénomène n’est pas<br />

directement responsable de la maladie. En effet, la maladie développée par les souris dont le gène<br />

DMPK a été inactivé par recombinaison homologue n’est pas similaire à DM1. Aucune autre<br />

mutation dans le gène DMPK n’a jamais été observée chez les patients DM1. De plus, la maladie<br />

DM2, une autre forme de dystrophie myotonique, phénotypiquement très proche de DM1, est causée<br />

par des extensions CCTG dans l’intron 1 du gène ZNF9. Le transcrit de ZNF9 est également retenu<br />

dans le noyau.<br />

Il a donc été suggéré que la présence de ces répétitions CUG dans ces ARNm (ARN (CUG)n ) est<br />

responsable de ces maladies indépendamment du locus considéré [19]. La ribonucléoprotéine<br />

nucléaire (hnRNP) CUG-BP fixe l’ARN et est impliquée dans la régulation de l’épissage alternatif<br />

d’ARNm spécifiques en se fixant sur des séquences introniques conservées contenant des éléments<br />

riches en U/G. Cette protéine est surexprimée dans les cellules DM1 et DM2, c’est à dire dans les<br />

cellules contenant des (ARN (CUG)n ). Le mécanisme de régulation de son expression par ces<br />

séquences CUG n’est pas connu. Les cibles spécifiques de CUG-BP sont entre autres, le gène du<br />

récepteur à l’insuline et le gène CIC-1 (chloride channel). L’accumulation nucléaire et donc la<br />

fixation de CUG-BP à des motifs U/G provoque des épissages aberrants. Par exemple, l’insertion<br />

d’un codon de terminaison prématuré entre deux exons aboutit à la perte d’expression de la protéine<br />

CIC-1 sauvage et à la myotonie. Dans le cas de IR, l’élimination de l’exon 11 de l’ARNm conduit à<br />

une isoforme courte du récepteur responsable de la résistance à l’insuline observée dans la pathologie<br />

DM.<br />

4- Promoteurs alternatifs<br />

Dans le cas de la synthèse de plusieurs ARNm à partir d’un même gène, deux possibilités se<br />

présentent quant à la régulation de la transcription : soit les transcrits sont régulés par les mécanismes<br />

que l’on vient d’illustrer précédemment, c’est-à-dire l’épissage alternatif, soit chacun d’eux est régulé<br />

sous le contrôle d’un promoteur distinct. Ce dernier mécanisme peut induire des différences<br />

d’épissage en fonction des espèces, des tissus d’expression ou même des conditions<br />

environnementales. Par conséquent, on peut rencontrer simultanément les deux mécanismes.<br />

Utilisation du promoteur spécifique du muscle (pM) de l’aldolase A<br />

La spécialisation des fibres musculaires squelettiques a lieu durant la période postnatale. Elle est<br />

caractérisée par la contractibilité (fibres rapides ou lentes) et par leur métabolisme qui est soit<br />

glycolytique soit oxydatif. Ces différences sont dues à la présence de différentes protéines contractiles<br />

<strong>EPHE</strong> Banque de Monographies SVT 17


et métaboliques. L’aldolase A est une enzyme glycolytique présente en grande quantité dans les fibres<br />

musculaires adultes rapides. Le gène murin codant pour l’enzyme glycolytique aldolase A est<br />

transcrit à partir de trois promoteurs alternatifs [20]: le promoteur pM muscle spécifique qui se situe<br />

entre les promoteurs pN et pH actifs dans la majorité des tissus y compris le muscle squeletique et<br />

cardiaque. Dans les cellules C2C12, le promoteur M est activé dans les 24 heures suivant l’induction<br />

de la différenciation et les trois promoteurs sont actifs dans les phases tardives de ce processus et le<br />

restent dans les myotubes différenciés [21]. Le promoteur pM est activé spécifiquement dans les<br />

fibres musculaires glycolytiques rapides et son niveau d’expression augmente durant la période<br />

postnatale de maturation du muscle. pM est beaucoup plus actif dans les muscles du corps que de la<br />

tête. Ce promoteur est activé en deux étapes : la spécificité de fibres est acquise très tôt durant la<br />

période après la naissance alors que la dichotomie corps/tête apparaît 15 jours après la naissance.<br />

Différents sites de fixation pour des facteurs de transcription ont été caractérisés dans cette région. La<br />

génération de souris transgéniques pour cette région, soit sous sa forme sauvage ou mutée pour<br />

certains des sites a montré que les sites de fixation requis pour l’expression dans les fibres rapides par<br />

rapport aux fibres lentes ainsi que ceux utilisés par différents types de fibres rapides sont différents.<br />

Ces résultats montrent que l’utilisation d’un promoteur alternatif permet de cibler l’expression d’un<br />

gène dans un tissu donné à un moment précis.<br />

III- Régions Régulatrices de l’ARN messager<br />

La régulation de l’expression d’un gène implique un contrôle de la transcription permettant d’aboutir<br />

à la maturation de l’ARN mais aussi à un contrôle post-transcriptionnel (c’est-à-dire le transport de<br />

l’ARNm du noyau vers le cytoplasme, l’efficacité de sa traduction, sa localisation cellulaire et sa<br />

stabilité). Ce dernier contrôle se fait principalement grâce à des éléments ARN généralement situés<br />

dans les régions transcrites mais non traduites de l’ARNm (à savoir le 5’ et le 3’ UTR)<br />

1. Interactions entre la coiffe, la séquence codante et la queue polyA<br />

Comme nous l’avons précisé précedemment, des études in vitro ont montré que la mise en place de la<br />

coiffe, de l’épissage et de la polyadénylation sont dépendantes les unes des autres.<br />

En particulier, il semble que la structure de la coiffe joue un rôle important au niveau du phénomène<br />

d’épissage. L’incubation in vitro d’un pré-ARNm dans un extrait nucléaire, montre que l’addition<br />

d’une coiffe augmente de façon significative la formation de l’ARNm épissé. L’interconnexion de la<br />

coiffe et de l’épissage est importante pour l’intron le plus proximal et diminue avec la distance. Cette<br />

étroite relation implique la protéine nucléaire CBC (Cap Binding Complex) associée à la coiffe.<br />

L’élimination de la protéine CBC d’extraits nucléaires entraîne une inhibition significative de<br />

l’épissage. Des études complémentaires ont montré que CBC influe de manière positive sur<br />

l’interaction du U6snRNA avec le site donneur d’épissage en affectant le remplacement du U1snRNP<br />

par U6 [12]. Ce mécanisme montre bien qu’un épissage efficace est dépendant de la coiffe.<br />

<strong>EPHE</strong> Banque de Monographies SVT 18


Il semble que la coiffe interfère également avec la polyadénylation. Des expériences similaires ont<br />

permis de montrer que la présence de CBC stabilise le complexe de polyadénylation en présence du<br />

transcrit primaire [22].<br />

Enfin, il existe deux liens étroits entre l’épissage et la polyadénylation<br />

- Le premier consiste en la délimitation des exons dans le mécanisme d’épissage de l’ARN. Pour les<br />

exons ²internes² au gène, les sites d’épissage 3’ et 5’ sont le plus souvent reconnus par des<br />

interactions entre les facteurs d’épissage aux bornes de l’exon. Ce mécanisme de délimitation des<br />

exons est également appliqué au dernier exon du gène, bien que dans ce cas le dernier exon soit<br />

délimité par le signal de polyadénylation. L’épissage et la polyadénylation à chaque extrémité de<br />

l’exon se régulent positivement entre eux. Cette régulation fait intervenir une interaction entre le<br />

facteur d’épissage U2AF et la polyA polymérase [23].<br />

- Le second lien qui existe entre l’épissage et la polyadénylation peut être mis en évidence dans le<br />

cas d’une polyadénylation alternative. En effet, la position de la queue polyA peut être variable<br />

s’il existe plusieurs sites de clivage dans la région 3’UTR de l’ARN pré-messager. Cette<br />

polyadénylation alternative peut conduire à l’expression de différents produits à partir d’un même<br />

gène. Deux exemples ont été bien caractérisés : le gène codant pour la chaîne lourde de<br />

l’immunoglobuline M (IgM) et le gène de la calcitonine [24].<br />

Le gène IgM possède un premier site de polyadénylation dans un intron qui est sujet à une répression<br />

par le site donneur d’épissage situé en amont. Ce site est finalement éliminé par épissage de l’intron<br />

le contenant. L’ARNm résultant utilise son second site de polyadénylation situé en aval, produisant<br />

ainsi la forme membranaire de la protéine, qui prédomine au cours du développement précoce des<br />

cellules B. Dans les cellules B matures, le premier site de polyadénylation, jusque-là réprimé, va être<br />

beaucoup plus sollicité, pour synthétiser une forme sécrétée plus courte de la protéine. Dans ces<br />

cellules, contrairement aux cellules B immatures, le facteur de polyadénylation CstF-64 (Cleavage<br />

stimulation Factor-64) est fortement exprimé et cette protéine a une haute affinité pour le plus court<br />

signal de polyadénylation. Elle entre donc en compétition avec le mécanisme d’épissage [25] et<br />

favorise ainsi la synthèse de la forme courte.<br />

Une situation similaire existe pour le gène de la calcitonine. Le transcrit du gène de la calcitonine<br />

subit un épissage alternatif spécifique de tissu qui conduit au messager de la calcitonine (dans la<br />

thyroïde) ou au messager d’un neuromédiateur, le CGRP (Calcitonin Gene Related Peptide) dans le<br />

cerveau. Il semble que cet épissage alternatif résulte de la présence, dans la thyroïde, d’un élément<br />

activateur (enhancer) impliqué dans le recrutement des facteurs d’épissage conduisant à la production<br />

de messagers de la calcitonine. Dans le cerveau, cet élément de régulation positif est présent, mais ne<br />

semble plus pouvoir agir. Ceci conduit à la production de CGRP plutôt qu’à la calcitonine [24].<br />

2. Régulation par la coiffe et la queue polyA [26]<br />

Les protéines qui interagissent avec la coiffe et la queue polyA induisent généralement deux<br />

<strong>EPHE</strong> Banque de Monographies SVT 19


processus de régulations supplémentaires. Le premier consiste en la reconnaissance de l’intégrité de<br />

l’ARNm par le système de surveillance. En effet, dans le cas où des anomalies seraient détectées, ce<br />

système empêche l’export de l’ARNm vers le cytoplasme. Le second mécanisme de régulation<br />

consiste en l’export de l’ARNm dans le cytoplasme à proprement parler. Les protéines mises en jeu<br />

lors de la reconnaissance de l’intégrité de l’ARNm vont interagir avec les protéines du pore nucléaire<br />

afin de permettre le transport de cet ARNm. Ces phases de régulation permettent la prise en charge<br />

d’un ARNm ²correct² par la machinerie traductionnelle.<br />

Dans le noyau, la protéine CBC se lie à la coiffe. Elle est composée de deux sous-unités : la sousunité<br />

CBP80 qui contient un NLS (Nuclear Import Signal) classique et la sous-unité CBP20 qui<br />

contient un domaine de liaison à l’ARN de type RNP. La protéine CBC est importante pour<br />

l’épissage du transcrit primaire mais aussi pour l’export de l’ARNm du noyau vers le cytoplasme<br />

grâce à des associations/dissociations avec les sous-unités des molécules d’importines a et b et les<br />

snRNA.<br />

La queue polyA, quant à elle, est associée à la PABPII qui semble jouer un rôle dans la stabilisation<br />

des messagers et dans l’initiation de la traduction.<br />

Une fois l’ARNm exporté vers le cytoplasme, les protéines CBC et PABPII vont être remplacées<br />

respectivement par le complexe eIF4-F (eukaryotic translation Initiation Factor 4-F) et par la protéine<br />

PABPI.<br />

Le complexe eIF4-F comprend trois sous-unités : eIF4-E qui est en contact direct avec la coiffe,<br />

eIF4-A qui possède une activité hélicase dépendante de l’ATP et eIF4-G (appelé aussi p220) qui<br />

permet l’assemblage du complexe d’initiation de la traduction. Ce complexe permet la traduction de<br />

l’ARNm.<br />

La protéine PABPI recouvre la queue polyA afin de lui servir de bouclier contre les attaques des<br />

ribonucléases de la cellule. Cette protéine va donc empêcher la dégradation de l’ARNm.<br />

3. Régulation par la région 5’UTR<br />

Rappelons que la région 5’UTR est délimitée par le site d’initiation de la transcription d’un côté et le<br />

site de démarrage de la traduction de l’autre. La distance qui sépare ces deux sites peut varier puisque<br />

dans un gène présentant plusieurs promoteurs, la transcription peut être initié à partir de plusieurs sites<br />

de démarrage différents. Ce phénomène conduirait donc à la synthèse de régions 5’UTR différentes<br />

pour un même ARNm. La région 5’UTR peut varier en taille car la traduction peut démarrer à<br />

différents sites, permettant ainsi la synthèse de protéines avec des régions N-terminal différentes.<br />

Une des premières régulations de la région 5’UTR est sa longueur. En effet, la distance entre la coiffe<br />

et le codon d’initiation de la traduction semble jouer un rôle sur l’efficacité de l’initiation de la<br />

traduction. La longueur minimale requise pour permettre la reconnaissance du premier codon AUG,<br />

est d’environ 20 nucléotides, mais elle peut être compensée par la présence de structures secondaires<br />

en aval de l’ATG [27]. Au-delà de 20 nucléotides, l’efficacité de l’initiation de la traduction<br />

augmente avec la taille. Ceci pourrait s’expliquer en partie par l’accumulation de nombreuses sousunités<br />

40S sur ces longs 5’UTR conférant ainsi un avantage pour la traduction. Des études ont montré<br />

<strong>EPHE</strong> Banque de Monographies SVT 20


qu’une région UTR riche en dinucléotides GC est néanmoins beaucoup plus courte qu’une région<br />

UTR pauvre en GC.<br />

Plusieurs éléments régulateurs post-transcriptionnels spécifiques à la région 5’UTR ont été décris.<br />

Ainsi, on peut retrouver en plus de la coiffe :<br />

- des IRES (Internal Ribosome Entry Site) ou sites internes d’entrée des ribosomes qui peuvent<br />

permettre la traduction de plusieurs protéines à partir d’un seul ARNm. L’IRES permet la traduction<br />

sans reconnaissance de la coiffe par le ribosome.<br />

- les uORF (upstream Open Reading Frame). Ce sont de petits cadres de lecture qui peuvent interférer<br />

avec le site préférentiel d’initiation de la traduction du gène considéré.<br />

- des structures secondaires en épingle à cheveux qui soit empêchent le balayage de l’ARNm par les<br />

ribosomes soit permettent l’interaction entre l’ARN et des protéines régulatrices pour moduler la<br />

traduction.<br />

3-1- IRES (Internal Ribosomal Entry Site)<br />

L’IRES est une structure d’initiation de la traduction qui ne nécessite pas la reconnaissance de la<br />

coiffe par le ribosome. L’activité IRES est dépendante non pas du codon d’initiation de la traduction<br />

(AUG) mais de structures secondaires ou tertiaires, de facteurs trans-activateurs, ou de séquences<br />

complémentaires à la sous-unité 18S de l’ARNr [28]. Cette initiation nécessite la présence des<br />

facteurs d’initiation de la traduction eIFs, à l’exception de eIF-4E (qui reconnaît spécifiquement la<br />

coiffe). La majorité des IRES sont d’origine virale. Seules quelques-unes ont été décrites comme étant<br />

d’origine cellulaire. Les séquences IRES cellulaires sont fréquemment activées lorsque la protéine<br />

normalement synthétisée (de manière coiffe dépendante) est inhibée.<br />

L’ARNm de c-myc comporte un long et complexe 5’UTR contenant un IRES. C-myc est un<br />

protooncogène impliqué dans la régulation de la prolifération et l’apoptose. L’activité de l’IRES cmyc<br />

dépend du type cellulaire et du stimulus appliqué à la cellule. Ainsi, lorsque la cellule entre en<br />

apoptose, la traduction dépendante de la coiffe diminue, probablement par le clivage de eIF-4G ainsi<br />

que d’autres facteurs de la traduction par les caspases et l’activité IRES augmente. D’autres gènes<br />

impliqués dans la régulation de l’apoptose contiennent un IRES dans leur extrémité 5’UTR. C’est le<br />

cas de Apaf-1 (Apoptosis protease activating factor-1) et de XIAP (X-linked Inhibitor Apoptosis<br />

Protein).<br />

Au cours de la phase G2/M du cycle cellulaire, la synthèse des protéines dépendante de la coiffe est<br />

inhibée. C’est le cas pour les protéines kinases PITSLRE qui appartiennent à la famille des kinases<br />

dépendantes des cyclines [29]. Elles agissent comme des gènes suppresseurs de tumeurs et ont été<br />

montré comme ayant un rôle dans la progression du cycle cellulaire. Deux isoformes des protéines<br />

kinases PITSLRE existent : p110 PITSLRE et p58 PITSLRE . p110 PITSLRE est produite par traduction<br />

dépendante de la coiffe alors que p58PITSLRE résulte d’une traduction dépendante d’une IRES. Lors<br />

de la phase G2/M du cycle cellulaire, l’ARNm des protéines kinases PITSLRE n’est pas traduit de<br />

manière dépendante à la coiffe. En effet, lorsque l’inhibition de la traduction dépendante de la coiffe<br />

<strong>EPHE</strong> Banque de Monographies SVT 21


est levée, seule la protéine p110 PITSLRE est synthétisée. En contrepartie, lorsque la traduction<br />

dépendante de la coiffe est inhibée, seule la protéine p58 PITSLRE est présente. Ces observations<br />

révèlent donc un nouveau mécanisme de régulation de la traduction pendant la progression du cyle<br />

cellulaire.<br />

En général, la traduction d’ARNm par l’intermédiaire d’un IRES est activée lorsque les conditions ne<br />

sont pas favorables à une traduction coiffe dépendante. C’est le cas de l’apoptose et de l’arrêt du<br />

cycle cellulaire.<br />

3-2- uORFs (upstream Open Reading Frame)<br />

Il semble que la reconnaissance de la séquence de l’ARNm par le complexe ribosomal nécessite en<br />

plus du contexte optimal du codon d’initiation de la traduction établit par Kozak : 5’GCCRCCaugG3’,<br />

des éléments régulateurs situés en 5’UTR [30]. C’est ainsi que les uORFs ont été décrits. Ce sont de<br />

petits cadres de lecture ouverts en amont de l’ATG. Tous les ARNm ne sont pas fonctionnels. Dans<br />

certains cas, ces transcrits sont traduits en quantité équivalente à l’ARN fonctionnel majoritaire. Dans<br />

d’autre cas, un transcrit incomplet peut parfois être plus abondant que l’ARN entièrement épissé et<br />

théoriquement traduisible.<br />

Après la reconnaissance et la traduction d’un uORF, le ribosome a quatre possibilités [31]:<br />

- Le ribosome reste associé à l’ARNm et continue à avancer sur le messager.<br />

- Le ribosome peut réinitier plus en aval après être resté associé et avoir avancé sur l’ARNm. Cette<br />

réinitiation peut se faire aussi bien à un codon AUG proximal qu’à un codon AUG distal. Les<br />

ribosomes traduisent souvent le petit cadre de lecture ouvert (uORF) et réinitient en aval avec une<br />

grande efficacité, n’affectant pas l’expression du gène considéré. Cependant, la taille du cadre de<br />

lecture (ORF) est un facteur limitant lors de réinitiation chez les eucaryotes. Cette réinitiation ne<br />

peut avoir lieu qu’après la traduction d’un premier cadre de lecture court mais en aucun cas après<br />

la traduction d’un premier cadre de lecture long et entier. La raison pour laquelle la réinitiation est<br />

fréquemment liée à la taille du premier cadre de lecture peut s’expliquer par le fait que certains<br />

facteurs impliqués dans l’initiation de la traduction se dissocient du ribosome progressivement<br />

pendant la phase d’élongation. Par conséquent, si la phase d’élongation est brève (dans le cas d’un<br />

premier cadre de lecture court), les facteurs requis pour la réinitiation d’un nouveau cadre de<br />

lecture seront présents. Ceci ne sera pas le cas, si la première initiation de la traduction a lieu à<br />

partir d’un cadre de lecture long et entier.<br />

- Le ribosome s’arrête en cours de la phase d’élongation ou de terminaison de la traduction de<br />

l’uORF, créant ainsi un blocus. Dans ce cas, la structure du peptide codée par l’uORF serait à<br />

l’origine de l’arrêt. Il semblerait que ce peptide interagisse avec la machinerie traductionnelle.<br />

Cette interaction semble perturber l’expression du gène lui-même et bloquer toute nouvelle<br />

traduction à partir d’un uORF plus en aval.<br />

- L’uORF synthétisée peut affecter l’expression du gène en altérant la stabilité de son messager. En<br />

effet, il semblerait qu’un complexe multiprotéique agisse au niveau de la terminaison de la<br />

traduction dans le but de réguler le devenir du ribosome et de l’ARNm. A ce moment là, l’uORF a<br />

<strong>EPHE</strong> Banque de Monographies SVT 22


la possibilité de provoquer la dégradation de l’ARNm et donc d’éliminer l’expression du gène. Le<br />

mécanisme qui entraîne cette dégradation est très mal connu.<br />

D’autre part, il existe des mécanismes qui éliminent les uORFs quand une forte synthèse de protéine<br />

est requise dans un tissu précis ou à un moment donné.<br />

En conclusion, les uORFs agissent au niveau de l’expression des gènes. Dans certains cas, ils servent<br />

d’éléments régulateurs importants.<br />

3-3- Présence de Structures Secondaires<br />

Le contrôle de la traduction d’un ARNm peut également être modulé par des interactions entre des<br />

séquences de réponse spécifiques à structures secondaires et des protéines régulatrices de l’initiation<br />

de la traduction, qui sont généralement des répresseurs. C’est le cas du facteur IRP1 (Iron Responsive<br />

Protein-1) [28]. Ce facteur se lie à un motif IRE (Iron Responsive Element) de manière dépendante à<br />

une homéostasie en fer dans la cellule. Le motif IRE correspond à une épingle à cheveux et est<br />

localisé près de la coiffe dans la région 5’UTR de l’ARNm de la ferritine. Cette protéine est requise<br />

pour le stockage du fer ainsi que pour son utilisation sauf lorsque le niveau en fer de la cellule est trop<br />

faible. En effet, si la quantité de fer intracellulaire est insuffisante, cela accroît l’activité de liaison de<br />

IRP1 à la structure en épingle à cheveux IRE. Ce complexe est stabilisé par IRP2 (Iron Responsive<br />

Protein-2). La liaison de IRP à IRE empêche l’accrochage du complexe ribosomale 40S à l’ARNm et<br />

donc inhibe fortement la traduction de la ferritine. Inversement, lorsque la concentration en fer est<br />

élevée, IRP2 est dégradée par le protéasome et IRP1 capture les ions fer, ce qui l’empêche de se lier<br />

au motif IRE. Dans ces conditions, les facteurs d’initiation à activité hélicase (eIFs) détruisent la<br />

structure en épingle à cheveux de l’IRE, et permettent l’entrée et la fixation à l’ARNm du complexe<br />

de pré-initiation 40S. Le ribosome ainsi assemblé peut donc entraîner l’initiation de la traduction.<br />

4. Régulation par la région 3’UTR<br />

La région 3’UTR se situe entre le codon de fin de la traduction et la queue polyA. Cette région peut<br />

être variable s’il existe plusieurs codons stop, des épissages alternatifs du dernier exon et un usage<br />

alternatif de sites de polyadénylation. On a pu constater que la région 3’UTR est impliquée dans la<br />

fixation de certains facteurs d’élongation (eIFs) ainsi que dans la réinitiation de la traduction en<br />

permettant de recycler les sous-unités ribosomales en direction de l’extrémité 5’ du même ARNm.<br />

Par conséquent, la région 3’UTR participe à l’optimisation de l’initiation de la traduction.<br />

Cette région est également impliquée dans le contrôle de la traduction, la localisation sub-cellulaire et<br />

la stabilité des messagers par l’intermédiaire d’éléments régulateurs tels que :<br />

- des éléments de polyadénylation cytoplasmique riches en U nommés CPE<br />

- des éléments de désadénylation riches en A + U nommés ARE (AU Rich Element)<br />

- des éléments de réponse (de type tige-boucle) à des facteurs spécifiques<br />

<strong>EPHE</strong> Banque de Monographies SVT 23


4-1- CPE (Cytoplasmic Polyadenylation Element)<br />

La présence et la taille de la queue polyA contribuent à l’efficacité de la traduction des ARNm. La<br />

longueur de la séquence polyA des ARNm cytoplasmiques varie. Elle est régie par un phénomène<br />

dynamique qui dépend de séquences spécifiques de l’ARNm ainsi que du type cellulaire, ceci<br />

indépendamment des événements nucléaires. La taille de la queue polyA de l’ARNm est réduite au<br />

cours du temps, mais la vitesse de désadénylation varie en fonction de l’ARNm, du type cellulaire et<br />

de l’efficacité de traduction. Des réactions de désadénylation précèdent la dégradation de l’ARNm.<br />

Dans certaines circonstances, des réactions de ré-adénylation peuvent se produire dans le cytoplasme.<br />

Ces réactions de ré-adénylation cytoplasmiques ont lieu au moment où l’ARNm devient traductible et<br />

est recruté par la machinerie traductionnelle. Ces réactions nécessitent le signal AAUAAA, le CPSF<br />

et la PAP, comme cela est le cas dans le noyau, mais aussi une séquence riche en résidus U, appelée<br />

CPE. Le mécanisme par lequel le motif CPE permet la fixation de la CPEB (CPE Binding protein)<br />

pour entraîner la polyadénylation cytoplasmique n’est pas encore clairement établi.<br />

4-2- ARE (AU Rich Element)<br />

On sait que la présence de la coiffe s’oppose à la digestion des ARNm par des exoribonucléases dans<br />

le sens 5’-3’. Deux mécanismes indiquent que la queue polyA protège également les ARNm de la<br />

dégradation. L’un de ces mécanismes a déjà été évoqué puisqu’il s’agit de l’interaction de la PABP<br />

sur la queue polyA, formant ainsi un complexe qui protège les ARNm polyadénylés contre leur<br />

digestion par les exoribonucléases dans le sens 3’-5’. Le second mécanisme correspond à l’étape qui<br />

précède la dégradation des ARNm : la désadénylation. Les séquences qui stimulent ce mécanisme et<br />

favorisent donc la dégradation des messagers sont des séquences riches en résidus A et U et sont<br />

localisées dans la région 3’UTR des messagers de courte durée de vie : les ARE. Aucune séquence<br />

consensus n’a été rigoureusement établie, mais une classification a été proposée, divisant les ARE en<br />

trois groupes [32].<br />

Le premier groupe est constitué par les séquences renfermant une ou plusieurs copies du motif<br />

pentamérique AUUUA (classe I) ou tétramérique AUUU (classe II), entouré de diverses répétitions de<br />

A et U, et couplé à une longue région continue riche en U.<br />

Le second groupe consiste en des séquences divisées en deux domaines dont un est formé par environ<br />

60% de A ou U et un autre domaine constitué par trois copies du motif pentamérique GUUUG.<br />

Le troisième groupe contient une continuité de U sans aucun pentamère.<br />

La seule protéine isolée capable de se fixer sur les ARE est : AUF1 (AU Factor 1). Sa fixation induit<br />

in vitro la déstabilisation des ARNm de c-myc et du GM-CSF par exemple. Cependant, il semble<br />

qu’il existe d’autres protéines non encore identifiées capables d’induire au contraire la stabilisation de<br />

ces messagers.<br />

L’ARE est donc reconnu par différents facteurs qui, selon leur nature, stabilisent ou déstabilisent<br />

l’ARNm. Ceci permet la synthèse de protéines à des moments précis dans de conditions particulières.<br />

<strong>EPHE</strong> Banque de Monographies SVT 24


4-3- Présence de Structures Secondaires<br />

Si l’on reprend le cas de la ferritine, on s’aperçoit que ce même élément de réponse au fer de type<br />

tige-boucle IRE est également présent en 5 exemplaires dans la région 3’UTR de l’ARNm du<br />

récepteur de la transferrine (TfR) [28]. En présence de faibles concentrations en fer, les protéines<br />

IRP1et IRP2 inhibent la traduction de l’ARNm de la ferritine. En revanche, ces protéines stabilisent<br />

l’ARNm codant pour la TfR. Ceci aboutit à une augmentation du taux de ce récepteur permettant<br />

ainsi à la cellule d’absorber le fer par endocytose de la transferrine. Inversement, lorsque la<br />

concentration en fer est élevée, les protéines IRP1 et IRP2 ne sont plus actives. En effet, elles<br />

n’empêchent plus la traduction du messager de la ferritine et par conséquent le stockage du fer dans la<br />

cellule. En parallèle, elles ne protègent plus la région 3’UTR de l’ARNm du récepteur à la<br />

transferrine. Cet ARNm est donc susceptible d’être dégradé par des endoribonucléases dans le sens<br />

3’-5’. Ainsi selon les stimuli reçus par la cellule ou les variations cellulaires, les ARNm présentant<br />

des séquences particulières dans leur région 3’UTR sont dégradés ou stabilisés afin qu’une protéine<br />

soit ou non synthétisée<br />

En conclusion, les séquences ou les structures présentes dans les régions 5’UTR et 3’UTR sont très<br />

importantes pour la stabilité et la localisation des messagers mais aussi pour l’efficacité de la<br />

traduction d’un messager.<br />

5. Conclusion<br />

Tous les mécanismes que nous avons évoqués ici, à savoir l’utilisation de promoteurs alternatifs, les<br />

mécanismes d’épissages alternatifs mais aussi les régulations par les régions 5’ et 3’ des ARN<br />

messagers, permettent une grande variabilité tant au niveau de l’ARNm qu’au niveau de la protéine.<br />

Ils sont importants et nécessaires car ils permettent l’expression d’une protéine à un moment donné<br />

dans une cellule définie. Ceci confirme bien l’hypothèse selon laquelle la complexité moléculaire se<br />

situe en aval des gènes (ou du génome) et plus particulièrement au niveau des étapes de la<br />

transcription et de la traduction. Cependant d’autres mécanismes, non évoqués ici, sont capables<br />

d’induire encore une plus grande diversité protéique en régulant l’état de la chromatine, l’édition des<br />

ARN, l’interférence par les ARN ou les modifications post-traductionnelles.<br />

La régulation de la myogenèse fait intervenir certains de ces mécanismes, comme nous l’avons vu à<br />

travers les exemples d’épissages et de promoteurs alternatifs.<br />

Au laboratoire, nous avons isolé une protéine impliquée dans la différenciation musculaire régulée<br />

par la voie de signalisation PI3-K: la protéine CKIP-1.<br />

BIBLIOGRAPHIE<br />

1. Flores O, Lu H, Reinberg D: Factors involved in specific transcription by mammalian<br />

RNA polymerase II. Identification and characterization of factor IIH. J Biol Chem 1992;<br />

267:2786-2793.<br />

<strong>EPHE</strong> Banque de Monographies SVT 25


2. Boisclair YR, Brown AL, Casola S, Rechler MM: Three clustered Sp1 sites are required for<br />

efficient transcription of the TATA-less promoter of the gene for insulin-like growth<br />

factor-binding protein-2 from the rat. J Biol Chem 1993; 268:24892-24901.<br />

3. O'Shea-Greenfield A, Smale ST: Roles of TATA and initiator elements in determining the<br />

start site location and direction of RNA polymerase II transcription. J Biol Chem 1992;<br />

267:6450.<br />

4. Lagrange T, Kapanidis AN, Tang H, Reinberg D, Ebright RH: New core promoter element<br />

in RNA polymerase II-dependent transcription: sequence-specific DNA binding by<br />

transcription factor IIB. Genes Dev 1998; 12:34-44.<br />

5. Kadonaga JT: The DPE, a core promoter element for transcription by RNA polymerase<br />

II. Exp Mol Med 2002; 34:259-264.<br />

6. Wang T, Lafuse WP, Zwilling BS: NFkappaB and Sp1 elements are necessary for maximal<br />

transcription of toll-like receptor 2 induced by Mycobacterium avium. J Immunol 2001;<br />

167:6924-6932.<br />

7. Lania L, Majello B, De Luca P: Transcriptional regulation by the Sp family proteins. Int J<br />

Biochem Cell Biol 1997; 29:1313-1323.<br />

8. Chalkley GE, Verrijzer CP: DNA binding sites selection by RNA ploymerase II TAFs: a<br />

TAFII250-TAFII150 complex recognizes the Initiator. Embo J 1999; 18:4835-4845.<br />

9. Burke TW, Kadonaga JT: The downstream core promoter element, DPE, is conserved<br />

from Drosophila to humans and is recognized by TAFII60 of Drosophila. Genes Dev<br />

1997; 11:3020-3031.<br />

10. Kutach AK, Kadonaga JT: The downstream promoter element DPE appears to be as<br />

widely used as the TATA box in Drosophila core promoters. Mol Cell Biol 2000; 20:4754-<br />

4764.<br />

11. Proudfoot NJ: Genetic dangers in poly(A) signals. EMBO Rep 2001; 2:891-892.<br />

12. Proudfoot NJ, Furger A, Dye MJ: Integrating mRNA processing with transcription. Cell<br />

2002; 108:501-512.<br />

13. Moore MJ, Sharp PA: Evidence for two active sites in the spliceosome provided by<br />

stereochemistry of pre-mRNA splicing. Nature 1993; 365:364-368.<br />

14. Russo S, Tomatis D, Collo G, Tarone G, Tato F: Myogenic conversion of NIH3T3 cells by<br />

exogenous MyoD family members: dissociation of terminal differentiation from myotube<br />

formation. J Cell Sci 1998; 111:691-700.<br />

15. Belkin AM, Zhidkova NI, Balzac F, Altruda F, Tomatis D, Maier A, Tarone G, Koteliansky<br />

VE, Burridge K: Beta 1D integrin displaces the beta 1A isoform in striated muscles:<br />

localization at junctional structures and signaling potential in nonmuscle cells. J Cell Biol<br />

1996; 132:211-226.<br />

16. Martin JF, Miano JM, Hustad CM, Copeland NG, Jenkins NA, Olson EN: A Mef2 gene that<br />

generates a muscle-specific isoform via alternative mRNA splicing. Mol Cell Biol 1994;<br />

14:1647-1656.<br />

17. Buj-Bello A, Furling D, Tronchere H, Laporte J, Lerouge T, Butler-Browne GS, Mandel JL:<br />

<strong>EPHE</strong> Banque de Monographies SVT 26


Muscle-specific alternative splicing of myotubularin-related 1 gene is impaired in DM1<br />

muscle cells. Hum Mol Genet 2002; 11:2297-2307.<br />

18. Groenen PJ, Wansink DG, Coerwinkel M, van den Broek W, Jansen G, Wieringa B:<br />

Constitutive and regulated modes of splicing produce six major myotonic dystrophy<br />

protein kinase (DMPK) isoforms with distinct properties. Hum Mol Genet 2000; 9:605-<br />

616.<br />

19. Charlet BN, Savkur RS, Singh G, Philips AV, Grice EA, Cooper TA: Loss of the musclespecific<br />

chloride channel in type 1 myotonic dystrophy due to misregulated alternative<br />

splicing. Mol Cell 2002; 10:45-53.<br />

20. Salminen M, Spitz F, Fiszman MY, Demignon J, Kahn A, Daegelen D, Maire P: Myotubespecific<br />

activity of the human aldolase A M-promoter requires an overlapping binding<br />

site for NF1 and MEF2 factors in addition to a binding site (M1) for unknown proteins. J<br />

Mol Biol 1995; 253:17-31.<br />

21. Salminen M, Lopez S, Maire P, Kahn A, Daegelen D: Fast-muscle-specific DNA-protein<br />

interactions occurring in vivo at the human aldolase A M promoter are necessary for<br />

correct promoter activity in transgenic mice. Mol Cell Biol 1996; 16:76-85.<br />

22. Flaherty SM, Fortes P, Izaurralde E, Mattaj IW, Gilmartin GM: Participation of the nuclear<br />

cap binding complex in pre-mRNA 3' processing. Proc Natl Acad Sci U S A 1997;<br />

94:11893-11898.<br />

23. Vagner S, Vagner C, Mattaj IW: The carboxyl terminus of vertebrate poly(A) polymerase<br />

interacts with U2AF 65 to couple 3'-end processing and splicing. Genes Dev 2000; 14:403-<br />

413.<br />

24. Zhao J, Hyman L, Moore C: Formation of mRNA 3' ends in eukaryotes: mechanism,<br />

regulation, and interrelationships with other steps in mRNA synthesis. Microbiol Mol Biol<br />

Rev 1999; 63:405-445.<br />

25. Takagaki Y, Seipelt RL, Peterson ML, Manley JL: The polyadenylation factor CstF-64<br />

regulates alternative processing of IgM heavy chain pre-mRNA during B cell<br />

differentiation. Cell 1996; 87:941-952.<br />

26. Dreyfuss G, Hentze M, Lamond AI: From transcript to protein. Cell 1996; 85:963-972.<br />

27. Pallier C: Les régions non traduites des ARN messagers et leur rôle dans la synthèse<br />

protéique. Medecine et Sciences 2001; 17:23-32.<br />

28. Meijer HA, Thomas AA: Control of eukaryotic protein synthesis by upstream open<br />

reading frames in the 5'-untranslated region of an mRNA. Biochem J 2002; 367:1-11.<br />

29. Cornelis S, Bruynooghe Y, Denecker G, Van Huffel S, Tinton S, Beyaert R: Identification<br />

and characterization of a novel cell cycle-regulated internal ribosome entry site. Mol Cell<br />

2000; 5:597-605.<br />

30. Kozak M: Initiation of translation in prokaryotes and eukaryotes. Gene 1999; 234:187-<br />

208.<br />

31. Morris DR, Geballe AP: Upstream open reading frames as regulators of mRNA<br />

translation. Mol Cell Biol 2000; 20:8635-8642.<br />

<strong>EPHE</strong> Banque de Monographies SVT 27


32. Zhang T, Kruys V, Huez G, Gueydan C: AU-rich element-mediated translational control:<br />

complexity and multiple activities of trans-activating factors. Biochem Soc Trans 2002;<br />

30:952-958.<br />

<strong>EPHE</strong> Banque de Monographies SVT 28

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!