12.07.2015 Views

Statistiques Flux Portuaires - LMPA - Université du Littoral-Côte-d ...

Statistiques Flux Portuaires - LMPA - Université du Littoral-Côte-d ...

Statistiques Flux Portuaires - LMPA - Université du Littoral-Côte-d ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Statistiques</strong> <strong>Flux</strong> <strong>Portuaires</strong>Master 1 Management Portuaire et MaritimeUniversité <strong>du</strong> <strong>Littoral</strong> - Côte d’Opale, Pôle LamartineLaurent SMOCHSeptembre 2013Laboratoire de Mathématiques Pures et Appliquées Joseph LiouvilleUniversité <strong>du</strong> <strong>Littoral</strong>, zone universitaire de la Mi-Voix, bâtiment H. Poincaré50, rue F. Buisson, BP 699, F-62228 Calais cedex


IITABLE DES MATIÈRES3 Séries chronologiques 473.1 Intro<strong>du</strong>ction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 473.2 Modèles de composition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 473.2.1 Les composantes fondamentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 473.2.2 Les différents modèles de composition . . . . . . . . . . . . . . . . . . . . . . . . . . . 483.3 Analyse des différentes composantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483.3.1 Analyse de la tendance à long terme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483.3.2 Analyse de la composante saisonnière . . . . . . . . . . . . . . . . . . . . . . . . . . . 553.3.3 Correction des variations saisonnières . . . . . . . . . . . . . . . . . . . . . . . . . . . 573.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 614 Cas pratiques 634.1 Le port de Longoni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 634.1.1 Le port de Longoni en quelques chiffres . . . . . . . . . . . . . . . . . . . . . . . . . . 634.1.2 <strong>Statistiques</strong> <strong>du</strong> port de Longoni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644.1.3 Les indicateurs d’exploitation des terminaux conteneurs en 2011 . . . . . . . . . . . . 654.1.4 Les marchandises conteneurisées en 2011 . . . . . . . . . . . . . . . . . . . . . . . . . . 664.1.5 Les visites de contrôle (DAF, DSV, DOUANE) . . . . . . . . . . . . . . . . . . . . . . 664.1.6 Les engins de manutention de la concession . . . . . . . . . . . . . . . . . . . . . . . . 674.1.7 La gestion des matières dangereuses au port . . . . . . . . . . . . . . . . . . . . . . . . 674.2 Trafics de passagers des ports métropolitains . . . . . . . . . . . . . . . . . . . . . . . . . . . 684.3 Le Port de Montréal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 724.3.1 Présentation <strong>du</strong> Port . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 724.3.2 Le Port en bref et en chiffres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 724.3.3 Quelques statistiques <strong>du</strong> port de Montréal . . . . . . . . . . . . . . . . . . . . . . . . . 734.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76


Chapitre 1Séries statistiques à une variable1.1 Intro<strong>du</strong>ctionÀ l’origine (sans doute en Chine, plus de 2000 ans avant Jésus-Christ et en Égypte, vers 1700 avant J.-C.),la statistique fournissait des renseignements intéressant l’État concernant la population (le nombre d’habitantsd’un pays et leur répartition par sexe, par âge, par catégorie socio-professionnelle,...) et l’économie(l’évaluation des ressources de l’État, des stocks,...). Il faut préciser que le mot statistique, tra<strong>du</strong>ction <strong>du</strong>mot allemand “statistik” apparu au milieu <strong>du</strong> XV III e siècle, provient <strong>du</strong> mot latin “status” qui signifieétat.Le premier bureau de statistique a été créé en France en 1800 par Napoléon. Cet organisme a pris en 1946le nom d’Institut National de la Statistique et des Études Économiques (INSEE).Les méthodes statistiques sont aujourd’hui employées principalement– en médecine pour l’évaluation de l’efficacité d’un médicament, de l’état sanitaire d’une population,– en agronomie pour la recherche d’engrais spécifiques ainsi que pour la sélection des variétés,– en sociologie pour des enquêtes et sondages d’opinion,– dans l’in<strong>du</strong>strie pour l’organisation scientifique <strong>du</strong> travail, le contrôle de la qualité, la gestion des stockset dans bien d’autres domaines.1.2 Méthodes de représentation1.2.1 VocabulaireLa statistique a traditionnellement un vocabulaire spécifique. Récapitulons ci-après les définitions destermes courants les plus utilisés.Définition 1.2.1 La population est l’ensemble que l’on observe et dont chaque élément est appelé indivi<strong>du</strong>ou unité statistique.Définition 1.2.2 Un échantillon (ou lot) est une partie (ou sous-ensemble) de la population considérée.On étudie un échantillon de la population notamment lorsque celle-ci est impossible à étudier dans sonensemble ; c’est le cas pour les sondages d’opinion ou pour des mesures rendant inutilisables les objetsétudiés, par exemple la <strong>du</strong>rée de vie de piles électriques d’un certain type.Définition 1.2.3 Le caractère étudié est la propriété observée dans la population ou l’échantillon considéré.On peut citer par exemple la région de résidence de chaque français observé lors d’un recensement, ou lenombre d’enfants par famille observé à cette même occasion, ou encore la taille des élèves d’un lycée.Dans ces deux derniers exemples, le caractère est dit quantitatif car il est mesurable : nombre d’enfants,1


2 CHAPITRE 1.SÉRIES STATISTIQUES À UNE VARIABLEtaille. Ça n’est pas le cas <strong>du</strong> premier exemple où le caractère est dit qualitatif : région.Dans le deuxième exemple, le caractère quantitatif est discret car il ne peut prendre que des valeursisolées (ici entières) alors que dans le troisième, le caractère quantitatif est continu car il peut prendre, aumoins théoriquement, n’importe quelle valeur d’un intervalle de nombres réels.1.2.2 Les tableauxDans chaque exemple, les résultats obtenus se présentent, au départ sous forme d’une liste éventuellementlongue et sans autre classement que l’ordre d’arrivée des informations. Aussi, pour faciliter leur lecture, est-onamené à les présenter de manière plus synthétique sous forme de tableau ou de graphique.Exemple 1.2.1 (exemple de référence) Un concessionnaire d’automobiles neuves a enregistré au cours deses 40 premières semaines d’opération le nombre X d’automobiles qu’il a ven<strong>du</strong> hebdomadairement. Il aobtenu les résultats suivants :5,7,2,6,3,4,8,5,4,3,9,6,5,7,6,8,3,4,4,0,8,6,7,1,5,5,4,6,6,10,9,8,1,5,5,6,7,8,5,5Présenter de manière synthétique les résultats précédents à l’aide <strong>du</strong> tableau ci-dessous :i 1 2 3 4 5 6 7 8 9 10 11x i 0 1 2 3 4 5 6 7 8 9 10n i 1 2 1 3 5 9 7 4 5 2 1Définition 1.2.4 Une classe (ou modalité) est un sous-ensemble de la population correspondant à unemême valeur ou à des valeurs voisines prises par le caractère.Ces classes peuvent donc être des valeurs ponctuelles (nombre d’enfants par famille, “2 enfants” est uneclasse) ou des intervalles (salaires en euros des employés d’une entreprise, [700; 800] est une classe).Définition 1.2.5 L’effectif d’une classe est son nombre d’éléments.Ainsi, une série statistique à une variable peut être définie par un tableau de la forme :i 1 2 . . . . . . pValeurs prises par le caractère(ou classes) x ix 1 x 2 . . . . . . x pEffectifs correspondants n i n 1 n 2 . . . . . . n pp est le nombre de classes (ou modalités) et n i est l’effectif de la i-ème classe.L’effectif total de l’échantillon n est tel quen = n 1 + n 2 + . . . + n p avec n i ≤ n, ∀ 1 ≤ i ≤ p.On peut noter égalementn =p∑i=1n icette formule se lisant littéralement “somme des n i pour i allant de 1 à p”.On considère l’exemple 1.2.1 :


1.2.MÉTHODES DE REPRÉSENTATION 3– quelle est la taille (ou effectif total) de l’échantillon ?40– À quoi correspond le caractère x i ?Le nombre de voitures ven<strong>du</strong>es la semaine i– Le caractère x i est-il quantitatif ou qualitatif, discret ou continu ?Le caractère est quantitatif (quantité de voitures) et discret (les classes sont des valeurs ponctuelles)– Combien y a-t-il de modalités ?Il y a 11 modalités (x i peut prendre les 11 valeurs 0, 1, 2, . . . , 10).Définition 1.2.6 La fréquence d’une classe est la proportion d’indivi<strong>du</strong>s de la population (ou de l’échantillon)appartenant à cette classe.Ainsi la i-ème classe a pour fréquencef i = n inConsidérons maintenant la somme des fréquences de toutes les classes :f 1 + f 2 + . . . + f p =p∑i=1f i = n 1n + n 2n + . . . + n pn = 1 np∑n i .i=1On sait quep∑n i = n donci=1p∑f i = n n = 1.i=1Propriété 1.2.1 Les fréquences de classes d’une série statistique vérifient les propriétés suivantes :p∑f i = 1i=10 ≤ f i ≤ 1, ∀ 1 ≤ i ≤ p.On considère l’exemple 1.2.1 : calculer les fréquences de chacune des modalités de la série statistique.i 1 2 3 4 5 6 7 8 9 10 11 Totalx i 0 1 2 3 4 5 6 7 8 9 10 –n i 1 2 1 3 5 9 7 4 5 2 1 40f i 0,025 0,05 0,025 0,075 0,125 0,225 0,175 0,1 0,125 0,05 0,025 11.2.3 Les graphiques(a) Caractère qualitatifExemple 1.2.2 On s’intéresse aux étudiants d’une filière de Licence de l’ULCO et plus particulièrement àla région dont ils proviennent (qu’on symbolise respectivement par Lille, Calais Dunkerque). On obtient letableau suivant :Classe Lille Calais DunkerquePourcentage 20, 2% 35, 4% 44, 4%La propriété étudiée dans la population des étudiants est la ville d’origine. C’est un caractère qualitatif quiprend trois valeurs ou modalités permettant ainsi de définir trois classes avec leur fréquence :


4 CHAPITRE 1.SÉRIES STATISTIQUES À UNE VARIABLEi Région Pourcentage Fréquence f i1 Lille 20,2% 0,2022 Calais 35,4% 0,3543 Dunkerque 44,4% 0,444Voici trois graphiques possibles pour cette série statistique.– Diagramme à secteurs circulaireChaque classe correspond à un secteur dont l’angle est proportionnel à l’effectif donc à la fréquencede la classe. On a les angles suivants :i Région Pourcentage Angle α i1 Lille 20,2% 72,722 Calais 35,4% 127,443 Dunkerque 44,4% 159,84ce qui donne le diagramme– Diagramme en tuyaux d’orgueDans ce cas et dans le suivant (diagramme en bandes), chaque classe est représentée par un rectanglede même largeur et de longueur proportionnelle à l’effectif, donc à la fréquence de la classe.


1.2.MÉTHODES DE REPRÉSENTATION 5– Diagramme en bandes(b) Caractère quantitatif discretExemple 1.2.3 Le responsable des ventes d’un magasin a noté le niveau de la demande journalière pourun pro<strong>du</strong>it pendant cent jours ouvrables consécutifs en 2008 :Nombre x i d’unités Nombre n i de jours Effectifs cumulés Fréquence Fréquence cumuléedemandées par jour où l’on a ven<strong>du</strong> x i croissants n i ↗ f i croissante f i ↗0 5 5 0,05 0,051 15 20 0,15 0,202 23 43 0,23 0,433 22 65 0,22 0,654 16 81 0,16 0,815 9 90 0,09 0,96 5 95 0,05 0,957 et plus 5 100 0,05 1TOTAL 100 – 1 –– Dans un repère orthogonal, on porte en abscisse les valeurs définissant les classes et en ordonnée leseffectifs. Pour rendre le diagramme plus lisible, on trace les segments de droite correspondant auxordonnées des points ainsi définis, et on obtient ce qu’on appelle un diagramme des effectifs enbâtons.On obtient le diagramme en bâtons des fréquences par simple changement d’échelle sur l’axe desordonnées. Par exemple, l’effectif “5” devient la fréquence “0,05”.– Intéressons-nous maintenant au diagramme des effectifs cumulés croissants, en escalier : dansun repère orthogonal, on porte en abscisse les valeurs définissant les classes et en ordonnée les effectifs


6 CHAPITRE 1.SÉRIES STATISTIQUES À UNE VARIABLEcumulés croissants.Comme précédemment, on obtient le diagramme en bâtons des fréquences cumulées croissantespar simple changement d’échelle sur l’axe des ordonnées.(c) Caractère quantitatif continuExemple 1.2.4 On relève dans une banque à une date donnée les montants des économies de 1000 clientsen euros. Les résultats obtenus sont les suivants :Montant des économies(en euros) x iNombre n i de clientsEffectifs cumuléscroissants[0; 500[ 5 5[500; 1000[ 12 17[1000; 1500[ 33 50[1500; 2000[ 71 121[2000; 2500[ 119 240[2500; 3000[ 175 415[3000; 3500[ 185 600[3500; 4000[ 158 758[4000; 4500[ 122 880[4500; 5000[ 69 949[5000; 5500[ 35 984[5500; 6000[ 11 9956000 et plus 5 1000TOTAL 1000 –Toutes les autres classes ayant la même amplitude 500, on convient d’assimiler la classe “6000 et plus” à[6000; 6500[.Le graphique utilisé pour représenter ce type de données est appelé histogramme des effectifs. Les effectifsdes classes sont proportionnels aux aires des rectangles représentant les classes.


1.2.MÉTHODES DE REPRÉSENTATION 7Diagramme des effectifs, histogramme.Imaginons maintenant qu’on modifie le tableau précédent afin d’obtenir des classes d’amplitudes différentes :Montant des économiesEffectifs cumulésNombre n i de clients(en euros) x icroissants[0; 1000[ 17 17[1000; 3000[ 398 415[3000; 3500[ 185 600[3500; 4000[ 158 758[4000; 4500[ 122 880[4500; 5000[ 69 949[5000; 5500[ 35 984[5500; 6500[ 16 1000TOTAL 1000 –On obtient l’histogramme des effectifs ci-dessous.On remarque alors de manière générale que– l’histogramme est constitué de la juxtaposition de rectangles dont les bases sont les différentes classeset dont les surfaces sont proportionnelles aux fréquences,– si les classes sont toutes d’amplitude égale, les hauteurs sont proportionnelles aux fréquences et doncaux effectifs.


8 CHAPITRE 1.SÉRIES STATISTIQUES À UNE VARIABLEIl faut noter comme c’était le cas précédemment que l’histogramme des fréquences est obtenu par simplechangement d’échelle sur l’axe des ordonnées.Reprenons l’exemple initial et tâchons de représenter graphiquement les effectifs cumulés croissants. Ceciest réalisé à l’aide de ce qu’on nomme une courbe polygonale.Diagramme des effectifs cumulés croissants, courbe polygonaleOn remarquera que ce diagramme n’est pas à proprement parler une courbe mais bien une succession desegments d’où la dénomination “courbe polygonale”.Enfin, il est à noter que le diagramme des fréquences cumulées croissantes est obtenu à l’aide <strong>du</strong> diagrammeprécédent par simple changement d’échelle sur l’axe des ordonnées.1.3 Caractéristiques de positionOn a vu dans la première partie comment condenser les informations pour les rendre plus lisibles etutilisables. On est ainsi passé d’une liste de plusieurs dizaines, centaines, éventuellement milliers de donnéesà un tableau ou un graphique reposant sur un regroupement de celles-ci en quelques classes.On souhaite maintenant synthétiser davantage l’information pour les caractères quantitatifs en mettanten évidence des nombres permettant de décrire au mieux la population observée.La première idée concerne naturellement la “tendance centrale” de la population.Cela peut signifier :– calculer une moyenne,– chercher un nombre séparant la population en deux parties représentant chacune 50% de l’effectif total,– choisir la (ou une) classe de plus grand effectif.Ces trois points de vue présentent de l’intérêt et con<strong>du</strong>isent à définir des caractéristiques de positionutilisées en statistique.1.3.1 Le mode (ou dominante)Définition 1.3.1 On appelle mode d’une série statistique la ou les valeurs <strong>du</strong> caractère dont l’effectif estle plus élevé. Dans le cas d’une répartition à l’aide de classes, la classe dont l’effectif est le plus élevé estappelée classe modale, le mode étant le centre de la classe.Remarque 1.3.1


1.3.CARACTÉRISTIQUES DE POSITION 9– Le mode correspond à un sommet sur l’histogramme ou le diagramme en bâtons.– Il peut exister des séries unimodales ou plurimodales (dans le cas ou plusieurs classes ont le mêmeeffectif maximal).– Le mode est un caractère peu utilisé en pratique car il ne fait pas intervenir l’ensemble des valeurs.• Considérons l’exemple 1.2.3. Le mode de la série statistique est égal à 2. En effet, c’est la valeur de lasérie qui admet l’effectif le plus élevé c’est-à-dire 23. La série est unimodale.• Considérons l’exemple 1.2.4. Les éléments de la série statistique sont répartis à l’aide de classes.[3000; 3500[ est la classe modale puisque c’est elle qui admet l’effectif le plus élevé à savoir 185, lemode étant égal à 3250. La série est unimodale.1.3.2 La moyennePour Pythagore (V e siècle avant J.-C.), “les nombres sont les éléments de toutes choses, tout est nombre,l’harmonie est divine, elle consiste en rapports numériques”. On doit à cette école pythagoricienne plusieurssortes de moyennes (moyenne arithmétique, moyenne géométrique, moyenne harmonique). Cette dernièrefut d’ailleurs inventée par Hippase (un des premiers pythagoriciens) qui travaillait sur les différents typesde liens que trois nombres peuvent entretenir entre-eux et qu’on nommait alors “médiétés”.Définition 1.3.2 La moyenne arithmétique de n nombres y 1 , y 2 , . . . , y n esty = y 1 + y 2 + . . . + y nn= 1 nn∑y i .i=1Les séries statistiques (à une variable quantitative) peuvent se présenter directement ou indirectement sousl’une des trois formes suivantes :– 1 er cas : on dispose de la liste des n éléments x 1 , x 2 , . . . , x n . La moyenne est alors obtenue à l’aide dela formulex = x 1 + x 2 + . . . + x nnReprenons l’exemple 1.2.1 : la série consiste en une suite de 40 éléments, sa moyenne arithmétiquevautx = 5 + 7 + 2 + 6 + 3 + . . . + 6 + 7 + 8 + 5 + 5 = 2164040 = 5, 4– 2 e cas : on dispose <strong>du</strong> tableau des effectifs n i des p classes x i .x = n 1x 1 + n 2 x 2 + . . . + n p x pn= 1 nn∑i=1= 1 nx ip∑n i x iConsidérons une fois encore l’exemple 1.2.1 une fois que la synthèse est réalisée, la moyenne arithmétiquevaut alorsi=1x = 1 × 0 + 2 × 1 + 1 × 2 + . . . + 5 × 8 + 2 × 9 + 1 × 1040= 21640 = 5, 4– 3 e cas : on dispose <strong>du</strong> tableau des effectifs n i des p classes [a i ; b i [ de centre c i = a i + b i.2x = n 1c 1 + n 2 c 2 + . . . + n p c p= 1 p∑n i c innOn considère l’exemple 1.2.4 : on travaille dans ce cas avec un caractère quantitatif continu, on vadonc considérer pour chacune des classes son centre. La moyenne arithmétique vaut alors :x =i=15 × 250 + 12 × 750 + . . . + 11 × 5750 + 5 × 62501000= 32430001000= 3243


1.3.CARACTÉRISTIQUES DE POSITION 11(b) Variable continueDans ce cas, la détermination de la médiane est très différente. Il faut tout d’abord repérer la classe quicontient la médiane à l’aide de la moitié de l’effectif total n 2 soit [x A, x B [. Cette classe peut également êtrerepérée sur le diagramme des effectifs (ou fréquences) cumulés croissants :Il est possible de déterminer explicitement la valeur de la médiane en utilisant l’interpolation linéaire. Envoici le principe.( ) ( )xAxBConsidérons la droite (D) d’équation y = ax + b passant par les points M A et Mn B . LesA n Bcoordonnées de ces deux points vérifient bien-évidemment l’équation de (D) ce qui nous donne le systèmelinéaire suivant :{nA = ax A + b (1)n B = ax B + b (2)En soustrayant (1) à (2) puis en isolant “a”, on obtient l’égalitéOr le point M( Mén/2a = n B − n A.x B − x A)vérifie également l’équation de (D) donc on a le second système{nA = ax A + b (1)= aMé + b (2)En réalisant les mêmes étapes que précédemment, on obtientce qui permet d’affirmer quen2a =n2 − n AMé − x A.n B − n Ax B − x A=n2 − n AMé − x A⇔Mé − x Ax B − x A=n2 − n An B − n AIl est assez simple de retenir cette formule à l’aide des encadrements suivants :x A Mé x Bn An2n B


12 CHAPITRE 1.SÉRIES STATISTIQUES À UNE VARIABLEOn récupère ainsi l’expression de la médianeMé = x A + ( n 2 − n A)(n B − n A ) (x B − x A )Il est possible de travailler avec les fréquences plutôt que les effectifs. Dans ce cas, les seules modificationsà apporter concernent les effectifs n A , n B et n . Cette dernière valeur devient 0, 5 si on travaille avec des2proportions, i.e.,et 50 (%) si on travaille avec des pourcentages, i.e,Considérons l’exemple 1.2.4.Montant des économies(en euros) x iMé = x A + (0, 5 − f A)(f B − f A ) (x B − x A )Mé = x A + (50 − p A)(p B − p A ) (x B − x A )Nombre n i de clients n i ↗ f i ↗ f i ↗ (%)[0; 500[ 5 5 0,005 0,5[500; 1000[ 12 17 0,017 1,7[1000; 1500[ 33 50 0,05 5[1500; 2000[ 71 121 0,121 12,1[2000; 2500[ 119 240 0,24 24[2500; 3000[ 175 415 0,415 41,5[3000; 3500[ 185 600 0,6 60[3500; 4000[ 158 758 0,758 758[4000; 4500[ 122 880 0,88 88[4500; 5000[ 69 949 0,949 94,9[5000; 5500[ 35 984 0,984 98,4[5500; 6000[ 11 995 0,995 99,5[6000; 6500[ 5 1000 1 100TOTAL 1000 – 1 100Déterminons tout d’abord à l’aide <strong>du</strong> tableau la classe contenant la médiane.On rappelle que dans le contexte de l’exemple, la médiane est le montant qui sépare l’ensemble de lanpopulation concernée en deux parties de même effectif. On considère ainsi2 = 1000 = 500. Puis on se2réfère à la colonne effectifs cumulés croissants (ni ↗) afin de trouver la classe correspondant à cet effectif.On remarque tout d’abord que la valeur “500” n’apparaît pas explicitement. Il faut donc réussir à l’extraire<strong>du</strong> tableau :– 415 personnes ont une économie comprise entre 0 et 3000 euros. On est donc certain que la médianen’appartient pas à cet intervalle puisqu’il ne fait pas intervenir 500 personnes mais seulement 415.– 600 personnes ont une économie comprise entre 0 et 3500 euros. On est donc certain que la médianeappartient à cet intervalle puisqu’il fait intervenir au moins 500 personnes. On en dé<strong>du</strong>it que la médianeappartient à l’intervalle [3000; 3500[.On peut vérifier cette propriété à l’aide de la courbe des effectifs cumulés croissants.


1.3.CARACTÉRISTIQUES DE POSITION 13On retrouve bien le fait, graphiquement, que Mé∈ [3000; 3500[.Déterminons la médiane explicitement : à l’aide <strong>du</strong> calcul précédent, on peut affirmer queRemarque 1.3.3Mé = 3000 + ( 10002− 415)(3500 − 3000)(600 − 415)(effectifs)(0, 5 − 0, 415)= 3000 + (3500 − 3000)(0, 6 − 0, 415)(fréquences)(50 − 41, 5)= 3500 − (3500 − 3000)(60 − 41, 5)(pourcentages)≃ 3229, 73 à 10 −2 près.– Lorsque la population est répartie en classes [a i , b i [, la médiane peut donc être évaluée soit graphiquementsoit par une interpolation affine (ou linéaire) à l’aide d’une courbe des effectifs cumulésen faisant l’hypothèse supplémentaire : les éléments de la classe contenant la médiane sontuniformément répartis.– On doit distinguer la médiane Mé et la moyenne x d’une population. Le calcul de la moyenne faitintervenir toutes les données ce qui n’est pas le cas pour la détermination de la médiane. De plus, lamoyenne est sensible aux variations des valeurs extrêmes de la série statistique, ce qui n’est pas le casde la médiane.1.3.4 Les quartilesLe quartile est une extension de la médiane puisqu’il s’agit de partager l’effectif en quatre parties égales.Les quartiles sont au nombre de 3 et on les note Q 1 , Q 2 et Q 3 . Le quartile Q 2 correspond à la médiane Mé.Définition 1.3.4 Q 1 (respectivement Q 3 ) est la valeur telle que 25% (respectivement 75%) des valeurs del’effectif total de la population étudiée lui sont inférieures et 75% (respectivement 25%) supérieures.On peut schématiser les quartiles de la manière suivanteRemarque 1.3.4


14 CHAPITRE 1.SÉRIES STATISTIQUES À UNE VARIABLE– Les quartiles Q 1 et Q 3 permettent d’apprécier l’importance de la dispersion d’une série autour de lamédiane.– Q 3 − Q 1 est appelée l’amplitude de l’intervalle interquartile [Q 1 ; Q 3 ]. 50% de la population del’échantillon se retrouvent dans cet intervalle.– On peut définir de même les déciles, les centiles dans le cas d’un effectif n très important.On s’intéresse maintenant à la détermination pratique des quartiles dans le cas d’une variable continue. Laméthode est la même que celle utilisée pour calculer la médiane :– le premier quartile Q 1 correspond à l’abscisse <strong>du</strong> point d’ordonnée 0, 25 sur la courbe des fréquences cumuléescroissantes (ou n sur la courbe des effectifs cumulés croissants), sa valeur exacte est déterminée4à l’aide de l’interpolation linéaire,– le troisième quartile Q 3 correspond à la médiane,– le troisième quartile Q 3 correspond à l’abscisse <strong>du</strong> point d’ordonnée 0, 75 sur la courbe des fréquencescumulées croissantes (ou 3n 4Considérons l’exemple 1.2.4.On rappelle que la taille de l’échantillon est égale à 1000.sur la courbe des effectifs cumulés croissants).– Le premier quartile correspond à l’abscisse <strong>du</strong> point d’ordonnée n = 250. La valeur “250” n’apparaît4pas explicitement dans le tableau, il faut donc réussir à l’extraire :. 240 personnes ont une économie comprise entre 0 et 2500 euros. On est donc certain que le premierquartile n’appartient pas à cet intervalle puisqu’il ne fait pas intervenir 250 personnes mais seulement240.. 415 personnes ont une économie comprise entre 0 et 3000 euros. On est donc certain que Q 1 appartientà cet intervalle puisqu’il fait intervenir au moins 250 personnes.On en dé<strong>du</strong>it que le premier quartile Q 1 appartient à l’intervalle [2500; 3000[.– Le troisième quartile correspond à l’abscisse <strong>du</strong> point d’ordonnée 3n = 750. La valeur “750” n’apparaît4pas explicitement dans le tableau. Il faut donc réussir à l’extraire :. 600 personnes ont une économie comprise entre 0 et 3500 euros. On est donc certain que le troisièmequartile n’appartient pas à cet intervalle puisqu’il ne fait pas intervenir 750 personnes mais seulement600.. 758 personnes ont une économie comprise entre 0 et 4000 euros. On est donc certain que Q 3 appartientà cet intervalle puisqu’il fait intervenir au moins 750 personnes.On en dé<strong>du</strong>it que le troisième quartile Q 3 appartient à l’intervalle [3500; 4000[.On peut vérifier ces propriétés à l’aide de la courbe des effectifs cumulés croissants.


1.4.CARACTÉRISTIQUES DE DISPERSION 15On retrouve bien graphiquement que Q 1 ∈ [2500; 3000[ et Q 3 ∈ [3500; 4000[.Déterminons les quartiles Q 1 et Q 3 explicitement :• on a l’encadrement suivant pour Q 12500 Q 1 3000On a alors l’égalité :240 250 415Q 1 − 2500 250 − 240=3000 − 2500 415 − 240⇔ Q 1 = 2500 + 500 × 10175⇔ Q 1 ≃ 2528, 57 à 10 −2 près.• On a l’encadrement suivant pour Q 33500 Q 3 4000On a alors l’égalité :600 750 758Q 3 − 3500 750 − 600=4000 − 3500 758 − 600⇔ Q 3 = 3500 + 500 × 150158⇔ Q 3 ≃ 3974, 68 à 10 −2 près.1.4 Caractéristiques de dispersionExemple 1.4.1 Les élèves A et B ont obtenu dans une matière spécifique les notes ci-dessous.7,8,11,12,13,13,13 pour A,4,7,9,12,13,13,19 pour B.On peut vérifier que les séries de notes de A et B ont la même médiane (12), la même moyenne (11) et lemême mode (13) et pourtant, ces deux séries de notes sont différentes : les notes de B sont plus disperséesque celles de A.Aussi, à côté des caractéristiques de position, on est amené à intro<strong>du</strong>ire des caractéristiques de dispersionpour décrire plus précisément une population.1.4.1 L’éten<strong>du</strong>eAfin de mesurer l’étalement des termes d’une série, on peut tout d’abord calculer l’éten<strong>du</strong>e.Définition 1.4.1 L’éten<strong>du</strong>e d’une série est la différence de ses valeurs extrêmes.Considérons EX5, on montre aisément que les éten<strong>du</strong>es des séries de A et de B valent respectivemente A = 13 − 7 = 6 et e B = 19 − 4 = 15. Les notes de B sont donc plus étalées que celles de A.1.4.2 L’écart absolu moyenPour étudier la dispersion des valeurs d’une série, on peut également calculer la moyenne des écarts entrechaque valeur et la moyenne arithmétique. Il est nécessaire cependant que tous les termes de la somme soientpositifs d’où l’utilisation de la valeur absolue.Définition 1.4.2 L’écart absolu moyen d’une série statistique est la moyenne des valeurs absolues desécarts à la moyenne arithmétique xe m = 1 nn∑|x i − x| = 1 ni=1p∑n i |x i − x|i=1


16 CHAPITRE 1.SÉRIES STATISTIQUES À UNE VARIABLEConsidérons l’exemple 1.4.1, supposons que l’on veuille mesurer la dispersion des valeurs des deux séries àl’aide de l’écart moyen (non absolu). On obtient– pour A : 1 [(7 − 11) + (8 − 11) + . . . + (13 − 11)] = 07– pour B : 1 [(4 − 11) + (7 − 11) + . . . + (19 − 11)] = 07En fait, ce résultat est général :Preuve : 1 n1n [(x 1 − x) + (x 2 − x) + . . . + (x n − x)] = 1 nn∑(x i − x) = 1 n∑n [ x i −i=1i=1n∑x] = = 1 ni=1n∑x i − 1 ni=1n∑(x i − x) = 0i=1n∑x = x − 1 n nx = x − x = 0Comme les écarts moyens sont nuls, on comprend l’intérêt de calculer l’écart absolu moyen.Considérons l’exemple 1.4.1,– pour A : e m = 1 [|7 − 11| + |8 − 11| + . . . + |13 − 11|] = 147– pour B : e m = 1 [|4 − 11| + |7 − 11| + . . . + |19 − 11|] = 267On retrouve bien le fait que les notes de B sont plus dispersées que celles de A.1.4.3 La variance et l’écart-typeComme cela a été montré précédemment, le calcul de la moyenne des écarts entre chaque valeur de lasérie et la moyenne arithmétique nécessite que les termes de la somme soient positifs. Il existe un autreprocédé élémentaire qui permet de surmonter cette difficulté : les carrés.Définition 1.4.3 La variance d’une série statistique est la moyenne des carrés des écarts à la moyennearithmétique xi=1V (X) = 1 nn∑(x i − x) 2 = 1 ni=1p∑n i (x i − x) 2i=1Toutefois, ce calcul n’est pas très commode : la somme nécessite le calcul de p soustractions, p mises aucarré, p multiplications et enfin p − 1 additions.La variance peut être donnée sous une autre forme plus pratique :V (X) = 1 nn∑x 2 i − x 2 = 1 ni=1p∑n i x 2 i − x 2i=1Cete fois-ci, la somme ne nécessite plus les soustractions. Démontrons ce résultat pour la version par regroupements.Preuve :V (X) = 1 np∑n i (x i − x) 2 = 1 ni=1p∑n i [x 2 i − 2x i x + x 2 ]i=1et ceci d’après l’identité remarquable (a − b) 2 = a 2 − 2ab + b 2 . Ainsi,


1.4.CARACTÉRISTIQUES DE DISPERSION 17V (X) = 1 np∑n i x 2 i − 2 p∑n x n i x i + 1 n x2i=1i=1i=1p∑n i ⇔ V (X) = 1 np∑n i x 2 i − 2x 2 + x 2 = 1 ni=1p∑n i x 2 i − x 2i=1Définition 1.4.4 L’écart-type d’une série statistique est la racine carrée de sa variance V (X).σ(X) = √ V (X) = √ 1 nn∑(x i − x) 2 = √ 1 ni=1p∑n i (x i − x) 2i=1Cette caractéristique de dispersion est la plus utilisée. L’expérience montre que dans une distribution unimodaleet symétrique,– l’intervalle [x − σ(X), x + σ(X)] contient environ 68% des valeurs de la série,– l’intervalle [x − 2σ(X), x + 2σ(X)] contient environ 95% des valeurs de la série.Dans une distribution relativement symétrique, les résultats restent voisins de ceux indiqués.Considérons une nouvelle fois l’exemple 1.2.4. Afin de calculer la variance et l’écart-type de la série, onréalise un tableau contenant toutes les données nécessaires à leur calcul (voir page suivante).La quatrième colonne nous permet de calculer la moyenne arithmétique de la série : sa dernière ligne nousp∑donne le nombre n i x i = 3243000. Donc x = 1 p∑n i x i = 3243000 = 3243. L’économie moyenne des 1000n1000i=1i=1clients de la banque est de 3243 euros.La cinquième colonne nous permet de calculer la variance de la série : sa dernière ligne nous donne lep∑nombre n i x 2 i = 11662000000. Donc V (X) = 1 p∑n i x 2 i − x 2 = 11662000000 − (3243) 2 = 1144951.n1000i=1On en dé<strong>du</strong>it l’écart-type de la série : σ(X) = √ V (X) = √ 1144951 ≃ 1070, 02 à 10 −2 près.Ce nombre peut être interprété de la manière suivante :i=1– l’intervalle [x − σ(X), x + σ(X)] = [3243 − 1070, 02; 3243 + 1070, 02] = [2172, 98; 4313, 02] contientenviron 68% des valeurs de la série,– l’intervalle [x − 2σ(X), x + 2σ(X)] = [3243 − 2 × 1070, 02; 3243 + 2 × 1070, 02] = [1102, 96; 5383, 04]contient environ 95% des valeurs de la série.


18 CHAPITRE 1.SÉRIES STATISTIQUES À UNE VARIABLEMontant des économies(en euros)n iCentre de classex in i x in i x 2 i[0; 500[ 5 250 1250 312500[500; 1000[ 12 750 9000 6750000[1000; 1500[ 33 1250 41250 51562500[1500; 2000[ 71 1750 124250 217437500[2000; 2500[ 119 2250 267750 602437500[2500; 3000[ 175 2750 481250 1323437500[3000; 3500[ 185 3250 601250 1954062500[3500; 4000[ 158 3750 592500 2221875000[4000; 4500[ 122 4250 518500 2203625000[4500; 5000[ 69 4750 327750 1556812500[5000; 5500[ 35 5250 183750 964687500[5500; 6000[ 11 5750 63250 363687500[6000; 6500[ 5 6250 31250 195312500TOTAL 1000 – 3243000 11662000000Remarque 1.4.1 Le calcul de la variance ne peut être réalisé avant celui de la moyenne arithmétique.1.5 Paramètres de concentrationOn se restreint au cas particulier de la masse salariale versée chaque mois par l’entreprise. La questionest la suivante : “Cette masse est-elle répartie de manière égale sur l’ensemble <strong>du</strong> personnel ou bien aucontraire seules quelques personnes s’en octroient-elles la plus grande partie ?”1.5.1 DéfinitionsPour répondre à la question précédente, on considère une série statistique de forme générale (x i , n i ) 1≤i≤p .On définit– la fréquence cumulée croissante p i = ∑ f j etj≤i– le coefficient q i comme étant le rapport entre la masse salariale cumulée divisée par la masse salariale∑n j x jtotale M = ∑ j≤pn j x j : q i =j≤iM .Illustrons ces formules dans le cadre de l’exemple suivant.Exemple 1.5.1 Les salaires (en euros) des employés d’une entreprise sont répartis de la manière suivante.Classes x i n i∑nj p i n i x i∑nj x j q i[3000; 4000[ 3500 22 22 0,22 77000 77000 0,140[4000; 5000[ 4500 18 40 0,40 81000 158000 0,287[5000; 7000[ 6000 47 87 0,87 282000 440000 0,799[7000; 10000[ 8500 13 100 1 110500 550500 1Total – 100 – – 550500 – –


1.5.PARAMÈTRES DE CONCENTRATION 19On utilise les notations suivantes :4∑. N = n i = 100,. M =i=14∑n i x i = 550500,i=1. x = M N = 550500 = 5505 qui correspond au salaire moyen dans l’entreprise.100Interprétation de la colonne des q i : si on considère sa deuxième ligne, 28, 7% de la masse salariale estdistribuée à 40% des employés, ceux gagnant moins de 5000 (euros).1.5.2 La courbe de Gini ou de LorenzLa courbe de Gini ou de Lorenz va nous permettre de mesurer la concentration de la masse salarialegraphiquement. Elle est représentée à l’aide des points (p i , q i ) avec p 0 = q 0 = 0.Considérons l’exemple 1.5.1, la courbe de Gini associée est la suivanteLa courbe polygonale (OM 1 M 2 M 3 M n ) représente la courbe de Gini. Afin de mesurer la concentration decette courbe, il faut la comparer à une courbe de référence. La droite en pointillés appelée bissectricereprésente une concentration salariale nulle c’est-à-dire que les salaires sont répartis de manière égale surl’ensemble <strong>du</strong> personnel.Plus la courbe de Gini sera proche de la bissectrice, plus la concentration sera faible. Plus elle en seraéloignée, plus la concentration sera forte. Néanmoins, cette mesure graphique n’est pas suffisante pour quantifierprécisément le niveau de concentration de la masse salariale. Pour pallier ce manque de précision oncalcule l’indice de Gini.1.5.3 L’indice de la concentration ou indice de GiniDéfinition 1.5.1 On appelle indice de concentration ou indice de Gini le rapport i de la surface Scomprise entre la courbe de concentration et la bissectrice <strong>du</strong> repère avec la surface S 0 <strong>du</strong> triangle OAM n .Il apparaît quei = S S 0vérifie l’inégalité 0 ≤ i ≤ 1Interprétation :


20 CHAPITRE 1.SÉRIES STATISTIQUES À UNE VARIABLE– lorsque i est faible (ou proche de 0), la courbe est proche de la bissectrice, la série est peu concentrée,la répartition de la masse salariale est assez homogène,– lorsque i est proche de 1, la courbe de Gini reste longtemps proche de l’axe des abscisses, la série esttrès concentrée, il y a une répartition très inégalitaire de la masse salariale.1.5.4 Calcul <strong>du</strong> coefficient de GiniSelon qu’on travaille avec des pourcentages ou des fréquences, les valeurs de S et S 0 s’exprimentdifféremment.• Calcul de S 0 : par définition,base b × hauteur hAire triangle =2donc S 0 = 1 × 1 = 1 2 2 en termes de fréquences et S 100 × 1000 = = 5000 en termes de pourcentages.2• Calcul de S (en termes de pourcentages) :S = (Aire <strong>du</strong> triangle OAM n ) − ( ∑ aires des trapèzes A i A i+1 M i+1 M i )= 5000 − ( ∑ aires des trapèzes A i A i+1 M i+1 M i ).– Le premier trapèze est en fait un triangle. On peut calculer son aire :S 1 = aire(OA 1 M 1 ) = p 1 × q 1= 1542– On rappelle que pour les trapèzes, l’aire est donnée par la formuleAire trapèze =[(petite base b)+(grande base B)] × (hauteur h)2AinsiS 2 = aire(A 1 A 2 M 2 M 1 ) = 1 2 (p 2 − p 1 )(q 1 + q 2 ) = 1 (18 × 42, 7) = 384, 32– puisS 3 = aire(A 2 A 3 M 3 M 2 ) = 1 2 (p 3 − p 2 )(q 2 + q 3 ) = 1 (47 × 108, 6) = 2552, 12– etS 4 = aire(A 3 AM n M 3 ) = 1 2 (100 − p 3)(q 3 + 100) = 1 (13 × 179, 9) = 1169, 352Finalement S = 5000 − (154 + 384, 3 + 2552, 1 + 1169, 35) = 740, 25.On en dé<strong>du</strong>it que i = 740.25 = 0, 14805 et on peut affirmer ainsi que la concentration est faible puisque5000l’indice de Gini est proche de 0. La masse salariale est répartie de manière égalitaire.1.5.5 La médialeIl existe un autre moyen de mesurer la concentration de la masse salariale et qui se nomme la médiale.Définition 1.5.2 On appelle médiale de la série statistique, notée M l , la première valeur <strong>du</strong> caractère àpartir de laquelle la moitié de la masse salariale a été étudiée, c’est-à-dire la valeur <strong>du</strong> caractère qui partagela masse salariale en deux parties égales. Dans une répartition par classes, on procède par interpolationlinéaire.Il existe deux possibilités pour déterminer la médiale– soit déterminer la valeur <strong>du</strong> caractère correspondant à M 2dans la colonne “masse salariale cumulée”– soit déterminer la valeur <strong>du</strong> caractère qui correspond à 1 2 dans la colonne “q i”.


1.6. EXERCICES 21Considérons l’exemple 1.5.1. Le calcul de la médiale se fait de la même manière que celui de la médiane. Onrepère tout d’abord 1 2 dans la colonne q i. Si 1 n’apparaît pas explicitement dans le tableau, on utilise les2valeurs qui l’encadrent :Il suit par interpolation linéaire que5000 M l 70000,287120, 213M l = 5000 + 2000 × = 5832, 030, 512Ainsi, 50% de la masse salariale est distribuée aux salariés gagnant moins de 5832,03 euros et 50% à ceuxgagnant plus de 5832,03 euros.1.6 Exercices✞☎✝Exercice 1 ✆ Dans le fichier <strong>du</strong> service ORL <strong>du</strong> centre hospitalier de Dunkerque, on trouve pour chaquepatient les informations suivantes :– sexe,– âge,– profession,– poids,– taille,– groupe sanguin.1. Quelle est la population étudiée ? Quels sont les indivi<strong>du</strong>s ?2. Donner le type de chacune des variables statistiques ci-dessus, en précisant éventuellement leurs modalités.0,799✞☎✝Exercice 2 ✆ Pour chaque commune française de plus de 20000 habitants, on note– le département auquel elle appartient,– le nombre de ses habitants,– le nombre de ses établissements d’enseignement secondaire.Reprendre les questions de l’exercice précédent.✞☎✝Exercice 3 ✆ D’après l’INSEE, la structure sociale de la population active <strong>du</strong> <strong>Littoral</strong> et de la région Nord-Pas de Calais était en 1990 la suivante :CSP <strong>Littoral</strong> RégionAgriculteurs 3, 2 2Artisans,Commerçants 5, 7 5, 3Chefs d’entrepriseProfessions libéralesCadres supérieurs5, 6 5, 6Professions intermédiaires 13, 8 14, 4Employés 17, 7 17, 8Ouvriers 26, 1 27Autres (*) 27, 9 26, 6


22 CHAPITRE 1.SÉRIES STATISTIQUES À UNE VARIABLE(*) Autres : retraités, inactifs, chômeurs . . .1. Quelle est la variable statistique étudiée ? Quel est son type ?2. Quelles représentations graphiques peut-on envisager ?3. Représenter sur un même graphique ces deux distributions.✞☎✝Exercice 4 ✆ On donne dans le tableau ci-dessous la répartition des étudiants inscrits à l’Université <strong>du</strong><strong>Littoral</strong> 1998/1999 par secteurs disciplinaires :Lettres 5%Langues 13%Sciences humaines et sociales 10%Science de la nature et de la vie 7%Science et structure de la matière 13%Sciences et technologies 8%Sport 6%Droit 11%Sciences économiques et gestion 10%SESA 17%Faire le diagramme à secteurs représentant cette distribution.✞☎✝Exercice 5 ✆ Le maire d’une commune rurale située dans une zone d’élevage et de polyculture a fait releverla superficie des 70 exploitations agricoles de la commune. On obtient la distribution statistique suivante :Superficie (en ha) Nombre d’exploitations0 à moins de 20 720 à moins de 40 2040 à moins de 50 1850 à moins de 60 1060 à moins de 80 151. Quelle est la variable étudiée ? Quel est son type ?2. Représenter graphiquement cette distribution.✞☎✝Exercice 6 ✆ Un syndicat de salariés a réalisé une enquête sur les salaires <strong>du</strong> personnel ouvrier d’un groupein<strong>du</strong>striel. Il a obtenu, pour les personnes ayant travaillé toute l’année à temps complet, la distribution desalaires annuels suivante :


1.6. EXERCICES 23Salaire annuel Nombre d’ouvriersmoins de 5000 euros 31455000 à moins de 5800 euros 24655800 à moins de 6600 euros 46756600 à moins de 8200 euros 112208200 à moins de 9800 euros 91809800 à moins de 13000 euros 816013000 euros et plus 3655Total 42500La masse des salaires correspondant à la première classe (moins de 5000 euros) s’élève à 10, 693 millionsd’euros tandis que celle correspondant à la dernière classe s’élève à 53, 363 millions d’euros.Reprendre les questions de l’exercice précédent.✞☎✝Exercice 7 ✆ En réponse à une offre d’emploi visant à recruter une secrétaire sténodactylo, 7 candidatesse sont présentées. Le test qui leur est proposé consiste à dactylographier un texte préalablement noté ensténo. Le tableau suivant donne le nombre d’erreurs commises par chaque candidate.Candidate 1 2 3 4 5 6 7Nombre d’erreurs 1 5 4 3 7 6 101. Calculer la moyenne et déterminer la médiane de cette distribution.2. Une huitième candidate arrive en retard et est admise à passer le test. Elle fait 9 erreurs.Calculer la moyenne et déterminer la médiane de cette nouvelle distribution.✞☎✝Exercice 8 ✆ La distribution selon le nombre d’enfants des 110 familles inscrites sur la liste d’attente d’unoffice de HLM est la suivante :Nombre d’enfants1. Représenter graphiquement cette distribution.Nombre de familles0 181 272 273 184 155 52. Calculer le nombre moyen d’enfants de ces familles.3. Déterminer la médiane et le mode de cette distribution et calculer son écart-type.4. Quelle est la proportion de familles comptant au plus 3 enfants ?5. Quelle est la proportion de familles comptant moins de 3 enfants ?


24 CHAPITRE 1.SÉRIES STATISTIQUES À UNE VARIABLE✞☎✝Exercice 9 ✆ Calculer la moyenne, la médiane, les quartiles, l’écart-type et donner la classe modale dela variable statistique de l’exercice 5.Calculer la proportion d’exploitations agricoles dont la superficie est inférieure à 45 hectares.✞☎✝Exercice 10 ✆ Calculer la moyenne, la médiane, l’écart-type et donner la classe modale de la variable statistiquede l’exercice 6.✞☎✝Exercice 11 ✆ Le tableau suivant donne la répartition des entreprises d’au moins 20 salariés dans le secteurde l’in<strong>du</strong>strie, en France en 1994, ainsi que les parts respectives <strong>du</strong> chiffre d’affaires total de ce secteur.Nombre de salariés❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤part (en %)[20, 50[ [50, 100[ [100, 200[ [200, 500[ 500 et plusNombre 59, 7% 18, 5% 10, 9% 7% 3, 9%Chiffre d’affaires 8, 3% 6, 2% 8, 1% 13, 4% 64%1. Tracer la courbe de Lorenz associée à cette distribution.2. Sur la courbe de Lorenz, lire la part des entreprises (ayant le moins de salariés) qui réalisent 50% <strong>du</strong>chiffre d’affaires total de ce secteur.3. Calculer l’indice de Gini associé à cette distribution.4. Calculer la médiane de cette distribution.✞☎✝Exercice 12 ✆ Les notes de 1000 étudiants lors d’une épreuve de statistiques se répartissent de la manièresuivante :Notes x i 6 7 8 9 10 11 12 13 14 15 16 17 18Effectifs n i 10 23 45 78 116 147 162 148 117 77 46 20 111. Présenter un tableau où figureront entre-autres :– les fréquences,– les effectifs cumulés croissants,– les fréquences cumulées croissantes.2. Effectuer un diagramme en bâtons des fréquences de la série statistique.3. Tracer la courbe des fréquences cumulées croissantes.✞☎✝Exercice 13 ✆ La répartition des salaires des employés d’une entreprise est donnée dans le tableau suivant:Salaires en euros Centres Effectifs Fréquences (%)[900; 1100[ 5[1100; 1200[ 8, 5[1200; 1300[ 23, 75[1300; [ 25[ ; [ 1500Effectifs cumuléscroissants[1600; 1700[ 6, 75 400


1.6. EXERCICES 251. Compléter le tableau.2. Combien d’employés ont un salaire inférieur à 1300 euros ?3. Réaliser un histogramme des effectifs de la série statistique.✞☎✝Exercice 14 ✆ Le personnel d’une entreprise se répartit ainsi :FonctionNombreManœuvres 96Ouvriersprofessionnels288Ouvriers qualifiés 184Employé(s)s 40Cadres et direction 321. Calculer le pourcentage que représente chaque catégorie.2. Représenter ces pourcentages par un diagramme à secteurs circulaire. (Mesure des secteurs au degréle plus proche)✞☎✝Exercice 15 ✆ On considère la série statistique suivante :3, 4, 9, 10, 7, 6, 5, 4, 4, 3, 7, 9, 8On notera X la variable statistique prenant ces valeurs.1. Déterminer la médiane pour la variable X.2. Extraire de ces données un tableau de distribution contenant entre-autres les effectifs et les effectifscumulés.3. Retrouver la médiane pour X à l’aide <strong>du</strong> tableau.4. Représenter graphiquement à l’aide d’un diagramme en bâtons la distribution des fréquences.✞☎✝Exercice 16 ✆ On considère le nombre de pièces A sortant d’un entrepôt pendant 40 jours consécutifs :10, 12, 17, 6, 13, 20, 18, 18, 16, 15, 15, 14, 7, 8, 9, 11, 11, 12, 9, 9,12, 14, 15, 15, 10, 12, 7, 7, 13, 14, 14, 14, 16, 16, 15, 18, 8, 9, 8, 9.1. Regrouper par modalités cette série statistique en complétant, après l’avoir repro<strong>du</strong>it, le tableau suivant.Nombre depièces A6 7 ...Effectif 1 3 ...2. Déterminer la médiane de cette série statistique.3. Déterminer une valeur approchée à 10 −2 près de la moyenne x de cette série statistique.4. Calculer la variance et l’écart-type de cette série statistique à 10 −2 près. Interpréter la valeur del’écart-type obtenue en termes de dispersion.


26 CHAPITRE 1.SÉRIES STATISTIQUES À UNE VARIABLE✞☎✝Exercice 17 ✆ Avant d’accepter un contrat de livraison de véhicules, une société d’équipements automobilesétablit une statistique de pro<strong>du</strong>ction journalière sur 100 jours.Le nombre de véhicules équipés journellement se répartit comme suit :Pro<strong>du</strong>ction journalièrede véhicules équipésNombre de jours95 196 397 698 899 10100 13101 18102 14103 9104 8105 6106 2107 2Total 100Déterminer la valeur moyenne de la pro<strong>du</strong>ction journalière et une valeur approchée à 10 −2 près de l’écart-typede cette pro<strong>du</strong>ction.✞☎✝Exercice 18 ✆ Un nouveau responsable de magasin a enregistré au cours de ses 40 premières semainesd’activité le nombre X de tonnes de marchandises qu’il a stocké hebdomadairement. Il a obtenu les résultatssuivants :5, 7, 2, 6, 3, 4, 8, 5, 4, 3, 9, 6, 5, 7, 6, 8, 3, 4, 4, 0, 8, 6, 7, 1, 5, 5, 4, 6, 6, 10, 9, 8, 1, 5, 5, 6, 7, 8, 5, 5⎛ ⎞i∑1. Déterminer la distribution de fréquences (n i ) et la distribution de fréquences cumulées ⎝ n j⎠ decette variable X et représenter graphiquement ces deux distributions à l’aide respectivement d’undiagramme en bâtons et d’un graphique en escaliers.2. Calculer la médiane pour la variable X.j=1✞☎✝Exercice 19 ✆ On se donne le tableau de données suivantes :


1.6. EXERCICES 27i Classes Centres x i Effectifs n i Effectifs cumulés croissants1 500 ≤ X < 1500 312 1500 ≤ X < 2500 463 2500 ≤ X < 3500 864 3500 ≤ X < 4500 1515 4500 ≤ X < 5500 1976 5500 ≤ X < 6500 1677 6500 ≤ X < 7500 1078 7500 ≤ X < 8500 659 8500 ≤ X < 9500 3210 9500 ≤ X < 10500 181. Remplir le tableau de distribution.2. Tracer la courbe des effectifs cumulés croissants et en dé<strong>du</strong>ire approximativement la valeur de lamédiane.3. Déterminer une valeur de la médiane à 10 −3 près.✞☎✝Exercice 20 ✆ Un hypermarché assure les livraisons à domicile. Le tableau suivant donne le nombre delivraisons effectuées dans un trimestre, selon la distance <strong>du</strong> magasin au point de livraison.Distance (en km) [0; 5[ [5; 10[ [10; 15[ [15; 20[ [20; 25[ [25; 30[ [30; 35[ [35; 40[ TotalEffectifs 50 250 500 800 700 650 320 230 3500Chaque livraison est facturée 100 euros au client servi.Le gérant de cet hypermarché, après une étude, a estimé à 5 euros le prix de revient <strong>du</strong> kilomètre par colis.Il envisage de modifier le tarif d’une livraison afin d’équilibrer le coût de ce service.1. (a) Calculer pour chaque classe, en remplaçant celle-ci par son milieu, le nombre de kilomètres parcourus.(b) Vérifier que ce service est déficitaire. Quelle est approximativement la perte ?2. (a) Dresser le tableau des fréquences cumulées croissantes.(b) Tracer la courbe des fréquences cumulées croissantes. Notons M 1 le point de la courbe dontl’ordonnée est 25%, M 2 celui dont l’ordonnée est 75%. L’abscisse Q 1 de M 1 est appelée le premierquartile et l’abscisse Q 3 de M 3 est appelée le troisième quartile. Trouver Q 1 et Q 3 .(c) Calculer l’intervalle interquartile [Q 1 , Q 3 ] et l’interquartile Q 3 − Q 1 .3. Pour la suite, on prend Q 1 ≃ 15 km et Q 3 ≃ 30 km.(a) Recopier et compléter le tableau suivant, dans lequel on a ré<strong>du</strong>it la série à trois classes [0; Q 1 [,[Q 1 ; Q 3 [, [Q 3 ; 40[.Classes Effectifs[0; 15[ 800[15; 30[ 2150[30; 40[ 550Coût Coût moyenkilomètresdes d’uneparcourus livraisons livraison


28 CHAPITRE 1.SÉRIES STATISTIQUES À UNE VARIABLE(b) Quel conseil peut-on donner au gérant de cet hypermarché ?✞☎✝Exercice 21 ✆ Les salaires nets des employés d’un garage automobile ont permis d’établir la courbe deseffectifs cumulés croissants suivante :1. Présenter le tableau où figureront entre autres• les classes• les effectifs• les effectifs cumulés croissants• les effectifs cumulés décroissants2. Présenter l’histogramme de cette série.3. Préciser l’éten<strong>du</strong>e de cette série statistique.4. Préciser la classe modale.5. Calculer les trois quartiles.6. Déterminer la moyenne arithmétique, puis l’écart-type de cette série :• directement,• par le changement de variable u i = x i − 9500.500✞☎✝Exercice 22 ✆ Un entrepôt stockant un certain pro<strong>du</strong>it envisage de modifier ses infra-structures. Le gérantde l’entrepôt effectue auparavant des observations sur les flux d’entrée et de sortie de ce pro<strong>du</strong>it pendantles deux dernières années.Unités (×100)Nombre de semaines0 à moins de 10 110 à moins de 20 220 à moins de 30 330 à moins de 40 840 à moins de 50 2550 à moins de 60 2760 à moins de 70 2070 à moins de 80 1280 à moins de 90 6Total 104


1.6. EXERCICES 291. Dresser le tableau des effectifs cumulés croissants.2. Tracer la courbe des effectifs cumulés croissants.3. On suppose que les données sont régulièrement réparties. Trouver une valeur approchée de la médianem par une lecture graphique puis par le calcul.4. Déterminer les quartiles de la même façon.✞☎✝Exercice 23 ✆ Une entreprise de conditionnement lance une étude sur la quantité de polystyrène utiliséependant 200 jours pour emballer des matières fragiles. Les résultats obtenus sont les suivantsClasses (en kg)Effectifs[55; 65[ 10[65; 75[ 23[75; 77[ 21[77; 79[ 28[79; 81[ 34[81; 83[ 28[83; 85[ 25[85; 95[ 23[95; 105[ 81. Déterminer la classe modale.2. Calculer les trois quartiles et retrouver graphiquement, à l’aide de la courbe des effectifs cumuléscroissants, ces valeurs.3. On appelle x i les centres de classes. On précise que∑n i x i = 15976 et ∑ n i x 2 i = 1288920iiCalculer la valeur moyenne et l’écart-type à 0, 01 près de cette série statistique.✞☎✝Exercice 24 ✆ Un chef d’entreprise s’intéresse à la répartition des salaires annuels exprimés en milliersd’euros de 100 employés d’une de ses succursales. Il récupère les données suivantes.Classes des salaires x i n i n i ↗ n i ↗ (%) n i x i n i x i ↗ n i x i ↗ (%)[10; 12[ 11 40[12; 14[ 13 30[14; 16[ 15 20[16; 18[ 17 10Total – – – – –1. Compléter le tableau précédent2. Quel pourcentage de la masse salariale totale se partagent les 50% des salariés les mieux payés de cetteentreprise ?3. Construire sur le graphique ci-joint la courbe de Lorenz associée à cette répartition de salaires (10centimètres représentent 100%). Tracer sur ce même graphique la droite D d’équation y = x.


30 CHAPITRE 1.SÉRIES STATISTIQUES À UNE VARIABLE4. Calculer le coefficient de Gini sachant que l’aire comprise entre la courbe de Gini et D vaut 415, 2.Comment peut-on interpréter cette valeur ?✞☎✝Exercice 25 ✆ On considère le salaire mensuel X de 200 salariés d’une petite entreprise, exprimé en milliersd’euros :Classes n i n i ↗ P i % n i x i Q i %[1; 1, 5[ 52 65 17, 45[1, 5; 2[ 71 124, 25 50, 8[2; 2, 5[ 57 85, 23[2, 5; 3[ 20 100Total — — —1. Compléter le tableau précédent.2. Calculer le salaire médian et interpréter le résultat.3. Expliquer comment on obtient le résultat 50, 8 dans la dernière colonne et interpréter ce résultat.4. Calculer la médiale et interpréter le résultat.5. À l’aide d’une calculatrice graphique, on a obtenu le graphique ci-dessous représentant les points decoordonnées (P i , Q i ).(a) Donner le nom de la courbe obtenue en reliant les différents points.(b) Pourquoi peut-on dire qu’il y a une faible concentration ? Que peut-on dire alors des salaires ?✞☎✝Exercice 26 ✆ On s’intéresse à la distribution des salaires mensuels dans une entreprise de confection.Les salariés de cette entreprise sont au nombre de 150. Les résultats obtenus sont les suivants :Salaires en Centres deeuros classes x in i n i ↗ p i (%) n i x i n i x i ↗ q i (%)[1000; 1200[ 80[1200; 1400[ 43[1400; 1600[ 17[1600; 1800[ 10Total – – – – –


1.6. EXERCICES 311. Compléter le tableau.2. Construire la courbe de Lorenz.3. Analyser la concentration de la masse salariale à l’aide <strong>du</strong> graphique.


32 CHAPITRE 1. SÉRIES STATISTIQUES À UNE VARIABLE


Chapitre 2Séries statistiques à deux variables2.1 Intro<strong>du</strong>ctionDans certains cas, il semble exister un lien entre les deux caractères d’une série statistique à deuxvariables, par exemple entre le poids et la taille d’une personne, les heures de révision pour un examen etla note obtenue, etc... Il est alors intéressant d’étudier simultanément deux caractères X et Y d’une mêmepopulation E.2.2 Tableaux de données. Nuages de pointsOn peut représenter les résultats sous forme de tableaux ou de graphiques.2.2.1 Tableaux de donnéesOn se donne plusieurs exemples ci-dessous impliquant indifféremment des caractères X et Y discrets oucontinus.Exemple 2.2.1 Au cours <strong>du</strong> troisième trimestre 2008, une marque automobile a lancé la commercialisationd’une nouvelle voiture avec deux motorisations distinctes de puissances respectives 138 chevaux DIN et 177chevaux DIN. On dispose des quantités de voitures ven<strong>du</strong>es par zones :Nombre d’unités Nombre d’unitésZones 138 CV ven<strong>du</strong>es 177 CV ven<strong>du</strong>esx iy i1 400 2402 200 1203 600 3004 300 1505 300 1506 600 270Exemple 2.2.2 Un même pro<strong>du</strong>it est ven<strong>du</strong> conditionné sous différentes formes et différents volumes. Letableau suivant indique pour chaque type d’emballage le volume x i et le prix y i <strong>du</strong> pro<strong>du</strong>it.x i en cm 3 100 150 200 300 500 600 700 800 900 1000y i en euros 7 8 9,5 13 20 23 25 28,3 30,5 3433


34 CHAPITRE 2.SÉRIES STATISTIQUES À DEUX VARIABLESExemple 2.2.3 Les chiffres d’affaires trimestriels d’une entreprise ont été pour les douze derniers trimestres:Rang <strong>du</strong> trimestre x i 1 2 3 4 5 6 7 8 9 10 11 12Chiffre d’affaires (en milliers d’euros) y i 300 450 130 200 280 410 200 250 320 500 210 2502.2.2 Nuages de pointsLe plan étant muni d’un repère orthogonal, on peut associer au couple (x i , y i ) de la série statistiquedouble le point M i de coordonnées x i et y i .L’ensemble des points M i obtenus constitue le nuage de points représentant la série statistique.Dans l’exemple 2.2.1, on obtient le nuage ci-dessous :Dans l’exemple 2.2.2, on obtient le nuage suivant :Le nuage étant dessiné, on peut essayer de trouver une fonction f telle que la courbe d’équation y = f(x)passe “le plus près possible” des points <strong>du</strong> nuage. C’est le problème de l’ajustement.Lorsqu’il sera possible de tracer une droite D au voisinage des points, on parlera d’ajustement linéaire. Sil’ajustement linéaire ne convient pas, on peut penser à approcher le nuage à l’aide d’une parabole, d’unehyperbole, d’une fonction exponentielle...2.3 Calcul des paramètres de position et de dispersionComme dans le chapitre sur les séries statistiques à une variable, il est possible de déterminer pour lesséries statistiques à deux variables la moyenne arithmétique, la variance et tous les autres paramètres de positionet de dispersion de chaque variable prise séparément. Il suffit pour cela de déterminer les distributionsmarginales des variables X et Y .


2.3. CALCUL DES PARAMÈTRES DE POSITION ET DE DISPERSION 35Exemple 2.3.1 On a réparti 1000 indivi<strong>du</strong>s d’une population suivant– le nombre x d’arrêts de travail suite à des accidents par an,– l’âge y en annéesde ces indivi<strong>du</strong>s. On obtient les résultats synthétisés dans le tableau ci-dessous.❍ ❍❍❍❍ y j[20; 30[ [30; 40[ [40; 50[ [50; 60[ nx i.i ❍0 20 150 22 0 1921 99 102 180 12 3932 60 51 150 30 2913 18 0 50 32 1004 3 0 10 11 24n .j 200 303 412 85 1000Ce tableau à double entrée est appelé tableau de contingence ou d’effectifs n ij .L’effectif marginal de la variable X est défini par :q∑n i. = n ij pour i ∈ {1, 2, . . . , p}j=1où p et q sont respectivement les nombres de modalités (ou de catégories) de X et Y .L’effectif marginal de la variable Y est défini par :n .j =p∑n ij pour j ∈ {1, 2, . . . , q}i=1L’effectif total est donné parn =p∑ q∑n ij =i=1 j=1p∑n i. =q∑i=1 j=1n .jOn peut définir les fréquences marginalesainsi que la fréquencef i. = n i.n et f .j = n .jnf ij = n ijnpour i ∈ {1, 2, . . . , p} et j ∈ {1, 2, . . . , q}.Dans le cadre de l’exemple 2.3.1, on remarquera au préalable que les nombres de modalités pour X et Y sontrespectivement p = 5 et q = 4. Les distributions marginales de X et Y en termes d’effectifs et de fréquencessont respectivement :


36 CHAPITRE 2.SÉRIES STATISTIQUES À DEUX VARIABLESx i n i. f i.0 192 0,1921 393 0,3932 291 0,2913 100 0,1004 24 0,024Total 1000 1Classe y j n .j f .j[20; 30[ 25 200 0,200[30; 40[ 35 303 0,303[40; 50[ 45 412 0,412[50; 60[ 55 85 0,085Total – 1000 12.3.1 Le point moyenSupposons qu’on souhaite calculer les moyennes arithmétiques de X et Y , il suffit pour cela d’utiliser lesformules déja étudiées dans le chapitre 1 à savoirx = 1 np∑n i. x ii=1y = 1 nq∑n .j y jj=1Afin de calculer les sommes ∑ in i. x i et ∑ jn .j y j on utilise le tableau des effectifs de X et Y qu’on complèteavec une colonne supplémentaire, n i. x i pour la variable X, n .j y j pour la variable Y .Considérons l’exemple 2.3.1 :x i n i. n i. x i0 192 01 393 3932 291 5823 100 3004 24 96Total 1000 1371Classe y j n .j n .j y j[20; 30[ 25 200 5000[30; 40[ 35 303 10605[40; 50[ 45 412 18540[50; 60[ 55 85 4675Total – 1000 38820On en dé<strong>du</strong>it que x = 137138820= 1, 371 et y = = 38, 82.1000 1000Lorsqu’on pense pouvoir réaliser un ajustement linéaire (ou affine) d’un nuage, il semble intéressant, avantde tracer la droite, de placer le point dont l’abscisse est la moyenne des abscisses x i et l’ordonnée la moyennedes ordonnées y j .Définition 2.3.1 On appelle point moyen G d’un nuage de n points M i de coordonnées (x i , y i ) le pointde coordonnées :⎛(x G , y G ) = (x, y) = ⎝ 1 np∑n i. x i , 1 ni=1q∑j=1n .j y j⎞⎠On vérifie ainsi que le point moyen dans l’exemple 2.3.1 est G(1, 371; 38, 82)


2.4. VOCABULAIRE, DÉFINITIONS 372.3.2 Les variancesComme on l’a vu précédemment, le calcul de la variance suivi de celui de l’écart-type nous permet demesurer la dispersion des valeurs de la série statistique autour de la moyenne arithmétique. On peut calculerindépendamment les variances des deux variables X et Y à l’aide de formules déja utilisées dans le chapitre1 dans le cadre des séries statistiques à deux variables :V (X) = 1 np∑n i. (x i − x) 2 = 1 ni=1p∑n i. x 2 i − x 2i=1V (Y ) = 1 nq∑n .j (y j − y) 2 = 1 nj=1q∑n .j yj 2 − y 2j=1où p et q sont respectivement le nombre de modalités (ou de catégories) de X et Y .On en dé<strong>du</strong>it queσ(X) = √ V (X) σ(Y ) = √ V (Y )Appliquons ces formules dans le cadre de l’exemple 2.3.1. Une colonne supplémentaire est ajoutée au tableau,n i. x 2 i pour la variable X, n .jyj 2 pour la variable Y .x i n i. n i. x i n i. x 2 i0 192 0 01 393 393 3932 291 582 11643 100 300 9004 24 96 384Total 1000 1371 2841Classe y j n .j n .j y j n .j yj2[20; 30[ 25 200 5000 125000[30; 40[ 35 303 10605 371175[40; 50[ 45 412 18540 834300[50; 60[ 55 85 4675 257125Total – 1000 38820 1587600Par conséquent,. V (X) = 28411000 − (1, 371)2 ≃ 0, 961 et σ(X) = √ 0, 961 ≃ 0, 98. V (Y ) = 15876001000− (38, 82) 2 ≃ 80, 61 et σ(Y ) = √ 80, 61 ≃ 8, 982.4 Vocabulaire, définitions2.4.1 La covarianceIl est possible comme lors de l’étude sur les séries à une variable de définir une variance sur les deuxvariables simultanément, c’est la covariance.Définition 2.4.1 La covariance d’une série statistique à deux variables X et Y est donnée par la formuleCov(X, Y ) = σ XY =∑n ij (x i − x)(y j − y)i,jn


38 CHAPITRE 2.SÉRIES STATISTIQUES À DEUX VARIABLESComme pour la variance, il existe une écriture de la covariance plus adaptée au calcul, obtenue simplementen développant la formule précédente.Propriété 2.4.1Cov(X, Y ) = σ XY = 1 ∑n ij x i y j − x.yni,jPreuve :Cov(X, Y ) =⎛∑n ij (x i − x)(y j − y)i,jn= 1 ∑n ij (x i y j − xy j − yx i + x.y)ni,j⎞n ij⎠= 1 ⎝ ∑ n ij x i y j − x ∑ n ij y j − y ∑ n ij x i + x.y ∑ ni,ji,ji,ji,j= 1 ∑n ij x i y j − 2x.y + x.y = 1 ∑n ij x i y j − x.y.nni,ji,jRemarque 2.4.1• Cov(X, Y ) = xy − x.y• Cov(X, X) = V (X) (la covariance est en quelque sorte le “dédoublement” de la variance)Considérons l’exemple 2.3.1. On doit tout d’abord déterminer ∑ i,jn ij x i y j , tâche qui peut être réalisée enutilisant le tableau de contingence :❍ ❍❍❍❍ y j[20; 30[ [30; 40[ [40; 50[ [50; 60[ nx i.i ❍0 20 150 22 0 192(0) (0) (0) (0)1 99 102 180 12 393(2475) (3570) (8100) (660)2 60 51 150 30 291(3000) (3570) (13500) (3300)3 18 0 50 32 100(1350) (0) (6750) (5280)4 3 0 10 11 24(300) (0) (1800) (2420)n .j 200 303 412 85 1000Par exemple, n 11 x 1 y 1 = 20 × 0 × 25 = 0, n 23 x 2 y 3 = 180 × 1 × 45 = 8100,...On obtient ∑ n ij x i y j = 56075 ce qui permet de déterminer la covariance entre X et Y :i,jCov(X, Y ) = 560751000− (1, 371 × 38, 82) ≃ 2, 853


2.5. AJUSTEMENT LINÉAIRE (OU AFFINE) 392.4.2 Le coefficient de corrélation linéairePour mesurer l’intensité de la relation linéaire entre X et Y (autrement que par interprétation graphique<strong>du</strong> nuage de points), on définit le coefficient de corrélation linéaire r(X, Y ).Définition 2.4.2 Le coefficient de corrélation linéaire d’une série statistique double de variables X et Yest le nombre r défini parr(X, Y ) = Cov(X, Y )σ X σ YPropriété 2.4.2 Le coefficient de régression vérifie :−1 ≤ r(X, Y ) ≤ 1Considérons l’exemple 2.3.1r(X, Y ) =2, 853≃ 0, 3240, 98 × 8, 98Commentaires :• r = 1 ou r = −1 si et seulement si les points M i (x i , y i ) sont alignés.• Si r est voisin de 1 ou −1, la corrélation linéaire entre X et Y est très forte.• Si r est proche de 0, il n’existe pas de corrélation linéaire entre X et Y . Les variables X et Y sontlinéairement indépendantes ; il peut néanmoins exister une autre relation fonctionnelle entre X et Y ,par exemple Y = aX 2 + bX + c, . . .• On peut présumer d’une corrélation linéaire pour |r| ≥ 0, 866 de sorte que la présomption de corrélationlinéaire commence à partir de la valeur |r| ≃ 0, 872.5 Ajustement linéaire (ou affine)Avant de préciser ces notions par le calcul, il est bon de comprendre comment se pose le problème de lacorrélation linéaire. Le problème consiste à déterminer dans quelle mesure les deux variables X et Y sontliées (c’est-à-dire dépendent l’une de l’autre). Par exemple, on peut intuitivement penser que la taille etle poids des indivi<strong>du</strong>s d’une population sont liés, que par contre il est plus improbable que la taille et lerevenu mensuel des habitants d’un pays donné soient liés. Si on arrive, à l’aide des données dont on dispose,à déterminer s’il existe une certaine fonction f telle que ∀k ∈ {1, 2, . . . , n}, y k = f(x k ) on pourra répondreavec plus de précision à cette idée de lien entre X et Y .Lorsque le nuage de points est nettement longiligne, les points étant disposés suivant une direction privilégiée,la corrélation est dite affine. Il est utile alors, dans un but d’extrapolation, de déterminer une droiterendant compte le mieux possible de la tendance observée. On dit qu’on effectue un ajustement affine.On distingue deux types d’ajustement : les ajustements graphiques et les ajustements analytiques nécessitantun calcul spécifique2.5.1 Ajustement graphiqueOn peut utiliser trois techniques :– Ajustement direct à la règleOn utilise une règle transparente qu’on dispose de façon à l’ajuster le mieux possible suivant la directionprivilégiée constatée et on s’efforce d’équilibrer le nombre de points situés de part et d’autre.


40 CHAPITRE 2.SÉRIES STATISTIQUES À DEUX VARIABLES– Utilisation <strong>du</strong> point moyenOn montre par le calcul que, pour obtenir le meilleur ajustement affine, il convient de prendre unedroite passant par le point moyen G.– Fractionnement <strong>du</strong> nuage, méthode de Mayer.2.5.2 Ajustement analytique - Méthode des moindres carrésOn considère une série statistique à deux variables représentée par un nuage justifiant un ajustementaffine. La méthode d’ajustement linéaire des moindres carrés con<strong>du</strong>it à obtenir 2 droites de régression D Y/Xet D X/Y concourantes au point moyen G(x, y) mais il est nécessaire de remarquer que ces 2 droites existentquel que soit le lien existant entre X et Y (même s’il n’y a aucune dépendance entre X et Y , on peuttoujours tracer la droite telle que la somme des carrés des distances des points M i <strong>du</strong> nuage aux points dela droite de mêmes abscisses soit minimale, ce minimum pouvant d’ailleurs être grand).Le problème peut donc être posé ainsi : “à l’aide des deux droites de régression D Y/X et D X/Y , quel critèrenumérique permet de dire si X et Y sont plus ou moins dépendantes l’une de l’autre par l’intermédiaired’une fonction f affine ?”On considère les deux graphes suivants :Définition 2.5.1 On appelle droite d’ajustement par la méthode des moindres carrés de Y parrapport à X la droite– passant par G– qui minimise la somme des carrés des écarts M i P i entre les ordonnées des points <strong>du</strong> nuage et lesordonnées des points de la droite ayant même abscisse.On dit aussi droite de régression de Y en XPropriété 2.5.1 La droite des moindres carrés de Y par rapport à X est notée D Y/X . Son équation esty = ax + bavec⎧⎨⎩a = Cov(X, Y )V (X)b = y − axcoefficient directeur de D Y/XDéfinition 2.5.2 On appelle droite d’ajustement par la méthode des moindres carrés de X parrapport à Y la droite– passant par G– qui minimise la somme des carrés des écarts Q i M i entre les abscisses des points <strong>du</strong> nuage et lesabscisses des points de la droite ayant même ordonnée.


2.5. AJUSTEMENT LINÉAIRE (OU AFFINE) 41On dit aussi droite de régression de X en YPropriété 2.5.2 La droite des moindres carrés de X par rapport à Y est notée D X/Y . Son équation estx = a ′ y + b ′avec⎧⎨⎩a ′ = Cov(X, Y )V (Y )b ′ = x − a ′ ycoefficient directeur de D X/YRemarque 2.5.1– Les deux droites D Y/X et D X/Y passent par le point moyen <strong>du</strong> nuage.– Les points <strong>du</strong> nuage sont alignés si et seulement si les droites D Y/X et D X/Y sont confon<strong>du</strong>es.Propriété 2.5.3Preuve :D Y/X = D X/Y ⇔ r 2 = 1– L’équation de D Y/X peut se réécrire sous la forme y = ax + (y − ax) ⇔ a(x − x) = y − y– De même, l’équation D X/Y peut s’écrire x = a ′ y + (x − a ′ y) ⇔ x − x = a ′ (y − y)Donc, D Y/X = D X/Y ⇔ a.a ′ = 1 ⇔Cov(X, Y )2σ 2 X σ2 YOn a finalement les 5 cas graphiques suivants := 1. Or r = Cov(X, Y )σ X σ Ydonc on obtient le résultat voulu.


42 CHAPITRE 2.SÉRIES STATISTIQUES À DEUX VARIABLESL’ajustement linéaire que nous venons d’étudier avait pour objet de remplacer le nuage de points M i (x i , y i )par une droite D d’équation y = ax + b (ou x = a ′ y + b ′ ), résumant en partie la liaison entre X et Y . Cettedroite D permet à partir des valeurs x i observées d’obtenir une valeur ajustée ŷ i pour y i .Considérons l’exemple 2.3.1 et déterminons les deux droites de régression D Y/X et D X/Y :– On a a = Cov(X, Y )V (X)=2, 8530, 98≃ 2, 911 et b = y − ax ≃ 38, 82 − 2, 911 × 1, 371 ≃ 34, 829On dé<strong>du</strong>it de ces résultats l’équation de D Y/X : y = 2, 911x + 34, 829– On a a ′ = Cov(X, Y )V (Y )=2, 8538, 98 ≃ 0, 318 et b′ = x − a ′ y ≃ 1, 371 − 0, 318 × 38, 82 ≃ −10, 974On dé<strong>du</strong>it de ces résultats l’équation de D Y/X : x = 0, 318y − 10, 974Représentons graphiquement ces deux droites et comparons les résultats aux graphiques précédents.On reconnaît immédiatement le cas 0 < r < 1 (on rappelle d’ailleurs que r ≃ 0, 324). Comme le coefficient decorrélation linéaire ne vérifie pas la condition |r| > 0, 87, cela implique qu’il n’y ait pas de réelle corrélationlinéaire entre X et Y . Il n’existe pas, par le biais des données disponibles, de relation linéaire entre l’âge d’unindivi<strong>du</strong> et le nombre d’arrêts de travail subi annuellement par cette personne. Il n’est pas donc possibled’extrapoler des résultats, c’est-à-dire de traiter des valeurs non contenues dans la série initiale et de répondreà des questions <strong>du</strong> type– “Quelle estimation portant sur le nombre d’arrêts de travail peut-on donner si la personne est agée de47 ans ?”– “Quelle estimation de l’âge d’une personne peut on donner lorsque le nombre d’arrêts de travail qu’ellea subi est égal à 7 ?”En supposant que le coefficient de corrélation vérifie l’inégalité |r| > 0, 87, il est possible alors de répondreà de telles interrogations.2.6 Exercices✞☎✝Exercice 27 ✆ Après un examen de mathématiques, on a réparti 100 étudiants de 1ère année en économieselon le nombre x de minutes qu’ils ont passé lors des révisions la veille et la note y sur 20 qu’ils ont obtenue.Les résultats sont les suivants :


2.6. EXERCICES 43❍ ❍❍❍❍ yx ❍[0; 4[ [4; 8[ [8; 12[ [12; 16[ [16; 20[ n i.[0; 60[ 16 6 2 1 0[60; 120[ 5 10 5 3 0[120; 180[ 2 7 17 10 4[180; 240[ 1 1 1 5 4n .j1. Compléter le tableau.2. Combien d’étudiants ont entre 8 et 20 à leur examen ?3. Quel est le pourcentage d’étudiants ayant eu une note inférieure à 8 et ayant révisé moins de 2 heures ?4. Quel est le pourcentage d’étudiants ayant eu une note supérieure à 8 et ayant révisé plus de 2 heures ?5. Présenter les histogrammes des séries x et y.6. Tracer la courbe des effectifs cumulés croissants pour les deux séries statistiques.✞☎✝Exercice 28 ✆ L’étude des hauteurs barométriques en fonction de l’altitude a permis d’établir le tableausuivant avec x l’altitude en km et y la hauteur barométrique en cm de mercure :x i 0 1 2 4 6 10y i 76 67 59 46 35 201. Représenter graphiquement la série statistique par un nuage de points.2. Déterminer par la méthode des moindres carrés l’équation de la droite de régression de y en x. Tracercette droite sur le graphique.3. Sachant que la hauteur barométrique en un lieu est de 40 cm, calculer l’altitude.✞☎✝Exercice 29 ✆ Le tableau ci-dessous donne l’évolution de la consommation de médicaments des ménages enFrance. x représente l’année, y le montant en milliards d’euros de la consommation de médicaments.x i 1970 1975 1980 1985 1990 1995 2002 2006y i 0,352 0,6660 1,073 2,026 3,369 6,420 9,592 10,891. Déterminer les coordonnées <strong>du</strong> point moyen G(x, y).2. Calculer le coefficient de corrélation linéaire à 0, 001 près. Interpréter ce résultat.3. Déterminer par la méthode des moindres carrés une équation de la droite de régression D de Y en X.4. En supposant que l’évolution se poursuive de la même façon dans les années suivantes, donner uneestimation de la consommation de médicaments des ménages en France en 2010.En quelle année la consommation dépassera-t-elle 12,5 milliards d’euros ?✞☎✝Exercice 30 ✆ Une bibliothèque municipale établit le bilan de ses activités pour les 4 dernières années.Le tableau suivant donne en milliers pour chaque année,– l’augmentation <strong>du</strong> nombre des prêts de livres x i– le nombre des nouveaux lecteurs inscrits y i– le nombre des nouveautés achetées z i


44 CHAPITRE 2.SÉRIES STATISTIQUES À DEUX VARIABLES2003 2004 2005 2006x i 3 7 1 5y i 0,3 1,2 0,1 0,8z i 0,9 3,2 2,1 2,81. Calculer le coefficient de corrélation linéaire des séries (x i ) et (y i ).2. Calculer le coefficient de corrélation linéaire des séries (x i ) et (z i ).3. Déterminer quel élément (y i ou z i ) est le plus susceptible d’avoir influencé l’augmentation des prêtsde livres x i .4. Déterminer la droite d’ajustement par la méthode des moindres carrés D Y/X .5. En dé<strong>du</strong>ire une estimation <strong>du</strong> nombre de nouveaux lecteurs inscrits y i , si l’on pense que l’augmentation<strong>du</strong> nombre des prêts sera de 9000 en 2007.✞☎✝Exercice 31 ✆ 50 étudiants d’une promotion ont effectué deux contrôles, l’un en méthodes quantitativesdont les notes sont x i , l’autre en marketing dont les notes sont y j .On obtient la série statistique double donnée par le tableau ci-dessous :❍ ❍❍❍❍ x i2 8 12 18y j ❍6 8 1 1 09 1 10 2 011 1 2 14 114 0 0 2 71. En précisant dans un tableau complet à double entrée les détails des calculs, déterminer une équationde régression de Y en X.2. Déterminer une équation de la droite de régression de X en Y .3. Calculer le coefficient de corrélation linéaire.4. Si un étudiant obtient 15 au devoir de marketing, quelle note peut-on prévoir en méthodes quantitatives?5. Si un étudiant obtient 4 au devoir de méthodes quantitatives, quelle note peut-on prévoir en marketing ?✞☎✝Exercice 32 ✆ Dans le cadre d’une enquête médicale, une étude est réalisée auprès de 60 patients concernantla taille et le poids de chacun. Les résultats sont donnés dans le tableau ci-dessous. On exprimera le poids xen kilogrammes et la taille y en centimètres. On arrondira les résultats des questions suivantes à 10 −3 près.❳❳❳ ❳ x (kg)y (cm)❳❳❳❳❳❳❳[50; 60[ [60; 70[ [70; 80[ [80; 90[ [90; 100[[150; 160[ 10 2 1 0 0[160; 170[ 1 12 3 1 0[170; 180[ 1 1 13 2 0[180; 190[ 0 0 2 6 1[190; 200[ 0 0 0 1 3


2.6. EXERCICES 451. Calculer le pourcentage de personnes pesant moins de 80 kilos et mesurant plus de 180 centimètres.2. Calculer la proportion de personnes pesant entre 60 et 90 kilos.Dans la suite <strong>du</strong> problème, on utilisera les résultats suivants :x (kg)❳❳❳❳❳❳❳❳❳y (cm)[50; 60[ [60; 70[ [70; 80[ [80; 90[ [90; 100[ n .j n .jy j n .jy 2 j[150; 160[ 10 2 1 0 0 13 2015 312325[160; 170[ 1 12 3 1 0 17 2805 462825[170; 180[ 1 1 13 2 0 17 2975 520625[180; 190[ 0 0 2 6 1 9 1665 308025[190; 200[ 0 0 0 1 3 4 780 152100n i. 12 15 19 10 4 60 10240 1755900n i. x i 660 975 1425 850 380 4290n i.x 2 i 36300 63375 106875 72250 36100 314900x (kg)❳❳❳❳❳❳❳❳ y (cm) ❳ ❳❳[50; 60[ [60; 70[ [70; 80[ [80; 90[ [90; 100[[150; 160[ 85250 20150 11625 0 0 117025[160; 170[ 9075 128700 37125 14025 0 188925[170; 180[ 9625 11375 170625 29750 0 221375[180; 190[ 0 0 27750 94350 17575 139675[190; 200[ 0 0 0 16575 55575 72150103950 160225 247125 154700 73150 7391503. Retrouver (en expliquant vos calculs) les trois valeurs encadrées dans les deux tableaux précédents.4. Calculer les moyennes arithmétiques x et y des poids et tailles.5. Calculer les variances V (x) et V (y). Déterminer alors les écart-types σ(x) et σ(y).6. Calculer la covariance et en dé<strong>du</strong>ire le coefficient de corrélation linéaire entre le poids et la taille.7. Un ajustement linéaire est-il justifié. Peut-on prévoir alors à l’aide de l’échantillon donné la taille d’unepersonne à partir de son poids ?


46 CHAPITRE 2. SÉRIES STATISTIQUES À DEUX VARIABLES


Chapitre 3Séries chronologiques3.1 Intro<strong>du</strong>ctionL’étude des séries chronologiques (ou séries temporelles ou chroniques - time series- en anglais)permet de décrire, expliquer, contrôler, prévoir des phénomènes évoluant au cours <strong>du</strong> temps.Définition 3.1.1 On appelle série chronologique la succession de valeurs que prend une variable (ou caractéristique)au cours <strong>du</strong> temps pour N périodes successives pour un même indivi<strong>du</strong> (ou cas).Donc, une série chronologique est une suite d’observations d’une variable statistique au cours <strong>du</strong> temps.Exemple 3.1.1– la pro<strong>du</strong>ction mensuelle d’une entreprise,– le prix <strong>du</strong> pain au 1 er de chaque mois,– le revenu national de 1953 à aujourd’hui.Une série chronologique peut être identifiée à une série statistique à deux variables t et X t , où t représentele temps. On la note (t, X t ).Remarque 3.1.1 La variable t sert à ordonner X t , ses valeurs sont séparées par une constante c’est-à-direl’unité de temps (année, mois, semaine) qui caractérise la série chronlogique et en donne la périodicité. Onpeut ainsi parler de séries chronologiques annuelles, mensuelles ou trimestrielles.Les observations sont supposées faites à intervalles de temps réguliers. Dans la pratique, ce n’est pas toujoursréalisé. Par exemple, pour des séries mensuelles, le nombre de jours varie d’un mois à l’autre, on utilise alorsdes données corrigées.3.2 Modèles de compositionPour étudier (t, X t ), on décompose la série chronologique en différents mouvements.3.2.1 Les composantes fondamentales– La tendance à long terme ou “trend” : T tElle représente l’évolution à long terme de la série et tra<strong>du</strong>it son aspect général (croissance, décroissance,. . . ).– La composante cyclique : C tPour des séries très longues, elle correspond à des variations connues régulières. Par exemple, enéconomie, des fluctuations correspondant à des périodes de prospérité ou de récession.En général, la composante cyclique n’est pas détectable sur la période étudiée et on suppose alors queC t n’existe pas.47


48 CHAPITRE 3.SÉRIES CHRONOLOGIQUES– La composante saisonnière : S tElle correspond à des variations régulières inconnues mais détectables sur des périodes courtes, généralementà l’intérieur d’une année : semaine, mois, trimestre,. . . . Par exemple, l’influence des congés annuelssur la pro<strong>du</strong>ction d’une entreprise.– La composante accidentelle : A tElle correspond à des variations accidentelles de forte amplitude <strong>du</strong>es à des phénomènes imprévisibles.Par exemple, la grève, le risque de guerre.3.2.2 Les différents modèles de compositionIl y a plusieurs manières de composer les mouvements ci-dessus.– Le modèle additif :si C t , S t et A t sont indépendants de T t .– Le modèle multiplicatif :si C t , S t et A t sont dépendants de T t .X t = T t + C t + S t + A tX t = T t × C t × S t × A t– Le modèle mixte : les modèles concernés composent les mouvements avec pro<strong>du</strong>its et sommes.Le choix <strong>du</strong> modèle est souvent délicat. En général, le modèle le mieux adapté est le modèle multiplicatif.3.3 Analyse des différentes composantesExemple 3.3.1 On se donne les livraisons trimestrielles d’essence en super sans plomb 98 (en millions dem 3 ) dans un hypermarché de la région pendant quatre années :Trimestres❵❵❵❵❵❵❵❵❵❵❵❵❵❵Années1 2 3 41997 1050 1300 1500 13001998 1050 1400 1750 13501999 1100 1550 1850 14502000 1150 1700 2000 1550Table 3.1 – Livraisons trimestrielles de SSP983.3.1 Analyse de la tendance à long termeCette analyse peut être réalisée uniquement si la série est assez longue.(a) Méthode graphiqueOn représente tout d’abord sur un graphique les livraisons trimestrielles (sur l’axe des ordonnées) enfonction des différents trimestres (sur l’axe des abscisses). On obtient la figure 3.1.


3.3. ANALYSE DES DIFFÉRENTES COMPOSANTES 49Figure 3.1 – Représentation graphiqueL’objectif de l’analyse graphique est d’exhiber <strong>du</strong> graphe un mouvement, une tendance générale afin depréciser la manière dont les livraisons progressent au cours <strong>du</strong> temps. La période d’observation est ici dequatre années.La procé<strong>du</strong>re est ensuite la suivante :– on joint les maxima M i à la règle,– on joint les minima m i à la règle,– on définit les projections orthogonales M ′ i des maxima M i sur les segments [m i , m i+1 ],– on définit les projections orthogonales m ′ i des minima m i sur les segments [M i , M i+1 ],– on trace les segments verticaux [M i , M ′ i ] et [m i, m ′ i ].La ligne brisée qui joint les milieux des segments [M i , M i ′] et [m i, m ′ i ] constitue une tendance (voir figure3.2.).Figure 3.2 – Tendance - Méthode graphique


50 CHAPITRE 3.SÉRIES CHRONOLOGIQUES(b) Ajustement linéaire par la méthode des moindes carrésSi le coefficient de corrélation de (t, X(t))) est assez grand en valeur absolue (on suppose qu’en pratique,r doit être plus proche de 1 que de 0), la droite de régression de X t en fonction de t donne la tendance.Recherchons l’équation de régression de X t dans le cadre de l’exemple 3.3.1. On utilisera donc le tableau devaleurs de la page suivante où t i représente le rang d’un trimestre et X t (i) la livraison d’essence correspondante: On récupère les valeurs suivantes :Rang Trimestre Livraisonsi t i X(t) it 2 i X(t) 2 i t i .X(t) i1 1 1050 1 1102500 10502 2 1300 4 1690000 26003 3 1500 9 2250000 45004 4 1300 16 1690000 52005 5 1050 25 1102500 52506 6 1400 36 1960000 84007 7 1750 49 3062500 122508 8 1350 64 1822500 108009 9 1100 81 1210000 990010 10 1550 100 2402500 1550011 11 1850 121 3422500 2035012 12 1450 144 2102500 1740013 13 1150 169 1322500 1495014 14 1700 196 2890000 2380015 15 2000 225 4000000 3000016 16 1550 256 2402500 24800Total 136 23050 1496 34432500 206750Table 3.2 – Tableau de calculs (trimestres) - Exemple 3.3.1• t = 13616 = 8, 5• X(t) = 23050 = 1440, 62516• V (t) = 149616 − (8, 5)2 = 21, 25• V (X(t)) = 34432500 − (1440, 625) 2 = 76630, 85916• Cov(t, X(t)) = 206750 − (8, 5 × 1440, 625) = 676, 5625.16Le coefficient directeur et l’ordonnée à l’origine de la droite de régression D X(t)/t sont respectivement donnéspar :Cov(t, X(t))a = et b = X(t) − atV (t)


3.3. ANALYSE DES DIFFÉRENTES COMPOSANTES 51soita =676, 562521, 25Finalement, la droite admet pour équation= 31, 838 et b = 1440, 625 − 31, 838 × 8, 5 = 1170, 002.D X(t)/t : X(t) = 31, 838t + 1170, 002où t représente le trimestre, qu’on renomme D 1 . On peut calculer accessoirement le coefficient de corrélationlinéaire entre t et X(t) :r =Cov(t, X(t))√ √ =V (t) V (X(t))676, 5625√ 21, 25√ 76630, 859= 0, 53.Remarque 3.3.1 On peut également chercher par la méthode des moindres carrés l’équation d’une droitequi nous permettra d’évaluer, en fonction cette fois-ci <strong>du</strong> rang d’une année, les quantités livrées trimestriellementen moyenne sur une année. On utilisera dans ce cas le tableau ci-dessous où x représente le rangd’une année et m x la moyenne trimestrielle correspondant à cette année :(Par exemple, m 2 = 1387, 5 =On trouve les valeurs• x = 10 4 = 2, 5Rang x m x x 2 m 2 x xm x1 1 1287, 5 1 1657656, 25 1287, 52 2 1387, 5 4 1925156, 25 2775, 03 3 1487, 5 9 2212656, 25 4462, 54 4 1600, 0 16 2560000 6400, 0Total 10 5762, 5 30 8355468, 75 14925, 0Table 3.3 – Tableau de calculs (années) - Exemple 3.3.1)(1050 + 1400 + 1750 + 1350).4• m x = 5762, 5 = 1440, 6254• V (x) = 304 − (2, 5)2 = 1, 258355468, 75• V (m x ) = − (1440, 625) 2 = 13466, 7974• Cov(x, m x ) = 14925 − (2, 5 × 1440, 625) = 129, 687.4Le coefficient directeur et l’ordonnée à l’origine de la droite de régression D mx /x sont respectivement donnéspar :soita = Cov(x, m x)V (x)et b = m x − ax⎧⎨ 129, 687a = = 103, 751, 25⎩b = 1440, 625 − 103, 75 × 2, 5 = 1181, 25


52 CHAPITRE 3.SÉRIES CHRONOLOGIQUESOn trouve ainsi queoù X représente l’année, qu’on renomme D 2 .D mx/x : m x (x) = 103, 75x + 1181, 25On trace ces deux droites de régression sur le graphe :Figure 3.3 – Tendance - Ajustement linéaire(c) Méthode des moyennes échelonnéesSoit k ≥ 2 un entier. On partage l’ensemble des observations en sous-ensembles comprenant k observationssuccessives. Pour chaque sous-ensemble, on calcule son point moyen. La tendance est alors la lignebrisée qui passe par ces points.Remarque 3.3.2 Les inconvénients de cette méthode sont :– le choix de k,– la ré<strong>du</strong>ction <strong>du</strong> nombre de points <strong>du</strong> graphique.Retour à l’exemple 3.3.1. Si on choisit k = 8, on a le tableau suivant :tSous-ensemble 1Sous-ensemble 21050 + 1300 + 1500 + 1300 + 1050 + 1550 + 1850 + 145081100 + 1550 + 1850 + 1450 + 1150 + 1700 + 2000 + 15508Y t= 1337, 5= 1543, 75Si on choisit k = 4, on obtient les données :Table 3.4 – Moyennes échelonnées, k = 8


3.3. ANALYSE DES DIFFÉRENTES COMPOSANTES 53tSous-ensemble 1Sous-ensemble 2Sous-ensemble 3Sous-ensemble 4Y t1050 + 1300 + 1500 + 130041050 + 1400 + 1750 + 135041100 + 1550 + 1850 + 145041150 + 1700 + 2000 + 15504= 1287, 5= 1387, 5= 1487, 5= 1600Table 3.5 – Moyennes échelonnées, k = 4ainsi que le graphique associé :Figure 3.4 – Tendance - Moyennes échelonnées, k = 4(d) Méthode des moyennes mobilesAfin d’éliminer ou d’amortir les mouvements cycliques, saisonniers et accidentels, on peut égalementutiliser la technique des moyennes mobiles. Le principe de cette méthode est similaire à celui de la méthodedes moyennes échelonnées. Il consiste à construire une nouvelle série obtenue en calculant des moyennesarithmétiques successives de longueur k ≥ 2 fixe à partir des données originales. Chacune de ces moyennesobtenues correspondra au “milieu” de la période pour laquelle la moyenne arithmétique vient d’être calculée.(– Le premier est (1, X 1 ), (2, X 2 ), . . . , (k, X k ), représenté par 1, 1 )k (X 1 + X 2 + . . . + X k ) ,(– le deuxième est (2, X 2 ), (3, X 3 ), . . . , (k + 1, X k+1 ), représenté par 2, 1 )k (X 2 + X 3 + . . . + X k+1 ) ,– et ainsi de suite. . .


54 CHAPITRE 3.SÉRIES CHRONOLOGIQUESOn remarque dans ce cas que les k − 1 dernières moyennes sont incalculables (X N+1 , . . . , X N+k−1 n’existentpas).On peut perfectionner la méthode en considérant des moyennes mobiles centrées. On appelle moyennesmobiles centrées d’ordre k de la série des {X t , t = 1, . . . , N} les moyennes arithmétiques calculées sur kvaleurs successives et rapportées à la date <strong>du</strong> milieu de la période.– Si k est impair (k = 2p + 1), on considérera les points de coordonnées(j,12p + 1 (X j−p + . . . + X j + . . . + X j+p )Il est évident que des problèmes se posent aux extrémités de la série. Par exemple, si k = 3 = 2 × 1 + 1(donc p = 1), les moyennes mobiles de la première (j = 1) et de la dernière période (j = N) ne peuventpas être calculées (X 0 et X N+1 n’existent pas). Si k = 5, ce sont les moyennes des deux premières etdes deux dernières périodes qui sont incalculables.– En choisissant k pair (k = 2p), nous sommes confrontés au problème que les moyennes obtenues necorrespondront pas à une abscisse existante, mais chevaucheront entre deux de ces valeurs. Afin decontourner ce problème, plutôt que de considérer le point moyen de (j−p, X j−p ), . . . , (j+p−1, X j+p−1 )ou (j − p + 1, X j−p+1 ), . . . , (j + p, X j+p ), on considérera les points de coordonnées(j, 12p (1 2 X j−p + X j−p+1 + . . . + X j+p−1 + 1 )2 X j+p)Les moyennes incalculables sont les mêmes que dans le cas impair.Remarque 3.3.3– Concernant le choix de k, pour des données trimestrielles, on prendra k = 4. Pour des donnéesmensuelles, on prendra k = 12,. . .– Cette méthode élimine les influences saisonnière et accidentelle, c’est une méthode de lissage.Retour à l’exemple 3.3.1. Choisissons k = 4 :• 1ère méthode (sans considérer le caractère pair de k) :t 1 2 3 4 5 6 7 8M ′ t 1287, 5 1287, 5 1312, 5 1375 1387, 5 1400 1437, 5 1462, 5t 9 10 11 12 13 14 15 16M ′ t 1487, 5 1500 1537, 5 1575 1600 −− −− −−Table 3.6 – Moyennes mobiles centrées, k = 4)• 2ème méthode (en considérant le caractère pair de k) :t 1 2 3 4 5 6 7 8M t ′ −− −− 1287, 5 1300 1343, 75 1381, 25 1393, 75 1418, 75t 9 10 11 12 13 14 15 16M t ′ 1450 1475 1493, 75 1518, 75 1556, 25 16 −− −−Table 3.7 – Moyennes mobiles centrées, k = 4 = 2 × 2On représente graphiquement la tendance à l’aide de la deuxième méthode (cf. figure 3.5).


3.3. ANALYSE DES DIFFÉRENTES COMPOSANTES 55Figure 3.5 – Tendance - Moyennes mobiles centrées, k = 4 = 2 × 23.3.2 Analyse de la composante saisonnièreL’analyse de la composante saisonnière a deux objectifs :– étudier les mouvements saisonniers,– les éliminer afin de faire apparaître les composantes cyclique et accidentelle.Pour effectuer l’analyse des mouvements saisonniers, on essaie d’abord de déterminer si on est en présenced’une série dans laquelle pour une observation donnée :– la variation saisonnière S t s’ajoute simplement à la résultante des autres composantes, c’est le modèleadditif ;– la variation saisonnière S t est proportionnelle à la résultante des autres composantes, et alors c’est lemodèle multiplicatif.(a) Modèle additif ou multiplicatif ?• Méthode graphique de superposition.Pour faire cette détermination (modèle additif, multiplicatif) graphiquement, on peut par exemplesuperposer les saisons représentées par des droites de profil sur un même graphique. Cela donne dansle cas de l’exemple 3.3.1 la figure suivante :Figure 3.6 – Détermination <strong>du</strong> modèle - Méthode graphique de superposition


56 CHAPITRE 3.SÉRIES CHRONOLOGIQUESDe manière générale, si les droites <strong>du</strong> graphique superposé sont parallèles, le modèle est additif, autrementle modèle est multiplicatif. Sur le graphique de notre exemple, les droites de profil ne sont pasparallèles pour toutes les saisons, le modèle est multiplicatif.• Méthode graphique de la bande.La nature <strong>du</strong> modèle peut être confirmée à l’aide d’une autre méthode graphique : la méthode dela bande. On fait un graphique représentant la série chronologique, puis on trace une droite passantrespectivement par les minima et par les maxima de chaque saison. Si ces deux droites sont parallèles,nous sommes en présence d’un modèle additif. Dans le cas contraire, c’est un modèle multiplicatif.Illustrons ceci à l’aide de l’exemple 3.3.1 de référence. On a la figure 3.7, nous constatons que les deuxdroites ne sont pas parallèles, nous sommes donc en présence d’un modèle multiplicatif.Figure 3.7 – Détermination <strong>du</strong> modèle - Méthode de la bande• Méthode analytique.Présentons maintenant la méthode analytique. On calcule les moyennes et écarts-types pour chacunedes périodes considérées et on calcule la droite des moindres carrés σ = ax + b. Si la pente a est nulle,c’est un modèle additif, sinon, le modèle est multiplicatif. Dans le cadre de l’exemple 3.3.1, on obtient(en utilisant partiellement la table 3.3) le tableau suivant :Rang Moyenne x Écart-type σ x 2 σ 2 σ1 1287,5 159,59 1657656,25 25468,97 205472,132 1387,5 248,43 1925156,25 61717,46 344696,633 1487,5 267,80 2212656,25 71716,84 398352,54 1600 306,19 2560000 93752,32 489904Total 5762,5 982,01 8355468,8 252655,59 1438425,26Table 3.8 – Détermination <strong>du</strong> modèle - Méthode analytiqueEn déterminant l’équation de la droite des moindres carrés associée, on obtient a = 0, 44 (Cov(x, σ) =5932, 88 et V (x) = 13466, 81) et b = −388, 38 (σ = 245, 50 et x = 1440, 625), ce qui confirme encoreune fois que pour cet exemple, nous sommes bien en présence d’un modèle multiplicatif.


3.3. ANALYSE DES DIFFÉRENTES COMPOSANTES 57On peut maintenant effectuer l’analyse des mouvements saisonniers. On présente deux méthodes.(b) Analyse des mouvements saisonniers - La méthode graphiqueLa visualisation de la composante saisonnière peut se faire naturellement à l’aide <strong>du</strong> graphique dit“superposé”. Dans le cas de l’exemple 3.3.1 de référence, on constate à l’aide de la figure 3.7 qu’il y apériodicité annuelle (les courbes sont sensiblement de même forme) même si certains phénomènes sousjacentssemblent intervenir.(c) Analyse des mouvements saisonniers - La méthode des moyennes saisonnièresSoit j l’indice relatif à la saison.– Si on dispose de données trimestrielles, j = 1, . . . , 4– Si on dispose de données mensuelles, j = 1, . . . , 12On calcule la moyenne des données pour chaque saison x j puis x j − x ce qui permet de situer la valeursaisonnière moyenne par rapport à la valeur globale moyenne.On place sur un graphique les points (j, x j − x).On reprend l’exemple de référence 3.3.1. On a la moyenne globale des livraisons qui vaut x = 1440, 625ainsi que les moyennes saisonnières• x 1 = 1087, 5 avec x 1 − x = −353, 125,• x 2 = 1487, 5 avec x 2 − x = 46, 875,• x 3 = 1775 avec x 3 − x = 334, 375,• x 4 = 1412, 5 avec x 4 − x = −28, 125On a donc le graphe suivantFigure 3.8 – Graphique des moyennes saisonnièresOn peut ainsi remarquer par exemple que les livraisons d’essence moyennes <strong>du</strong> premier trimestre sontinférieures aux ventes globales moyennes d’environ 353 millions de m 3 .3.3.3 Correction des variations saisonnièresDans beaucoup de situations, il est préférable de travailler sur des données qui ne sont pas affectéespar un mouvement saisonnier. C’est pour cela que l’on transforme la série chronologique initiale en donnéesdésaisonnalisées ou corrigées des variations saisonnières.


58 CHAPITRE 3.SÉRIES CHRONOLOGIQUES(a) Le modèle multiplicatifOn a X t = T t × C t × S t × A t .– On détermine la tendance T t par la droite de régression ou par la méthode des moyennes mobiles,– pour chaque t, on calcule le rapport X tT t= r t appelé rapport à la tendance,– on calcule les moyennes des rapports r t correspondant à une même saison et on obtient ainsi lescoefficients saisonniers s j où j est l’indice relatif à la saison. Si les rapports à la tendance ne sontpas égaux, cela est dû à une influence accidentelle,– on calcule la moyenne s des coefficients saisonniers. Si le modèle est bien choisi, la moyenne s doit êtreproche de 1. Dans le cas contraire,– on calcule les correctionss ⋆ j = s jsqui vérifient dorénavant la propriété 1 n∑s ⋆ j = 1 où n est le nombre de coefficients saisonniers.nj=1– On calcule enfin la série désaisonnalisée ou série corrigée des variations saisonnières(t, Xt ⋆ = X )ts ⋆ toù s ⋆ t = s ⋆ jsi t appartient à la saison j. Par ce biais, on estompe l’influence accidentelle de la série.On reprend l’exemple 3.3.1 de référence. On sait que le modèle est multiplicatif. La tendance à la saison t(soit T t ) peut être donnée à l’aide de la droite de régression dont on rappelle l’équation :X(t) = 31, 838t + 1170, 002On est donc en mesure de calculer les rapports à la tendance :t 1 2 3 4 5 6 7 8X t 1050 1300 1500 1300 1050 1400 1750 1350T t 1201, 84 1233, 68 1265, 52 1297, 35 1329, 19 1361, 03 1392, 87 1424, 71r t = X t /T t 0, 87 1, 05 1, 19 1, 00 0, 79 1, 03 1, 26 0, 95t 9 10 11 12 13 14 15 16X t 1100 1550 1850 1450 1150 1700 2000 1550T t 1456, 54 1488, 38 1520, 22 1552, 06 1583, 90 1615, 73 1647, 57 1679, 41r t = X t /T t 0, 76 1, 04 1, 22 0, 93 0, 73 1, 05 1, 21 0, 92On calcule ensuite les coefficients saisonniersTable 3.9 – Rapports à la tendance• s 1 = 1 4 (r 1 + r 5 + r 9 + r 13 ) = 1 (0, 87 + 0, 79 + 0, 76 + 0, 73) = 0, 794• s 2 = 1 4 (r 2 + r 6 + r 10 + r 14 ) = 1 (1, 05 + 1, 03 + 1, 04 + 1, 05) = 1, 044• s 3 = 1 4 (r 3 + r 7 + r 11 + r 15 ) = 1 (1, 19 + 1, 26 + 1, 22 + 1, 21) = 1, 224• s 4 = 1 4 (r 4 + r 8 + r 12 + r 16 ) = 1 (1, 00 + 0, 95 + 0, 93 + 0, 92) = 0, 954


3.3. ANALYSE DES DIFFÉRENTES COMPOSANTES 59Comme s = 1 4 (s 1 + s 2 + s 3 + s 4 ) = 1 (0, 79 + 1, 04 + 1, 22 + 0, 95) = 1, le modèle est bien choisi.4On se sert ensuite des coefficients saisonniers pour désaisonnaliser la série. On obtient le tableau suivant :t 1 2 3 4 5 6 7 8X t 1050 1300 1500 1300 1050 1400 1750 1350X ⋆ t 1329, 11 1250 1229, 51 1368, 42 1329, 11 1346, 15 1434, 43 1421, 05t 9 10 11 12 13 14 15 16X t 1100 1550 1850 1450 1150 1700 2000 1550X ⋆ t 1392, 41 1490, 38 1516, 39 1526, 32 1455, 70 1634, 62 1639, 34 1631, 58Table 3.10 – Série désaisonnaliséeVoici pour terminer les représentations graphiques de la série originale, de la droite de régression et dela série désaisonnalisée.Figure 3.9 – Représentations graphiques de la série originale, de la droite de régression et de la sériedésaisonnaliséeLa série désaisonnalisée fait apparaître par conséquent les composantes cycliques et accidentelles plusexplicitement.(b) Le modèle additifOn a X t = T t + C t + S t + A t . La méthode est analogue à celle <strong>du</strong> modèle multiplicatif :– on calcule la différence d t = X t − T t au lieu <strong>du</strong> rapport,– on obtient les coefficients s j en calculant les moyennes des différences d t correspondant à une mêmesaison,– on calcule ensuite la moyenne s de ces coefficients s j . Si le modèle est bien choisi, la moyenne s doitêtre proche de 0. Dans le cas contraire,– on calcule les correctionss ⋆ j = s j − s,


60 CHAPITRE 3.SÉRIES CHRONOLOGIQUES– on calcule enfin la série désaisonnalisée(t, X ⋆ t = X t − s ⋆ t ).Exemple 3.3.2 (cas additif) Considérons la série statistique des chiffres d’affaires trimestriels (en milliersd’euros) d’une entreprise.Trimestre 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4Chiffre d’affaires 120 181 71 119 128 190 73 124 140 196 84 133 145 206 96 142Table 3.11 – Chiffres d’affaire trimestrielsLe modèle de la série statistique est bien additif, pour s’en convaincre, il suffit d’employer la méthode de labande et de constater que la droite qui passe par les maxima et celle qui passe par les minima sont parallèles.Calculons les moyennes mobiles T t d’ordre 4 (puisque nous sommes en présence d’une série dont la périodicitéest de 4 trimestres). Ensuite nous déterminons les différences saisonnières d t , c’est-à-dire les différencesentre les valeurs de la série statistique de départ et les valeurs des moyennes mobiles correspondantes. Cesdifférences vont nous servir pour obtenir les coefficients saisonniers non corrigés trimestriels.t 1 2 3 4 5 6 7 8X t 120 181 71 119 128 190 73 124T t – – 123,75 125,88 127,25 128,13 130,25 132,50d t – – -52,75 -6,88 0,75 61,88 -57,25 -8,50t 9 10 11 12 13 14 15 16X t 140 196 84 133 145 206 96 142T t 134,63 137,13 138,88 140,75 143,50 146,13 – –d t 5,38 58,88 -54,88 -7,75 1,50 59,88 – –Table 3.12 – Différences à la tendanceLes coefficients saisonniers correspondent aux moyennes des différences saisonnières pour chacun destrimestres. On obtient :• s 1 = 1 3 (d 5 + d 9 + d 13 ) = 1 (0, 75 + 5, 38 + 1, 50) = 2, 544• s 2 = 1 3 (d 6 + d 10 + d 14 ) = 1 (61, 88 + 58, 88 + 59, 88) = 60, 213• s 3 = 1 3 (d 3 + d 7 + d 11 ) = 1 (−52, 75 − 57, 25 − 54, 88) = −54, 963• s 4 = 1 3 (d 4 + d 8 + d 12 ) = 1 (−6, 88 − 8, 50 − 7, 75) = −7, 713Nous supposons que la composante saisonnière est strictement périodique. L’effet net de la composantesaisonnière sur une période doit être nul car il est repris dans la tendance générale de la série chronologique.Or ce n’est pas le cas dans cet exemple puisques = 1 4 (s 1 + s 2 + s 3 + s 4 ) = 1 (2, 54 + 60, 21 − 54, 96 − 7, 71) = 0, 02.4Ceci nous amène donc à rectifier les coefficients saisonniers non corrigés en leur retranchant la moyenne descoefficients saisonniers pour toutes les périodes. On a alors :


3.4. EXERCICES 61• s ⋆ 1 = s 1 − s = 2, 54 − 0, 02 = 2, 52• s ⋆ 2 = s 2 − s = 60, 21 − 0, 02 = 60, 19• s ⋆ 3 = s 3 − s = −54, 96 − 0, 02 = 54, 98• s ⋆ 4 = s 4 − s = −7, 71 − 0, 02 = −7, 73Disposant maintenant des coefficients saisonniers corrigés, nous pouvons désaisonnaliser la série chronologiqueen retranchant à chacune des valeurs initiales de la série la valeur <strong>du</strong> coefficient saisonnier correspondant.t 1 2 3 4 5 6 7 8X t 120 181 71 119 128 190 73 124d t 117,48 120,81 125,98 126,73 125,48 129,81 127,98 131,73t 9 10 11 12 13 14 15 16X t 140 196 84 133 145 206 96 142X ⋆ t 137,48 135,81 138,98 140,73 142,48 145,81 150,98 149,73Table 3.13 – Série désaisonnalisée3.4 Exercices✞☎✝Exercice 33 ✆ Dans une grande concession, on dispose d’une statistique portant sur les ventes mensuellesde voitures au cours de vingt quatre mois. Le tableau suivant contient les valeurs brutes (c’est-à-dire noncorrigées des variations saisonnières).Ventes brutes x t janv févr mars avril mai juin juill août sept oct nov déc2002 410 435 450 430 440 455 450 430 460 470 460 4402003 465 480 465 475 480 430 460 460 490 470 480 5001. Calculer la série des moyennes mobiles sur quatre périodes.2. Calculer les coefficients a et b de la droite de régression.3. Représenter sur un même graphique la série brute (t, y t ), la série des moyennes mobiles sur quatrepériodes, la droite de régression.4. Calculer le coefficient de détermination r qui est défini parr 2 =Cov(x, t)2V (x)V (t)La droite de régression fournit-elle une bonne estimation de la tendance d’ensemble des ventes ?✞☎✝Exercice 34 ✆ La série suivante retrace les fluctuations de l’indice trimestriel pour la pro<strong>du</strong>ction in<strong>du</strong>strielleau cours de six années. Le tableau suivant contient les valeurs brutes (c’est-à-dire non corrigées desvariations saisonnières).


62 CHAPITRE 3.SÉRIES CHRONOLOGIQUESy ik printemps été automne hiver2005 105 1302006 120 125 103 1252007 122 125 102 1262008 121 127 104 1282009 124 128 109 1252010 125 1321. Montrer le caractère saisonnier de cette chronique.2. Calculer le trend par la méthode des moyennes mobiles.3. Calculer les coefficients saisonniers.4. Calculer la valeur désaisonnalisée <strong>du</strong> quatrième trimestre de l’année 2010 si la valeur brute est 132.5. Calculer la valeur corrigée des variations saisonnières.✞☎✝Exercice 35 ✆ Dans un magasin d’habillement, on a enregistré à la fin de chaque trimestre et pendant troisannées le bilan des ventes d’un article d’habillement en milliers d’unités. Les résultats sont donnés dans letableau suivant qui en fournit les valeurs brutes (c’est-à-dire non corrigées des variations saisonnières).2001-2003 1 2 3 4 5 6 7 8 9 10 11 12Ventes brutes x t 4,16 5,27 1,70 2,94 7,04 8,33 2,80 4,27 10,56 11,73 3,70 5,531. Construire la représentation graphique de la série brute (t, x t )2. On se propose d’étudier maintenant comme modèle de série chronologique approprié un modèle multiplicatifde la forme x t = C t S t ε t . Donner le tableau des valeurs brutes (c’est-à-dire non corrigées desvariations saisonnières) <strong>du</strong> logarithme y t = ln x t = ln C t + ln S t + ln ε t de x t . Ici ln C t sera la tendancelinéaire, ln S t sera la série des moyennes mobiles sur quatre périodes de y t et enfin ln ε t une suitechronologique de moyenne nulle.3. Calculer les coefficients a et b de la droite de régression de y t en fonction de t. En dé<strong>du</strong>ire l’expressionde C t .4. Calculer la série ln S t des moyennes mobiles sur quatre périodes de y t .


Chapitre 4Cas pratiques4.1 Le port de Longoni4.1.1 Le port de Longoni en quelques chiffresImplanté sur la baie de Longoni, le port de Longoni est un port décentralisé relevant de la compétence <strong>du</strong>Conseil Général de Mayotte. La Chambre de Commerce et d’In<strong>du</strong>strie de Mayotte en est le concessionnairedepuis sa mise en service en 1992 et assure de ce fait plusieurs missions :– la gestion des terres-pleins et hangars,– la gestion des entrées et sorties des marchandises au port,– la livraison des marchandises aux clients et– assure des prestations de services aux navires.La CCI de Mayotte gère également une zone in<strong>du</strong>strielle, la Vallée 2, où sont implantées des entreprises<strong>du</strong> milieu portuaire, ainsi qu’une zone de restauration, une zone de dépotage et un parking client. Depuispresque 21 ans après sa mise en service, les évolutions qu’il a connues jalonnent les principales étapes <strong>du</strong>développement de Mayotte en général.Le port de Longoni en 2011, c’est aussi :– plus de 200 navires marchands qui escalent sur le port de Longoni chaque année,– une activité logistique qui génère plus de 500 emplois directs,– 11 919 483=C de chiffre d’affaires de manutention (CCI/SMART),– 6 947 486=C de droits de port,– 2 652 360=C de RSM (redevance sur marchandises),– 18 205 EVP en import,– 16 204 EVP en transbo.Une activité globalement en croissance de 14% entre 2009 et 2011.Figure 4.1 – Le port de Longoni en 2011Figure 4.2 – Le plan d’exploitation <strong>du</strong>port de Longoni63


64 CHAPITRE 4. CAS PRATIQUES4.1.2 <strong>Statistiques</strong> <strong>du</strong> port de LongoniOn se donne les statistiques suivantes relatives au port de Longoni :TRAFIC 2009 2010 2011 2012Total Vracs liquides (hors ravitaillement) 97 96 86 −12%Total Vracs solides 49 47 37 −24%Conteneurs 184 184 337 83%Entrées en kt ⋆ Marchandises Roulier hors conteneurs 0 0 0diversesM/ses diverses horsconteneur et roulier44 45 45 2%Total M/ses diverses 228 229 504 121%Total entrées 374 373 627 68%Total Vracs liquides (hors ravitaillement) 0 0Total Vracs solides 0 0 0Conteneurs 37 41 206 456%Entrées en kt ⋆ Marchandises Roulier hors conteneurs 0 0 0diversesM/ses diverses horsconteneur et roulier1 0 2 194%Total M/ses diverses 38 42 209 450%Total sorties 38 42 209 450%Transbordés Marchandises Conteneurisés 235 310 344 46%Total Entrées + Sorties 647 724 1,180 82%⋆ source : Conseil Général de Mayotte / Direction <strong>du</strong> Portnb EVP en entrée 16,129 17,154 17,509 9%Conteneurs ⋆⋆ nb EVP en sortie 16,275 18,367 16,921 4%nb EVP en transbordement 12,721 16,795 16,841 32%Total nb EVP 45,125 52,316 51,271 14%⋆⋆ source : Chambre de Commerce et d’In<strong>du</strong>strie de Mayotte / Direction de la Concession PortuairePassagers ⋆ ⋆ ⋆ Croisière 6,188 3,284 0Services côtiers ou inter-îles 40,750 57,527 2,252 −94%⋆ ⋆ ⋆ source : Conseil Général de Mayotte / Direction <strong>du</strong> PortPêche Tonnage débarqué 0 0 0Table 4.1 – <strong>Statistiques</strong> Port de Longoni• Le port de Longoni a enregistré une augmentation entre 2009 à 2011, avec une variation positive de82% sur le tonnage <strong>du</strong> trafic global de marchandises. Comme le montre le tableau 4.1, le tonnage desimportations a évolué de 68%, passant de 374Kt à 627Kt en 3 ans, et les exportations de 38Kt à 209Ktsoit une progression de 450%.• En terme d’EVP entre 2009 et 2011, le trafic connaît une évolution de 14%, on constate une légèrediminution des exportations entre 2010 et 2011 (18367 à 16921), mais avec un pourcentage positif, etun ralentissement des conteneurs transbordés sur la même période. Les importations restent stables.


4.1. LE PORT DE LONGONI 654.1.3 Les indicateurs d’exploitation des terminaux conteneurs en 2011Terminaux conteneurs Quai 1 + Quai 2Nombre d’escales navires porte conteneurs 195Nombre d’heures passées au port 6344Nombre d’heures passées à Quai 5560Nombre d’heures operations commerciales 3823Tonnes totales de marchandises conteneurisées opérées 538 119Nombre total d’EVP 51 271Nombre total d’EVP déchargés 17509Nombre total d’EVP chargés 16 921Tonnage manutentionné / heures d’operations commerciales 141Tonnage manutentionnné / heures passées à quai 97Tonnage manutentionné / heures passées au port 85Nombre moyen d’EVP manipulés / heures 13Pour une escale navire en moyenneTemps passé (heures) au port 33Temps passé (heures) à quai 29Temps passé (heures) à quai pour opérations commerciales 20Nombre d’equipes 2Nombre de grues operationnelles 2Nombre de shifts 4Nombre moyen de conteneurs manipulés 263Tonnes moyennes de marchandises conteneurisées 2760Indicateurs de pro<strong>du</strong>ctivité (EVP/h/grue) 7Indicateur de pro<strong>du</strong>ction (tonnes/h/équipes) 10Table 4.2 – Les indicateurs d’exploitation des terminaux conteneurs en 2011Pour l’année 2011, on compte 211 navires qui sont passés par le port de port de Longoni : 195 navirescommerciaux et 16 non commerciaux. On enregistre aussi pour cette année une légère baisse <strong>du</strong> tonnagemanipulé entre 2010 et 2011 (545214,5 à 538119), donc une baisse des conteneurs estimés en EVP. Cecis’explique notamment par les événements sociaux qui ont secoué l’île de Mayotte en fin d’année 2011.


66 CHAPITRE 4. CAS PRATIQUES4.1.4 Les marchandises conteneurisées en 2011Entrées Sorties Trafic 2011 Trafic 2010 Variation 2010/2011Import 13179 0 13179 13307 −0, 96%Export 0 785 785 748 4, 93%Transbo 8098 8743 16841 18141 −7, 16%Vides 4330 16136 20465 20816 −1, 68%TOTAL 25607 25664 51271 53012 −3, 28%Table 4.3 – Les marchandises conteneurisées en 2011Figure 4.3 – Trafic en EVP4.1.5 Les visites de contrôle (DAF, DSV, DOUANE)Type de visite DAF/Phyto DSV Douane1er semestre 264 198 962e semestre 270 59 14TOTAL 526 257 110Table 4.4 – Tableau Visites de contrôle des marchandisesDes visites de contrôle sont effectuées régulièrement sur les conteneurs frigos, ainsi que sur les conteneursdry pour vérifier toutes les marchandises débarquées, vérifier le poids réel des TC, le respect des normes,voire si tout les pro<strong>du</strong>its sont déclarés. . . Sur l’année 2011, il y a eu 1015 conteneurs visités :– Les visites phytosanitaires effectuées par la Direction de l’Agriculture et de la Forêt représentent plusde 526 conteneurs dans l’année.– Les services vétérinaires ont visité plus de 257 conteneurs.– Pour les visites douane, on dénombre 110 conteneurs.Figure 4.4 – Diagramme Visites de contrôle des marchandises


4.1. LE PORT DE LONGONI 674.1.6 Les engins de manutention de la concessionFigure 4.5 – Tableau d’utilisation <strong>du</strong> parc des engins de manutention de la concessionL’année 2011 est particulière en terme d’entretien des engins car elle a vu la recrudescence de la maintenancecurative. Ceci est essentiellement dû aux pannes à répétition des engins et à leur immobilisation<strong>du</strong>rant plusieurs jours. Dans le même temps, le coût de la maintenance préventive a baissé de 46%. Cettesituation est <strong>du</strong>e à la ré<strong>du</strong>ction des machines à uniquement 2 stackers, ce qui ne permet pas le respect d’unplanning de maintenance. La consommation en gasoil a légèrement augmenté par rapport à 2010, passantde 41582 litres à 46523 litres, soit une hausse de près de 12%. Ceci s’explique par le fait qu’en cas de panned’une machine, celle qui est disponible travaille beaucoup plus dans le soucis de satisfaire la clientèle. Uneaugmentation de gasoil a donc été enregristrée.Figure 4.6 – Répartition par nature de maintenance des engins4.1.7 La gestion des matières dangereuses au portLe nombre de conteneurs de matières dangereuses reçus au port est en constante augmentation, cela anécessité la mise en place <strong>du</strong>ne procé<strong>du</strong>re de gestion des matières dangereuses sur le port en collaborationavec la Capitainerie <strong>du</strong> port et la Préfecture. L’année 2011 a été très prometteuse sur le nombre de TC dematières dangereuses réceptionnés sur le parc, néanmoins, on a enregistré une forte baisse en fin d’année.La grande difficulté sur la gestion des conteneurs de matières dangereuses relève des infractions constatéessur le parc.Mois Janv. Fév. Mars Avril Mai Juin Juill. Août Sept. Oct. Nov. Déc. TOTALQuantité 135 52 59 85 89 62 44 48 96 52 72 37 831Tonnage 2329 746 838 1433 1428 947 638 725 1401 754 1076 549 12863Table 4.5 – Tableau Matières dangereuses année 2011


68 CHAPITRE 4. CAS PRATIQUESFigure 4.7 – Courbe Matières dangereuses année 20114.2 Trafics de passagers des ports métropolitainsAvec 28,5 millions de passagers, le trafic des ports maritimes métropolitains est en légère hausse parrapport à 2010 (+0, 6%).Passagers autre que croisière Total passagers Évolution2010 2011 2010 2011 2011/2010Dunkerque 2533 2601 2533 2601 2, 7%Calais 10236 10063 10236 10067 −1, 7%Boulogne 296 0 296 0 −100%Dieppe 254 259 254 259 1, 7%Le Havre 270 345 526 715 36, 1%Caen 1022 952 1022 954 −6, 7%Cherbourg 559 625 623 700 12, 5%St-Malo 930 1124 948 1157 22, 0%Roscoff 534 544 534 545 2, 0%TOTAL Manche - Mer <strong>du</strong> Nord 16635 16513 16973 16998 0, 2%Sete 201 170 212 212 0, 0%Marseille 1383 1531 2485 2887 16, 2%Toulon 1283 1219 1568 1637 4, 4%Nice 916 812 1811 1662 −8, 2%Bastia 2524 2282 2532 2291 −9, 5%L’Ile-Rousse 406 366 406 366 −9, 8%Ajaccio 1117 1041 1868 1941 3, 9%Bonifacio 240 241 254 261 2, 9%Calvi 179 154 196 217 10, 9%Total Méditerranée 8250 7817 11333 11475 1, 3%Total Métrople (17 ports) 24885 24330 28305 28474 0, 6%Table 4.6 – Tableau Trafics de passagers des ports métropolitains


4.2. TRAFICS DE PASSAGERS DES PORTS MÉTROPOLITAINS 69Figure 4.8 –Évolution 2011/2010 des traficsde passagers dans lesports métropolitains françaispar façade (en milliers de passagers)Figure 4.9 – Répartition par type devoyageurs dans les portsmétropolitains français en2011• En Manche-Mer <strong>du</strong> Nord, le trafic est stable par rapport à 2010.– À Calais, premier port de la façade pour les trafics de voyageurs, le trafic recule de −1, 7% en 2011,en raison notamment de l’interruption des liaisons SeaFrance à partir de la mi-novembre.– Le Grand port maritime <strong>du</strong> Havre enregistre une forte progression de trafic (+36, 1%), grâce notammentà la hausse des fréquentations vers la Grande-Bretagne.– À Dunkerque (+2, 7% en 2011), la croissance per<strong>du</strong>re, soutenue par le dynamisme de la ligneDunkerque-Douvres.– À contrario, le port de Boulogne Sur Mer n’a plus de trafic passagers depuis l’arrêt de la liaisonBoulogne-Douvres et le départ de LD lines fin 2010.– Les autres ports de la façade affichent des résultats globalement positifs (+12, 5% et +22% respectivementà Cherbourg et Saint-Malo).– Le port de Caen voit sa fréquentation diminuer de −6, 7%.• En Méditerranée, le trafic poursuit sa progression et s’établit à 11,5 millions de passagers en 2011(+1, 3%). Les ports de la façade méditerranéenne ont connu des réussites diverses.– Sous l’effet de la forte croissance des liaisons avec la Corse, le Grand port maritime de Marseille voitses trafics de passagers augmenter de +16, 2%. En revanche, les lignes régulières vers le Maghrebaffichent une fréquentation en baisse (−12%).– Les trafics à Toulon (+4, 4%), Ajaccio (+3, 9%), Bonifacio (+2, 9%) et Calvi (+10, 9%) restent bienorientés.– À contrario, les ports de Bastia, Nice et L’Ile-Rousse enregistrent des baisses de trafic.On se donne à la page suivante les données et graphes superposés des trafics totaux de passagers lors desannées 2009, 2010 et 2011. sur la façade Manche - Atlantique, exprimés en milliers de passagers (chiffresprovisoires au 24 janvier 2012).


70 CHAPITRE 4. CAS PRATIQUESFigure 4.10 – Tableau Trafics passagers exprimés en milliers de passagers en 2009Figure 4.11 – Tableau Trafics passagers exprimés en milliers de passagers en 2010Figure 4.12 – Tableau Trafics passagers exprimés en milliers de passagers en 2011


4.2. TRAFICS DE PASSAGERS DES PORTS MÉTROPOLITAINS 71Figure 4.13 – Trafic total de passagers en 2009 (- bleu), 2010 (- rouge), 2011 (- vert). FaçadeMéditerranéenne. Exprimé en milliers de passagers (Chiffres provisoires au 24 janvier 2012)Figure 4.14 – Trafic total de passagers en 2009 (- bleu), 2010 (- rouge), 2011 (- vert). Façade Manche -Atlantique. Exprimé en milliers de passagers (Chiffres provisoires au 24 janvier 2012)


72 CHAPITRE 4. CAS PRATIQUES4.3 Le Port de Montréal4.3.1 Présentation <strong>du</strong> PortSitué sur le Saint-Laurent, une des plus grandes voies navigables <strong>du</strong> monde, le Port de Montréal est laliaison intermodale la plus directe entre le cœur in<strong>du</strong>striel de l’Amérique <strong>du</strong> Nord et les marchés de l’Europe<strong>du</strong> Nord et de la Méditerranée.À 1600 kilomètres à l’intérieur des terres, le Port de Montréal donne accès à un bassin de plus de 100 millionsde consommateurs canadiens et américains.De tous les ports de la côte Est Nord-Américaine, c’est le Port de Montréal qui offre l’accès le plus rapide, leplus direct et le plus économique aux principaux marchés <strong>du</strong> centre <strong>du</strong> Canada, <strong>du</strong> Nord-Est et <strong>du</strong> Midwestaméricains. Il suffit d’un seul arrêt à Montréal pour exploiter ce gigantesque potentiel commercial.De plus, le Port de Montréal est relié, par les transporteurs maritimes qui le desservent, à plus de 100 payssur les 5 continents. Il offre des liens directs avec les grands ports Nord-Européens et Méditerranéens parmilesquels :– Anvers, en Belgique,– Liverpool, au Royaume-Uni,– Rotterdam, aux Pays-Bas,– Hambourg et Bremerhaven, en Allemagne,– Le Havre et Marseille/Fos, en France,– Algésiras, Barcelone et Valence, en Espagne,– Gnes, Livourne et Gioia Tauro, en Italie,– Lisbonne, au Portugal.Le Port de Montréal possède des installations modernes pour manutentionner tous les types de fret. Il gèrenotamment plus de 1,3 million de conteneurs EVP (équivalents 20 pieds), représentant plus de 12 millionsde tonnes de marchandises conteneurisées chaque année.Son trafic de conteneurs à l’exportation et à l’importation est assuré par des services réguliers à hautefréquence de transporteurs maritimes de classe mondiale : CMA CGM, Hanjin Shipping, Hapag-Lloyd,Maersk, MSC et OOCL.Le Port de Montréal manutentionne également des marchandises non conteneurisées, <strong>du</strong> vrac liquide, <strong>du</strong>vrac solide et des céréales.4.3.2 Le Port en bref et en chiffresAvec sa situation géographique privilégiée qui lui permet de rejoindre plus de 100 millions de consommateursen moins de 36 heures de train, il est le premier port de conteneurs en importance de l’est <strong>du</strong> Canadaet un port d’envergure internationale relié à plus de 80 pays partout au monde.– Les trois grands secteurs de manutention s’y retrouvent : marchandises conteneurisées, vrac liquide etvrac solide (incluant les céréales). Le port est également actif dans le secteur des croisières internationaleset fluviales.– Près de 30 millions de tonnes de marchandises y sont manutentionnées annuellement.


4.3. LE PORT DE MONTRÉAL 73– Ses installations portuaires s’étalent sur 26 km sur l’île de Montréal et sur 4 km à Contrecoeur, à 40km en aval de Montréal, sur la rive sud <strong>du</strong> Saint-Laurent.– Il est le seul port à conteneurs de la Porte continentale <strong>du</strong> Canada par où transitent plus de 80% deséchanges commerciaux <strong>du</strong> Canada.– Il fait partie <strong>du</strong> club sélect des ports <strong>du</strong> monde qui reçoivent annuellement plus d’un million deconteneurs équivalent vingt pieds (EVP).– Le réseau ferroviaire <strong>du</strong> port est directement relié aux réseaux <strong>du</strong> CN (Canadien National) et <strong>du</strong> CP(Canadien Pacifique).– En 2011, le Royaume-Uni et l’Europe continentale ont fourni 46, 8% <strong>du</strong> trafic des conteneurs, laMéditerranée, 18, 9%, l’Asie, 12, 9%, le Moyen-Orient, 8, 7%, l’Amérique latine, 5, 9%, l’Afrique/Océanie,4% et le Canada, 2, 8%.– 2200 bateaux en moyenne chaque année,– 5000 mouvements quotidiens de camions (entrées et sorties),– 80 convois de trains chaque semaine,– 100 km de voies ferrées le long des quais et sur les terminaux.– L’année 2011 s’est soldée par une année record avec 28,5 millions de tonnes métriques de marchandisesmanutentionnées, soit une hausse de 10, 1% par rapport à 2010.– Le secteur des croisières a accueilli 40 navires en 2011 pour un total de 38031 passagers. Le nombrede passagers atten<strong>du</strong>s pour l’année 2012 s’élève à 55500, soit une augmentation de 46%.– 1,5 milliard de dollars en valeur ajoutée à l’économie canadienne (Étude Secor, 2008) soit 1,0 milliardde dollars au Québec et 0,5 milliard de dollars pour le reste <strong>du</strong> Canada,– 241 emplois à l’Administration portuaire de Montréal (2012)– 18280 emplois soutenus par l’activité maritime et portuaire à Montréal : 5 400 emplois directs (emploisliés aux entreprises directement impliquées dans le système portuaire et maritime de Montréal) et 12880 emplois indirects (emplois liés aux fournisseurs de la demande de biens et services engendrée parles entreprises directement impliquées dans le système portuaire et maritime de Montréal).4.3.3 Quelques statistiques <strong>du</strong> port de MontréalFigure 4.15 – Trafic cumulatif de conteneurs


74 CHAPITRE 4. CAS PRATIQUESFigure 4.16 – Tableau Trafic cumulatifFigure 4.17 – Diagramme Trafic cumulatif


4.3. LE PORT DE MONTRÉAL 75Figure 4.18 – Trafic cumulatif de conteneursFigure 4.19 – Trafics trimestrielsFigure 4.20 – Trafic cumulatif de conteneurs


76 CHAPITRE 4. CAS PRATIQUES4.4 Exercices✞☎✝Exercice 36 ✆ - Port de Longoni1. À l’aide de la table 4.1, retrouver - dans la mesure <strong>du</strong> possible et en justifiant - les résultats suivants :• Le port de Longoni a enregistré une augmentation entre 2009 à 2011, avec une variation positive de82% sur le tonnage <strong>du</strong> trafic global de marchandises. Le tonnage des importations a évolué de 68%,passant de 374Kt à 627Kt en 3 ans, et les exportations de 38Kt ‘a 209Kt soit une progression de450%.• En terme d’EVP entre 2009 et 2011, le trafic connaît une évolution de 14%, on constate une légèrediminution des exportations entre 2010 et 2011 (18367 à 16921), mais avec un pourcentage positif, etun ralentissement des conteneurs transbordés sur la même période. Les importations restent stables.2. Concernant la baisse des conteneurs estimés en EVP (page 69), calculer le pourcentage de variation,le coefficient multiplicateur et l’indice base 100 associés. Si ce pourcentage se maintient, à combienpourra t-on estimer le tonnage manipulé en 2014 ?3. Si vous aviez à commenter la table 4.3 et la figure 4.3, quelles seraient vos observations ? La figure 4.3peut-elle remplacée par d’autres graphiques ?4. La figure 4.5 met en avant un problème concret relatif aux engins de manutention. Quelle solutionpouvez-vous apporter au problème ?5. Le tableau 4.5 décrit l’évolution des tonnages de matières dangeureuses en 2011. À l’aide de la méthodedes moindres carrés, déterminer un estimation de ce tonnage en juin 2012.✞☎✝Exercice 37 ✆ - Trafics de passagers des ports métropolitainsOn s’intéresse aux figures (tableaux) 4.10 et 4.11 et en particulier au trafic “Boulonnais” des passagersexprimé en milliers de passagers en 2009 et 2011.1. Calculer la série des moyennes mobiles sur quatre périodes.2. Calculer les coefficients de la droite de régression.3. Représenter sur un même graphique la série brute (t, x t ), la série des moyennes mobiles sur qutrepériodes et la droite de régression. Que vous enseigne ce graphique ?4. Le modèle est-il additif ou multiplicatif ?5. Calculer les coefficients saisonniers (1 saison = 1 trimestre) de la série puis les valeurs de la sériedésaisonnalisée.✞☎✝Exercice 38 ✆ - Le port de MontréalOn considère la figure 4.19. Supposons que l’on dispose des valeurs relatives au 3e trimestre 2013 à savoir :Trimestre3e trimestreseptembre 2013Vrac Marchandises diverses TotalLiquide Solide Conteneurisées Non conteneurisées Total général2126768 1430657 3100045 45657 3145702 67031271. Faites apparaître dans la figure 4.19 les modifications consécutives à l’apport de ces valeurs.2. Représenter graphiquement le trafic cumulatif de conteneurs (comme dans la figure 4.20) relatif àseptembre 2013.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!