1 Introduction à Scilab - CNRS Orleans

UNIVERSITÉ D’ORLEANS Année universitaire 2007-2008 

UFR Sciences Masters EE et ESM 

OUTILS NUMÉRIQUES ET STATISTIQUES POUR LA PHYSIQUE 

1 Introduction à Scilab 

SÉANCES SUR ORDINATEUR 

Scilab est un logiciel de calcul numérique développé par l’Institut National de Recherche 

en Informatique et en Automatique (INRIA) et distribué gratuitement sur plusieurs plateformes 

(Linux, Unix, OSX, Windows). Ce logiciel gratuit peut être téléchargé de l’adresse 

http://www.scilab.org. 

Le logiciel Scilab possède plusieurs fenêtres : la fenêtre de commande (qui s’ouvre en premier), 

une ou plusieurs fenêtres graphiques, ainsi qu’un éditeur. Scilab et Matlab ont quasiment 

la même syntaxe et la même organisation matricielle des variables. La plupart des 

commandes s’écrivent directement dans la fenêtre de commande. On peut cependant aussi 

regrouper les commandes répétitives dans des fonctions. 

Pour créer une fonction, il faut ouvrir l’éditeur, écrire les lignes de commande et enregister 

le fichier sous un nom****.sci. Cette fonction doit être compilée avant de pouvoir l’exécuter 

dans Scilab. Après chaque modification de la fonction, allez dans le menuExecuter puis 

faitesCharger dans Scilab. 

La syntaxe d’une fonction est toujours la même : 

function [arguments de sortie] = nom de la fonction(arguments d’entrée) 

lignes de code 

\\ eventuellement des commentaires 

lignes de code 

endfunction 

N’écrivez jamais une telle fonction directement dans la fenêtre de commande. C’est dans 

l’éditeur qu’il faut la rédiger. La fonction doit être enregistrée puis compilée après chaque 

modification. 

1

Exemple 

La fonction ci-dessous calcule la moyenne et l’écart-type d’une variable aléatoire et restitue 

en outre la variable centrée réduite 

function [moy,sigma,y] = stat(x) 

moy = mean(x); 

sigma = st_deviation(x); 

y = (x-moy)/sigma; 

endfunction 

Enregistrez cette fonction dans un fichier nommé stat.sci. Le nom du fichier doit être le 

même que celui de la fonction. Avant de l’exécuter, on commence par créer avec la commande 

grand un vecteur de 50 valeurs aléatoires distribuées uniformément entre 0 et 1 

-->u = grand(50,1,"unf",0,1); 

-->u 

u = 

0.7577401 

0.8219033 

0.3019131 

0.6554779 

etc 

Pour ensuite exécuter la fonction stat à partir des valeurs contenues dans la variable u, il 

suffit de faire 

-->stat(u) 

ans = 

0.5103843 

-->[moy,s,v] = stat(u); 

-->moy 

moy = 

0.5103843 

-->s 

s = 

0.2768577 

-->mean(v) 

ans = 

1.221E-17 

Dans le premier cas, le résultat du calcul est affiché sans être stocké dans une variable ; sa 

valeur est donc perdue. Dans le second cas, les valeurs respectives de la moyenne, de l’écarttype 

et du vecteur centré-réduit sont enregistrés dans les variablesmoy,setv. 

Dans le cas où il faut traiter plusieurs vecteurs de valeurs aléatoires, il suffit de créer une matrice 

et d’appliquerstat séparément à chaque colonne de cette matrice. Il suffit alors d’écrire 

2

-->u = grand(50,4,"unf",0,1); 

-->for i=1:4, [moy(i),sigma(i),v(:,i)] = stat(u(:,i)); end 

-->moy 

moy = 

0.5223238 

0.5242195 

0.5454979 

0.4266284 

Dans Scilab, il n’est pas nécessaire de déclarer initialement les variables. Cependant, pour 

accélérer le déroulement du programme et pour en faciliter la lecture, il est vivement recommandé 

de le faire pour les grands tableaux. Ainsi, on aurait pu faire précéder la boucle cidessus 

d’une commande qui remplit les variables de valeurs nulles 

-->moy=zeros(4,1); sigma=zeros(4,1); v=zeros(50,4); 

Commandes à essayer 

Tapez successivement les commandes suivantes et vérifiez ce qui se passe, ainsi que le pourquoi 

de certains messages d’erreur 

x = 1 

x = 1; 

y = [10 11 12] 

y = [10 11 12]’ 

pi 

%pi 

%eps 

%i 

%e 

racinei = sqrt(%i) 

z = [1 2 3; 4 5 6; 7 8 9] 

I = [1 0 0; 0 1 0; 0 0 1] 

I*z 

I.*z 

z 

z’ 

y0 = y*z 

y0 = y’*z 

y0 = y*z’ 

y0 = y.*z’ 

y0 = z*y 

y0*2 

y0+2 

z(1,1), z(2,1), z(2,3) 

z(:,1), z(1,:) 

3 

z(:,1:2) 

z(:,2:$) 

ind = [1 3]; z(:,ind) 

z^2 

z.^2 

M = ones(3,4) 

M = zeros(2,4) 

M = eye(4,4) 

t = (0:3) 

t + M 

t = (0:0.1:3) 

t = linspace(0,1,30) 

t = t’ 

n = length(t) 

whos() 

[n,m] = size(t) 

y = exp(-t’) 

y = exp(-t) 

y = sin(2*%pi*t) 

abs([-4:4]) 

plot2d(y) 

plot2d([y sqrt(y)]) 

clf 

plot2d(t,y) 

plot2d(t,y,style=3)

plot2d(t,y,leg="exponentielle") 

plot2d(t,y,logflag="nl") 

plot2d2(t,y) 

for i=1:10, i, end 

for i=1:2:10, i, end 

for i=1:0.2:10, i, end 

for i=[1 2 9 10], i, end 

for i=[5:-1:0], i, end 

u=4; for i=1:u, i, end 

u=-1; for i=1:u, i, end 

Scilab est un langage matriciel : chaque variable est interprétée comme une matrice. Un scalaire 

n’est rien d’autre qu’une matrice 1×1. La multiplication de deux variables se fait donc 

de façon matricielle. Ainsi, si 

A= 

1 2 

3 4 

 

et B = 

1 1 

0 1 

alors A∗ B donne le produit matriciel classique. Il arrive fréquemment qu’on ait besoin de 

faire un produit terme à terme. Dans ce cas, la syntaxe à utiliser est A.∗B. Il en va de même 

pour l’élévation à une puissance, etc. 

 

1 3 

A∗ B = 

3 7 

Problème : impacts de foudre 

 

 

1 2 

alors que A.∗B = 

0 4 

Un détecteur de foudre compte le nombre n d’impacts dans une région par intervalle d’une 

minute. Lors d’un orage (que l’on suppose stationnaire), ce détecteur a fonctionné pendant 80 

minutes consécutives. A cette occasion, N = 339 impacts ont été comptabilisés. On supposera 

que les impacts successifs sont indépendants et que l’orage était stationnaire durant cette 

période. 

1. Quelle est la loi que suit n ? Déterminez son espérance. 

2. Générez avec Scilab un vecteur colonnexde 80 valeurs aléatoires réparties selon cette 

même loi. Visualisez cette suite de nombres comme une série temporelle. 

3. Calculez la moyenne de x. Comparez-la avec l’espérance prédite par cette loi. 

4. L’écart-type de x est-il en accord avec celui prédit par la loi ? 

5. Comparez le mode de x, sa moyenne et sa médiane. Lequel est le plus grand ? 

6. Calculez d’après la loi la probabilité p

2 Tests d’hypothèse 

2.1 Porosité d’un film 

Dans une expérience de mesure de porosité, on soumet les deux faces d’un film de faible 

épaisseur à une forte différence de potentiel, et on compte le nombre de décharges qui se 

produisent pendant un intervalle de temps. Ce nombre est révélateur de la quantité de micropores 

dans l’échantillon ; chaque micropore donne lieu à une décharge au maximum. 

Huit échantillons ont été analysés. On a relevé les valeurs suivantes 

échantillon i 1 2 3 4 5 6 7 8 

nombre de décharges 2730 2734 2920 2938 2882 2746 2804 2888 

On aimerait savoir si ces échantillons possèdent les mêmes caractéristiques physiques. L’hypothèse 

nulle revient à supposer que les différences observées entre les huit échantillons sont 

imputables à des fluctuations aléatoires. La loi qui convient le mieux à ce test d’hypothèse est 

la loi du χ 2 . 

Pour tester l’hypothèse nulle, il vous faut 

1. Calculer la nouvelle variable J = i ˆx 2 

i , où ˆxi est la variable xi centrée et réduite. 

2. Quel est le nombre de degrés de liberté ? 

3. Fixez un niveau de confiance α et déterminez si Prob(J > Js)=α. L’hypothèse nulle estelle 

acceptée ? 

Dans Scilab, on obtient la valeur de Js avec la commande 

Js = cdfchi("X", N, 1-alpha, alpha) 

qui donne le seuil pour le cas unilatéral, pour N degrés de liberté. Essayez plusieurs 

valeurs de α. 

4. L’expression analytique de la loi de χ 2 étant connue, on peut inverser les calculs et déterminer 

la probabilité α correspondant à une valeur seuil Js donnée. La commande 

alpha = 1 - cdfchi("PQ", J, n-1) 

nous donne le niveau de confiance avec lequel l’hypothèse d’indépendance des échantillons 

peut être acceptée. Tracez le graphe α=α(Js) pour déterminer comment α varie 

avec Js. 

2.2 Origine des roches terrestres 

L’oxygène possède trois isotopes stables. Jusque dans les années 1980, il était admis que leur 

concentration relative était la même dans tout l’univers. On a depuis découvert que le rapport 

isotopique (= le rapport entre la concentration relative de deux isotopes) varie légèrement 

d’une roche à l’autre. Sur Terre, le rapport est partout le même. Par contre, certaines 

5

météorites présentent des rapports légèrement différents. Des classes de matériaux ont été 

définies en fonction de leur signature isotopique et de leur lien parental. Comme l’oxygène 

est essentiellement produit lors de supernovae, on en conclut que la matière sur Terre et celle 

rencontrée dans notre système solaire a été produite par deux voire trois supernovae. 

Il existe plusieurs techniques pour déterminer 

la concentration isotopique. L’une d’elles 

consiste à bombarder l’échantillon avec des 

neutrons d’énergie connue et à étudier les caractéristiques 

des neutrons diffractés. Le tableau 

ci-dessous résume le nombre de neutrons 

comptabilisés en fonction de leurs caractéristiques. 

On supposera ici que ce nombre 

est proportionnel à la proportion de chaque 

isotope. 

FIG. 1 – Comparaison entre le rapport isotopique 

de 18 O et celui de 17 O pour différents échantillons. 

nombre de neutrons n16 n17 n18 

météorite 1 260’075’109 520’121 89’304 

météorite 2 25’379’070 50’541 8’910 

valeur de référence (roche terrestre) n17/n16= 0.0020 n18/n17= 0.1779 

La valeur de référence donne le rapport isotopique (supposé ici exact) d’un échantillon de 

roche terrestre. 

1. Calculez le rapport isotopique ρ= n18/n17 des météorites ainsi que leur incertitude. 

2. Quelle loi approxime le mieux ce rapport ? 

3. Comparez les différents rapports isotopiques à celui de la valeur de référence terrestre. 

Fixez un seuil de α= 0.05 et testez l’hypothèse selon laquelle les rapports correspondent 

à des classes parentales différentes. 

4. Le rapport isotopique pour un échantillon de chondrite (une variété de météorite) est 

de ρ = 5.710. Pouvez-vous dire si, parmi les échantillons, certains sont assimilables à 

des chondrites ? 

N.B. Les commandes 

ys = cdfnor("X", mu, s, a, 1-a) 

ys = cdfpoi("S", mu, a, 1-a) 

calculent la valeur ys telle que Prob(y < ys)= a, respectivement pour une loi normale d’espérance 

µ et d’écart-type s, et pour une loi de Poisson d’espérance µ. 

6

3 Détection de traceurs dans un spectre 

La figure ci-dessous représente deux spectres infrarouge obtenus dans des conditions identiques 

mais avec des échantillons différents : le premier sans impuretés, les second avec. La 

présence d’impuretés se traduit par l’apparition de raies spectrales nouvelles dont la position 

(i.e. la longueur d’onde) et l’amplitude fournissent des informations importantes sur la nature 

et la concentration des constituants. Il est donc important de déterminer ce qui change 

entre les deux mesures. 

FIG. 2 – Spectres infrarouge enregistrés sans (figure de gauche) et avec impuretés (figure de droite). 

Chaque spectre représente le nombre de photons comptés en fonction de la longueur d’onde. 

Les raies d’émission, même faibles, possèdent une largeur caractéristique (la largeur à mihauteur), 

qui vaut au moins dix unités de longueur d’onde. 

Les données 

Récupérez les données de la page 

http://lpce.cnrs-orleans.fr/~ddwit/enseignement.html#master-outils Enregistrez 

les fichiers dans votre répertoire de travail. Pour charger les données dans Scilab, 

faites 

load spectro.dat 

clf 

plot2d(y) 

le taux de comptage est stocké dans la variabley, de dimensions 512×2. La première colonne 

correspond à la mesure sans impuretés et la seconde à la mesure avec impuretés. 

7

Marche à suivre 

1. Pour une longueur d’onde donnée, quelle est la loi de probabilité de la variable y ? 

2. Définissez une nouvelle variablez = y(:,2)-y(:,1); qui contient la différence entre 

les deux spectres. 

3. Par quelle loi peut-on approximer la loi de probabilité de la variable z ? 

4. Estimez l’écart-type σz de z pour chaque longueur d’onde. 

5. Fixez un niveau de confiance α = 0.05 et déterminez le test à effectuer pour vérifier 

l’hypothèse nulle selon laquelle les deux spectres sont identiques (H0 : z = 0). 

6. Faut-il un test unilatéral ou bilatéral ? 

7. Si zmin et zmax sont les bornes de l’intervalle dans lequel doit se trouver z pour que 

l’hypothèse nulle soit vérifiée, alors il est commode de visualiser sur un même graphe 

z, zmi n et zmax. Pour définir ces bornes, faites appel à la fonctioncdfnor 

zmin = cdfnor("X", 0, sigmaz, alpha/2, 1-alpha/2); 

zmax = cdfnor("X", 0, sigmaz, 1-alpha/2, alpha/2); 

Ces commandes doivent être répétées pour chaque valeur de σz ; on obtient ainsi pour 

chaque longueur d’onde une valeur dezmin etzmax. 

8. Le résultat précédent est difficile à exploiter en raison du niveau de bruit important. Il 

est donc souhaitable de réduire ce dernier. On peut raisonnablement supposer que les 

valeurs de z varient peu d’une longueur d’onde à une autre. On peut donc tenter de 

lisser les spectres en moyennant chaque valeur de z sur ses plus proches voisins. 

Faut-il d’abord lisser les spectres puis calculer leur différence, ou bien lisser après calcul 

de la différence ? 

9. Répétez les étapes 2 - 4 en lissant les spectres avec la fonction lissage (décrite cidessous). 

Prenez diverses largeurs de lissage n allant de 1 à 30. 

Remarque : si vous lissez une série temporelle, l’écart-type sur chaque valeur diminue. 

Pour une série temporelle y dont chaque valeur possède la même incertitude σy, après 

un lissage gaussien avec une fenêtre de taille n (comme le fait la fonction lissage.sci), le 

nouvel écart-type devient approximativement σy −→ σy /(0.65× n). 

10. Identifiez les raies significatives pour différentes valeurs de la largeur de lissage n. 

Quelle valeur de n vous semble la plus appropriée ? Pourrait-on déterminer cette valeur 

de façon plus rigoureuse ? 

Lissage des données aveclissage 

La fonctionlissage.sci sert à lisser les données, cf. les notes de cours. 

La commande suivante (après compilation préalable de la fonctionlissage.sci) 

zs = lissage(z,n); 

permet d’effectuer un tel lissage, aveczun vecteur contenant la suite à lisser. La largeurn de 

la fenêtre de lissage doit être un entier positif. 

8

4 Mouvement d’un colorant dans un liquide 

Une goutte de colorant liquide, placée dans un fluide homogène, aura tendance à subir dans 

celui-ci un mouvement constitué d’une 

• diffusion : due au mouvement brownien des molécules ; 

• convection : si le colorant n’a pas la même densité que le fluide. 

Nous nous intéresserons ici uniquement au mouvement vertical d’une ou de plusieurs molécules 

de colorant. Celui-ci peut être simulé par une marche aléatoire, dans laquelle chaque 

molécule se déplace par une série de pas discrets. Chaque pas résulte d’une collision avec 

une autre molécule. Suivant le théorème de la limite centrale, on peut supposer que l’amplitude 

x de chaque pas suit une loi de probabilité normale de moyenne m et de variance v. 

On supposera pour simplifier que les collisions se produisent à des intervalles de temps réguliers. 

Les dimensions seront normalisées de façon à avoir une variance égale à 1. Nous nous 

intéresserons ici au déplacement de la molécule après n pas de temps, défini comme 

Ln = 

n 

xk 

k=1 

avec L(0)=0 

Le colorant est injecté dans un récipient de taille finie (hauteur H). Le mouvement de chaque 

molécule sera donc contraint dans l’espace. Une molécule sera réfléchie par les parois chaque 

fois que sa position verticale dépassera H/2 ou −H/2. Ce genre problème se rencontre dans 

les réacteurs chimiques. On peut par exemple être amené à se demander si un colorant plus 

dense que le liquide finira par diffuser ou non dans la cuve entière. 

Le modèle en Scilab 

Nous nous intéressons ici à l’évolution temporelle de la position L d’une molécule de colorant, 

pour des temps allant de t = 1 à t = N pas, ce que calcule la fonction suivante. L est le chemin 

parcouru, N est nombre de pas de temps, H la hauteur de la boite et m la valeur moyenne 

d’un pas. 

function L = marche(N,H,m) 

L = zeros(N,1); 

for i=2:N 

L(i) = L(i-1) + grand(1,1,"nor",m,1); 

if L(i) > H/2, 

L(i) = H - L(i); 

elseif L(i) < -H/2, 

L(i) = -H - L(i); 

end 

end 

endfunction 

9

Calculs à effectuer 

1. Commençons par le régime dans lequel les molécules diffusent peu et s’approchent 

lentement des parois : N = 1000, H = 200 et m= 0. 

• Visualisez le déplacement de quelques molécules. Y’en a-t-il qui atteignent le 

bord ? 

• Le théorème de la limite centrale nous permet de calculer la position moyenne 

d’une molécule après n pas. Déterminez l’expression analytique de cette position 

moyenne. Pour vérifier ce résultat par la simulation, choisissez un grand 

nombre de molécules (au minimum 50) et calculez pour chaque pas de temps k 

la position〈Lk〉 moyennée sur toutes les molécules. L’accord est-il satisfaisant ? 

• Le même théorème nous permet de prédire la valeur de la dispersion (c’est-àdire 

l’écart-type σk sur les valeurs de Lk de différentes molécules) en un temps 

k donné. Déterminez l’expression analytique de σk et comparez-la aux résultats 

de la simulation. Complétez le tableau suivant 

n 〈Ln〉 (théorie) 〈Ln〉 (mesuré) σn (théorie) σn (mesuré) D (mesuré) 

2 

10 

100 

1000 

• La quantité σk équivaut ici à la distance quadratique moyenne parcourue après 

k pas de temps. En posant σk = Dk, nous pouvons interpréter le coefficient D 

comme le coefficient de diffusion des molécules dans le fluide. Cette quantité 

joue un rôle-clé dans la théorie cinétique des fluides. Donnez sa valeur dans le 

tableau ci-dessus. 

2. Prenons ensuite le régime dans lequel les molécules diffusent rapidement par rapport 

à la taille de la boîte : N = 1000, H = 30 et m= 0. 

• Calculez la position de quelques molécules et visualisez leur déplacement. Ontelles 

tendance à remplir uniformément la boîte ? Qu’est-ce qui distingue leur 

mouvement du cas précédent ? 

• Visualisez avechistplot la distribution des molécules aux différents temps n= 

2, 10, 100, 1000 et commentez ce que vous observez. Prenez un échantillon d’au 

moins 300 molécules pour avoir une bonne statistique. 

• A partir de quand les molécules remplissent-elles uniformément la boîte ? 

3. Pour finir, on considère le cas où les molécules se déplacent préférentiellement dans un 

sens. Ce cas surgit avec un colorant plus dense que le fluide. Le pas moyen m ne sera 

donc plus nul. Prenez N = 1000, H = 100 et m=−0.2. 

• Calculez la position de quelques molécules et visualisez leur déplacement. Ontelles 

tendance à remplir uniformément la boîte ? 

• Visualisez avechistplot la distribution des molécules aux différents temps n= 

2, 10, 100, 1000 et commentez ce que vous observez. Prenez un échantillon d’au 

moins 300 molécules pour avoir une bonne statistique. 

• Tracez sur un même graphe la dispersion σn ainsi que la position moyenne〈Ln〉 

au cours du temps. Que peut-on en déduire ? 

10

5 Cycle d’activité solaire 

La figure ci-dessous représente 52 ans de mesures journalières du : 

– nombre de taches solaires. Ce nombre est représentatif du niveau d’activité solaire. Le 

champ magnétique est intensifié dans les tâches solaires, qui sont sources d’éruptions. 

– nombre de neutrons enregistrés par un observatoire au Colorado. Ce flux de neutrons est le 

résultat de réactions nucléaires produites dans la haute atmosphère par l’impact de rayons 

cosmiques de très haute énergie. Ces derniers sont sensibles au niveau de turbulence générée 

par le Soleil dans le milieu interplanétaire, ce qui explique une anticorrélation : forte 

activité solaire = davantage de turbulence = diffusion accrue des rayons cosmiques = moins 

de neutrons. 

Les deux quantités révèlent une variation cyclique de 11 ans environ, qui correspond au cycle 

de l’activité solaire. Ces données suscitent aujourd’hui beaucoup d’intérêt, depuis la découverte 

d’un impact des rayons cosmiques sur la nébulosité et donc sur le climat global. 

isn, neutrons/1000 

600 

500 

400 

300 

200 

100 

isn 

neutrons/10 3 

0 

1950 1960 1970 1980 

annee 

1990 2000 2010 

FIG. 3 – A gauche : nombre de taches solaires et nombre moyen de neutrons par heure. A droite : le 

Soleil vu en lumière blanche, avec quelques tâches solaires particulièrement grosses. 

1. Les données 

Téléchargez de l’adresse 

http://lpce.cnrs-orleans.fr/~ddwit/enseignement.html#master-outils 

les fichierslissage.sci,crosscorr.sci etneutrons.dat et enregistrez-les dans dans votre 

répertoire de travail. Pour charger les données dans Scilab, faitesload(’neutrons.dat’). Le 

nombre de neutrons figure dans la variable n et le nombre de tâches solaires dans s. Le temps 

t est exprimé en années. 

11

2. Prétraitement 

1. Visualisez les données et repérez d’éventuels points aberrants (données manquantes, 

détecteur saturé, valeur anormale, ...) et remplacez-les par une valeur adéquate. 

La commandefind est utile pour déterminer les indices d’une matrice qui satisfont à 

une condition particulière. Par exemple 

k = find(s < 0); 

s(k) = - s(k); 

enregistre dans k les indices du vecteur s dont la valeur est négative et inverse ensuite le 

signe de ces valeurs. 

2. Comme n et s s’expriment en des unités différentes, et que seule leur variation relative 

nous intéresse, il est conseillé de les standardiser. Définissez deux nouveaux vecteurs 

qui contiennent les valeurs standardisées. 

3. Corrélation 

1. Tracez s en fonction de n. Peut-on dire s’il existe une relation linéaire entre ces deux 

variables ? 

2. La dispersion des points sur le graphe précédent est en partie due à des variations sur 

de courtes échelles de temps. Pour s’en affranchir, il est judicieux de lisser les données 

(avec la fonction lissage). 

Lissez les données sur des durées variables, en allant au moins jusqu’à 400 jours. La 

corrélation s’améliore-t-elle visuellement ? 

4. Mesure de la corrélation 

Pour quantifier le degré de corrélation linéaire, on estime le coefficient de corrélation défini 

comme suit (fonction crosscorr) 

ρx y (τ)= 

Rx y (τ) 

Rxx (0) Ry y(0) 

 

 

où Rx y (τ)= (x(t)− ¯x) (y(t+ τ)− ¯y) 

Notez que Rxx(τ = 0) = σ2 x . Dans notre cas, x = s et y = n. La valeur de ρ est bornée, avec 

−1≤ρ ≤ 1. Une valeur proche de zéro équivaut à une faible covariance ; les variables x(t) et 

y(t+ τ) sont alors peu corrélées. Une valeur proche de 1 (respectivement -1) signifie qu’il y a 

forte (anti-)corrélation. 

1. Calculez la corrélation entre le nombre de tâches solaires et le nombre de neutrons pour 

des valeurs de τ allant de -5000 à +5000 jours. 

2. Pour quel délai τ les deux variables sont-elles le plus fortement anticorrélées ? Cela 

signifie-t-il que le minimum de neutrons est en avance ou en retard de phase par rapport 

au maximum de nombre de tâches ? 

3. Estimez le coefficient de corrélation pour les données lissées. En quoi cela change-t-il 

les valeurs ? 

12

6 Déposition de silicium amorphe 

Un des moyens pour déposer du silicium amorphe sur une surface consiste à exposer celleci 

à un plasma de silane (SiH4) chauffé par des ondes radio de haute fréquence. Lorsque le 

plasma est stationnaire, l’épaisseur d de la couche déposée tend à croître linéairement avec 

la durée t de l’exposition. Il est donc important de connaître la relation entre t et d pour bien 

maîtriser le processus. Pour faire cela, on expose plusieurs échantillons pendant des durées 

différentes, et on mesure l’épaisseur de la couche de silicium par des procédés optiques. Il se 

pourrait que la première couche se dépose plus aisément que les autres ; on cherche donc à 

ajuster aux données une expression de la forme 

d = a t+ b 

où la durée t est connue avec précision, alors que la épaisseur d est entachée d’une erreur. 


t [min] 2.0 3.0 3.5 4.0 4.6 5.7 6.2 6.8 7.5 8.5 9.2 9.6 

d [Å] 2.4 4.1 4.8 4.5 5.2 7.2 7.5 8.6 9.5 10.6 11.70 11.90 

L’incertitude sur l’épaisseur vaut 0.3 Å. 

2. Prétraitement 

Les éventuels points aberrants doivent être corrigés, mais comme nous nous intéressons ici à 

la relation exacte entre d et t, il ne faut pas standardiser ces dernières. 

3. Régression 

Pour estimer les coefficients du système linéaire par la méthode des moindres carrés, il faut 

résoudre le système sur-déterminé 

⎛ 

t1 1 

t2 1 

⎞ 

⎜ 

⎝ . 

⎟ 

⎟ a 

⎟ 

. ⎠ b 

tN 1 

⎛ 

⎜ 

= ⎜ 

⎝ 

1. Estimez les coefficients a et b par la méthode des moindres carrés (cf. cours). 

2. Il existe une autre méthode pour estimer ces coefficients, qui tire profit de la notation 

matricielle de Scilab. Le système linéaire (1) peut se résoudre avec une notation très 

compacte 

N = length(nd); 

M = [t ones(N,1)]; 

coef = M \ d; 

a = coef(1); b = coef(2); 

13 

d1 

d2 

. 

dN 

⎞ 

⎟ 

⎠ 

(1)

où l’opérationM \ d signifie que le vecteurdest divisé par la matriceMdepuis la gauche. 

Assurez-vous auparavant que t et d sont des vecteurs colonne. 

Vérifiez que le résultat obtenu est identique à celui trouvé en 1. 

3. Il est important de savoir dans quelle mesure le modèle linéaire reproduit bien les résultats. 

Il suffit pour cela d’estimer l’épaisseurdfit prédite par le modèle (1). Cela s’obtient 

avec 

dfit = M*coef; 

oùMetcoef sont les variables calculées précédemment. Comparezdfit àdet déterminez 

si le modèle linéaire semble correct. 

4. Validation de la régression 

Pour quantifier les résultats ci-dessus, il convient de faire un test du χ 2 . Calculez l’écart quadratique 

moyen et comparez-le à la valeur seuil d’une loi du χ 2 à ν degrés de liberté, pour un 

niveau de confiance de 1 %. 

5. Extrapolation avec ce modèle 

Une fois que le modèle est validé, on peut l’utiliser pour extrapoler les données. Il est intéressant 

de connaître l’épaisseur de la couche pour des temps très courts, qui sont difficilement 

accessibles expérimentalement. Déterminez la valeur ˆ d prédite par le modèle pour t = 0 et 

donnez en particulier son incertitude. Que peut-on en conclure sur le processus ? 

14

7 Rendement d’un filtre antipollution 

Un constructeur de moteurs veut déterminer la durée de vie d’un filtre antipollution. Il effectue 

pour cela des mesures du rendement à des temps différents sur un même filtre. En 

première approximation, le rendement devrait diminuer avec le temps comme 

d x 

= A− x ⇒ x(t)=a+ be−ct 

d t 

et tendre progressivement vers une valeur constante (pas forcément nulle). Le système étant 

complexe et les mesures bruitées, on peut aussi être tenté d’approximer la décroissance par 

une simple droite 

x(t)= A+ B t 

Dans ce dernier cas, les paramètres A et B peuvent être estimés par une régression des 

moindres carrés. Ceci n’est pas possible avec l’exponentielle, pour laquelle l’estimation de 

{a,b,c} conduit à un système non-linéaire, qui requiert une régression non-linéaire. 


Le fichier de données filtre.dat peut être téléchargé à l’adresse 

http://lpce.cnrs-orleans.fr/~ddwit/enseignement.html#master-outils Le rendement 

et son incertitude sont enregistrés dans x et dx, le temps (en unités quelconques) est 

dans la variable t. 

2. Régression linéaire 

Estimez d’abord les paramètres A et B par la méthode des moindres carrés. 

3. Régression non-linéaire 

Supposons que l’on dispose d’une estimation initiale {a0,b0,c0} des paramètres du modèle 

exponentiel. On peut alors estimer le rendement ˆx pour chaque temps t. 

Appelons J l’écart quadratique entre le vrai rendement et le résultat du modèle 

J = 

N 

(xk− ˆxk ) 2 

k=1 

Il s’agit de trouver de façon itérative la suite de valeurs de {ai ,bi ,ci } qui minimisent cet écart 

J. Avec un bon algorithme de recherche de minima et une estimation initiale correcte, la suite 

convergera vers un minimum (pas forcément global). 

Dans Scilab, ce genre d’optimisation non-linéaire se fait aisément à l’aide de la fonction optim 

(cf. cours). Cette fonction requiert deux paramètres d’entrée : le nom de la fonction qui 

calcule l’écart quadratique J ainsi qu’un vecteur contenant la valeur initiale {a0,b0,c0} des 

paramètres. Par exemple 

15

coef0 = [100 20 2]; 

[J, coef] = optim(minimisation, coef0); 

fournit en retour la valeur de J minimale obtenue par la fonction minimisation lorsque les 

paramètres prennent les valeurs données dans coef. 

La syntaxe de la fonction qui calcule J doit obéir à une règle stricte : 

function [J, dJdp, K] = minimisation(p, K); 

... 

J = .... 

dJdp = .... 

endfunction 

où p est un vecteur qui contient les différents paramètres du modèle, J est l’écart quadratique 

(un scalaire), K est un paramètre qui ne sera pas utilisé ici (mais qui doit être déclaré) et dJdp 

est un vecteur contenant la dérivée partielle de J par rapport aux paramètres. 

La fonction minimisation.sci qui est donnée en annexe est un exemple de fonction qui calcule 

J et ses dérivées pour le cas d’une régression linéaire. Vous pouvez vous inspirer de cette 

fonction pour le cas de l’exponentielle. 

1. Concevez dans l’éditeur la fonction minimisation.sci (qui obéit à la syntaxe ci-dessus) 

afin qu’elle calcule la fonction de coût ainsi que sa dérivée partielle pour le modèle exponentiel. 

2. Au vu des résultats obtenus avec le modèle linéaire, déterminez quelle valeur initiale 

des paramètres a, b et c il faudrait prendre pour lancer la recherche non-linéaire. 

3. La fonction optim parvient-elle toujours à trouver la valeur des paramètres qui minimisent 

J ? Lancez la minimisation avec d’autres valeurs initiales et comparez la valeur 

de J ainsi obtenue. Regardez aussi ce qui ce passe quand b< 0 et c < 0. 

4. Relancezoptim avec la valeur des coefficients que vous venez de trouver en 3. La convergence 

se poursuit-elle ou bien optim a-t-il trouvé le minimum recherché ? 

5. Extrapolez les deux modèles jusqu’au temps t = 35. Lequel vous paraît le plus réaliste ? 

6. Effectuez un test du χ 2 pour décider lequel des deux modèles est le meilleur. 

16

8 Invariance d’échelle dans la turbulence 

La turbulence développée se rencontre dans les écoulements fluides à haut nombre de Reynolds 

et correspond à un état désordonné avec des tourbillons de toutes les tailles qui interagissent 

entre eux de façon non-linéaire. La densité spectrale de puissance ou spectre de 

puissance d’un paramètre (par exemple la densité ou la température) d’un tel fluide suit une 

fonction qui décroît avec la fréquence selon une loi de puissance 

P(f )= a f −b 

Une telle loi de puissance signifie qu’il y a invariance d’échelle = toutes les échelles caractéristiques 

sont mélangées = si on agrandit l’image d’une portion du fluide, on retrouve le même 

type d’image que précédemment. 

La figure suivante représente l’évolution temporelle de la température mesurée dans une 

soufflerie subsonique (à gauche) et son spectre de puissance (à droite). Le spectre en loi de 

puissance, exprimé en échelle logarithmique, donne lieu à une droite. 

temperature [V] 

4 

2 

0 

−2 

−4 

0 0.05 0.1 

temps [s] 

0.15 0.2 

spectre de puiss. [u.a.] 

10 9 

10 8 

10 7 

10 6 

10 5 

10 4 

10 3 

10 2 

10 1 

10 2 

10 3 

10 4 

frequence [Hz] 

De telles lois de puissance se rencontrent dans toutes les disciplines (biologie, économie, géologie, 

linguistique, ...) et apportent des renseignements importants sur les processus dynamiques 

sous-jacents. Il est important de parvenir à estimer correctement les paramètres a et 

b d’une telle loi. On appelle parfois b exposant d’échelle ou indice spectral. 


Le fichier de données spectre.dat correspondant à l’exemple ci-dessus peut être téléchargé 

de l’adresse 

http://lpce.cnrs-orleans.fr/~ddwit/enseignement.html#master-outils Il comprend 

la fréquence f en [Hz] ainsi que la densité spectrale de puissance p en [mV 2 /Hz]. 

L’incertitude relative sur p est donnée dans err, en pourcent. 

17 

10 5 

10 6

2. Régression par moindres carrés 

Estimez les paramètres a et b par une régression des moindres carrés, sans tenir compte de 

l’incertitude sur p. Divisez si nécessaire le spectre de puissance en plusieurs intervalles d’indices 

spectraux différents. 

3. Régression par moindres carrés pondérée 

Comme l’incertitude relative sur la densité de puissance est connue, il est préférable d’intégrer 

cette information dans l’estimation par moindres carrés, en pondérant chaque valeur par 

l’inverse de son écart-type. 

Montrez que si le système à résoudre par moindres carrés est Mc = y, avec 

⎛ 

x1 1 

x2 1 

⎜ 

M = ⎜ 

⎝ . 

⎟ 

⎟, 

. ⎠ 

 

a 

c = 

b 

xN 1 

⎞ 

⎛ 

⎜ 

, y = ⎜ 

⎝ 

alors il suffit de diviser tous les éléments de la i-ième ligne de M et de y par σi avant d’opérer 

la division c = M\y. Comparez les résultats avec ceux obtenus en 2. 

4. Estimation des incertitudes sur a et b 

Les estimateurs des incertitudes sur les paramètres a et b, quoique connus analytiquement, 

ne sont pas toujours faciles à manipuler. Une autre approche consiste à utiliser une méthode 

de Monte-Carlo (valable seulement si les erreurs sur p sont indépendantes d’une fréquence à 

une autre) : 

1. Choisissez un intervalle de fréquences sur lequel il faut estimer a et b. 

2. A chaque valeur pi de la densité spectrale dans cet intervalle, ajoutez un nombre aléatoire 

distribué suivant une loi normale N (0,σi ). On obtient alors une nouvelle valeur 

p ′ 

i . 

3. Estimez les paramètres a ′ et b ′ par régression des moindres carrés sur p ′ . 

4. Répétez les étapes 2. et 3. un grand nombre de fois, et mémorisez à chaque fois les valeurs 

de a ′ et de b ′ . 

5. Les meilleurs estimateurs de a et de b sont les moyennes respectivement de a ′ et de b ′ . 

Les écarts-type de ces derniers nous donnent une estimation de leur incertitude. 

18 

y1 

y2 

. 

yN 

⎞ 

⎟ 

⎠

TAB. 1 – Quelques commandes utiles 

x = [1,2,3,12]; crée le vecteur ligne x 

x = [1;2;3;12]; crée le vecteur colonne x 

x affiche le contenu de x 

y = [1 0 3; 4 3 1]; crée une matrice 2 x 3 

x = (0:5); crée le vecteur ligne x = [0 1 2 3 4 5]; 

x = (0:0.5:2); crée le vecteur ligne x = [0 0.5 1 1.5 2]; 

x = x’; transpose x 

y = sin(x); calcule y = sin(x) 

[n,m] = size(x); calcule le nombre n de lignes et le nombre m de colonnes 

de x 

y = x*x’ calcule le produit scalaire x x T si x est un vecteur 

ligne ; le résultat est un scalaire 

y = x’*x calcule le produit scalaire x T x si x est un vecteur 

colonne ; le résultat est un scalaire 

y = x.*x calcule le produit terme à terme yi = xi ∗ xi . Le résultat 

est un vecteur. 

y = 3*x-2 calcule yi = 3xi − 2. Le résultat est un vecteur de 

même dimensions que x. 

clf efface le contenu de la fenêtre graphique 

whos() affiche les variables actuellement en mémoire et 

donne leur taille 

plot2d(x,y) trace y en fonction de x 

plot2d(x,y,style=2) change la couleur du trait 

plot2d(x,y,style=-3) change le type de symbole 

subplot(3,1,2) découpe la fenêtre graphique en 3 fenêtres réparties 

verticalement ; le prochain graphe apparaîtra dans 

la seconde fenêtre 

z = mean(x) calcule la moyenne de tous les éléments de x 

z = mean(x,"c") calcule la moyenne sur les colonnes de x 

z = mean(x,"r") calcule la moyenne sur les rangées (lignes) de x 

z = sum(x,"r") calcule la somme selon les rangées (lignes) de x 

z = cumsum(x,"r") calcule la somme cumulée zk = k 

i=1 xi selon les 

rangées (lignes) de x 

z = st_deviation(x,"r") calcule l’écart-type sur les rangées (lignes) de x 

z = median(x,"r") calcule la médiane sur les rangées (lignes) de x 

z = max(x,"c") calcule la valeur maximale sur les colonne de x 

u = grand(m,n,’chi’,d) calcule une matrice m × n de variables aléatoires 

distribuées selon la loi du χ 2 à d degrés de liberté 

u = grand(m,n,’nor’,mu,sigma) idem pour la loi normale N (µ,σ 2 ) 

u = grand(m,n,’poi’,mu) idem pour la loi de Poisson d’espérance µ 

u = grand(m,n,’unf’,1,4) idem pour la loi uniforme sur l’intervalle [1,4] 

k = find(u

1 Introduction à Scilab - CNRS Orleans

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?