1 Introduction à Scilab - CNRS Orleans
1 Introduction à Scilab - CNRS Orleans
1 Introduction à Scilab - CNRS Orleans
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
2. Prétraitement<br />
1. Visualisez les données et repérez d’éventuels points aberrants (données manquantes,<br />
détecteur saturé, valeur anormale, ...) et remplacez-les par une valeur adéquate.<br />
La commandefind est utile pour déterminer les indices d’une matrice qui satisfont <strong>à</strong><br />
une condition particulière. Par exemple<br />
k = find(s < 0);<br />
s(k) = - s(k);<br />
enregistre dans k les indices du vecteur s dont la valeur est négative et inverse ensuite le<br />
signe de ces valeurs.<br />
2. Comme n et s s’expriment en des unités différentes, et que seule leur variation relative<br />
nous intéresse, il est conseillé de les standardiser. Définissez deux nouveaux vecteurs<br />
qui contiennent les valeurs standardisées.<br />
3. Corrélation<br />
1. Tracez s en fonction de n. Peut-on dire s’il existe une relation linéaire entre ces deux<br />
variables ?<br />
2. La dispersion des points sur le graphe précédent est en partie due <strong>à</strong> des variations sur<br />
de courtes échelles de temps. Pour s’en affranchir, il est judicieux de lisser les données<br />
(avec la fonction lissage).<br />
Lissez les données sur des durées variables, en allant au moins jusqu’<strong>à</strong> 400 jours. La<br />
corrélation s’améliore-t-elle visuellement ?<br />
4. Mesure de la corrélation<br />
Pour quantifier le degré de corrélation linéaire, on estime le coefficient de corrélation défini<br />
comme suit (fonction crosscorr)<br />
ρx y (τ)=<br />
Rx y (τ)<br />
Rxx (0) Ry y(0)<br />
<br />
<br />
où Rx y (τ)= (x(t)− ¯x) (y(t+ τ)− ¯y)<br />
Notez que Rxx(τ = 0) = σ2 x . Dans notre cas, x = s et y = n. La valeur de ρ est bornée, avec<br />
−1≤ρ ≤ 1. Une valeur proche de zéro équivaut <strong>à</strong> une faible covariance ; les variables x(t) et<br />
y(t+ τ) sont alors peu corrélées. Une valeur proche de 1 (respectivement -1) signifie qu’il y a<br />
forte (anti-)corrélation.<br />
1. Calculez la corrélation entre le nombre de tâches solaires et le nombre de neutrons pour<br />
des valeurs de τ allant de -5000 <strong>à</strong> +5000 jours.<br />
2. Pour quel délai τ les deux variables sont-elles le plus fortement anticorrélées ? Cela<br />
signifie-t-il que le minimum de neutrons est en avance ou en retard de phase par rapport<br />
au maximum de nombre de tâches ?<br />
3. Estimez le coefficient de corrélation pour les données lissées. En quoi cela change-t-il<br />
les valeurs ?<br />
12