03.07.2015 Views

Le mod`ele de régression multiple

Le mod`ele de régression multiple

Le mod`ele de régression multiple

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Cette hypothèse signifie que le modèle est correctement écrit : il n’y a pas <strong>de</strong><br />

redondance dans la liste <strong>de</strong>s variables explicatives. Si ce n’est pas le cas, on<br />

parle<strong>de</strong>colinéarité (entre <strong>de</strong>ux variables) ou <strong>de</strong> multicolinéarité (entre plus<br />

<strong>de</strong> <strong>de</strong>ux variables), nous reverrons cela àlafinduchapitre.<br />

X<br />

• lim ′ X<br />

n→∞ = V<br />

n X où V X est une matrice définie positive, donc régulière.<br />

Ainsi, la matrice <strong>de</strong> variance-covariance empirique <strong>de</strong>s variables explicatives<br />

converge vers une matrice finie et définie positive. Lorsque le modèle comprend<br />

une constante, cette hypothèse signifie que les moyennes, les variances et les<br />

covariances <strong>de</strong>s variables explicatives ten<strong>de</strong>nt vers <strong>de</strong>s limites finies quand<br />

n → ∞. L’idée important formalisée ici est que les variables explicatives<br />

conservent toujours une certaine variance quand n →∞.<br />

• E(ε i ) = 0 (comme dans le modèle<strong>de</strong>régression simple)<br />

• var(ε i )=σ 2 (comme dans le modèle <strong>de</strong> régression simple)<br />

• cov(ε i ,ε j )=0pouri ≠ j (comme dans le modèle<strong>de</strong>régression simple)<br />

Ces <strong>de</strong>ux <strong>de</strong>rnières hypothèses s’écrivent, sous forme matricielle :<br />

E(εε ′ )=σ 2 I n<br />

où I n est la matrice i<strong>de</strong>ntité d’ordre n (constituée <strong>de</strong> 1 sur la diagonale et <strong>de</strong> 0<br />

sinon). En effet, toutes les variances sont égales à σ 2 (éléments <strong>de</strong> la diagonale<br />

<strong>de</strong> V ), et les covariances sont nulles (les éléments en <strong>de</strong>hors <strong>de</strong> la diagonale).<br />

• ε i suit une loi Normale N (0,σ 2 ).<br />

• cov(ε i ,X ′ i)=0 6<br />

Ainsi, on en déduit que E(y) =Xβ et V (y) =V (ε) =σ 2 I.<br />

6 Il est habituel <strong>de</strong> supposer que les régresseurs sont non stochastiques, c’est-à-dire que l’analyste<br />

choisit la valeur <strong>de</strong>s régresseurs puis observe y; lesrégresseurs sont exogènes et la variable explicative<br />

est endogène. Par exemple, on cherche à expliquer le ren<strong>de</strong>ment d’une parcelle <strong>de</strong> terre àpartir<br />

<strong>de</strong> l’engrais et <strong>de</strong> la pluie; ou alors l’effet d’une politique budgétaire ou monétaire sur le PIB.<br />

Cette hypothèse est surtout plus pratique, elle permet d’utiliser les résultats standards <strong>de</strong> statistiques.<br />

<strong>Le</strong>s variables x j sont <strong>de</strong>s constantes connues.<br />

Une autre possibilité est <strong>de</strong> supposer que les observations sur x j sont fixées dans <strong>de</strong>s échantillons<br />

répétés, <strong>de</strong> telle manière qu’on travaille conditionnellement àl’échantilon qu’on a observé. Ainsi,<br />

on suppose que la régression et les hypothèses s’appliquent àl’échantillon qu’on a observé. On<br />

modélise y conditionnellement aux réalisations X i ′ observées dans l’échantillon.<br />

Mais on a aussi <strong>de</strong>s modèles où lesrégresseurs ont le même statut que la variable à expliquer :<br />

dans la fonction <strong>de</strong> consommation keynésienne, pourquoi aurait-on <strong>de</strong>s hypothèses différentes sur<br />

le revenu et sur la consommation?<br />

Dans ce cas, on fait les hypothèses suivantes et la plupart <strong>de</strong>s résultats que l’on énoncera plus<br />

tard sont maintenus :<br />

• la distribution <strong>de</strong> chaque variable explicative est indépendante <strong>de</strong>s vrais paramètres du modèle.<br />

• la distribution <strong>de</strong>s variables explicatives est distribuée indépendamment <strong>de</strong>s erreurs du modèle.<br />

Cette <strong>de</strong>rnière hypothèse implique que X i ′ et ε i sont indépendants. Cette hypothèse est fondamentale<br />

: elle conduit à <strong>de</strong>s estimateurs sans biais. Cela signifie que l’approximation constituée<br />

par le modèle est acceptable si les perturbations sont indépendantes <strong>de</strong>s déterminants <strong>de</strong> y i qui<br />

ont été retenus dans la liste <strong>de</strong> variables explicatives.<br />

32

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!