Le mod`ele de régression multiple
Le mod`ele de régression multiple
Le mod`ele de régression multiple
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Cette hypothèse signifie que le modèle est correctement écrit : il n’y a pas <strong>de</strong><br />
redondance dans la liste <strong>de</strong>s variables explicatives. Si ce n’est pas le cas, on<br />
parle<strong>de</strong>colinéarité (entre <strong>de</strong>ux variables) ou <strong>de</strong> multicolinéarité (entre plus<br />
<strong>de</strong> <strong>de</strong>ux variables), nous reverrons cela àlafinduchapitre.<br />
X<br />
• lim ′ X<br />
n→∞ = V<br />
n X où V X est une matrice définie positive, donc régulière.<br />
Ainsi, la matrice <strong>de</strong> variance-covariance empirique <strong>de</strong>s variables explicatives<br />
converge vers une matrice finie et définie positive. Lorsque le modèle comprend<br />
une constante, cette hypothèse signifie que les moyennes, les variances et les<br />
covariances <strong>de</strong>s variables explicatives ten<strong>de</strong>nt vers <strong>de</strong>s limites finies quand<br />
n → ∞. L’idée important formalisée ici est que les variables explicatives<br />
conservent toujours une certaine variance quand n →∞.<br />
• E(ε i ) = 0 (comme dans le modèle<strong>de</strong>régression simple)<br />
• var(ε i )=σ 2 (comme dans le modèle <strong>de</strong> régression simple)<br />
• cov(ε i ,ε j )=0pouri ≠ j (comme dans le modèle<strong>de</strong>régression simple)<br />
Ces <strong>de</strong>ux <strong>de</strong>rnières hypothèses s’écrivent, sous forme matricielle :<br />
E(εε ′ )=σ 2 I n<br />
où I n est la matrice i<strong>de</strong>ntité d’ordre n (constituée <strong>de</strong> 1 sur la diagonale et <strong>de</strong> 0<br />
sinon). En effet, toutes les variances sont égales à σ 2 (éléments <strong>de</strong> la diagonale<br />
<strong>de</strong> V ), et les covariances sont nulles (les éléments en <strong>de</strong>hors <strong>de</strong> la diagonale).<br />
• ε i suit une loi Normale N (0,σ 2 ).<br />
• cov(ε i ,X ′ i)=0 6<br />
Ainsi, on en déduit que E(y) =Xβ et V (y) =V (ε) =σ 2 I.<br />
6 Il est habituel <strong>de</strong> supposer que les régresseurs sont non stochastiques, c’est-à-dire que l’analyste<br />
choisit la valeur <strong>de</strong>s régresseurs puis observe y; lesrégresseurs sont exogènes et la variable explicative<br />
est endogène. Par exemple, on cherche à expliquer le ren<strong>de</strong>ment d’une parcelle <strong>de</strong> terre àpartir<br />
<strong>de</strong> l’engrais et <strong>de</strong> la pluie; ou alors l’effet d’une politique budgétaire ou monétaire sur le PIB.<br />
Cette hypothèse est surtout plus pratique, elle permet d’utiliser les résultats standards <strong>de</strong> statistiques.<br />
<strong>Le</strong>s variables x j sont <strong>de</strong>s constantes connues.<br />
Une autre possibilité est <strong>de</strong> supposer que les observations sur x j sont fixées dans <strong>de</strong>s échantillons<br />
répétés, <strong>de</strong> telle manière qu’on travaille conditionnellement àl’échantilon qu’on a observé. Ainsi,<br />
on suppose que la régression et les hypothèses s’appliquent àl’échantillon qu’on a observé. On<br />
modélise y conditionnellement aux réalisations X i ′ observées dans l’échantillon.<br />
Mais on a aussi <strong>de</strong>s modèles où lesrégresseurs ont le même statut que la variable à expliquer :<br />
dans la fonction <strong>de</strong> consommation keynésienne, pourquoi aurait-on <strong>de</strong>s hypothèses différentes sur<br />
le revenu et sur la consommation?<br />
Dans ce cas, on fait les hypothèses suivantes et la plupart <strong>de</strong>s résultats que l’on énoncera plus<br />
tard sont maintenus :<br />
• la distribution <strong>de</strong> chaque variable explicative est indépendante <strong>de</strong>s vrais paramètres du modèle.<br />
• la distribution <strong>de</strong>s variables explicatives est distribuée indépendamment <strong>de</strong>s erreurs du modèle.<br />
Cette <strong>de</strong>rnière hypothèse implique que X i ′ et ε i sont indépendants. Cette hypothèse est fondamentale<br />
: elle conduit à <strong>de</strong>s estimateurs sans biais. Cela signifie que l’approximation constituée<br />
par le modèle est acceptable si les perturbations sont indépendantes <strong>de</strong>s déterminants <strong>de</strong> y i qui<br />
ont été retenus dans la liste <strong>de</strong> variables explicatives.<br />
32