03.05.2013 Views

Excel parancsfájlok felhasználása a statisztikai elemzésekben Írta ...

Excel parancsfájlok felhasználása a statisztikai elemzésekben Írta ...

Excel parancsfájlok felhasználása a statisztikai elemzésekben Írta ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

x5 VMAX végsebesség (km/h)<br />

x6 TÖMEG saját tömeg (kg)<br />

x7 MTÖMEG megengedett össztömeg (kg)<br />

x8 HOSSZ hosszúság (mm)<br />

x9 SZÉLES szélesség (mm)<br />

x10 MAGAS magasság (mm)<br />

x11 FOGYV fogyasztás városban (liter/100 km)<br />

x12 FOGYVK fogyasztás városon kívül (liter/100 km)<br />

A multikollinearitás kiküszöbölése. Főkomponens regresszió F<br />

194 195<br />

F<br />

F<br />

196 197<br />

F<br />

Az autóárak és az autóárakat befolyásoló 12 magyarázó változó, az autók tulajdonságai közötti regressziós<br />

kapcsolat vizsgálata alapján az alábbi fontosabb megállapításokat tehettük:<br />

• A modell minden számított teszt alapján homoszkedasztikus.<br />

• A modellben minden számított teszt alapján káros mértékű a multikollinearitás. Ennek oka az,<br />

hogy az autók tulajdonságai közül a teljesítmény erőteljesen befolyásolja a többi magyarázó változót,<br />

pl. a sebességet, a fogyasztást, a gyorsulást, a végsebességet, a tömeget, stb.<br />

• A multikollinearitás miatt a regressziós paraméterek standard hibái nagyobbak (a VIF-mutató<br />

például 10 magyarázó változó esetében a kritikus értéknél nagyobb) és csak a b0 és b3 regressziós<br />

paraméter különbözik a t-próba alapján 5%-os szignifikancia szinten szignifikánsan 0-tól.<br />

• Figyelembe véve, hogy mind a 12 magyarázó változónak a modellben való megtartása indokolt,<br />

célszerű a főkomponens-elemzést (PCA: Principal Components Analysis) elvégezni.<br />

A regresszio.xls program közli a bevont változókra vonatkozó és a számításokhoz szükséges sajátértékeket<br />

és sajátvektorokat, továbbá a sajátértékek megoszlási és kumulált megoszlási viszonyszámait.<br />

A számítások lépései:<br />

1. A regressziószámítás elvégzése a 12 magyarázó változó bevonásával, konstans becslése nélkül. A regressziós<br />

paraméterek:<br />

b1 b2 b3 b4 b5 b6 b7 b8 b9 b10 b11 b12<br />

0,629 13,055 6,716 -10,012 -0,112 2,317 0,191 0,499 -2,280 -0,404 68,313 39,852<br />

2. Az eredeti regresszió n × k méretű X magyarázó változó mátrixot egy k × k méretű A mátrixszal egy<br />

ugyancsak n × k méretű Z = XA mátrixszá transzformáljuk. E Z mátrix oszlopvektorait főkomponenseknek<br />

nevezik. Az A mátrix becsülhető a magyarázó változók korrelációs mátrixából számított sajátértékekhez<br />

tartozó sajátvektorokkal. A b0-t elhagyva az X magyarázó változók 119× 12 típusú mátrixát kell<br />

szorozni, a magyaráz változók korrelációs mátrixából számított sajátvektorok 12× 12 típusú A mátrixával.<br />

A számításokat a mátrix.xls program mátrixok szorzata munkalap felhasználásával végezhetjük el. A<br />

szorzás eredményeképpen megkapjuk a 119× 12 típusú Z mátrixot.<br />

3. A modellbe bevont főkomponensek kiválasztása. Az egyik megközelítés az lehet, hogy akkor jelentős<br />

egy főkomponens, ha a sajátértéke nagyobb, mint egy, illetve ha nem nagyobb egynél, de a figyelembe<br />

vett sajátértékek az összes variancia F<br />

198 legalább 80%-át megmagyarázzák. A számítások eredményekép-<br />

194 Mundruczó György [1981]: 71-73.<br />

195 Hunyadi László [2001]: 179-181.<br />

196 Sipos Béla [1982]:195-204.<br />

197 Petres Tibor-Tóth László [2008]: 245-246.<br />

198 A sajátértékek kumulált megoszlási viszonyszáma ebben az esetben 100%.<br />

174

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!