A KORRESPONDENCIA-ELEMZÉS (CA) ELMÉLETE ÉS ...
A KORRESPONDENCIA-ELEMZÉS (CA) ELMÉLETE ÉS ...
A KORRESPONDENCIA-ELEMZÉS (CA) ELMÉLETE ÉS ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
A <strong>KORRESPONDENCIA</strong>-<strong>ELEMZ<strong>ÉS</strong></strong> (<strong>CA</strong>) <strong>ELMÉLETE</strong> <strong>ÉS</strong><br />
GYAKORLATA<br />
1. BEVEZET<strong>ÉS</strong><br />
Molnár László<br />
tudományos segédmunkatárs<br />
Miskolci Egyetem, Marketing Intézet<br />
Ahogy fejlıdik a marketingkutatás, mint tudományos diszciplína, újabb és újabb<br />
(matematikai-statisztikai) adatelemzési módszerek épülnek be a mindennapi<br />
gyakorlatba. Ezek közé a módszerek közé sorolható a korrespondencia-elemzés<br />
(Correspondence Analysis, <strong>CA</strong>), amely elméleti kereteit az 1960-as években már<br />
rögzítették.<br />
Természetesen a hazai gyakorlat számára sem ismeretlen a módszer, sıt a piac- és<br />
közvélemény-kutató cégek elıszeretettel alkalmazzák is. Ugyanakkor ritkán<br />
találkozhatunk vele a felsıoktatásban, de még a doktori iskolákban sem gyakori az<br />
oktatása. Nem is beszélve arról a néhány magyar nyelvő szakirodalomról, amelyek<br />
csupán rövid említést tesznek errıl a módszerrıl.<br />
Jelen tanulmány célja kettıs. Egyrészt ismertetni kívánom a korrespondenciaelemzés<br />
legfontosabb elméleti tudnivalóit, különös tekintettel a módszer egyes<br />
lépéseire. Másrészt egy konkrét gyakorlati példán keresztül kívánom bemutatni az<br />
alkalmazását, amely input adatait külön ebbıl a célból készített kérdıíves<br />
megkérdezés nyújtotta.<br />
2. A <strong>KORRESPONDENCIA</strong>-<strong>ELEMZ<strong>ÉS</strong></strong> <strong>ELMÉLETE</strong><br />
A korrespondencia-elemzés lényegét Hajdu [5] definíciója alapján határozom meg,<br />
vagyis egy olyan exploratív többváltozós technikáról van szó, amely az asszociáció<br />
kapcsolat vizuális elemzése érdekében egy kontingencia tábla adatait grafikus<br />
ábrává konvertálja. Egyszerőbben fogalmazva a korrespondencia-elemzés a<br />
kereszttábla sorait az oszlopok, míg az oszlopait a sorok tengelyeinek tekintetében<br />
egy „pontfelhı” pontjaiként értelmezi. A módszer eredményeként egy redukált,<br />
alacsony dimenziójú térben grafikusan ábrázoljuk a „pontfelhı” pontjait. Mindezek<br />
után vizuális elemzéssel következtetni tudunk arra, hogy a vizsgált változók mely<br />
kategóriái vonzzák és melyek taszítják egymást.<br />
2.1. A korrespondencia-elemzés menete<br />
A probléma meghatározása. A probléma megfogalmazása során a kutatónak meg<br />
kell határoznia azt a célt, amelyre a korrespondencia-elemzés eredményeit szeretné<br />
felhasználni, és ki kell választani azt a két változót, amelyek bekerülnek az<br />
elemzésbe. Mindkét változó esetében legalább három kategóriát kell definiálni,<br />
hogy elkészülhessen az észlelési térkép, viszont változóként 12 kategória értékelése<br />
már nehézkes, az eredmények értelmezése túlságosan bonyolulttá válik.<br />
A kiinduló adatok összegyőjtése. A korrespondencia-elemzéshez csak nominális<br />
skálán mért változókra van szükség, vagyis a kiinduló adatok összegyőjtése során<br />
arra kell megkérni a válaszadókat, hogy ítéljék meg, hogy az egyik változó mely<br />
kategóriái (Pl.: jellemzık) vonatkoznak a másik változó kategóriáira (Pl.: márkák).
A kiinduló kereszttábla elıállítása. A kiinduló kereszttábla csupán a vizsgálatba<br />
vont változók adott kategóriáira vonatkozó pozitív válaszokat tartalmazza. Fontos<br />
megjegyezni, hogy a kiinduló kereszttábla adatai a különbözı peremgyakoriságok<br />
következtében csak normalizált alakban alkalmas további elemzésre.<br />
Sor- és oszlopprofilok elıállítása. A sor- és oszlopprofilok elıállítása egyszerően<br />
történik: A sorváltozó kategóriáinak értékeit a megfelelı sorösszegekkel, míg az<br />
oszlopváltozó kategóriáinak értékeit a megfelelı oszlopösszegekkel kell elosztani.<br />
A kategóriák geometriai súlypontjainak elıállítása. A kategóriák geometriai<br />
súlypontjának elıállítása azért szükséges, hogy egyszerően kiszámítható legyen az<br />
adatok saját centroidjaik, azaz peremprofiljaik körüli szóródási mutatószámai.<br />
A kategóriák közötti távolság kiszámítása. A kategóriák közötti és geometriai<br />
súlyponttól mért távolság kiszámításával kapunk információt a hasonlóságukról és a<br />
különbözıségükrıl, amelyet normál esetben Euklédeszi-távolsággal határozunk<br />
2<br />
meg. A korrespondencia-elemzés esetében azonban χ -távolsággal célszerő<br />
számolni, mivel eliminálja az eltérı peremgyakoriságokból fakadó torzító hatást.<br />
Az adatok súlyozott varianciájának kiszámítása. Az adatok súlyozott<br />
varianciájának (inercia) kiszámítása azért szükséges, hogy információt kapjunk az<br />
egyes kategóriák geometria súlypontjaik körüli szóródásának mértékérıl.<br />
A dimenziók számának csökkentése. A dimenziószám csökkentésekor azt az<br />
alacsonyszámú többdimenziós teret keressük, amely a legkisebb információveszteséggel<br />
jár. Fontos megjegyezni, hogy a vizuális elemzése csak két-, legfeljebb<br />
három dimenzióban lehetséges. A dimenziószám csökkentésének lineáris algebrai<br />
módszere a szinguláris érték felbontás (Singular Value Decomposition, SVD).<br />
A konfiguráció interpretálása. A konfiguráció vagy a korrespondencia-térkép a<br />
koordináták és a vizsgálatba vont változók kategóriái pozíciójának elemzésével<br />
értelmezhetı. Az egymáshoz közel elhelyezkedı kategóriák hasonlóaknak észlelik a<br />
válaszadók, míg a távol elhelyezkedıket különbözıeknek. Azok a kategóriák,<br />
amelyek közel találhatók az origóhoz, kevésbé markáns, míg azok, amelyek távol<br />
találhatók attól, markáns tulajdonságokkal, egyedi imázzsal rendelkeznek.<br />
A megbízhatóság és az érvényesség értékelése. A korrespondencia-elemzés<br />
megbízhatóságát és érvényességét többféle technika segítségével ellenırizhetjük:<br />
- A kiinduló adatokat két vagy több részre osztjuk, majd a korrespondenciaelemzést<br />
mindegyik részre külön elvégezzük, és az eredményeket összehasonlítjuk.<br />
- A változók kategóriáit felváltva eltávolítjuk az eredeti adatokból és elvégezzük az<br />
elemzést a megmaradt kategóriákra.<br />
- Véletlen hibát adunk az eredeti adatokhoz, majd az így kapott adatokra elvégezzük<br />
az elemzést, és az eredményeket összehasonlítjuk.<br />
- Az eredeti adatok győjtését két különbözı idıpontban tesszük meg, majd<br />
tesztadatok-kontrolladatok módszerrel meghatározzuk az elemzés megbízhatóságát.
3. A <strong>KORRESPONDENCIA</strong>-<strong>ELEMZ<strong>ÉS</strong></strong> GYAKORLATA<br />
A korrespondencia-elemzés legfontosabb elméleti tudnivalóinak áttekintése után az<br />
életbıl vett gyakorlati példán keresztül mutatom be a használatát, különös<br />
tekintettel az input adatokra, az elemzés menetére és az eredmények értelmezésére.<br />
3.1. A kutatás módszertana<br />
A korrespondencia-elemzés demonstrálása érdekében önkitöltıs kérdıívvel<br />
támogatott megkérdezést 1 végeztem, melynek célja, annak feltárása, hogyan észlelik<br />
a fiatalok a különbözı sörmárkákat. A kutatás alapsokaságát a Miskolci Egyetem<br />
azon hallgatói képezték, akik havonta legalább 1 alkalommal fogyasztanak sört.<br />
A mintanagyság – a rendelkezésre nem álló anyagi erıforrások következtében –<br />
100 fı.<br />
3.2. Az input adatok<br />
Az elemzéshez nominális skálán mért input adatokra van szükség, vagyis elı kell<br />
állítani egy olyan kereszttáblát (Lásd. 1. táblázat), amelynek az egyik dimenziója a<br />
jellemzıket 2 , a másik dimenziója a sörmárkákat 3 tartalmazza. Az egyes cellákban<br />
pedig azon válaszadók száma szerepel, akik egy adott jellemzıt igaznak vélnek egy<br />
adott sörmárkára. Fontos megjegyezni, hogy a kereszttábla celláiban nem<br />
szerepelhet nulla, ellenkezı esetben a korrespondencia-elemzés megbízhatósága<br />
csökken.<br />
3.3. Az elemzés menete<br />
Az elemzéshez az SPSS 15.0 statisztikai szoftvercsomag Categories modulját<br />
használtam, azon belül pedig a Leideni Egyetem adatok skálázási rendszereivel<br />
foglalkozó elméleti csoportja által kifejlesztett Correspondence 1.1 programot<br />
(Analyze/Data Reduction/Correspondence Analysis). Sorváltozónak (Row) a<br />
jellemzıket választottam, majd definiáltam a kategóriáit (Define Range). Ezt<br />
követıen kijelöltem a sörmárkákat oszlopváltozónak (Column), és szintén<br />
meghatároztam a kategóriáit (Define Range). A program futtatásához több beállítás<br />
nem szükséges.<br />
3.4. Az eredmények értelmezése<br />
Az eredmények értelmezését elıször a kereszttábla vizsgálatával kezdem, ezt<br />
követın az elemzés legfontosabb eredményeként elıállt ún. korrespondencia-térkép<br />
(Lásd. 1. ábra) alapján levonható általános következtetéseket fogalmazom meg.<br />
1 A gyakorlati példa kiválasztásában nagy szerepet játszott a sörpiacon szerezett tapasztalatom, amelyet a<br />
Dreher Sörgyárak Rt. [6], valamint a Borsodi Sörgyár Rt. [1] részére készített marketingkutatások<br />
elemzıjeként szereztem az elmúlt években.<br />
2 A jellemzık a Dreher Sörgyárak Rt. részére készített kvantitatív kutatásból [6] származnak.<br />
3 A sörmárkák a Borsodi Sörgyárak Rt. részére készített szakértıi jelentésbıl [1] származnak.
1. táblázat<br />
A jellemzık és a sörök kereszttáblája<br />
Borsodi Heineken Kozel Arany Ászok Soproni Stella Dreher Gösser Kıbányai<br />
Fiatalok fogyasztják 77 41 20 31 28 19 22 11 12<br />
Különleges alkalomra 4 57 10 2 2 45 20 30 1<br />
Finom/zamatos 30 53 20 8 14 38 27 26 1<br />
Vagány 17 47 7 3 3 26 20 15 5<br />
Jó minıségő 39 61 20 9 21 54 30 45 4<br />
Barátaim is ezt isszák 79 19 12 18 23 10 12 2 6<br />
Férfias 55 32 15 15 22 22 25 12 40<br />
Laza 25 35 11 14 19 21 10 13 10<br />
Mindenhol megtalálható 90 24 6 49 37 17 15 11 21<br />
Jó a reklámja 42 64 23 18 19 35 15 25 1<br />
Jó a csomagolása 22 67 17 11 12 41 19 31 1<br />
A kereszttábla elemzésekor – mint bármely más sztochasztikus kapcsolat vizsgálatakor – arra keressük a választ, hogy van-e<br />
összefüggés a két – ez esetben minıségi – ismérv között. Abban az esetben, ha találunk szignifikáns kapcsolatot a két változó között,<br />
megvizsgáljuk, hogy milyen erıs ez a kapcsolat. Az elsı kérdésünk megválaszolására nem paraméteres hipotézisvizsgálatot, ún.<br />
2<br />
Pearson-féle χ -próbát 4 kell végeznünk. A második kérdés megválaszolására több jó megoldás is kínálkozik, azonban a<br />
marketingkutatás gyakorlatában Cramer-féle V-mutató 5 terjedt el leginkább. Jelen esetben egyértelmő a szoros összefüggés a<br />
2<br />
jellemzık és a sörmárkák között, hiszen a χ -próba kétoldali aszimptotikus szignifikancia értéke 0,000. A kapcsolat erıssége<br />
azonban gyengének mondható, hiszen a Cramer-féle V-mutató értéke 0,181.<br />
4<br />
5<br />
= ∑ − 2<br />
( fij<br />
Eij<br />
)<br />
2<br />
p<br />
ij Eij<br />
χ , ahol fij<br />
a megfigyelt,<br />
⎛<br />
V = ⎜<br />
⎝W<br />
2<br />
χ p<br />
( q − )<br />
⎞<br />
1 ⎟⎟ ⎠<br />
1/ 2<br />
, ahol W a fıösszeg és q min{ R,<br />
C}<br />
E<br />
ij<br />
pedig a függetlenség esetén elvárt gyakoriság.<br />
= , ahol R a sorok, C pedig az oszlopok száma.
1,00<br />
0,75<br />
0,50<br />
0,25<br />
0,00<br />
-0,25<br />
Barátaim is ezt isszák<br />
Arany Ászok<br />
Borsodi<br />
Mindenhol megtalálható<br />
Fiatalok fogyasztják<br />
Soproni<br />
Laza<br />
Kozel<br />
Jó a reklámja<br />
Dreher<br />
Finom, zamatos<br />
Jó minıségő<br />
Jó a csomagolása<br />
Heineken Gösser<br />
Stella<br />
Vagány<br />
-0,50<br />
-0,75<br />
-1,00<br />
-1,00 -0,75 -0,50 -0,25 0,00 0,25 0,50 0,75 1,00<br />
2. ábra<br />
Korrespondencia-térkép<br />
A korrespondencia-térkép elemzésébıl levonható legfontosabb tanulság, hogy a fiatalok értékítéletében három kategória<br />
különböztethetı meg a leginkább preferált sörök esetében. 1. populáris: Arany Ászok, Borsodi, Soproni; ezek azok a sörmárkák,<br />
amelyeket szinte bárhol be lehet szerezni és sokan is fogyasztják a fiatalok közül. 2. útkeresı: Kozel, Dreher, ezek a sörök még nem<br />
rendelkeznek igazán markáns tulajdonságokkal az ifjú felnıttek körében. 3. trendi: Heineken, Stella, Gösser, ezek azok a sörmárkák,<br />
amelyek igazán trendinek számítanak, termékjellemzıik és személyiségjegyeik alapján méltán kerülnek ebbe a kategóriába. Fontos<br />
megjegyezni, hogy a „férfias” jellemzı és Kıbányai sör lekerültek a térképrıl a jobb átláthatóság kedvéért.
4. KÖVETKEZTET<strong>ÉS</strong>EK<br />
- A kereszttábla-elemzés korlátozott kiválóan alkalmas az asszociációs kapcsolat<br />
vizsgálatára, vagyis két minıségi ismérv közötti összefüggés feltárására, leírására.<br />
A módszer nagy hátránya, hogy mélyebb elemzések elvégzésére nem alkalmas.<br />
Példánkban szignifikáns, de gyenge kapcsolat van az egyes jellemzık és a<br />
sörmárkák között.<br />
- A mélyebb elemzések elvégzésére sokkal alkalmasabb módszer a korrespondencia<br />
elemzés, amely úgy alakítja át az elemzésbe vont kereszttábla sorait és oszlopait,<br />
hogy grafikusan ábrázolható legyen az alacsonyszámú többdimenziós térben.<br />
A gyakorlati példában három kategóriába sorolhatók a fiatalok által leginkább<br />
preferált sörök.<br />
KÖSZÖNETNYILVÁNÍTÁS<br />
Ezúton mondok köszönetet a Miskolci Egyetem, Marketing Intézet hallgatóinak,<br />
Farkas Zsuzsannának, Firtkó Juditnak, Forgács Andrásnak, Gömöri Beátának, Jakab<br />
Zoltánnak, Kalina Juditnak, Kohlmáyer Fanninak, Lieber Nórának, Tóth Nórának,<br />
Simon Tündének, és Kása Richárdnak, a Miskolci Egyetem, Vezetéstudományi<br />
Intézet Ph.D. hallgatójának az adatgyőjtés, valamint Kalina Juditnak az adatrögzítés<br />
terén nyújtott önzetlen segítségéért.<br />
IRODALOMJEGYZÉK<br />
[1] BERECZKINÉ F. E. – HAVRILÓ A. – MOLNÁR L. – PISKÓTI I. –<br />
SCHUPLER H.: A fiatalok életstílusának, alkohol- és sörfogyasztási szokásának<br />
kvalitatív vizsgálata – Szakértıi jelentés a Borsodi Sörgyár Rt. részére,<br />
Miskolc, 2007<br />
[2] BOLLA M. – KRÁMLI A.: Statisztikai következtetések elmélete, Budapest,<br />
Typotex Kiadó, 2005<br />
[3] FÜSTÖS L. – KOVÁCS E. – MESZÉNA GY. – SIMONNÉ M. N.:<br />
Alakfelismerés – Sokváltozós statisztikai módszerek, Budapest, Új Mandátum<br />
Könyvkiadó, 2004<br />
[4] GREENACRE, M. J.: Theory and applications of correspondence analysis,<br />
Academic Press, London, 1984<br />
[5] HAJDU O.: Többváltozós statisztikai számítások, Budapest, Központi<br />
Statisztikai Hivatal, 2003<br />
[6] HÓDOSI L. – KÓSA Á. – KULCSÁR I. – MOLNÁR L. – SZIVÓS J.:<br />
Kvantitatív kutatás a Dreher Sörgyárak Rt. részére, Miskolc, 2004<br />
[7] KETSKEMÉTY L. – IZSÓ L.: Bevezetés az SPSS programrendszerbe,<br />
Budapest, ELTE Eötvös Kiadó, 2005<br />
[8] MALHOTRA, N. K.: Marketingkutatás, Budapest, KJK-KERSZÖV Jogi és<br />
Üzleti Kiadó, 2002<br />
[9] SPSS Inc.: SPSS Categories, Chicago, 2005<br />
[10] VERES Z. – HOFFMANN M. – KOZÁK Á.: Bevezetés a piackutatásba,<br />
Budapest, Akadémiai Kiadó, Budapest, 2006