A KORRESPONDENCIA-ELEMZÉS (CA) ELMÉLETE ÉS ...

A KORRESPONDENCIA-ELEMZÉS (CA) ELMÉLETE ÉS 

GYAKORLATA 

1. BEVEZETÉS 

Molnár László 

tudományos segédmunkatárs 

Miskolci Egyetem, Marketing Intézet 

Ahogy fejlıdik a marketingkutatás, mint tudományos diszciplína, újabb és újabb 

(matematikai-statisztikai) adatelemzési módszerek épülnek be a mindennapi 

gyakorlatba. Ezek közé a módszerek közé sorolható a korrespondencia-elemzés 

(Correspondence Analysis, CA), amely elméleti kereteit az 1960-as években már 

rögzítették. 

Természetesen a hazai gyakorlat számára sem ismeretlen a módszer, sıt a piac- és 

közvélemény-kutató cégek elıszeretettel alkalmazzák is. Ugyanakkor ritkán 

találkozhatunk vele a felsıoktatásban, de még a doktori iskolákban sem gyakori az 

oktatása. Nem is beszélve arról a néhány magyar nyelvő szakirodalomról, amelyek 

csupán rövid említést tesznek errıl a módszerrıl. 

Jelen tanulmány célja kettıs. Egyrészt ismertetni kívánom a korrespondenciaelemzés 

legfontosabb elméleti tudnivalóit, különös tekintettel a módszer egyes 

lépéseire. Másrészt egy konkrét gyakorlati példán keresztül kívánom bemutatni az 

alkalmazását, amely input adatait külön ebbıl a célból készített kérdıíves 

megkérdezés nyújtotta. 

2. A KORRESPONDENCIA-ELEMZÉS ELMÉLETE 

A korrespondencia-elemzés lényegét Hajdu [5] definíciója alapján határozom meg, 

vagyis egy olyan exploratív többváltozós technikáról van szó, amely az asszociáció 

kapcsolat vizuális elemzése érdekében egy kontingencia tábla adatait grafikus 

ábrává konvertálja. Egyszerőbben fogalmazva a korrespondencia-elemzés a 

kereszttábla sorait az oszlopok, míg az oszlopait a sorok tengelyeinek tekintetében 

egy „pontfelhı” pontjaiként értelmezi. A módszer eredményeként egy redukált, 

alacsony dimenziójú térben grafikusan ábrázoljuk a „pontfelhı” pontjait. Mindezek 

után vizuális elemzéssel következtetni tudunk arra, hogy a vizsgált változók mely 

kategóriái vonzzák és melyek taszítják egymást. 

2.1. A korrespondencia-elemzés menete 

A probléma meghatározása. A probléma megfogalmazása során a kutatónak meg 

kell határoznia azt a célt, amelyre a korrespondencia-elemzés eredményeit szeretné 

felhasználni, és ki kell választani azt a két változót, amelyek bekerülnek az 

elemzésbe. Mindkét változó esetében legalább három kategóriát kell definiálni, 

hogy elkészülhessen az észlelési térkép, viszont változóként 12 kategória értékelése 

már nehézkes, az eredmények értelmezése túlságosan bonyolulttá válik. 

A kiinduló adatok összegyőjtése. A korrespondencia-elemzéshez csak nominális 

skálán mért változókra van szükség, vagyis a kiinduló adatok összegyőjtése során 

arra kell megkérni a válaszadókat, hogy ítéljék meg, hogy az egyik változó mely 

kategóriái (Pl.: jellemzık) vonatkoznak a másik változó kategóriáira (Pl.: márkák).

A kiinduló kereszttábla elıállítása. A kiinduló kereszttábla csupán a vizsgálatba 

vont változók adott kategóriáira vonatkozó pozitív válaszokat tartalmazza. Fontos 

megjegyezni, hogy a kiinduló kereszttábla adatai a különbözı peremgyakoriságok 

következtében csak normalizált alakban alkalmas további elemzésre. 

Sor- és oszlopprofilok elıállítása. A sor- és oszlopprofilok elıállítása egyszerően 

történik: A sorváltozó kategóriáinak értékeit a megfelelı sorösszegekkel, míg az 

oszlopváltozó kategóriáinak értékeit a megfelelı oszlopösszegekkel kell elosztani. 

A kategóriák geometriai súlypontjainak elıállítása. A kategóriák geometriai 

súlypontjának elıállítása azért szükséges, hogy egyszerően kiszámítható legyen az 

adatok saját centroidjaik, azaz peremprofiljaik körüli szóródási mutatószámai. 

A kategóriák közötti távolság kiszámítása. A kategóriák közötti és geometriai 

súlyponttól mért távolság kiszámításával kapunk információt a hasonlóságukról és a 

különbözıségükrıl, amelyet normál esetben Euklédeszi-távolsággal határozunk 

2 

meg. A korrespondencia-elemzés esetében azonban χ -távolsággal célszerő 

számolni, mivel eliminálja az eltérı peremgyakoriságokból fakadó torzító hatást. 

Az adatok súlyozott varianciájának kiszámítása. Az adatok súlyozott 

varianciájának (inercia) kiszámítása azért szükséges, hogy információt kapjunk az 

egyes kategóriák geometria súlypontjaik körüli szóródásának mértékérıl. 

A dimenziók számának csökkentése. A dimenziószám csökkentésekor azt az 

alacsonyszámú többdimenziós teret keressük, amely a legkisebb információveszteséggel 

jár. Fontos megjegyezni, hogy a vizuális elemzése csak két-, legfeljebb 

három dimenzióban lehetséges. A dimenziószám csökkentésének lineáris algebrai 

módszere a szinguláris érték felbontás (Singular Value Decomposition, SVD). 

A konfiguráció interpretálása. A konfiguráció vagy a korrespondencia-térkép a 

koordináták és a vizsgálatba vont változók kategóriái pozíciójának elemzésével 

értelmezhetı. Az egymáshoz közel elhelyezkedı kategóriák hasonlóaknak észlelik a 

válaszadók, míg a távol elhelyezkedıket különbözıeknek. Azok a kategóriák, 

amelyek közel találhatók az origóhoz, kevésbé markáns, míg azok, amelyek távol 

találhatók attól, markáns tulajdonságokkal, egyedi imázzsal rendelkeznek. 

A megbízhatóság és az érvényesség értékelése. A korrespondencia-elemzés 

megbízhatóságát és érvényességét többféle technika segítségével ellenırizhetjük: 

- A kiinduló adatokat két vagy több részre osztjuk, majd a korrespondenciaelemzést 

mindegyik részre külön elvégezzük, és az eredményeket összehasonlítjuk. 

- A változók kategóriáit felváltva eltávolítjuk az eredeti adatokból és elvégezzük az 

elemzést a megmaradt kategóriákra. 

- Véletlen hibát adunk az eredeti adatokhoz, majd az így kapott adatokra elvégezzük 

az elemzést, és az eredményeket összehasonlítjuk. 

- Az eredeti adatok győjtését két különbözı idıpontban tesszük meg, majd 

tesztadatok-kontrolladatok módszerrel meghatározzuk az elemzés megbízhatóságát.

3. A KORRESPONDENCIA-ELEMZÉS GYAKORLATA 

A korrespondencia-elemzés legfontosabb elméleti tudnivalóinak áttekintése után az 

életbıl vett gyakorlati példán keresztül mutatom be a használatát, különös 

tekintettel az input adatokra, az elemzés menetére és az eredmények értelmezésére. 

3.1. A kutatás módszertana 

A korrespondencia-elemzés demonstrálása érdekében önkitöltıs kérdıívvel 

támogatott megkérdezést 1 végeztem, melynek célja, annak feltárása, hogyan észlelik 

a fiatalok a különbözı sörmárkákat. A kutatás alapsokaságát a Miskolci Egyetem 

azon hallgatói képezték, akik havonta legalább 1 alkalommal fogyasztanak sört. 

A mintanagyság – a rendelkezésre nem álló anyagi erıforrások következtében – 

100 fı. 

3.2. Az input adatok 

Az elemzéshez nominális skálán mért input adatokra van szükség, vagyis elı kell 

állítani egy olyan kereszttáblát (Lásd. 1. táblázat), amelynek az egyik dimenziója a 

jellemzıket 2 , a másik dimenziója a sörmárkákat 3 tartalmazza. Az egyes cellákban 

pedig azon válaszadók száma szerepel, akik egy adott jellemzıt igaznak vélnek egy 

adott sörmárkára. Fontos megjegyezni, hogy a kereszttábla celláiban nem 

szerepelhet nulla, ellenkezı esetben a korrespondencia-elemzés megbízhatósága 

csökken. 

3.3. Az elemzés menete 

Az elemzéshez az SPSS 15.0 statisztikai szoftvercsomag Categories modulját 

használtam, azon belül pedig a Leideni Egyetem adatok skálázási rendszereivel 

foglalkozó elméleti csoportja által kifejlesztett Correspondence 1.1 programot 

(Analyze/Data Reduction/Correspondence Analysis). Sorváltozónak (Row) a 

jellemzıket választottam, majd definiáltam a kategóriáit (Define Range). Ezt 

követıen kijelöltem a sörmárkákat oszlopváltozónak (Column), és szintén 

meghatároztam a kategóriáit (Define Range). A program futtatásához több beállítás 

nem szükséges. 

3.4. Az eredmények értelmezése 

Az eredmények értelmezését elıször a kereszttábla vizsgálatával kezdem, ezt 

követın az elemzés legfontosabb eredményeként elıállt ún. korrespondencia-térkép 

(Lásd. 1. ábra) alapján levonható általános következtetéseket fogalmazom meg. 

1 A gyakorlati példa kiválasztásában nagy szerepet játszott a sörpiacon szerezett tapasztalatom, amelyet a 

Dreher Sörgyárak Rt. [6], valamint a Borsodi Sörgyár Rt. [1] részére készített marketingkutatások 

elemzıjeként szereztem az elmúlt években. 

2 A jellemzık a Dreher Sörgyárak Rt. részére készített kvantitatív kutatásból [6] származnak. 

3 A sörmárkák a Borsodi Sörgyárak Rt. részére készített szakértıi jelentésbıl [1] származnak.

1. táblázat 

A jellemzık és a sörök kereszttáblája 

Borsodi Heineken Kozel Arany Ászok Soproni Stella Dreher Gösser Kıbányai 

Fiatalok fogyasztják 77 41 20 31 28 19 22 11 12 

Különleges alkalomra 4 57 10 2 2 45 20 30 1 

Finom/zamatos 30 53 20 8 14 38 27 26 1 

Vagány 17 47 7 3 3 26 20 15 5 

Jó minıségő 39 61 20 9 21 54 30 45 4 

Barátaim is ezt isszák 79 19 12 18 23 10 12 2 6 

Férfias 55 32 15 15 22 22 25 12 40 

Laza 25 35 11 14 19 21 10 13 10 

Mindenhol megtalálható 90 24 6 49 37 17 15 11 21 

Jó a reklámja 42 64 23 18 19 35 15 25 1 

Jó a csomagolása 22 67 17 11 12 41 19 31 1 

A kereszttábla elemzésekor – mint bármely más sztochasztikus kapcsolat vizsgálatakor – arra keressük a választ, hogy van-e 

összefüggés a két – ez esetben minıségi – ismérv között. Abban az esetben, ha találunk szignifikáns kapcsolatot a két változó között, 

megvizsgáljuk, hogy milyen erıs ez a kapcsolat. Az elsı kérdésünk megválaszolására nem paraméteres hipotézisvizsgálatot, ún. 

2 

Pearson-féle χ -próbát 4 kell végeznünk. A második kérdés megválaszolására több jó megoldás is kínálkozik, azonban a 

marketingkutatás gyakorlatában Cramer-féle V-mutató 5 terjedt el leginkább. Jelen esetben egyértelmő a szoros összefüggés a 

2 

jellemzık és a sörmárkák között, hiszen a χ -próba kétoldali aszimptotikus szignifikancia értéke 0,000. A kapcsolat erıssége 

azonban gyengének mondható, hiszen a Cramer-féle V-mutató értéke 0,181. 

4 

5 

= ∑ − 2 

( fij 

Eij 

) 

2 

p 

ij Eij 

χ , ahol fij 

a megfigyelt, 

⎛ 

V = ⎜ 

⎝W 

2 

χ p 

( q − ) 

⎞ 

1 ⎟⎟ ⎠ 

1/ 2 

, ahol W a fıösszeg és q min{ R, 

C} 

E 

ij 

pedig a függetlenség esetén elvárt gyakoriság. 

= , ahol R a sorok, C pedig az oszlopok száma.

1,00 

0,75 

0,50 

0,25 

0,00 

-0,25 

Barátaim is ezt isszák 

Arany Ászok 

Borsodi 

Mindenhol megtalálható 

Fiatalok fogyasztják 

Soproni 

Laza 

Kozel 

Jó a reklámja 

Dreher 

Finom, zamatos 

Jó minıségő 

Jó a csomagolása 

Heineken Gösser 

Stella 

Vagány 

-0,50 

-0,75 

-1,00 

-1,00 -0,75 -0,50 -0,25 0,00 0,25 0,50 0,75 1,00 

2. ábra 

Korrespondencia-térkép 

A korrespondencia-térkép elemzésébıl levonható legfontosabb tanulság, hogy a fiatalok értékítéletében három kategória 

különböztethetı meg a leginkább preferált sörök esetében. 1. populáris: Arany Ászok, Borsodi, Soproni; ezek azok a sörmárkák, 

amelyeket szinte bárhol be lehet szerezni és sokan is fogyasztják a fiatalok közül. 2. útkeresı: Kozel, Dreher, ezek a sörök még nem 

rendelkeznek igazán markáns tulajdonságokkal az ifjú felnıttek körében. 3. trendi: Heineken, Stella, Gösser, ezek azok a sörmárkák, 

amelyek igazán trendinek számítanak, termékjellemzıik és személyiségjegyeik alapján méltán kerülnek ebbe a kategóriába. Fontos 

megjegyezni, hogy a „férfias” jellemzı és Kıbányai sör lekerültek a térképrıl a jobb átláthatóság kedvéért.

4. KÖVETKEZTETÉSEK 

- A kereszttábla-elemzés korlátozott kiválóan alkalmas az asszociációs kapcsolat 

vizsgálatára, vagyis két minıségi ismérv közötti összefüggés feltárására, leírására. 

A módszer nagy hátránya, hogy mélyebb elemzések elvégzésére nem alkalmas. 

Példánkban szignifikáns, de gyenge kapcsolat van az egyes jellemzık és a 

sörmárkák között. 

- A mélyebb elemzések elvégzésére sokkal alkalmasabb módszer a korrespondencia 

elemzés, amely úgy alakítja át az elemzésbe vont kereszttábla sorait és oszlopait, 

hogy grafikusan ábrázolható legyen az alacsonyszámú többdimenziós térben. 

A gyakorlati példában három kategóriába sorolhatók a fiatalok által leginkább 

preferált sörök. 

KÖSZÖNETNYILVÁNÍTÁS 

Ezúton mondok köszönetet a Miskolci Egyetem, Marketing Intézet hallgatóinak, 

Farkas Zsuzsannának, Firtkó Juditnak, Forgács Andrásnak, Gömöri Beátának, Jakab 

Zoltánnak, Kalina Juditnak, Kohlmáyer Fanninak, Lieber Nórának, Tóth Nórának, 

Simon Tündének, és Kása Richárdnak, a Miskolci Egyetem, Vezetéstudományi 

Intézet Ph.D. hallgatójának az adatgyőjtés, valamint Kalina Juditnak az adatrögzítés 

terén nyújtott önzetlen segítségéért. 

IRODALOMJEGYZÉK 

[1] BERECZKINÉ F. E. – HAVRILÓ A. – MOLNÁR L. – PISKÓTI I. – 

SCHUPLER H.: A fiatalok életstílusának, alkohol- és sörfogyasztási szokásának 

kvalitatív vizsgálata – Szakértıi jelentés a Borsodi Sörgyár Rt. részére, 

Miskolc, 2007 

[2] BOLLA M. – KRÁMLI A.: Statisztikai következtetések elmélete, Budapest, 

Typotex Kiadó, 2005 

[3] FÜSTÖS L. – KOVÁCS E. – MESZÉNA GY. – SIMONNÉ M. N.: 

Alakfelismerés – Sokváltozós statisztikai módszerek, Budapest, Új Mandátum 

Könyvkiadó, 2004 

[4] GREENACRE, M. J.: Theory and applications of correspondence analysis, 

Academic Press, London, 1984 

[5] HAJDU O.: Többváltozós statisztikai számítások, Budapest, Központi 

Statisztikai Hivatal, 2003 

[6] HÓDOSI L. – KÓSA Á. – KULCSÁR I. – MOLNÁR L. – SZIVÓS J.: 

Kvantitatív kutatás a Dreher Sörgyárak Rt. részére, Miskolc, 2004 

[7] KETSKEMÉTY L. – IZSÓ L.: Bevezetés az SPSS programrendszerbe, 

Budapest, ELTE Eötvös Kiadó, 2005 

[8] MALHOTRA, N. K.: Marketingkutatás, Budapest, KJK-KERSZÖV Jogi és 

Üzleti Kiadó, 2002 

[9] SPSS Inc.: SPSS Categories, Chicago, 2005 

[10] VERES Z. – HOFFMANN M. – KOZÁK Á.: Bevezetés a piackutatásba, 

Budapest, Akadémiai Kiadó, Budapest, 2006

A KORRESPONDENCIA-ELEMZÉS (CA) ELMÉLETE ÉS ...

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?