26.10.2014 Views

A KORRESPONDENCIA-ELEMZÉS (CA) ELMÉLETE ÉS ...

A KORRESPONDENCIA-ELEMZÉS (CA) ELMÉLETE ÉS ...

A KORRESPONDENCIA-ELEMZÉS (CA) ELMÉLETE ÉS ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

A <strong>KORRESPONDENCIA</strong>-<strong>ELEMZ<strong>ÉS</strong></strong> (<strong>CA</strong>) <strong>ELMÉLETE</strong> <strong>ÉS</strong><br />

GYAKORLATA<br />

1. BEVEZET<strong>ÉS</strong><br />

Molnár László<br />

tudományos segédmunkatárs<br />

Miskolci Egyetem, Marketing Intézet<br />

Ahogy fejlıdik a marketingkutatás, mint tudományos diszciplína, újabb és újabb<br />

(matematikai-statisztikai) adatelemzési módszerek épülnek be a mindennapi<br />

gyakorlatba. Ezek közé a módszerek közé sorolható a korrespondencia-elemzés<br />

(Correspondence Analysis, <strong>CA</strong>), amely elméleti kereteit az 1960-as években már<br />

rögzítették.<br />

Természetesen a hazai gyakorlat számára sem ismeretlen a módszer, sıt a piac- és<br />

közvélemény-kutató cégek elıszeretettel alkalmazzák is. Ugyanakkor ritkán<br />

találkozhatunk vele a felsıoktatásban, de még a doktori iskolákban sem gyakori az<br />

oktatása. Nem is beszélve arról a néhány magyar nyelvő szakirodalomról, amelyek<br />

csupán rövid említést tesznek errıl a módszerrıl.<br />

Jelen tanulmány célja kettıs. Egyrészt ismertetni kívánom a korrespondenciaelemzés<br />

legfontosabb elméleti tudnivalóit, különös tekintettel a módszer egyes<br />

lépéseire. Másrészt egy konkrét gyakorlati példán keresztül kívánom bemutatni az<br />

alkalmazását, amely input adatait külön ebbıl a célból készített kérdıíves<br />

megkérdezés nyújtotta.<br />

2. A <strong>KORRESPONDENCIA</strong>-<strong>ELEMZ<strong>ÉS</strong></strong> <strong>ELMÉLETE</strong><br />

A korrespondencia-elemzés lényegét Hajdu [5] definíciója alapján határozom meg,<br />

vagyis egy olyan exploratív többváltozós technikáról van szó, amely az asszociáció<br />

kapcsolat vizuális elemzése érdekében egy kontingencia tábla adatait grafikus<br />

ábrává konvertálja. Egyszerőbben fogalmazva a korrespondencia-elemzés a<br />

kereszttábla sorait az oszlopok, míg az oszlopait a sorok tengelyeinek tekintetében<br />

egy „pontfelhı” pontjaiként értelmezi. A módszer eredményeként egy redukált,<br />

alacsony dimenziójú térben grafikusan ábrázoljuk a „pontfelhı” pontjait. Mindezek<br />

után vizuális elemzéssel következtetni tudunk arra, hogy a vizsgált változók mely<br />

kategóriái vonzzák és melyek taszítják egymást.<br />

2.1. A korrespondencia-elemzés menete<br />

A probléma meghatározása. A probléma megfogalmazása során a kutatónak meg<br />

kell határoznia azt a célt, amelyre a korrespondencia-elemzés eredményeit szeretné<br />

felhasználni, és ki kell választani azt a két változót, amelyek bekerülnek az<br />

elemzésbe. Mindkét változó esetében legalább három kategóriát kell definiálni,<br />

hogy elkészülhessen az észlelési térkép, viszont változóként 12 kategória értékelése<br />

már nehézkes, az eredmények értelmezése túlságosan bonyolulttá válik.<br />

A kiinduló adatok összegyőjtése. A korrespondencia-elemzéshez csak nominális<br />

skálán mért változókra van szükség, vagyis a kiinduló adatok összegyőjtése során<br />

arra kell megkérni a válaszadókat, hogy ítéljék meg, hogy az egyik változó mely<br />

kategóriái (Pl.: jellemzık) vonatkoznak a másik változó kategóriáira (Pl.: márkák).


A kiinduló kereszttábla elıállítása. A kiinduló kereszttábla csupán a vizsgálatba<br />

vont változók adott kategóriáira vonatkozó pozitív válaszokat tartalmazza. Fontos<br />

megjegyezni, hogy a kiinduló kereszttábla adatai a különbözı peremgyakoriságok<br />

következtében csak normalizált alakban alkalmas további elemzésre.<br />

Sor- és oszlopprofilok elıállítása. A sor- és oszlopprofilok elıállítása egyszerően<br />

történik: A sorváltozó kategóriáinak értékeit a megfelelı sorösszegekkel, míg az<br />

oszlopváltozó kategóriáinak értékeit a megfelelı oszlopösszegekkel kell elosztani.<br />

A kategóriák geometriai súlypontjainak elıállítása. A kategóriák geometriai<br />

súlypontjának elıállítása azért szükséges, hogy egyszerően kiszámítható legyen az<br />

adatok saját centroidjaik, azaz peremprofiljaik körüli szóródási mutatószámai.<br />

A kategóriák közötti távolság kiszámítása. A kategóriák közötti és geometriai<br />

súlyponttól mért távolság kiszámításával kapunk információt a hasonlóságukról és a<br />

különbözıségükrıl, amelyet normál esetben Euklédeszi-távolsággal határozunk<br />

2<br />

meg. A korrespondencia-elemzés esetében azonban χ -távolsággal célszerő<br />

számolni, mivel eliminálja az eltérı peremgyakoriságokból fakadó torzító hatást.<br />

Az adatok súlyozott varianciájának kiszámítása. Az adatok súlyozott<br />

varianciájának (inercia) kiszámítása azért szükséges, hogy információt kapjunk az<br />

egyes kategóriák geometria súlypontjaik körüli szóródásának mértékérıl.<br />

A dimenziók számának csökkentése. A dimenziószám csökkentésekor azt az<br />

alacsonyszámú többdimenziós teret keressük, amely a legkisebb információveszteséggel<br />

jár. Fontos megjegyezni, hogy a vizuális elemzése csak két-, legfeljebb<br />

három dimenzióban lehetséges. A dimenziószám csökkentésének lineáris algebrai<br />

módszere a szinguláris érték felbontás (Singular Value Decomposition, SVD).<br />

A konfiguráció interpretálása. A konfiguráció vagy a korrespondencia-térkép a<br />

koordináták és a vizsgálatba vont változók kategóriái pozíciójának elemzésével<br />

értelmezhetı. Az egymáshoz közel elhelyezkedı kategóriák hasonlóaknak észlelik a<br />

válaszadók, míg a távol elhelyezkedıket különbözıeknek. Azok a kategóriák,<br />

amelyek közel találhatók az origóhoz, kevésbé markáns, míg azok, amelyek távol<br />

találhatók attól, markáns tulajdonságokkal, egyedi imázzsal rendelkeznek.<br />

A megbízhatóság és az érvényesség értékelése. A korrespondencia-elemzés<br />

megbízhatóságát és érvényességét többféle technika segítségével ellenırizhetjük:<br />

- A kiinduló adatokat két vagy több részre osztjuk, majd a korrespondenciaelemzést<br />

mindegyik részre külön elvégezzük, és az eredményeket összehasonlítjuk.<br />

- A változók kategóriáit felváltva eltávolítjuk az eredeti adatokból és elvégezzük az<br />

elemzést a megmaradt kategóriákra.<br />

- Véletlen hibát adunk az eredeti adatokhoz, majd az így kapott adatokra elvégezzük<br />

az elemzést, és az eredményeket összehasonlítjuk.<br />

- Az eredeti adatok győjtését két különbözı idıpontban tesszük meg, majd<br />

tesztadatok-kontrolladatok módszerrel meghatározzuk az elemzés megbízhatóságát.


3. A <strong>KORRESPONDENCIA</strong>-<strong>ELEMZ<strong>ÉS</strong></strong> GYAKORLATA<br />

A korrespondencia-elemzés legfontosabb elméleti tudnivalóinak áttekintése után az<br />

életbıl vett gyakorlati példán keresztül mutatom be a használatát, különös<br />

tekintettel az input adatokra, az elemzés menetére és az eredmények értelmezésére.<br />

3.1. A kutatás módszertana<br />

A korrespondencia-elemzés demonstrálása érdekében önkitöltıs kérdıívvel<br />

támogatott megkérdezést 1 végeztem, melynek célja, annak feltárása, hogyan észlelik<br />

a fiatalok a különbözı sörmárkákat. A kutatás alapsokaságát a Miskolci Egyetem<br />

azon hallgatói képezték, akik havonta legalább 1 alkalommal fogyasztanak sört.<br />

A mintanagyság – a rendelkezésre nem álló anyagi erıforrások következtében –<br />

100 fı.<br />

3.2. Az input adatok<br />

Az elemzéshez nominális skálán mért input adatokra van szükség, vagyis elı kell<br />

állítani egy olyan kereszttáblát (Lásd. 1. táblázat), amelynek az egyik dimenziója a<br />

jellemzıket 2 , a másik dimenziója a sörmárkákat 3 tartalmazza. Az egyes cellákban<br />

pedig azon válaszadók száma szerepel, akik egy adott jellemzıt igaznak vélnek egy<br />

adott sörmárkára. Fontos megjegyezni, hogy a kereszttábla celláiban nem<br />

szerepelhet nulla, ellenkezı esetben a korrespondencia-elemzés megbízhatósága<br />

csökken.<br />

3.3. Az elemzés menete<br />

Az elemzéshez az SPSS 15.0 statisztikai szoftvercsomag Categories modulját<br />

használtam, azon belül pedig a Leideni Egyetem adatok skálázási rendszereivel<br />

foglalkozó elméleti csoportja által kifejlesztett Correspondence 1.1 programot<br />

(Analyze/Data Reduction/Correspondence Analysis). Sorváltozónak (Row) a<br />

jellemzıket választottam, majd definiáltam a kategóriáit (Define Range). Ezt<br />

követıen kijelöltem a sörmárkákat oszlopváltozónak (Column), és szintén<br />

meghatároztam a kategóriáit (Define Range). A program futtatásához több beállítás<br />

nem szükséges.<br />

3.4. Az eredmények értelmezése<br />

Az eredmények értelmezését elıször a kereszttábla vizsgálatával kezdem, ezt<br />

követın az elemzés legfontosabb eredményeként elıállt ún. korrespondencia-térkép<br />

(Lásd. 1. ábra) alapján levonható általános következtetéseket fogalmazom meg.<br />

1 A gyakorlati példa kiválasztásában nagy szerepet játszott a sörpiacon szerezett tapasztalatom, amelyet a<br />

Dreher Sörgyárak Rt. [6], valamint a Borsodi Sörgyár Rt. [1] részére készített marketingkutatások<br />

elemzıjeként szereztem az elmúlt években.<br />

2 A jellemzık a Dreher Sörgyárak Rt. részére készített kvantitatív kutatásból [6] származnak.<br />

3 A sörmárkák a Borsodi Sörgyárak Rt. részére készített szakértıi jelentésbıl [1] származnak.


1. táblázat<br />

A jellemzık és a sörök kereszttáblája<br />

Borsodi Heineken Kozel Arany Ászok Soproni Stella Dreher Gösser Kıbányai<br />

Fiatalok fogyasztják 77 41 20 31 28 19 22 11 12<br />

Különleges alkalomra 4 57 10 2 2 45 20 30 1<br />

Finom/zamatos 30 53 20 8 14 38 27 26 1<br />

Vagány 17 47 7 3 3 26 20 15 5<br />

Jó minıségő 39 61 20 9 21 54 30 45 4<br />

Barátaim is ezt isszák 79 19 12 18 23 10 12 2 6<br />

Férfias 55 32 15 15 22 22 25 12 40<br />

Laza 25 35 11 14 19 21 10 13 10<br />

Mindenhol megtalálható 90 24 6 49 37 17 15 11 21<br />

Jó a reklámja 42 64 23 18 19 35 15 25 1<br />

Jó a csomagolása 22 67 17 11 12 41 19 31 1<br />

A kereszttábla elemzésekor – mint bármely más sztochasztikus kapcsolat vizsgálatakor – arra keressük a választ, hogy van-e<br />

összefüggés a két – ez esetben minıségi – ismérv között. Abban az esetben, ha találunk szignifikáns kapcsolatot a két változó között,<br />

megvizsgáljuk, hogy milyen erıs ez a kapcsolat. Az elsı kérdésünk megválaszolására nem paraméteres hipotézisvizsgálatot, ún.<br />

2<br />

Pearson-féle χ -próbát 4 kell végeznünk. A második kérdés megválaszolására több jó megoldás is kínálkozik, azonban a<br />

marketingkutatás gyakorlatában Cramer-féle V-mutató 5 terjedt el leginkább. Jelen esetben egyértelmő a szoros összefüggés a<br />

2<br />

jellemzık és a sörmárkák között, hiszen a χ -próba kétoldali aszimptotikus szignifikancia értéke 0,000. A kapcsolat erıssége<br />

azonban gyengének mondható, hiszen a Cramer-féle V-mutató értéke 0,181.<br />

4<br />

5<br />

= ∑ − 2<br />

( fij<br />

Eij<br />

)<br />

2<br />

p<br />

ij Eij<br />

χ , ahol fij<br />

a megfigyelt,<br />

⎛<br />

V = ⎜<br />

⎝W<br />

2<br />

χ p<br />

( q − )<br />

⎞<br />

1 ⎟⎟ ⎠<br />

1/ 2<br />

, ahol W a fıösszeg és q min{ R,<br />

C}<br />

E<br />

ij<br />

pedig a függetlenség esetén elvárt gyakoriság.<br />

= , ahol R a sorok, C pedig az oszlopok száma.


1,00<br />

0,75<br />

0,50<br />

0,25<br />

0,00<br />

-0,25<br />

Barátaim is ezt isszák<br />

Arany Ászok<br />

Borsodi<br />

Mindenhol megtalálható<br />

Fiatalok fogyasztják<br />

Soproni<br />

Laza<br />

Kozel<br />

Jó a reklámja<br />

Dreher<br />

Finom, zamatos<br />

Jó minıségő<br />

Jó a csomagolása<br />

Heineken Gösser<br />

Stella<br />

Vagány<br />

-0,50<br />

-0,75<br />

-1,00<br />

-1,00 -0,75 -0,50 -0,25 0,00 0,25 0,50 0,75 1,00<br />

2. ábra<br />

Korrespondencia-térkép<br />

A korrespondencia-térkép elemzésébıl levonható legfontosabb tanulság, hogy a fiatalok értékítéletében három kategória<br />

különböztethetı meg a leginkább preferált sörök esetében. 1. populáris: Arany Ászok, Borsodi, Soproni; ezek azok a sörmárkák,<br />

amelyeket szinte bárhol be lehet szerezni és sokan is fogyasztják a fiatalok közül. 2. útkeresı: Kozel, Dreher, ezek a sörök még nem<br />

rendelkeznek igazán markáns tulajdonságokkal az ifjú felnıttek körében. 3. trendi: Heineken, Stella, Gösser, ezek azok a sörmárkák,<br />

amelyek igazán trendinek számítanak, termékjellemzıik és személyiségjegyeik alapján méltán kerülnek ebbe a kategóriába. Fontos<br />

megjegyezni, hogy a „férfias” jellemzı és Kıbányai sör lekerültek a térképrıl a jobb átláthatóság kedvéért.


4. KÖVETKEZTET<strong>ÉS</strong>EK<br />

- A kereszttábla-elemzés korlátozott kiválóan alkalmas az asszociációs kapcsolat<br />

vizsgálatára, vagyis két minıségi ismérv közötti összefüggés feltárására, leírására.<br />

A módszer nagy hátránya, hogy mélyebb elemzések elvégzésére nem alkalmas.<br />

Példánkban szignifikáns, de gyenge kapcsolat van az egyes jellemzık és a<br />

sörmárkák között.<br />

- A mélyebb elemzések elvégzésére sokkal alkalmasabb módszer a korrespondencia<br />

elemzés, amely úgy alakítja át az elemzésbe vont kereszttábla sorait és oszlopait,<br />

hogy grafikusan ábrázolható legyen az alacsonyszámú többdimenziós térben.<br />

A gyakorlati példában három kategóriába sorolhatók a fiatalok által leginkább<br />

preferált sörök.<br />

KÖSZÖNETNYILVÁNÍTÁS<br />

Ezúton mondok köszönetet a Miskolci Egyetem, Marketing Intézet hallgatóinak,<br />

Farkas Zsuzsannának, Firtkó Juditnak, Forgács Andrásnak, Gömöri Beátának, Jakab<br />

Zoltánnak, Kalina Juditnak, Kohlmáyer Fanninak, Lieber Nórának, Tóth Nórának,<br />

Simon Tündének, és Kása Richárdnak, a Miskolci Egyetem, Vezetéstudományi<br />

Intézet Ph.D. hallgatójának az adatgyőjtés, valamint Kalina Juditnak az adatrögzítés<br />

terén nyújtott önzetlen segítségéért.<br />

IRODALOMJEGYZÉK<br />

[1] BERECZKINÉ F. E. – HAVRILÓ A. – MOLNÁR L. – PISKÓTI I. –<br />

SCHUPLER H.: A fiatalok életstílusának, alkohol- és sörfogyasztási szokásának<br />

kvalitatív vizsgálata – Szakértıi jelentés a Borsodi Sörgyár Rt. részére,<br />

Miskolc, 2007<br />

[2] BOLLA M. – KRÁMLI A.: Statisztikai következtetések elmélete, Budapest,<br />

Typotex Kiadó, 2005<br />

[3] FÜSTÖS L. – KOVÁCS E. – MESZÉNA GY. – SIMONNÉ M. N.:<br />

Alakfelismerés – Sokváltozós statisztikai módszerek, Budapest, Új Mandátum<br />

Könyvkiadó, 2004<br />

[4] GREENACRE, M. J.: Theory and applications of correspondence analysis,<br />

Academic Press, London, 1984<br />

[5] HAJDU O.: Többváltozós statisztikai számítások, Budapest, Központi<br />

Statisztikai Hivatal, 2003<br />

[6] HÓDOSI L. – KÓSA Á. – KULCSÁR I. – MOLNÁR L. – SZIVÓS J.:<br />

Kvantitatív kutatás a Dreher Sörgyárak Rt. részére, Miskolc, 2004<br />

[7] KETSKEMÉTY L. – IZSÓ L.: Bevezetés az SPSS programrendszerbe,<br />

Budapest, ELTE Eötvös Kiadó, 2005<br />

[8] MALHOTRA, N. K.: Marketingkutatás, Budapest, KJK-KERSZÖV Jogi és<br />

Üzleti Kiadó, 2002<br />

[9] SPSS Inc.: SPSS Categories, Chicago, 2005<br />

[10] VERES Z. – HOFFMANN M. – KOZÁK Á.: Bevezetés a piackutatásba,<br />

Budapest, Akadémiai Kiadó, Budapest, 2006

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!