09.09.2014 Views

Adatok statisztikai feldolgozása

Adatok statisztikai feldolgozása

Adatok statisztikai feldolgozása

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Adatok</strong> <strong>statisztikai</strong> feldolgozása<br />

Kaszaki József Ph.D<br />

Szegedi Tudományegyetem<br />

Sebészeti Műtéttani Intézet<br />

Szeged


A mérési adatok kiértékelése,<br />

<strong>statisztikai</strong> analízis<br />

A mért adatok konvertálása adatbázis kezelőbe<br />

(Excel)<br />

Az adatbázis elkészítése;<br />

Ábra készítés;<br />

Statisztikai analízis<br />

Az adatok eloszlás típusa, eloszlás vizsgálata<br />

Elemszám, átlag/medián, adatok szórása;<br />

Konfidencia intervallum; Szignifikancia szint; P érték;


5. A mérési adatok kiértékelése,<br />

<strong>statisztikai</strong> analízis<br />

1. A mért adatok konvertálása adatbázis kezelőbe (Excel)<br />

2. Az adatbázis elkészítése;<br />

3. Ábra készítés;<br />

4. Statisztikai analízis<br />

Van kis hazugság<br />

Van nagy hazugság<br />

és a STATISZTIKA


5. Statisztikai analízis<br />

Az adatok jellemzői: eloszlás, átlag v. medián, szórás;<br />

Konfidencia (megbízhatósági) intervallum: amely (általában) nagy<br />

valószínűséggel tartalmazza a becsült paraméter valódi értékét;<br />

Szignifikancia szint → P érték: a <strong>statisztikai</strong> valószínűség értéke;<br />

Statisztikailag szignifikáns különbségről beszélünk, (P =


Az adatok eloszlása<br />

Eloszlás vizsgálat


Normális eloszlás<br />

Gaus görbe<br />

Szórás azonosság<br />

Átlag ±SD<br />

Paraméteres <strong>statisztikai</strong> próbák<br />

-SD<br />

Átlag<br />

+SD


Nem normális eloszlás<br />

Torzult Gaus görbe<br />

Nincs szórás azonosság<br />

Medián (25%; 75%)<br />

Nem-Paraméteres <strong>statisztikai</strong><br />

próbák<br />

Medián<br />

25% átlag<br />

75%


Eloszlás vizsgálat módszere:<br />

A szórás azonosság vizsgálata, F próba<br />

Eloszlás vizsgálat eredménye:<br />

A/ Szórás azonosság fennáll:<br />

Paraméteres eloszlás (Gausz görbe)<br />

Paraméteres <strong>statisztikai</strong> próbák<br />

B/ Nincs szórás azonosság:<br />

Nem-paraméteres eloszlás (torz Gausz görbe)<br />

Nem-Paraméteres <strong>statisztikai</strong> próbák


A közép és a szóródás<br />

jellemzőinek „párosítása”<br />

Közép<br />

Átlag<br />

Medián<br />

Szóródás<br />

Standard deviáció,<br />

Standard error<br />

Min, max<br />

5%-os, 95%-os<br />

percentilis<br />

25 % , 75% (Kvartilisek)<br />

Közlés<br />

cikkekben<br />

Átlag (SD)<br />

Átlag ± SD<br />

Átlag ± SE<br />

Átlag ± SEM<br />

Med (min, max)<br />

Med (25.p,75.p)


SD vagy SE?<br />

• 55.2 ± 15.7 (SD)<br />

• 55.2±1.57 (SE, n=100)<br />

0.26<br />

0.24<br />

0.22<br />

0.20<br />

0.18<br />

0.16<br />

0.14<br />

0.12<br />

0.10<br />

0.08<br />

0.06<br />

0.04<br />

0.02<br />

Probability Density Function<br />

y=normal(x;52.2;1.57)<br />

1.0<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0.00<br />

20 40 60 80<br />

0.0<br />

23.8<br />

86.6<br />

52.2 55.34<br />

Ebben az intervallumban van<br />

az adatok 95.44%-a<br />

Ebben az intervallumban van<br />

az igazi átlag 95%-os valószínűséggel<br />

1. Leíró statisztika


Standard deviáció vagy<br />

standard error??<br />

• Standard deviáció, SD: a minta szórása, a<br />

mintaadatok szóródása az átlag körül.<br />

Normális eloszlás esetén az átlag ±2SD-n belül<br />

van az adatok kb. 95%-a<br />

• Standard error (SE=SD/√n): az átlag<br />

megbízhatósága, a mintaátlag szóródása az<br />

(ismeretlen) populáció átlag körül.<br />

Normális eloszlás esetén az átlag ± 2SE-n belül<br />

van az igazi átlag kb. 95%-os valószínűséggel.


ml/perc/kg<br />

200<br />

180<br />

Box-plot<br />

ADATOK ÁBRÁZOLÁSA<br />

Szívindex<br />

Pont-vonal<br />

Átlag+SD<br />

Medián+25%,75%<br />

160<br />

140<br />

120<br />

100<br />

80<br />

60<br />

Műtét<br />

0 1 2 3<br />

Idő (óra)<br />

Műtét<br />

0 1 2 3 4<br />

Idő (óra)


Ábrázolás: Medián érték 25.-75. percentilissel<br />

CVP (Hgmm)<br />

10<br />

8<br />

Kolloid<br />

Krisztalloid<br />

x<br />

*<br />

*<br />

x<br />

*<br />

x<br />

*<br />

x<br />

x<br />

6<br />

4<br />

2<br />

0<br />

50 50 100 100 150 150<br />

-15 0 15 30 45 60 75 90 105<br />

Idő (perc)


Ábrázolás: Átlag érték SD-val<br />

Szívindex (ml/perc/m 2 )<br />

5,0<br />

4,5<br />

4,0<br />

Kolloid<br />

Krisztalloid<br />

*<br />

*<br />

*<br />

*<br />

*<br />

X<br />

*<br />

*<br />

3,5<br />

3,0<br />

50 50 100 100 150 150<br />

-15 0 15 30 45 60 75 90 105<br />

Idő (perc)


A KONTROL I.<br />

Mit tekintünk kontrollnak? Mit viszonyítunk mihez?<br />

A kontrollnak azt az állapotot kell tükröznie, amelyhez képest egy<br />

beavatkozás következtében fellépő változás mértéke<br />

meghatározható<br />

Kontroll érték (baseline) → normál körülmények között, a<br />

tervezett beavatkozás előtt mért érték → ön-kontrollos kísérlet<br />

Baseline.<br />

0 60 90 150 240 min<br />

Hemorrhagic shock 60 min<br />

Resuscitation<br />

Az ön-kontroll nem mindig adekvált. Hosszabb időtartamú<br />

vizsgálatok esetében számos tényező (pl. altatás) befolyásolhat.<br />

Ezért beavatkozás nélküli, önálló kontroll csoportra van szükség<br />

→ ál-műtött (ál-kezelt) csoport.


A KONTROL II.<br />

Ha egy kórállapotot befolyásoló farmakológiai kezelés<br />

hatékonyságát vizsgáljuk<br />

A kezelés hatását egy negatív és egy pozitív<br />

kontroll csoport adataihoz hasonlítjuk<br />

Negatív kontroll → olyan állapot, amelyben a<br />

vizsgált paraméterek változása minimális →<br />

nincs intervenció;<br />

Pozitív kontroll → olyan állapot, amely során a<br />

vizsgált paraméterek maximális mértékű<br />

változását hozzuk létre →maximal intervenció;


Pl.: Ha kísérletes pleuritis hatását vizsgáljuk a thorakális leukocyta<br />

szám változására:<br />

Negatív kontroll = ál-műtét, kórállapot okozása nélkül (NINCS<br />

pleuritis);<br />

Pozitív kontroll: Kísérletesen indukált pleuritis (carrageenan injekció).<br />

Leukocytes/ml<br />

X<br />

8000<br />

6000<br />

4000<br />

#<br />

#<br />

2000<br />

0<br />

Control Pleuritis Pleuritis Pleuritis<br />

+ASA +PE food


A kísérleti CSOPORTOK<br />

Kontroll: pozitív, negatív, ál-műtött;<br />

Előkezelt (pl. gyógyszeresen);<br />

Kezelt (a már indukált folyamat közben);<br />

Kísérleti beavatkozásnak (pl. sebészi) kitett;<br />

etc.


A kísérleti PROTOKOL<br />

A kísérlet periódusainak egymást szigorú időrendben<br />

követő sorozata, amely általában a kontroll, az intervenció<br />

és a megfigyelés periódusaiból áll.<br />

Szigorú, előre meghatározott időrendben elvégzett mérések,<br />

mintavételezések sorozata.<br />

• Kontroll / baseline<br />

• A kísérletes intervenció<br />

sebészi;<br />

pathofiziológiai;<br />

farmakológiai (előkezelés/ kezelés hatása)<br />

• A megfigyelési periódus


I/A<br />

A kísérleti PROTOKOL típusai I.<br />

Before and After<br />

Két mérés ugyanazon az egyeden; Beavatkozás ELŐTT és<br />

UTÁNNA.<br />

A statisztika szempontjából → egymástól függő mérések;<br />

I/B<br />

Két csoport összehasonlítása<br />

Csak egy-egy mérés/mintavétel mindkét vizsgált<br />

csoportban;<br />

A két csoport 1-1 (azonos) időpillanatbeli eltérésének<br />

összehasonlítása;<br />

Kontroll – Kezelt csoportok esete;<br />

A statisztika szempontjából → egymástól független<br />

mérések;


I/A<br />

ml/perc/kg<br />

200<br />

180<br />

Egy-egy mérés ugyanazon az egyeden;<br />

a beavatkozás ELŐTT és UTÁNA<br />

Szívindex<br />

Átlag+SD<br />

Medián+25%,75%<br />

160<br />

140<br />

120<br />

100<br />

80<br />

60<br />

Műtét<br />

0 1 2 3<br />

Idő (óra)<br />

Műtét<br />

0 1 2 3 4<br />

Idő (óra)


I/B Egy-egy mérés a mindkét vizsgálati<br />

csoportban, ugyanazon időpontban<br />

Kontroll – Kezelt csoportok esete;<br />

mU/mg protein/perc<br />

Miafrancáz Aktivitás<br />

100<br />

75<br />

50<br />

25<br />

0<br />

Kontroll<br />

csoport<br />

Kezelt<br />

csoport


Folytonos eloszlás<br />

2 minta (mérés)<br />

esetén<br />

Normális eloszlás<br />

Paraméteres próbák<br />

Nem Normális eloszlás<br />

Nem Paraméteres próbák<br />

Független<br />

Függő<br />

Önkontroll<br />

Független<br />

Függő<br />

Önkontroll<br />

Kétmintás t-próba<br />

Unpaired t-test<br />

Egymintás t-próba<br />

Paired t-test<br />

Mann-Whitney teszt<br />

Kétmintás próba<br />

Wilcoxon teszt<br />

Egymintás próba<br />

Két beteg<br />

csoporton<br />

1-1 mérés<br />

Egy beteg<br />

csoporton<br />

2 mérés<br />

Két beteg<br />

csoporton<br />

1-1 mérés<br />

Egy beteg<br />

csoporton<br />

2 mérés


Kettőnél több csoport összehasonlítása<br />

Mintavétel EGY időpontban<br />

Negativ kontroll, Pozítiv kontroll, Kezelt A, Kezelt<br />

B csoportok összehasonlítása;<br />

Speciális eset:<br />

mintavétel ugyanazon az egyed kezelt és nem<br />

kezelt végtagjából


3.6. A kísérleti PROTOKOL típusai II.<br />

Kettőnél több csoport összehasonlítása<br />

mU/mg protein/min<br />

80<br />

60<br />

*<br />

X<br />

* X<br />

Sham<br />

I/R+Saline<br />

I/R+GEL<br />

I/R+HES<br />

40<br />

20<br />

0<br />

Ischemic limb<br />

Control limb<br />

*<br />

P


Kettő csoport összehasonlítása DE<br />

mintavétel a beavatkozás előtt és után is<br />

történik<br />

KÉT csoport → 2-2 mérés


DEGRANULÁLT LT HÍZÓSEJTEK<br />

H<br />

ARÁNYA<br />

VÉKONYBÉL L XANTHIN<br />

OXIDÁZ<br />

ENZIMAKTIVITÁS<br />

Degranulált hízósejt / Összes hízósejt (%)<br />

pmol/perc -1 /mg protein -1<br />

18<br />

80<br />

60<br />

SBTX<br />

SBTX+IPC<br />

*<br />

*<br />

* #<br />

16<br />

14<br />

12<br />

10<br />

SBTX<br />

SBTX+IPC<br />

*<br />

#<br />

40<br />

8<br />

6<br />

20<br />

4<br />

0<br />

IPC<br />

Hideg ischaemia<br />

-180 -120 -60 0 180 240<br />

Idő (perc)<br />

2<br />

0<br />

IPC<br />

Hideg ischaemia<br />

-180 -120 -60 0 180 240<br />

Idő (perc)


A kísérleti PROTOKOL típusai III.<br />

Ismételt (kettőnél több) mérések esete<br />

egy csoportban<br />

Kettőnél több mérést/mintavételt végzünk<br />

ugyanazon az egyeden, meghatározott időrend<br />

szerint. A vizsgált paraméter változását a<br />

kiindulási kontroll (baseline) értékhez hasonlítjuk;<br />

Baseline.<br />

0 60 90 150 240 min<br />

Hemorrhagic shock 60 min<br />

Resuscitation<br />

Statisztika szempontjából → Egymástól függő mérések


Kettő csoport összehasonlítása,<br />

ismételt, 2-nél TÖBB mintavételezéssel<br />

KÉT csoport → n - n mérés<br />

n>2


CARDIAC OUTPUT<br />

MESENTERIC BLOOD<br />

FLOW<br />

200<br />

CObw (ml/min/kg)<br />

SMA blood flow (ml/min/kg)<br />

SBTX<br />

175<br />

150<br />

125<br />

100<br />

#<br />

*<br />

*<br />

#<br />

25<br />

20<br />

15<br />

SBTX+IPC<br />

#<br />

#<br />

*<br />

75<br />

50<br />

25<br />

0<br />

IPC<br />

SBTX<br />

SBTX+IPC<br />

Cold Ischemia<br />

* * * *<br />

-180 -120 -60 0 60 120 180 240<br />

Time (min)<br />

10<br />

5<br />

0<br />

IPC<br />

Cold Ischemia<br />

-180 -120 -60 0 60 120 180 240<br />

Time (min)<br />

*<br />

* * *


Ismételt mérések:<br />

Mérések a Kontroll periódus (baseline), a<br />

Beavatkozás (sebészi, farmakológiai) és<br />

a Megfigyelési periódus alatt,<br />

meghatározott időrendben;<br />

Több csoportban - 2-nél TÖBB mérés


A kísérleti PROTOKOL típusai IV.<br />

Ismételt mérések kettőnél több csoportban<br />

1. Vérzéses shock + zselatin (max. 50 ml/kg) (n=5)<br />

0 60 90 150 240 perc<br />

MAP 45 Hgmm 60 perc<br />

Kontroll.<br />

2. Vérzéses shock + hidroxietil-keményítő (max. 50 ml/kg) (n=5)<br />

0 60 90 150 240 perc<br />

MAP 45 Hgmm 60 perc<br />

Kontroll<br />

3. Vérzéses shock + dextrán (max. 50 ml/kg) (n=5)<br />

0 60 90 150 240 perc<br />

MAP 45 Hgmm 60 perc<br />

Kontroll<br />

Statisztika szempontjából:<br />

Egymástól függő mérések → csoporton belül;<br />

Egymástól független mérések → csoportok között;


fmol/mL<br />

12<br />

Plasma Endothelin Level<br />

*<br />

10<br />

8<br />

6<br />

4<br />

Gelatine<br />

HES<br />

Dextran<br />

#<br />

*<br />

*<br />

*<br />

* *<br />

*<br />

2<br />

0<br />

*<br />

Hemorrhagic shock<br />

Volume resuscitation<br />

0 30 60 90 120 150 180 210 240<br />

Time (min)<br />

P


Szignifikancia<br />

• Szignifikáns a különbség – ha azt mondjuk, hogy van hatás, az<br />

esetleges hibanagysága kicsi (maximum α). Ez az ún. első fajta<br />

hiba.<br />

• Nem szignifikáns a különbség – ilyenkor csak annyit tudunk<br />

mondani, hogy nincs elegendő információ a különbség<br />

kimutatására. Lehet, hogy<br />

– Valóban nincs is különbség<br />

– Van különbség, csak kevés volt az elemszám<br />

– Nagy volt a szórás<br />

– Rossz volt a vizsgálati módszer<br />

– …<br />

• A <strong>statisztikai</strong> szignifikanciát mindig át kell gondolni, vajon<br />

biológiai szempontból jelentős-e (előfordul, hogy túl sok<br />

elemszám esetén nagyon kis különbségek is szignifikánsak<br />

staisztikailag)


A hipotézisvizsgálat menete<br />

• Hipotézisek felállítása<br />

– Nullhipotézis: semmi nem történt<br />

– Alternatív hipotézis: valami változás van<br />

• A döntés megbízhatósága (vagy a hiba) rögzítése: α=0.05<br />

• Döntési szabály felállítása (függ: a kísérleti elrendezéstől, α-tól,<br />

az elemszámtól)<br />

• Döntés<br />

• A nullhipotézist elfogadjuk (nincs szignifikáns különbség α<br />

szinten, nincs elegendő információ a különbség (hatás)<br />

kimutatására)<br />

• A nullhipotézist elvetjük, a különbség szignifikáns α%-os<br />

szinten. A tapasztalt különbség nem csupán a véletlen műve,<br />

valami más hatás (kezelés??) is közbejátszott.


Előnyei:<br />

Paraméteres <strong>statisztikai</strong> próbák<br />

Jól megalapozott, „sarkos” matematikára épül;<br />

Az átlag és a szórás ismerete elegendő a <strong>statisztikai</strong> próbák,<br />

elvégzéséhez, tehát nem a teljes adathalmazzal kell<br />

dolgozni;<br />

A paraméteres próbák erősebbek, ha a feltételek teljesülnek<br />

A próbák robusztusak- feltételeik kisebb megsértése esetén<br />

még érvényesek maradnak<br />

„Hátrány”:<br />

Ábrázolás esetén a feltüntetett szórás (± SD) mindig<br />

nagyobb, mint a nem-paraméteres eloszlásnál használt 25-<br />

75 percentilis


Rangszámok készítése<br />

• 1 2 4 1<br />

• Sorba állítjuk az adatokat: 1 1 2 4<br />

• A legkisebb kapja az 1-es rangszámot, a<br />

legnagyobb az n-et: 1 2 3 4<br />

• Korrekció (kapcsolt rangok): az egyenlő<br />

elemek rangszámait korrigáljuk a<br />

megfelelő rangok átlagával: 1.5 1.5 3 4


A próbastatisztika általában<br />

valamilyen rangszámösszeg<br />

• Önkontrollos kísérlet: a különbségeket<br />

rangsoroljuk előjeltől függetlenül (a 0-kat<br />

kihagyjuk), majd az egyenlő előjelűeket<br />

összeadjuk<br />

• Független minták: a minták adatait egyesítjük,<br />

így készítjük el a rangssort, majd összeadjuk<br />

külön az egyik, külön a másik mintűhoz tartoó<br />

rangszámokat.<br />

• Ha igaz a nullhipotézis, a rangszámösszegek kb.<br />

megegyeznek


Előnyei:<br />

Nem-paraméteres <strong>statisztikai</strong> próbák<br />

A szórás ábrázolása esetén (25-75 percentilis) általában<br />

kisebb szórást mutat, mint a ±SD;<br />

Hátrányai:<br />

Az átlag és a szórás ismerete NEM elegendő a <strong>statisztikai</strong><br />

próbák elvégzéséhez, mindig a teljes adathalmazzal kell<br />

dolgozni;<br />

Kevésbé kidolgozott a matematikája, különösen a több<br />

szempontos, ismételt mérések esetére


Nem paraméteres próbák<br />

• Akkor alkalmazzuk, ha<br />

– A paraméteres próbák feltételei nem teljesülnek<br />

– Nem tudjuk ellenőrizni (kis elemszám)<br />

– Nem akarjuk ellenőrizni<br />

– Ordinális változók (mennyire örülök a tavasznak??? Kicsitközepesen-nagyon)<br />

• NEM HASZNÁLHATOK ÁTLAGOT ÉS SZÓRÁST!!<br />

• A fiziológiai paraméterek gyakrabban mutatnak nem<br />

normális eloszlást;


Normális eloszlás<br />

Paraméteres próbák<br />

Folytonos eloszlás<br />

Kettőnél több minta<br />

(mérés) esetén<br />

Nem Normális eloszlás<br />

Nem Paraméteres próbák<br />

Független Függő Független Függő<br />

Kettőnél több<br />

Csoport össze-<br />

Hasonlítása<br />

Egy v. több szempontos<br />

Variancia<br />

analízis<br />

Önkontroll +<br />

Ismételt mérések<br />

Variancia analízis<br />

Kettőnél több<br />

Csoport össze-<br />

Hasonlítása<br />

Kruskal-Wallis<br />

próba<br />

Önkontroll +<br />

Ismételt mérések<br />

Friedmann próba<br />

Az adatok szignifikanciája esetén:<br />

Páronkénti összehasonlítás:<br />

Dunnett, LSD, Tukey, Scheffé<br />

Az adatok szignifikanciája esetén:<br />

Páronkénti összehasonlítás:<br />

Dunn; Dunnett;<br />

3 v. több beteg<br />

csoporton 1-1<br />

mérés<br />

Egy beteg csoporton<br />

3, v. több ismételt<br />

mérés<br />

3 v. több beteg<br />

csoporton 1-1<br />

mérés<br />

Egy beteg csoporton<br />

3, v. több ismételt<br />

mérés

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!