Adatok statisztikai feldolgozása
Adatok statisztikai feldolgozása
Adatok statisztikai feldolgozása
Transform your PDFs into Flipbooks and boost your revenue!
Leverage SEO-optimized Flipbooks, powerful backlinks, and multimedia content to professionally showcase your products and significantly increase your reach.
<strong>Adatok</strong> <strong>statisztikai</strong> feldolgozása<br />
Kaszaki József Ph.D<br />
Szegedi Tudományegyetem<br />
Sebészeti Műtéttani Intézet<br />
Szeged
A mérési adatok kiértékelése,<br />
<strong>statisztikai</strong> analízis<br />
A mért adatok konvertálása adatbázis kezelőbe<br />
(Excel)<br />
Az adatbázis elkészítése;<br />
Ábra készítés;<br />
Statisztikai analízis<br />
Az adatok eloszlás típusa, eloszlás vizsgálata<br />
Elemszám, átlag/medián, adatok szórása;<br />
Konfidencia intervallum; Szignifikancia szint; P érték;
5. A mérési adatok kiértékelése,<br />
<strong>statisztikai</strong> analízis<br />
1. A mért adatok konvertálása adatbázis kezelőbe (Excel)<br />
2. Az adatbázis elkészítése;<br />
3. Ábra készítés;<br />
4. Statisztikai analízis<br />
Van kis hazugság<br />
Van nagy hazugság<br />
és a STATISZTIKA
5. Statisztikai analízis<br />
Az adatok jellemzői: eloszlás, átlag v. medián, szórás;<br />
Konfidencia (megbízhatósági) intervallum: amely (általában) nagy<br />
valószínűséggel tartalmazza a becsült paraméter valódi értékét;<br />
Szignifikancia szint → P érték: a <strong>statisztikai</strong> valószínűség értéke;<br />
Statisztikailag szignifikáns különbségről beszélünk, (P =
Az adatok eloszlása<br />
Eloszlás vizsgálat
Normális eloszlás<br />
Gaus görbe<br />
Szórás azonosság<br />
Átlag ±SD<br />
Paraméteres <strong>statisztikai</strong> próbák<br />
-SD<br />
Átlag<br />
+SD
Nem normális eloszlás<br />
Torzult Gaus görbe<br />
Nincs szórás azonosság<br />
Medián (25%; 75%)<br />
Nem-Paraméteres <strong>statisztikai</strong><br />
próbák<br />
Medián<br />
25% átlag<br />
75%
Eloszlás vizsgálat módszere:<br />
A szórás azonosság vizsgálata, F próba<br />
Eloszlás vizsgálat eredménye:<br />
A/ Szórás azonosság fennáll:<br />
Paraméteres eloszlás (Gausz görbe)<br />
Paraméteres <strong>statisztikai</strong> próbák<br />
B/ Nincs szórás azonosság:<br />
Nem-paraméteres eloszlás (torz Gausz görbe)<br />
Nem-Paraméteres <strong>statisztikai</strong> próbák
A közép és a szóródás<br />
jellemzőinek „párosítása”<br />
Közép<br />
Átlag<br />
Medián<br />
Szóródás<br />
Standard deviáció,<br />
Standard error<br />
Min, max<br />
5%-os, 95%-os<br />
percentilis<br />
25 % , 75% (Kvartilisek)<br />
Közlés<br />
cikkekben<br />
Átlag (SD)<br />
Átlag ± SD<br />
Átlag ± SE<br />
Átlag ± SEM<br />
Med (min, max)<br />
Med (25.p,75.p)
SD vagy SE?<br />
• 55.2 ± 15.7 (SD)<br />
• 55.2±1.57 (SE, n=100)<br />
0.26<br />
0.24<br />
0.22<br />
0.20<br />
0.18<br />
0.16<br />
0.14<br />
0.12<br />
0.10<br />
0.08<br />
0.06<br />
0.04<br />
0.02<br />
Probability Density Function<br />
y=normal(x;52.2;1.57)<br />
1.0<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
0.00<br />
20 40 60 80<br />
0.0<br />
23.8<br />
86.6<br />
52.2 55.34<br />
Ebben az intervallumban van<br />
az adatok 95.44%-a<br />
Ebben az intervallumban van<br />
az igazi átlag 95%-os valószínűséggel<br />
1. Leíró statisztika
Standard deviáció vagy<br />
standard error??<br />
• Standard deviáció, SD: a minta szórása, a<br />
mintaadatok szóródása az átlag körül.<br />
Normális eloszlás esetén az átlag ±2SD-n belül<br />
van az adatok kb. 95%-a<br />
• Standard error (SE=SD/√n): az átlag<br />
megbízhatósága, a mintaátlag szóródása az<br />
(ismeretlen) populáció átlag körül.<br />
Normális eloszlás esetén az átlag ± 2SE-n belül<br />
van az igazi átlag kb. 95%-os valószínűséggel.
ml/perc/kg<br />
200<br />
180<br />
Box-plot<br />
ADATOK ÁBRÁZOLÁSA<br />
Szívindex<br />
Pont-vonal<br />
Átlag+SD<br />
Medián+25%,75%<br />
160<br />
140<br />
120<br />
100<br />
80<br />
60<br />
Műtét<br />
0 1 2 3<br />
Idő (óra)<br />
Műtét<br />
0 1 2 3 4<br />
Idő (óra)
Ábrázolás: Medián érték 25.-75. percentilissel<br />
CVP (Hgmm)<br />
10<br />
8<br />
Kolloid<br />
Krisztalloid<br />
x<br />
*<br />
*<br />
x<br />
*<br />
x<br />
*<br />
x<br />
x<br />
6<br />
4<br />
2<br />
0<br />
50 50 100 100 150 150<br />
-15 0 15 30 45 60 75 90 105<br />
Idő (perc)
Ábrázolás: Átlag érték SD-val<br />
Szívindex (ml/perc/m 2 )<br />
5,0<br />
4,5<br />
4,0<br />
Kolloid<br />
Krisztalloid<br />
*<br />
*<br />
*<br />
*<br />
*<br />
X<br />
*<br />
*<br />
3,5<br />
3,0<br />
50 50 100 100 150 150<br />
-15 0 15 30 45 60 75 90 105<br />
Idő (perc)
A KONTROL I.<br />
Mit tekintünk kontrollnak? Mit viszonyítunk mihez?<br />
A kontrollnak azt az állapotot kell tükröznie, amelyhez képest egy<br />
beavatkozás következtében fellépő változás mértéke<br />
meghatározható<br />
Kontroll érték (baseline) → normál körülmények között, a<br />
tervezett beavatkozás előtt mért érték → ön-kontrollos kísérlet<br />
Baseline.<br />
0 60 90 150 240 min<br />
Hemorrhagic shock 60 min<br />
Resuscitation<br />
Az ön-kontroll nem mindig adekvált. Hosszabb időtartamú<br />
vizsgálatok esetében számos tényező (pl. altatás) befolyásolhat.<br />
Ezért beavatkozás nélküli, önálló kontroll csoportra van szükség<br />
→ ál-műtött (ál-kezelt) csoport.
A KONTROL II.<br />
Ha egy kórállapotot befolyásoló farmakológiai kezelés<br />
hatékonyságát vizsgáljuk<br />
A kezelés hatását egy negatív és egy pozitív<br />
kontroll csoport adataihoz hasonlítjuk<br />
Negatív kontroll → olyan állapot, amelyben a<br />
vizsgált paraméterek változása minimális →<br />
nincs intervenció;<br />
Pozitív kontroll → olyan állapot, amely során a<br />
vizsgált paraméterek maximális mértékű<br />
változását hozzuk létre →maximal intervenció;
Pl.: Ha kísérletes pleuritis hatását vizsgáljuk a thorakális leukocyta<br />
szám változására:<br />
Negatív kontroll = ál-műtét, kórállapot okozása nélkül (NINCS<br />
pleuritis);<br />
Pozitív kontroll: Kísérletesen indukált pleuritis (carrageenan injekció).<br />
Leukocytes/ml<br />
X<br />
8000<br />
6000<br />
4000<br />
#<br />
#<br />
2000<br />
0<br />
Control Pleuritis Pleuritis Pleuritis<br />
+ASA +PE food
A kísérleti CSOPORTOK<br />
Kontroll: pozitív, negatív, ál-műtött;<br />
Előkezelt (pl. gyógyszeresen);<br />
Kezelt (a már indukált folyamat közben);<br />
Kísérleti beavatkozásnak (pl. sebészi) kitett;<br />
etc.
A kísérleti PROTOKOL<br />
A kísérlet periódusainak egymást szigorú időrendben<br />
követő sorozata, amely általában a kontroll, az intervenció<br />
és a megfigyelés periódusaiból áll.<br />
Szigorú, előre meghatározott időrendben elvégzett mérések,<br />
mintavételezések sorozata.<br />
• Kontroll / baseline<br />
• A kísérletes intervenció<br />
sebészi;<br />
pathofiziológiai;<br />
farmakológiai (előkezelés/ kezelés hatása)<br />
• A megfigyelési periódus
I/A<br />
A kísérleti PROTOKOL típusai I.<br />
Before and After<br />
Két mérés ugyanazon az egyeden; Beavatkozás ELŐTT és<br />
UTÁNNA.<br />
A statisztika szempontjából → egymástól függő mérések;<br />
I/B<br />
Két csoport összehasonlítása<br />
Csak egy-egy mérés/mintavétel mindkét vizsgált<br />
csoportban;<br />
A két csoport 1-1 (azonos) időpillanatbeli eltérésének<br />
összehasonlítása;<br />
Kontroll – Kezelt csoportok esete;<br />
A statisztika szempontjából → egymástól független<br />
mérések;
I/A<br />
ml/perc/kg<br />
200<br />
180<br />
Egy-egy mérés ugyanazon az egyeden;<br />
a beavatkozás ELŐTT és UTÁNA<br />
Szívindex<br />
Átlag+SD<br />
Medián+25%,75%<br />
160<br />
140<br />
120<br />
100<br />
80<br />
60<br />
Műtét<br />
0 1 2 3<br />
Idő (óra)<br />
Műtét<br />
0 1 2 3 4<br />
Idő (óra)
I/B Egy-egy mérés a mindkét vizsgálati<br />
csoportban, ugyanazon időpontban<br />
Kontroll – Kezelt csoportok esete;<br />
mU/mg protein/perc<br />
Miafrancáz Aktivitás<br />
100<br />
75<br />
50<br />
25<br />
0<br />
Kontroll<br />
csoport<br />
Kezelt<br />
csoport
Folytonos eloszlás<br />
2 minta (mérés)<br />
esetén<br />
Normális eloszlás<br />
Paraméteres próbák<br />
Nem Normális eloszlás<br />
Nem Paraméteres próbák<br />
Független<br />
Függő<br />
Önkontroll<br />
Független<br />
Függő<br />
Önkontroll<br />
Kétmintás t-próba<br />
Unpaired t-test<br />
Egymintás t-próba<br />
Paired t-test<br />
Mann-Whitney teszt<br />
Kétmintás próba<br />
Wilcoxon teszt<br />
Egymintás próba<br />
Két beteg<br />
csoporton<br />
1-1 mérés<br />
Egy beteg<br />
csoporton<br />
2 mérés<br />
Két beteg<br />
csoporton<br />
1-1 mérés<br />
Egy beteg<br />
csoporton<br />
2 mérés
Kettőnél több csoport összehasonlítása<br />
Mintavétel EGY időpontban<br />
Negativ kontroll, Pozítiv kontroll, Kezelt A, Kezelt<br />
B csoportok összehasonlítása;<br />
Speciális eset:<br />
mintavétel ugyanazon az egyed kezelt és nem<br />
kezelt végtagjából
3.6. A kísérleti PROTOKOL típusai II.<br />
Kettőnél több csoport összehasonlítása<br />
mU/mg protein/min<br />
80<br />
60<br />
*<br />
X<br />
* X<br />
Sham<br />
I/R+Saline<br />
I/R+GEL<br />
I/R+HES<br />
40<br />
20<br />
0<br />
Ischemic limb<br />
Control limb<br />
*<br />
P
Kettő csoport összehasonlítása DE<br />
mintavétel a beavatkozás előtt és után is<br />
történik<br />
KÉT csoport → 2-2 mérés
DEGRANULÁLT LT HÍZÓSEJTEK<br />
H<br />
ARÁNYA<br />
VÉKONYBÉL L XANTHIN<br />
OXIDÁZ<br />
ENZIMAKTIVITÁS<br />
Degranulált hízósejt / Összes hízósejt (%)<br />
pmol/perc -1 /mg protein -1<br />
18<br />
80<br />
60<br />
SBTX<br />
SBTX+IPC<br />
*<br />
*<br />
* #<br />
16<br />
14<br />
12<br />
10<br />
SBTX<br />
SBTX+IPC<br />
*<br />
#<br />
40<br />
8<br />
6<br />
20<br />
4<br />
0<br />
IPC<br />
Hideg ischaemia<br />
-180 -120 -60 0 180 240<br />
Idő (perc)<br />
2<br />
0<br />
IPC<br />
Hideg ischaemia<br />
-180 -120 -60 0 180 240<br />
Idő (perc)
A kísérleti PROTOKOL típusai III.<br />
Ismételt (kettőnél több) mérések esete<br />
egy csoportban<br />
Kettőnél több mérést/mintavételt végzünk<br />
ugyanazon az egyeden, meghatározott időrend<br />
szerint. A vizsgált paraméter változását a<br />
kiindulási kontroll (baseline) értékhez hasonlítjuk;<br />
Baseline.<br />
0 60 90 150 240 min<br />
Hemorrhagic shock 60 min<br />
Resuscitation<br />
Statisztika szempontjából → Egymástól függő mérések
Kettő csoport összehasonlítása,<br />
ismételt, 2-nél TÖBB mintavételezéssel<br />
KÉT csoport → n - n mérés<br />
n>2
CARDIAC OUTPUT<br />
MESENTERIC BLOOD<br />
FLOW<br />
200<br />
CObw (ml/min/kg)<br />
SMA blood flow (ml/min/kg)<br />
SBTX<br />
175<br />
150<br />
125<br />
100<br />
#<br />
*<br />
*<br />
#<br />
25<br />
20<br />
15<br />
SBTX+IPC<br />
#<br />
#<br />
*<br />
75<br />
50<br />
25<br />
0<br />
IPC<br />
SBTX<br />
SBTX+IPC<br />
Cold Ischemia<br />
* * * *<br />
-180 -120 -60 0 60 120 180 240<br />
Time (min)<br />
10<br />
5<br />
0<br />
IPC<br />
Cold Ischemia<br />
-180 -120 -60 0 60 120 180 240<br />
Time (min)<br />
*<br />
* * *
Ismételt mérések:<br />
Mérések a Kontroll periódus (baseline), a<br />
Beavatkozás (sebészi, farmakológiai) és<br />
a Megfigyelési periódus alatt,<br />
meghatározott időrendben;<br />
Több csoportban - 2-nél TÖBB mérés
A kísérleti PROTOKOL típusai IV.<br />
Ismételt mérések kettőnél több csoportban<br />
1. Vérzéses shock + zselatin (max. 50 ml/kg) (n=5)<br />
0 60 90 150 240 perc<br />
MAP 45 Hgmm 60 perc<br />
Kontroll.<br />
2. Vérzéses shock + hidroxietil-keményítő (max. 50 ml/kg) (n=5)<br />
0 60 90 150 240 perc<br />
MAP 45 Hgmm 60 perc<br />
Kontroll<br />
3. Vérzéses shock + dextrán (max. 50 ml/kg) (n=5)<br />
0 60 90 150 240 perc<br />
MAP 45 Hgmm 60 perc<br />
Kontroll<br />
Statisztika szempontjából:<br />
Egymástól függő mérések → csoporton belül;<br />
Egymástól független mérések → csoportok között;
fmol/mL<br />
12<br />
Plasma Endothelin Level<br />
*<br />
10<br />
8<br />
6<br />
4<br />
Gelatine<br />
HES<br />
Dextran<br />
#<br />
*<br />
*<br />
*<br />
* *<br />
*<br />
2<br />
0<br />
*<br />
Hemorrhagic shock<br />
Volume resuscitation<br />
0 30 60 90 120 150 180 210 240<br />
Time (min)<br />
P
Szignifikancia<br />
• Szignifikáns a különbség – ha azt mondjuk, hogy van hatás, az<br />
esetleges hibanagysága kicsi (maximum α). Ez az ún. első fajta<br />
hiba.<br />
• Nem szignifikáns a különbség – ilyenkor csak annyit tudunk<br />
mondani, hogy nincs elegendő információ a különbség<br />
kimutatására. Lehet, hogy<br />
– Valóban nincs is különbség<br />
– Van különbség, csak kevés volt az elemszám<br />
– Nagy volt a szórás<br />
– Rossz volt a vizsgálati módszer<br />
– …<br />
• A <strong>statisztikai</strong> szignifikanciát mindig át kell gondolni, vajon<br />
biológiai szempontból jelentős-e (előfordul, hogy túl sok<br />
elemszám esetén nagyon kis különbségek is szignifikánsak<br />
staisztikailag)
A hipotézisvizsgálat menete<br />
• Hipotézisek felállítása<br />
– Nullhipotézis: semmi nem történt<br />
– Alternatív hipotézis: valami változás van<br />
• A döntés megbízhatósága (vagy a hiba) rögzítése: α=0.05<br />
• Döntési szabály felállítása (függ: a kísérleti elrendezéstől, α-tól,<br />
az elemszámtól)<br />
• Döntés<br />
• A nullhipotézist elfogadjuk (nincs szignifikáns különbség α<br />
szinten, nincs elegendő információ a különbség (hatás)<br />
kimutatására)<br />
• A nullhipotézist elvetjük, a különbség szignifikáns α%-os<br />
szinten. A tapasztalt különbség nem csupán a véletlen műve,<br />
valami más hatás (kezelés??) is közbejátszott.
Előnyei:<br />
Paraméteres <strong>statisztikai</strong> próbák<br />
Jól megalapozott, „sarkos” matematikára épül;<br />
Az átlag és a szórás ismerete elegendő a <strong>statisztikai</strong> próbák,<br />
elvégzéséhez, tehát nem a teljes adathalmazzal kell<br />
dolgozni;<br />
A paraméteres próbák erősebbek, ha a feltételek teljesülnek<br />
A próbák robusztusak- feltételeik kisebb megsértése esetén<br />
még érvényesek maradnak<br />
„Hátrány”:<br />
Ábrázolás esetén a feltüntetett szórás (± SD) mindig<br />
nagyobb, mint a nem-paraméteres eloszlásnál használt 25-<br />
75 percentilis
Rangszámok készítése<br />
• 1 2 4 1<br />
• Sorba állítjuk az adatokat: 1 1 2 4<br />
• A legkisebb kapja az 1-es rangszámot, a<br />
legnagyobb az n-et: 1 2 3 4<br />
• Korrekció (kapcsolt rangok): az egyenlő<br />
elemek rangszámait korrigáljuk a<br />
megfelelő rangok átlagával: 1.5 1.5 3 4
A próbastatisztika általában<br />
valamilyen rangszámösszeg<br />
• Önkontrollos kísérlet: a különbségeket<br />
rangsoroljuk előjeltől függetlenül (a 0-kat<br />
kihagyjuk), majd az egyenlő előjelűeket<br />
összeadjuk<br />
• Független minták: a minták adatait egyesítjük,<br />
így készítjük el a rangssort, majd összeadjuk<br />
külön az egyik, külön a másik mintűhoz tartoó<br />
rangszámokat.<br />
• Ha igaz a nullhipotézis, a rangszámösszegek kb.<br />
megegyeznek
Előnyei:<br />
Nem-paraméteres <strong>statisztikai</strong> próbák<br />
A szórás ábrázolása esetén (25-75 percentilis) általában<br />
kisebb szórást mutat, mint a ±SD;<br />
Hátrányai:<br />
Az átlag és a szórás ismerete NEM elegendő a <strong>statisztikai</strong><br />
próbák elvégzéséhez, mindig a teljes adathalmazzal kell<br />
dolgozni;<br />
Kevésbé kidolgozott a matematikája, különösen a több<br />
szempontos, ismételt mérések esetére
Nem paraméteres próbák<br />
• Akkor alkalmazzuk, ha<br />
– A paraméteres próbák feltételei nem teljesülnek<br />
– Nem tudjuk ellenőrizni (kis elemszám)<br />
– Nem akarjuk ellenőrizni<br />
– Ordinális változók (mennyire örülök a tavasznak??? Kicsitközepesen-nagyon)<br />
• NEM HASZNÁLHATOK ÁTLAGOT ÉS SZÓRÁST!!<br />
• A fiziológiai paraméterek gyakrabban mutatnak nem<br />
normális eloszlást;
Normális eloszlás<br />
Paraméteres próbák<br />
Folytonos eloszlás<br />
Kettőnél több minta<br />
(mérés) esetén<br />
Nem Normális eloszlás<br />
Nem Paraméteres próbák<br />
Független Függő Független Függő<br />
Kettőnél több<br />
Csoport össze-<br />
Hasonlítása<br />
Egy v. több szempontos<br />
Variancia<br />
analízis<br />
Önkontroll +<br />
Ismételt mérések<br />
Variancia analízis<br />
Kettőnél több<br />
Csoport össze-<br />
Hasonlítása<br />
Kruskal-Wallis<br />
próba<br />
Önkontroll +<br />
Ismételt mérések<br />
Friedmann próba<br />
Az adatok szignifikanciája esetén:<br />
Páronkénti összehasonlítás:<br />
Dunnett, LSD, Tukey, Scheffé<br />
Az adatok szignifikanciája esetén:<br />
Páronkénti összehasonlítás:<br />
Dunn; Dunnett;<br />
3 v. több beteg<br />
csoporton 1-1<br />
mérés<br />
Egy beteg csoporton<br />
3, v. több ismételt<br />
mérés<br />
3 v. több beteg<br />
csoporton 1-1<br />
mérés<br />
Egy beteg csoporton<br />
3, v. több ismételt<br />
mérés