2.cvičení 01.03.2013

nb.vse.cz
  • No tags were found...

2.cvičení 01.03.2013

Lenka BlažkováDoplňkový materiál ke cvičení ze 4ST201.


Průměr versus mediánTabulky četnostíGrafy v Excelu: Histogram, výsečový graf,polygon četností, …Míry variability a jejich výpočetKrabicový graf


Ideální situace je, když obě míry polohyvyjdou podobně (měří v podstatě to samé).Dáváme přednost průměru (protože sepoužívá v parametrických testech, které majívětší sílu než testy neparametrické). Pokud se významně liší, znamená topřítomnost odlehlých či extrémních hodnot.Medián je vůči takovým pozorovánímrobustnější a proto má lepší vlastnosti.


Absolutní četnosti n i kumulativní: n 1 +n 2 +...+n k Relativní četnosti p i =n i /n kumulativní: p 1 +p 2 +...+p kčetnostkumulativníčetnostrelativníčetnostkumulativnírel. četnostAB 3 3 =3/37=0.08 0.08B 15 18 =15/37=0.41 0.490 12 30 =12/37=0.32 0.81A 7 37 =7/37=0.19 1.00


Používají se zejména pro kategorické veličiny Pokud je vytváříme pro spojitou proměnnou,rozdělíme hodnoty, kterých tato proměnnánabývá, na intervaly a četnosti počítáme protyto intervaly(pro spojité proměnné je pravděpodobnost, ževýběr bude některou hodnotu obsahovat více nežjednou, nulová. Bez dělení na intervaly bychomdostali tabulku s mnoha řádky, kde jsou jednotlivéhodnoty, z nichž každá byla pozorována většinoujen jedenkrát…)


Spojnicový graf▪ osa x: hodnoty sledovaného znaku▪ osa y: počty případůSkupina20151050AB B 0 A


Krevní skupinyAB B 0 A8%19%41%32%• Má smysl, když součet je100% (nastane vždy právějedna z danýchmožností).• Je méně přehledný nežhistogram (velikost úhluse posuzuje hůře nežvýška sloupců).• Akceptovatelný přimenším počtu kategorií.


Sloupcový graf1614121086420AB B 0 AŘady1 3 15 12 7Počet případů


Grafický přehled – intervalové rozdělení četností. Zvolímevhodný počet intervalů nebo šířku jednoho intervalu. Ideálnípro spojité proměnné či proměnné s mnoha různýmihodnotami.8Histogram120,00%Četnost7654321100,00%80,00%60,00%40,00%20,00%ČetnostKumul. %08250 10437,5 12625 14812,5 DalšíTřídy0,00%


V excelu není, nicméně je to hojně používanýgraf pro spojité veličiny. Znázorňuje jakpolohu, tak variabilitu dat, odlehlé čiextrémní hodnoty, je vhodný i pro porovnánívíce proměnných.


Lze vybrat, zdachcemevycházet zmediánu apercentilů či zprůměru anásobkusměrodatnéodchylky…


Co je variabilita? Proč potřebujeme variabilitu měřit?


Variabilita je vzájemná odlišnost hodnotsouboru. Dva soubory mohou mít stejnoumíru polohy (průměr, medián, ...), ale mohouse lišit variabilitou (proměnlivostí hodnot).


Měřit variabilitu můžeme s použitím odchylkyjednotlivých pozorování v souboru odprůměrné hodnoty. Proč nepoužíváme pro výpočet variabilitynásledující vzorec?n1∑(x − x)ni1i=


420-2-40 5 10Počítáme-li variabilitu podle vzorce zpředchozího slajdu, vyjde 0, ačkoli hodnoty seod průměru liší. Je proto vhodné vzorecupravit:1n∑n i=1x i− xNaměřenéhodnoty-22-113-3S použitím absolutníhodnoty již vychází celkováprůměrná odchylka odprůměru rovna 12/6=2.Možností, jak měřitvariabilitu, je samozřejměvíc.


Variační rozpětíR=x − x max min(range)2 Rozptyls= ∑ (x−(variance) Výběrový rozptyl(sample variance) Směrodatná odchylka(standard deviation)Xs1n'2Xn∑i=1=i1n −1s Xx)n∑i=12( xi−nebo sX'x)2


Variační koeficientVX=sXx'Xnebo V=s'Xx


Uvažujme známky z pravidelných týdenníchtestů pro dva studenty biologie na gymnáziu: Petr: 1, 2, 4, 2, 2, 4, 1, 1, 3, 4. Jana: 3, 2, 3, 3, 4, 3, 2, 3, 3, 2.Pro oba vypočtěte:1. Průměr2. Variační rozpětí3. Rozptyl a výběrový rozptyl4. Směrodatnou odchylku (i výběrovou)5. Variační koeficient (z obou SD)6. Který student má větší stabilitu hodnocení svého testu?


PetrJanaPrůměr 2.4 2.8Variační rozpětí 3 2Směrodatnáodchylka1.2 0.6Výběrová SD 1.26 0.63Rozptyl 1.44 0.36Výběrový rozptyl 1.6 0.4Variační koeficient 0.5 0.21Výběrový variačníkoeficient0.53 0.23


Původní data∑=−=niiXxxns122)(1 ∑∑==⎟⎟⎟⎟⎞⎜⎜⎜⎜⎛−=niniiiXnxxns12122 1 Absolutní četnostii=n 1 ⎟ ⎠⎜⎝∑∑==−= niiniiiXnnxxs1122)(2111122⎟⎟⎟⎟⎠⎞⎜⎜⎜⎜⎝⎛−=∑∑∑∑====niiniiiniiniiiXnx nnnxs


Relativní četnostis2X=n∑i=1( xi−x)2pis2Xnn22 ⎛ ⎞xipi− ⎜ xipi⎟i= =1 ⎝ i=1⎠= ∑ ∑


Spočítejte rozptyl Petrových známek spoužitím: A) výpočtového tvaru pro původní data, B) výpočtového tvaru pro absolutní četnosti(nejprve vytvořte tabulku četností Petrovýchznámek).


Na druhém stupni ZŠ probíhala soutěž ve sběrupapíru. Procento tříd Počet kg10 % 8 202/5 4 803/20 3 101/20 1 503/10 15 Jaký je průměrný počet kg sběrného papíru natřídu a jaká je směrodatná odchylka (v rámciškoly)?


p i x i x i2x i2 p i x i p i1/10 8 20 672 400 67 240 822/5 4 80 230 400 92 160 1923/20 3 10 96 100 14 415 471/20 1 50 22 500 1 125 83/10 15 225 68 5Σ=1 Σ=175 008 Σ=333Průměr z relativních četností:xn= ∑i=1x i p i=110820+25480+ L+31015=333


p i x i x2i x i2 p i x i p i1/10 8 20 672 400 67 240 822/5 4 80 230 400 92 160 1923/20 3 10 96 100 14 415 471/20 1 50 22 500 1 125 83/10 15 225 68 5Σ=1 Σ=175 008 Σ=333Rozptyl zrelativníchčetností:s2Xnn2= ∑ x − ⎜∑ipii=1i=1=110⎛⎝xi25⎞⎟⎠222820 + 480 + L+15 −pi2=3103332


s2Xnn2 ⎛ ⎞= ∑ x − ⎜∑ipixipi⎟ =i=1 ⎝ i=1 ⎠2 1 2 22 3= 820+480+L+15−33310510= 175008 −110556.25= 64451.2522=Směrodatná odchylka je odmocnina z rozptylu:s X=64451.25=253.87


Jak se změní průměr, rozptyl a směrodatnáodchylka, kdyža) všechny hodnoty v souboru zvýšíme o 5,b) všechny hodnoty v souboru vynásobíme 2.


Jirkovi trvá překlad 1 strany A4 do angličtiny25 minut, Alešovi také 25 minut, Alice, Zuzkaa Petra zvládnou totéž za 20 minut a Janě trvápřeklad 30 minut. Jaká je průměrná rychlostpřekládání textu formátu A4 do anglickéhojazyka?


S použitím vzorců pro výpočet z relativníchčetností spočtěte průměrnou známku zangličtiny s její směrodatnou odchylku: 1 15% 2 30 % 3 40 % 4 10 % 5 5 %


Každý první den v měsíci investor koupil akcievybrané společnosti. Za posledních 6 měsícůprovedl nákupy 10, 15, 10, 25, 30 a 50 kusů akciíza cenu 7 800, 6 500, 6 700, 7 600, 8 000 a 8 100Kč.A. Jaká je průměrná cena za jednu akciinakoupenou v posledním půlroce?B. Jaký je průměrná hodnota, variačnírozmezí, rozptyl a variační poměr objemuinvestic do akcií společnosti, které investorměsíčně podnikne?

More magazines by this user
Similar magazines