Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
# 2011 Universiteit van Suid-Afrika<br />
Alle regte voorbehou<br />
Gedruk en uitgegee deur die<br />
Universiteit van Suid-Afrika<br />
Muckleneuk, Pretoria<br />
IOP2601/1/2012±2018<br />
98767631<br />
3B2<br />
IPS Styl
inhoud<br />
Bladsy<br />
Voorwoord iv<br />
AGTERGROND<br />
Studie-eenheid 1 Inleiding tot navorsing en statistiek 2<br />
2 Die taal van statistiek 14<br />
3 Basiese wiskundige berekenings wat in statistiek gebruik<br />
word 25<br />
DATA-VERWERKING: BESKRYWEND<br />
4 Aanbieding van data 31<br />
5 Maatstawwe van sentrale neiging 50<br />
6Maatstawwe van varieerbaarheid 58<br />
7 Korrelasie 67<br />
8 Regressie 82<br />
DATA-VERWERKING: INFERENSIEEL<br />
9 Basiese konsepte van waarskynlikheid 98<br />
10 Die normaalverspreiding 102<br />
11 Steekproefdistribusies en hipotesetoetsing 115<br />
12 Hipotesetoetse vir gemiddeldes: t-toetse 128<br />
13 Hipotesetoetse vir gemiddeldes: eenrigting-variansieontleding 149<br />
14 Die chi-kwadraattoets 168<br />
15 OnderskeidingsvermoeÈ 174<br />
TOEPASSING<br />
16Data-analise: 'n fiktiewe organisasie 181<br />
VERWYSINGS 201<br />
BYLAE: Lys van formules 203<br />
IOP2601/1/2012±2018 iii
voorwoord<br />
Baie welkom by Bedryfsielkundige navorsing, wat 'n tweedevlak-module in<br />
Bedryf- en Organisasiesielkunde aan Unisa is. As dosente in hierdie<br />
kursus hoop ons dat jy die kursus interessant en leersaam sal vind.<br />
Die studiegids is so geskryf dat dit jou aktief by die deurwerk van die<br />
kursusmateriaal betrek. Ons het die materiaal informeel en gemaklik probeer<br />
aanbied dat dit hopelik vir jou lekker sal wees om daarmee te werk!<br />
Die studiemateriaal word in so 'n volgorde aangebied dat dit die proses van<br />
navorsing in die praktyk uiteindelik in 'n sinvolle geheel weerspieeÈ l. 'n<br />
Kursuskaart is saamgestel sodat jy 'n geheelbeeld van die kursus kan kry, en<br />
sodat jy op enige tydstip kan sien met watter deel van die kursus jy besig is en hoe<br />
dit by die res van die kursus inskakel.<br />
Verskillende dosente het die onderskeie studie-eenhede geskryf en jy sal moontlik<br />
verskille in die styl van verskillende studie-eenhede merk. Ons hoop dat dit die<br />
studiemateriaal verder vir jou lewendig en interessant sal maak en jou<br />
bemeestering van die kursusmateriaal sal bevorder.<br />
Doel van hierdie vakkursus _________________________________<br />
Laat ons jou inlig oor die doel van die kursus in navorsingsmetodiek in<br />
Bedryfsielkunde.<br />
Die voltooiing van hierdie kursus behoort jou in staat te stel om<br />
. 'n toereikende woordeskat van statistiek te verwerf om hierdie voorgraadse<br />
kursus met gemak te bespreek. Hierdie woordeskat sal bestaan uit begrippe wat<br />
gesimboliseer word deur woorde en die alfabetiese simbole vir hierdie woorde.<br />
Jy ken waarskynlik al sommige van die simbole vanuit jou vroeeÈ re kennis van<br />
wiskunde.<br />
. jou berekeningsvaardighede te verbeter. 'n Mens leer statistiek die beste deur dit<br />
te doen.<br />
. statistiese gegewens korrek te interpreteer. Statistiese bevindinge wat korrek<br />
geõÈ nterpreteer is, kan hoogs beduidend wees, maar wanvertolking van resultate<br />
is tydmors. Laasgenoemde is dikwels onderliggend aan die skeptiese<br />
iv
opmerkings wat 'n mens hoor, byvoorbeeld dat jy ``enigiets met statistiek kan<br />
bewys''.<br />
. die logika van statistiek te begryp. As jy 'n navorsingsprobleem eers korrek<br />
geformuleer het, is jou stryd halfpad gewonne. Indien 'n mens sou voortgaan<br />
om gegewens in te win sonder om die probleem eers deeglik te oorweeg, kan dit<br />
gebeur dat geen statistiese tegniek gebruik kan word om die inligting sinvol te<br />
verwerk nie. Selfs in die beplanningsfase moet 'n mens deeglik oorweging skenk<br />
aan die statistiese tegnieke wat tydens dataverwerking gebruik gaan word.<br />
. te weet watter statistiese tegnieke op watter data van toepassing is. Onthou, elke<br />
tegniek berus op sy eie stel aannames en reeÈ ls wat streng nagevolg moet word<br />
om geldige resultate te lewer.<br />
Statistiese formules _______________________________________<br />
Hier is goeie nuus:<br />
Jy hoef geen statistiese formule te memoriseer nie! Jy hoef slegs te weet wanneer om<br />
dit te gebruik en hoe om dit reg toe te pas.<br />
In die eksamen kry jy altyd 'n lys van al die formules waarvan jy geleer het soos<br />
wat dit in die bylae aan die einde van hierdie studiegids gegee word. Die volledige<br />
formule word gegee, ook die simbool links van die `` = ''. Al wat jy moet ken, is<br />
die simbole links van die `` = '' in al die formules.<br />
Ikone en wat hulle beteken _________________________________<br />
As jy vinnig deur die studiegids blaai, sal jy sien dat verskillende ikone gebruik<br />
word om bepaalde soorte teks te identifiseer. Hier volg 'n voorbeeld en kort<br />
verduideliking van wat elk van hierdie ikone beteken:<br />
IKOON beteken: AKTIWITEIT<br />
Hierdie ikoon beteken dat jy iets daadwerklik moet doen, byvoorbeeld 'n definisie<br />
herformuleer, vrae beantwoord of berekeninge doen.<br />
'n Aktiwiteit sluit ook die terugvoering in wat ons jou daarop gee en wat jou sal<br />
help om die werk te verstaan.<br />
Doen asseblief die aktiwiteite, ons het dit spesiaal vir jou geskep.<br />
Eerstens kan jy bepaal of jy die werk wat behandel is, ken en verstaan.<br />
Tweedens kan jy dit as 'n mikro-ervaring van 'n werkopdrag- of eksamenvraag<br />
beskou.<br />
IOP2601/1 v
IKOON beteken: WENK<br />
'n Wenk is altyd belangrike inligting wat jou met sekere feite en berekeninge sal<br />
help. Neem deeglik kennis daarvan.<br />
IKOON beteken: TIPIESE REKENAARDRUKSTUK<br />
Dit verwys na 'n afdeling in die voorgeskrewe boek deur Tredoux en Durrheim<br />
(2002) of ons eie voorbeeld van die tipiese rekenaaruitdruk van 'n statistiese<br />
pakket.<br />
Bestudeer dit saam met die addisionele aantekeninge wat op die uitdruk<br />
aangebring is. Met die addisionele aantekeninge wys ons jou waar die spesifieke<br />
statistiese tegniek se eintlike antwoord op die uitdruk gekry word, aangesien sulke<br />
rekenaardrukstukke gewoonlik baie meer inligting bevat as die enkele syfer(s)<br />
waarin jy belangstel.<br />
IKOON beteken: WAT BEHOORT EK NOU TE KAN DOEN?<br />
Aan die einde van elke studie-eenheid word 'n kontrolelys ingesluit. Evalueer<br />
jouself om seker te maak dat jy die doelwitte wat ons vir die studie-eenheid gestel<br />
het, wel bemeester het.<br />
Hoe die voorgeskrewe boek saam met die studiegids gebruik moet word<br />
Hierdie studiegids is presies wat die naam impliseer. Jy gebruik die studiegids as 'n<br />
basis om die voorgeskrewe boek mee te bestudeer. Ons lei jou dus, met verdere<br />
verduidelikings in die studiegids, deur die boek. Moenie die boek sonder die hulp<br />
van die studiegids bestudeer nie.<br />
Navorsingsmetodiek en rekenaars _____________________________<br />
Vandag is die gebruik van die rekenaar by statistiese dataverwerking onmisbaar. Hierdie onderwerp word<br />
onder twee opskrifte behandel, naamlik:<br />
. Tipiese rekenaardrukstukke<br />
. Die internet/Weà reldwye Web (WWW)<br />
Tipiese rekenaardrukstukke<br />
Ons het dit goedgedink om tipiese rekenaardrukstukke by die studiemateriaal in<br />
vi<br />
te sluit om jou 'n idee te gee van die rol wat pakkette vir statistiese data-ontleding<br />
op 'n persoonlike rekenaar speel.<br />
Wanneer nuwe inligting in die vorm van 'n datastel aan jou beskikbaar gestel<br />
word, moet jy weet watter statistiese berekeninge om te doen, dit wil seà watter
statistieke om te bereken en ook hoe om dit te doen, hoe om die inligting uit die<br />
datastel te onttrek om dit te verstaan. In die oefeninge en werkopdragte gee ons<br />
vir jou oefening in bogenoemde (wat en hoe) deur klein datastelle en eenvoudige<br />
syfers te gebruik. In die praktyk sal jy egter meestal met groot datastelle en meer<br />
komplekse syfers te doen kry. Dan is dit nie meer prakties om self die berekeninge<br />
met 'n sakrekenaar te probeer doen nie ± jy sal BESLIS 'n rekenaar nodig heà . Ons<br />
een doelwit met hierdie kursus is om vir jou te wys hoe om die uitvoer van 'n<br />
sagteware program te lees (selfs al het jy nie toegang tot 'n rekenaar nie).<br />
Die voorgeskrewe boek bevat materiaal wat jou wys hoe om SPSS vir bepaalde<br />
statistiese ontledings te gebruik, maar jy kan ook sagteware soos STATISTICA<br />
gebruik wat uitgebreide ondersteuningsmateriaal op die meegaande CD bevat.<br />
Die voorgeskrewe boek bied ook voorbeelde in Microsoft Excel. Onthou, die doel<br />
met die rekenaardrukstukke is om jou die geleentheid te gee om die uitvoer te lees<br />
en om die verskillende statistiese konsepte daarop te identifiseer en te interpreteer.<br />
Indien jy nie toegang tot 'n rekenaar het nie, sal jy voorbeelde van die belangrikste<br />
rekenaardrukstukke ± wat jy moet kan uitken ± in verskillende studie-eenhede in<br />
die studiegids vind.<br />
Blaai gerus deur die voorgeskrewe boek en soek na voorbeelde van die uitvoer van<br />
'n rekenaarprogram as jy wil weet hoe dit lyk. Voorbeelde hiervan verskyn op<br />
bladsy 175 tot 179 in Tredoux en Durrheim (2002). Jy sal miskien in hierdie<br />
stadium nog nie die uitvoer verstaan nie, aangesien ons nog nie die betrokke<br />
konsepte verduidelik het nie. Ons wil eintlik net heà dat jy moet sien hoe die uitvoer<br />
van 'n program voorgestel word.<br />
Die internet/WeÃreldwye Web (WWW)<br />
Lees die laaste vier reeÈ ls van die voorwoord in Tredoux en Durrheim (2002) se<br />
boek oor die gebruik van die internet.<br />
Indien jy toegang tot die internet het, kan jy dit gerus benut om jou studie van<br />
navorsingsmetodes te verryk. Besoek webtuistes wat statistiese konsepte en<br />
tegnieke op 'n interaktiewe wyse aanbied. Ons kan dit beslis aanbeveel!<br />
Indien jy op die internet kan rondsnuffel, kan jy ook die bykomende hoofstuk op<br />
die CD oor internethulpbronne en gebruike daarvan deurwerk.<br />
Voorspoed! _____________________________________________<br />
Sterkte met jou studie! Ons hoop dat jy hierdie kursus sal geniet en dit wat jy hier<br />
gaan leer in die toekoms in jou werkomgewing sal kan gebruik.<br />
IOP2601/1 vii
viii<br />
Kyk nou baie deeglik na ons kursuskaart op die volgende bladsy.
16 Data-analise:<br />
'n fiktiewe<br />
organisasie<br />
9 Basiese konsepte van<br />
waarskynlikheid<br />
10 Die normaalverspreiding<br />
11 Steekproefdistribusies en<br />
hipotesetoetsing<br />
12 Hipotesetoetse vir gemiddeldes: t-toetse<br />
13 Hipotesetoetse vir gemiddeldes:<br />
eenrigting-variansieontleding<br />
14 Die chi-kwadraattoets<br />
15 OnderskeidingsvermoeÈ<br />
1 Inleiding tot navorsing<br />
en statistiek<br />
2 Die taal van statistiek<br />
3 Basiese wiskundige berekenings<br />
wat in statistiek gebruik word<br />
4 Voorstelling van data<br />
5 Maatstawwe van sentrale neiging<br />
6 Maatstawwe van varieerbaarheid<br />
7 Korrelasie<br />
8 Regressie
1 Inleiding tot navorsing en statistiek<br />
2 Die taal van statistiek<br />
3 Basiese wiskundige berekenings<br />
wat in statistiek gebruik word
1<br />
studie-eenheid een<br />
Inleiding tot navorsing<br />
en statistiek<br />
Studente wonder dikwels waarom die opleiding van voornemende<br />
bedryfsielkundiges 'n kursus in navorsing insluit. Om hierdie vraag te<br />
beantwoord, moet ons eerstens weet wat navorsing behels. Hierdie studieeenheid<br />
stel jou bekend aan navorsing, hoe bedryfsielkundiges navorsing gebruik<br />
en die basiese navorsingsproses. Ons sal ook die spesifieke fokus van hierdie<br />
module ten opsigte van die breeÈ r navorsingsproses verduidelik. Hierdie studieeenheid<br />
sal afsluit met die bekendstelling van ons revolusioneà re navorsingsprojek<br />
wat ons dwarsdeur hierdie studiegids sal ondersoek.<br />
Wat is navorsing? ________________________________________<br />
In 'n onlangse navorsingsveldtog vir 'n internasionale fiksheidsentrum is die<br />
volgende inligting vrygestel:<br />
FIGUUR 1: Advertensieveldtog van 'n internasionale fiksheidsentrum<br />
(Verkry van http:www.virginactive.co.za op 2009/10/30)<br />
bladsy 2 . studie-eenheid 1 inleiding tot navorsing en statistiek
Is dit slegs inligting wat deel van 'n advertensieveldtog uitmaak of kan hierdie<br />
inligting regtig waar wees? Wat as die advertensie gelees het: ``Navorsing het<br />
getoon dat ...'', sou jy dan geglo het dat dit die waarheid is?<br />
Wat beteken die woord navorsing vir jou?<br />
. afdeling 1 agtergrond<br />
................................................................................................................................<br />
................................................................................................................................<br />
................................................................................................................................<br />
................................................................................................................................<br />
Die woord navorsing word dikwels in alledaagse taal en met verskeie betekenisse<br />
op verskillende tye gebruik. Gevolglik bestaan daar dikwels heelwat<br />
wanopvattings daaroor. 'n Voorbeeld hiervan is dat navorsing 'n aktiwiteit is<br />
wat ietwat eksklusief en verwyder van die alledaagse lewe is, of dat navorsers<br />
afsydige individue in wit jasse is wat hulle in laboratoriums met rotte afsonder<br />
(Leedy & Omrod, 2010)!<br />
Maar in werklikheid is navorsing slegs 'n proses waardeur ons vrae kan<br />
beantwoord. Dit is 'n sistematiese proses van die insameling, ontleding en<br />
interpretering van inligting (of data soos dit in navorsingsterme genoem word) om<br />
ons begrip te verbeter van 'n aspek waarin ons belangstel of besorg oor is (Leedy<br />
& Ormrod, 2010).<br />
'n Verdere definisie van navorsing is dat dit 'n sistematiese studie of ondersoek<br />
van verskynsels volgens wetenskaplike beginsels is. Wat beteken dit om 'n<br />
sistematiese studie volgens wetenskaplike beginsels te doen? Dit klink<br />
ingewikkeld. Wat dit in werklikheid beteken is dat jy inligting op so 'n wyse<br />
insamel dat jy bewyse sal heà om te toon dat jou bewerings die waarheid is. Met<br />
ander woorde, jy gebruik spesifieke strategieeÈ en metodes om inligting op so 'n<br />
wyse in te samel dat dit betroubaar en geldig sal wees. Hierdie proses sal jou<br />
daarom in staat stel om aan te toon of die inligting wat in die navorsingsveldtog<br />
wat hierbo aangedui is in werklikheid 'n akkurate weerspieeÈ ling is. Navorsing help<br />
ons daarom om inligting op so 'n wyse in te samel dat ons die waarheid of selfs<br />
nuwe kennis kan ontdek.<br />
Maar selfs al weet jy van hierdie inligting kan jy dalk steeds wonder waar<br />
navorsing in die veld van Bedryfsielkunde inpas.<br />
Navorsing in Bedryfsielkunde ________________________________<br />
Soos ons genoem het, behels navorsing die beantwoording van vrae of die oplos<br />
van probleme. Oorweeg die volgende vrae:<br />
. Hoe voel generasie Y oor unies in organisasies?<br />
. Wat is die geskikste tyd om haarsorgprodukte vir vroue op televisie te<br />
adverteer?<br />
bladsy 3
. Is dit billik om persoonlikheidseienskappe te gebruik om werksprestasie te<br />
voorspel?<br />
. Wat is die optimale aantal mense om in 'n virtuele weà reldspan te werk?<br />
. Wat doen universiteite om studente vir die beroepsweà reld voor te berei?<br />
. Watter etiek is betrokke in die gebruik van gerekenariseerde toetsing?<br />
Al hierdie vrae val in die raamwerk van Bedryfsielkunde. Figuur 2 illustreer hoe<br />
elk van hierdie vrae op 'n aantal gebiede van Bedryfsielkunde van toepassing is.<br />
Kan jy aan 'n paar vrae in jou werkomgewing dink of in sommige ander modules<br />
waarvan jy graag die antwoord sal wil weet?<br />
................................................................................................................................<br />
................................................................................................................................<br />
................................................................................................................................<br />
................................................................................................................................<br />
Die waarde van navorsing leà daarom eerstens in die feit dat kennis van navorsing<br />
help om vrae binne jou spesifieke studieveld of werkomgewing te beantwoord.<br />
Organisatoriese<br />
Sielkunde:<br />
Wat is die optimale<br />
aantal mense<br />
om in 'n virtuele<br />
weà reldspan<br />
te werk?<br />
Loopbaansielkunde:<br />
Wat doen<br />
universiteite om<br />
studente vir die<br />
beroepsweà reld<br />
voor te berei?<br />
Verbruikersielkunde:<br />
Wanneer is die geskikste<br />
tyd om haarsorgprodukte<br />
vir vroue<br />
op televisie te<br />
adverteer?<br />
Bedryfsielkunde<br />
Arbeidsverhoudinge:<br />
Hoe voel generasie<br />
Y oor unies<br />
in organisasies?<br />
FIGUUR 2: Navorsingsvrae in Bedryfsielkunde<br />
bladsy 4 . studie-eenheid 1 inleiding tot navorsing en statistiek<br />
Sielkundige<br />
assessering:<br />
Watter etiek is<br />
betrokke by die<br />
gebruik van<br />
gerekenariseerde<br />
toetsing<br />
Personeelsielkunde:<br />
Is dit billik om<br />
persoonlikheidseienskappe<br />
te gebruik<br />
om werkverrigting<br />
te voorspel?
. afdeling 1 agtergrond<br />
Kennis van navorsing is ook nuttig om die werk van ander wetenskaplik te<br />
interpreteer en te evalueer. Dink na oor die volgende scenario: Jou organisasie is<br />
op die punt om R3 miljoen vir die ingebruikneming van 'n nuwe prestasieevalueringstelsel<br />
te bestee. Die persone wat die stelsel ontwikkel maak 'n aantal<br />
aannames oor die nut en voordele van hul stelsel. Met jou kennis van navorsing<br />
sal jy in staat wees om te bepaal of hierdie aannames werklik geldig is voordat jou<br />
organisasie in hierdie stelsel investeer.<br />
Kennis van navorsing sal jou daarom toerus met vaardighede wat jou sal help om<br />
probleme te kan oplos en vrae te kan beantwoord op 'n wyse wat wetenskaplik en<br />
betekenisvol is en wat die wins van die organisasie sal verhoog. Jy sal jou kennis<br />
van navorsing in jou werkomgewing sowel as in jou alledaagse lewe kan toepas<br />
om vrae te vra of probleme in jou gemeenskap of gesin op te los. Is dit genoeg<br />
motivering vir jou om meer oor navorsing te wete te kom?<br />
Ons het gesien navorsing begin met 'n vraag wat beantwoord moet word of 'n<br />
probleem wat opgelos moet word. Dit sal die doelwit van die meeste<br />
navorsingsprojekte wees. Navorsing word dan die proses waardeur nuwe kennis<br />
ontdek word of geõÈ dentifiseerde probleme opgelos word. Kom ons kyk nou na die<br />
onderskeie stappe wat in die navorsingsproses betrokke is.<br />
Die navorsingsproses _____________________________________<br />
Alhoewel sekere variasies mag voorkom, volg die meeste navorsingsprojekte wat<br />
uitgevoer word 'n basiese proses. Figuur 3 toon die tipiese stappe wat navorsers<br />
volg om navorsing te doen. Die navorsingsproses is basies 'n vyfstap-prosedure.<br />
. Eerstens begin die navorsingsproses met die indentifisering van die probleem:<br />
Wat is die vraag wat beantwoord moet word of wat is die probleem wat opgelos<br />
moet word?<br />
. Tweedens, hoe ontwerp jy 'n studie om die vraag te beantwoord? (Wie gaan by<br />
die studie betrokke wees en wanneer en hoe gaan hulle betrokke wees?)<br />
. Derdens, hoe verkry jy die inligting wat jy nodig het en samel die nodige data in<br />
om die navorsingsvraag te beantwoord?<br />
. Vierdens, hoe ontleed jy die data? (Met ander woorde, hoe maak jy sin uit al die<br />
inligting wat ingesamel is?)<br />
. Laastens, hoe maak jy gevolgtrekkings uit die data wat ontleed is om die<br />
navorsingsvraag te beantwoord?<br />
Jy sal dwarsdeur hierdie module die geleentheid heà om te sien hoe hierdie<br />
navorsingsproses prakties toegepas word. Ons sal kyk na 'n aantal verskillende<br />
navorsingsvrae, kortliks bespreek hoe so 'n navorsingsvraag ondersoek kan word<br />
(ontwerp); die wyse noem waarop data ingesamel word, bespreek hoe die data<br />
ontleed word en laastens illustreer hoe om gevolgtrekkings te maak oor die<br />
navorsingsvraag op grond van die data-ontleding. Hierdie module fokus egter<br />
meer op die vierde stap van die navorsingsproses, naamlik data-ontleding. Dit is<br />
bladsy 5
Navorsingsvraag<br />
Gevolgtrekkings<br />
FIGUUR 3: Die Navorsingsproses<br />
Navorsingsontwerp<br />
Data analise<br />
Data insameling<br />
daarop gemik om inligting te verskaf oor sekere tegnieke wat jy moet leer wat<br />
gebruik kan word om sin uit die data te maak wat ingesamel is en jou te leer om<br />
betekenisvolle gevolgtrekkings hieruit te maak. Hierdie tegnieke word<br />
gesamentlik Statistiek genoem.<br />
Statistiek ______________________________________________<br />
Die woord statistiek ontlok dikwels 'n sterk emosionele reaksie van studente.<br />
Sommige studente is opgewonde om meer oor statistiek te leer, ander mag 'n<br />
bietjie versigtig wees, terwyl sekere studente selfs die onderwerp met vrees en 'n<br />
voorgevoel benader!<br />
In hierdie stadium is dit moontlik dat jy nie baie vertroud met die studieveld van<br />
statistiek is nie. Statistiek, soos enige ander spesialisveld, het sekere unieke<br />
terminologie en amper 'n taal van sy eie. Studie-eenheid 2 sal daarom jou eerstens<br />
vertroud maak met die basiese terme en belangrike konsepte wat in hierdie veld<br />
gebruik word.<br />
Navorsing het bewys (byvoorbeeld Brown & Brown, 1995; Onwuegbuzie, 2000;<br />
Schau, 2003) dat studente se houding teenoor statistiek dikwels deur verskeie<br />
faktore beõÈ nvloed word. Die eerste is die graad waartoe studente hulself as vaardig<br />
in wiskunde beskou. Interessant genoeg, is dit nie die aantal vorige<br />
wiskundekursusse wat studente voltooi het of hoe goed hulle in hierdie kursusse<br />
gedoen het nie, maar eerder 'n baie subjektiewe siening van hoe vaardig hulle<br />
hulleself in wiskunde ag wat hulle houding teenoor statistiek bepaal.<br />
Laat ons jou onmiddellik hieroor gerus stel: alhoewel jy sekere basiese algebraõÈ ese<br />
beginsels moet ken, is dit nie 'n kursus in wiskunde nie. Om berekenings te doen,<br />
is slegs 'n klein deel van die werklike inhoud van die onderwerp. Selfs vir studente<br />
wat nooit blootstelling aan wiskunde gehad het nie, hoef die slaag van hierdie<br />
module nie 'n onoorkomelike probleem te wees nie. Studie-eenheid 3 sal al die<br />
bladsy 6 . studie-eenheid 1 inleiding tot navorsing en statistiek
asiese algebraberekenings hersien wat in hierdie module gebruik word. Nadat jy<br />
deeglik deur hierdie studie-eenheid gewerk het, sal jy in staat wees om die res van<br />
hierdie module met vertroue te benader.<br />
Wat ook belangrik is om te weet, is dat statistiek die beste geleer word deur dit te<br />
doen. Jy sal daarom aktief moet deelneem deur die res van die studiegids om die<br />
tegnieke te bemeester wat jy sal leer. Daar is ook pas genoem dat jy die<br />
geleentheid sal heà om te sien hoe die navorsingsproses prakties in hierdie module<br />
toegepas word. Ons sal daarom 'n spesifieke navorsingsprojek as praktiese<br />
illustrasie dwarsdeur die res van die studiegids gebruik. Die besonderhede van<br />
hierdie navorsingprojek word volgende beskryf.<br />
Bekendstelling van ons navorsingsprojek ________________________<br />
Verbeel jou dat jy deel is van 'n eksklusiewe navorsingspan om deel te neem aan 'n<br />
revolusioneà re en opwindende navorsingsprojek. Hierdie navorsingsprojek beloof<br />
om nuuswaardig en die grootste te wees wat die vermaaklikheidsweà reld hierdie<br />
jaar gaan beleef! Jy het Big Brother gesien, jy het Idols gesien en jy het The<br />
Apprentice gesien. Maar jy het nog nooit 'n werklikheidsvertoning gesien wat al<br />
drie hiervan kombineer nie!! Jy word uitgenooi om deel van 'n navorsingspan te<br />
wees wat hierdie nuwe en opwindende werklikheidsvertoning wat hierdie jaar<br />
bekengestel word, te monitor, ondersoek en te evalueer. Kom ons vertel jou meer<br />
van Nuwe Sterre: Die volgende advertensie is in al die groot koerante geplaas:<br />
NUWE STERRE __________________________________________<br />
Is dit jou droom om 'n ster te word? Ons stel bekend die grootste geleentheid in<br />
die mees opwindende werklikheidsvertoning wat jy nog ooit gesien het! Nuwe<br />
Sterre is op soek na sterre in wording wat die eienskappe het wat nodig is om die<br />
hitte van die kollig te verduur en naam te maak in die vermaaklikheidsweà reld!<br />
Die reeÈ ls van ``Nuwe Sterre'' is soos volg:<br />
. afdeling 1 agtergrond<br />
. Voordat iemand aan die Nuwe Sterre-sangkompetisie kan deelneem, moet hulle<br />
'n moordende leerlingskapprogram van drie weke deurloop.<br />
. Die hele leerlingskapprogram van drie weke sal 24 uur per dag verfilm word ...<br />
en ... wat meer is!!!!! alles sal regstreeks op televisie gebeeldsend word asook op<br />
die internet vertoon word. Die Nuwe Sterre-webtuiste sal regstreekse film van<br />
die deelnemers uitsaai soos hulle deur die leerlingskapprogram gaan.<br />
. Die leerlingskapprogram sal vereis dat deelnemers in 'n luukse gastehuis saam<br />
met die ander deelnemers bly terwyl hulle vir die lewe van 'n glanspersoon<br />
voorberei.<br />
. Voorbereidingsaktiwiteite sluit in<br />
± 'n algehele verandering van voorkoms<br />
± sielkundige assesserings<br />
bladsy 7
± dramaklasse<br />
± stemopleidingsessies<br />
± bywoning van kursusse wat aangebied word oor hoe om op te tree tydens<br />
onderhoudvoering<br />
± opleiding oor hoe om aandag van aanhangers en die media te hanteer.<br />
. Tien deelnemers sal gekies word om aan die Nuwe Sterre-leerlingskapprogram<br />
deel te neem, maar slegs vyf van hulle sal gekies word om aan die finale Nuwe<br />
Sterre-sangkompetisie deel te neem.<br />
. Die wenner van Nuwe Sterre sal die volgende wen:<br />
± 'n Internasionale opnamekontrak<br />
± 'n Kontantprys ter waarde van R1 000 000.00<br />
± 'n Drie-maande kontrak as die hoofsanger van die vertoning ``Grease'' op<br />
Broadway in New York.<br />
. Gedurende die leerlingskapprogram van drie weke sal kykers vir hulle<br />
gunsteling ``ster-in-wording'' kan stem en hulle sal ook met hulle kan<br />
kommunikeer deur middel van die sosiale netwerkfasiliteit wat op die Nuwe<br />
Sterre-webtuiste beskikbaar is. Alle kommunikasie en deelname aan hierdie<br />
sosiale netwerkfasiliteit sal noukeurig deur administrateurs, Nuwe Sterrebeoordelaars<br />
en lede van die paneel van die etiese komitee gemonitor word.<br />
En kykers word selfs meer aangebied<br />
. hulle sal 'n paar van die beoordelaars ook kan uitstem!<br />
Hoe sal die stemmery werk? ________________________________<br />
. Kykers kan vir deelnemers stem en punte gee op grond van hulle<br />
kommunikasievaardighede en interaksie met ander deelnemers, deelname aan<br />
die proses, sterkwaliteit, uitvoeringtalent asook hulle kanse om die kompetisie<br />
te wen.<br />
. Die stemming en gee van punte sal twee maal per week op Maandae en Vrydae<br />
plaasvind. Deelnemers en beoordelaars wat uitgestem word, sal op Dinsdae en<br />
Saterdae in kennis gestel word. Om dubbelstemming uit te skakel, sal die finale<br />
stemming vir die Nuwe Sterre-sangkompetisie slegs gedoen word deur die<br />
gehoor wat by die regstreekse televisie-uitsending van die vertoning<br />
teenwoordig is.<br />
. Deelnemers is uitgenooi om aansoek te doen deur 'n persoonlike aanbieding<br />
van hul CV's deur middel van 'n video-opname in te dien. Die aanbieding moes<br />
verwysing insluit na hul ouderdom, geslag, ras, opleiding, beroep, huidige<br />
inkomste en uitgawes, loopbaanaspirasies, vorige optree- en sangondervinding<br />
asook 'n motivering waarom hulle glo hulle in staat is om die eerste Nuwe<br />
Sterre-ster te wees.<br />
bladsy 8 . studie-eenheid 1 inleiding tot navorsing en statistiek
Ontmoet die 10 Nuwe Sterre-kandidate wat gekies is om aan die 24/7 Nuwe Sterreleerlingskapprogram<br />
vir drie weke deel te neem:<br />
. Vuyo K<br />
± Swart vrou<br />
± 20 jaar oud<br />
± Enkellopend<br />
± Derdejaar Drama-en-Kunsstudent<br />
± Sien haarself as die ``volgende beste ding'' in die musiekbedryf<br />
± Baie ambisieus, spontaan, en glo sy is gereed vir glorie en rykdom<br />
. Lebo<br />
± Swart man<br />
± 20 jaar oud<br />
± Enkellopend, maar onbeskikbaar, soos hy daarvan hou om homself bekend<br />
te stel<br />
± IT-administrateur<br />
± Glo hy het talent en sien hierdie kompetisie as iets nuuts om op die proef te<br />
stel, aangesien hy dink dit sal hom uitdaag om afstand van sy<br />
bleeksielmentaliteit te doen<br />
. Sasha<br />
± Wit vrou<br />
± 19 jaar oud<br />
± Tweedejaar BCom-student in Bedryfsielkunde aan Unisa<br />
± Sy beskryf haarself as 'n ``klein bom'' as gevolg van haar fyn liggaamsbou<br />
en groot stem<br />
± Sy sien daarna uit om die ``helder stadsligte'' te ervaar wat met 'n loopbaan<br />
in vermaaklikheid geassossieer word.<br />
. Susan<br />
. afdeling 1 agtergrond<br />
± Swart vrou<br />
± Enkellopend<br />
± 27 jaar oud<br />
± Baie ambisieus en wil meer wees as bloot 'n kunstenaar (``ster'')<br />
± Sien haarself as 'n entrepeneur wat eendag haar eie groot opname-ateljee<br />
wil bestuur<br />
± Ietwat berekenend in haar interpersoonlike vaardighede ± is geneig om te<br />
werk aan verhoudings met diegene wat haar kan help of tot voordeel vir<br />
haar op die lange duur kan wees<br />
± Baie ongeduldig met persone wat enige persoonlike tekortkoming of<br />
weerloosheid het<br />
± Baie gefokus en veeleisend wanneer sy met ander werk ± kan moeilik in 'n<br />
groep wees<br />
bladsy 9
. David<br />
± Wit man<br />
± 25 jaar oud<br />
± Enkellopend<br />
± Jong IT-kundige wat 'n klein besigheid tydelik saam met vriende van die<br />
huis af bestuur terwyl hy droom om 'n kunstenaar te word<br />
± Leefstyl en pret is vir hom baie belangrik ± nie baie ambisieus nie ± dink die<br />
die lewe van 'n kunstenaar is een waar die geld net sal instroom!<br />
± Is op soek na die groot geleentheid wat sy sangloopbaan met mening sal<br />
inlui ± sy motivering waarom hy in die eerste plek aansoek gedoen het!!<br />
. Tshepo<br />
± Swart man<br />
± 26jaar oud<br />
± Enkellopend<br />
± Tegniese agtergrond ± klankingenieur<br />
± Wil 'n loopbaan in die opnamebedryf volg ± maar sien die wyse waarop hy<br />
die veld betree om eers naam as kunstenaar te maak<br />
± Hy het kontakte in die musiekbedryf en glo dat hulle name hom sal help om<br />
vinniger opgang in sy loopbaan te maak<br />
. Indresan<br />
± IndieÈ rman<br />
± 25 jaar oud<br />
± Verloof aan sy meisie van vyf jaar<br />
± Hy is sedert hy 'n klein seuntjie was deur Bollywood geõÈ nspireer.<br />
± Hy het 'n passie en toewyding om 'n Suid-Afrikaanse Bollywoodproduksiemaatskappy<br />
van sy eie die lig te laat sien.<br />
± Hy is bekend daarvoor dat hy alle perke oorskry en advies van ander<br />
ignoreer.<br />
± Hy kan die beste as dramaties en selfbevorderlik beskryf word.<br />
. Shelly<br />
± Kleurlingvrou<br />
± 28 jaar oud<br />
± Sy is vier jaar gelede as Mejuffrou Langebaan gekroon.<br />
± Sy het haar modelloopbaan onderbreek om haar graad in Kommunikasie<br />
en Bemarking aan die Universiteit van die Weskaap te voltooi.<br />
± Sy wil nou haar lewe in die openbare oog voortsit en glo sy het baie om te<br />
bied.<br />
± Haar voorkoms en houding sal opmaak vir enige gebreke in haar<br />
sangtalent.<br />
bladsy 10 . studie-eenheid 1 inleiding tot navorsing en statistiek
. Cameron<br />
± Kleurlingman<br />
± 23 jaar oud<br />
± Studeer Politieke en Sosiale Wetenskappe voltyds aan Wits<br />
± Hy wil graag eendag 'n ``ernstige'' loopbaan heà , maar sien geen kwaad<br />
daarin om pret te heà terwyl hy nog jonk is nie.<br />
± Hy heg groot waarde aan openbare erkenning van sy dade en prestasies.<br />
. Kerry<br />
± IndieÈ rvrou<br />
± 21 jaar oud<br />
± Op aanmoediging van haar pa is sy tans ingeskryf vir haar graad in<br />
Rekeningkunde aan die Universiteit van KwaZulu-Natal.<br />
± Sy is sedert kleuterskool lief vir dans, sing en drama en is tans een van die<br />
Sharks-meisies wat op die veld dans terwyl rugbywedstryde gespeel word.<br />
± Sy is 'n ekstrovert en floreer op sosiale interaksie.<br />
± Sy is op soek na 'n leefstyl van vermaak en opwinding.<br />
En die beoordelaars is:<br />
. StellaDebark<br />
± Wit vrou<br />
± 53 jaar oud<br />
± Kinderster wat nie so goed in haar volwasse lewe gevaar het nie<br />
± Nou sing sy in jazz-nagklubs en het nie enige albums in amper twee<br />
dekades vervaardig nie<br />
± Twee kinders wat ook in die musiekbedryf is<br />
± Dink die vertoning sal haar die kans gee om haar weer tot roem te bevorder<br />
± Alhoewel sy jong talent aanmoedig, kan sy baie onsensitief wees in haar<br />
kritiek as sy dink jy het nie die nodige talent nie<br />
. Ricco Milan<br />
± 37-jarige enkellopende man<br />
± Mode-ontwerper en platejoggie<br />
± Is lief vir musiek en passievol oor modes, glo albei bepaal sukses in die<br />
vermaaklikheidsbedryf<br />
± Sien hierdie as 'n geleentheid om homself te bevorder<br />
± Baie energiek, vriendelik en aanmoedigend, sien altyd die positiewe in<br />
mense<br />
. Zolisa Mafupha aka Zee M<br />
± 31-jarige suksesvolle swart musikant<br />
± Het verskeie bekroonde treffers<br />
± Enkellopend<br />
. afdeling 1 agtergrond<br />
bladsy 11
± Baie beskeie en gretig om jong en vars talent te ontdek<br />
± Opgewonde om as beoordelaar gekies te word aangesien sy dit sien as 'n<br />
geleentheid om jong talent te ontwikkel<br />
. Angie Motseneka<br />
± Swart vrou<br />
± 35 jaar oud<br />
± MBA-student wat tans 'n bestuursposisie in 'n groothandelsmaatskappy<br />
beklee.<br />
± Getroud ± twee tienerkinders<br />
± Ietwat hooggespanne ± kan emosioneel onder spanning reageer<br />
± Persoonlike ontwikkeling baie belangrik vir haar<br />
± Taamlik krities teenoor mense wat nie verantwoordelikheid vir die gevolge<br />
van hulle besluite wil neem nie ± sal dit ook teenoor die deelnemers<br />
openbaar<br />
. Brian Mahlangu<br />
± Praktiserende prokureur<br />
± 29 jaar oud<br />
± Enkellopend en toon ywerige belangstelling in enkellopende jong vroue ±<br />
kan moontlik bevooroordeeld teenoor hulle wees?<br />
± Het vir sewe jaar in die regsveld gewerk<br />
± Goeie interpersoonlike vaardighede<br />
± kon goed onder druk presteer<br />
En nou vir die navorsingsprojek:<br />
Aangesien dit die eerste keer is dat 'n werklikheidsvertoning van hierdie aard<br />
aangebied gaan word, is jy, as deel van 'n groep navorsers, uitgenooi om 'n aantal<br />
aspekte van die aansoekers, deelnemers asook kykers dwarsdeur die<br />
bekendstelling en die eerste sessie van hierdie werklikheidsvertoning te ondersoek.<br />
Sommige van die navorsingsvrae wat jy gevra word om te ondersoek en oor verslag te doen, is die<br />
volgende:<br />
. Hoeveel deelnemers uit die verskillende rassegroepe het vir die kompetisie<br />
ingeskryf?<br />
. Wat is die inkomsteverspreiding van al die aansoekers?<br />
. Wat is die biografiese eienskappe van die aansoekers, deelnemers,<br />
televisiekykers en internetdeelnemers onderskeidelik?<br />
. Wat is die verhouding tussen die puntetellings van die internet-interaksie op die<br />
sosiale netwerkwebtuiste en die stemming vir die 10 deelnemers?<br />
. Is daar 'n verband tussen die hoeveelheid tyd wat kykers bestee om die program<br />
te kyk en die frekwensie waarmee hulle vir deelnemers stem?<br />
. Kan die kykers se jare van onderrig die aantal ure voorspel wat hulle na die<br />
vertoning kyk of die webtuiste besoek?<br />
bladsy 12 . studie-eenheid 1 inleiding tot navorsing en statistiek
. Wat is die verhouding, persentasie en aantal kykers wat aan die sosiale<br />
netwerkwebtuiste deelneem?<br />
. Is daar 'n verskil in die vlakke van gelukkigheid van deelnemers voor en na die<br />
leerlingskapprogram?<br />
. Is daar 'n verskil tussen die manlike en vroulike deelnemers en hul vermoeÈ om<br />
aandag van die media te hanteer?<br />
. Gee manlike stemmers hoeÈ r punte vir oulike, jong, vroulike deelnemers as vir<br />
manlike deelemers?<br />
. Is daar 'n verskil in die emosionele intelligensie van aansoekers, deelnemers aan<br />
die leerlingskapprogram en deelnemers wat aan die finale Nuwe Sterresangkompetisie<br />
deelneem?<br />
. Is daar 'n verskil tussen kykers se puntetelling vir deelnemers op grond van<br />
hulle haarkleur (blond, rooi of bruin hare)?<br />
Kan jy dink aan ander vrae wat jy uit hierdie projek beantwoord wil heà ? Lys dit<br />
hier:<br />
................................................................................................................................<br />
................................................................................................................................<br />
................................................................................................................................<br />
................................................................................................................................<br />
Hierdie navorsingsprojek sal as grondslag gebruik word vir ons praktiese<br />
illustrasies in die res van hierdie studiegids.<br />
Ons nooi jou nou uit om ons op hierdie opwindende reis te vergesel om meer oor<br />
navorsing en spesifiek statistiek in die navorsingsproses te leer.<br />
Nadat jy hierdie studie-eenheid voltooi het, moet jy in staat wees om:<br />
. navorsing in jou eie woorde te omskryf<br />
. die basiese navorsingsproses te omskryf<br />
. 'n navorsingsprobleem te identifiseer<br />
. afdeling 1 agtergrond<br />
bladsy 13
2<br />
studie-eenheid twee<br />
Die taal van statistiek<br />
Noudat jy 'n goeie idee het van waarom 'n studie van<br />
navorsingsmetodiek vir jou belangrik is, en hoe bedryfsielkundige<br />
navorsing verloop, wil ons jou bekendstel aan die taal van statistiek.<br />
In hierdie studie-eenheid stel ons die volgende bekend:<br />
. kwantitatiewe metodes en waarom dit gebruik word<br />
. die klassifikasie van statistiese tegnieke<br />
. belangrike konsepte wat onderliggend is aan enige statistiese ontleding van data<br />
Kwantitatiewe metodes _____________________________________<br />
Soos jy tot dusver uit die bespreking kon aflei, sal jy met syfers in hierdie kursus<br />
werk. Wanneer 'n mens enige vorm van inligting of data neem, is dit moontlik om<br />
dit in die vorm van syfers te beskryf. 'n Eenvoudige voorbeeld hiervan kan wees:<br />
Indien ons al die aansoekers van Nuwe Sterre gevra het om ons te vertel hoeveel<br />
vertroue hulle het dat hulle as een van die 10 deelnemers gekies sal word, kon ons<br />
hulle gevra het om hulle gevoel op 'n skaal van 1 tot 10 te evalueer, waar 1 sal seÃ<br />
``Ek voel ek het geen kans nie,'' 5 sal seà ``Ek voel ek het 'n 50/50-kans'' en 10 sal seÃ<br />
``Ek voel ek sal definitief gekies word''.<br />
Wanneer 'n mens data in syfers omskakel, soos ons in bostaande voorbeeld<br />
gedoen het, kwantifiseer 'n mens die inligting. Kwantitatiewe metodes is daarop<br />
gemik om data in die vorm van syfers uit te druk. Wat is die waarde hiervan?<br />
Waarom is dit nuttig om data in syfers om te skakel? Eerstens, syfers is deel van<br />
ons alledaagse lewe.<br />
Dink net aan die tarief wat jy vir die gebruik van jou selfoon betaal en hoeveel<br />
geld jy nodig het om die maand uit te kom. Wanneer jy weer inkopies gaan doen,<br />
dink aan hoe gekwantifiseer die bedrywighede in 'n winkel is. Dink aan die bedrag<br />
wat jy vir 'n artikel betaal, die wins wat daarop gemaak word, belastings wat<br />
gehef word, die huur vir die perseel en salarisse, om maar enkele voorbeelde te<br />
noem. Kwantifisering en kwantitatiewe denke is dus ewe onvermydelik in die<br />
daaglikse lewe.<br />
Afgesien hiervan het kwantitatiewe metodes ook spesifieke voordele.<br />
bladsy 14 . studie-eenheid 2 die taal van statistiek
Kwantitatiewe metodes is besonder nuttig omdat dit<br />
. inligting doeltreffend oordra<br />
. voorsiening maak vir die hermodellering van lewenswerklike verskynsels<br />
. deel uitmaak van 'n goed ontwerpte en kragtige dissiplineà re taal<br />
Gee op grond van die inligting oor die voordele van kwantitatiewe metodes jou eie<br />
voorbeeld om elk van die drie voordele van kwantitatiewe metodes te verduidelik.<br />
1 ........................................................................................................................<br />
2 ........................................................................................................................<br />
3 ........................................................................................................................<br />
In hierdie studie-eenheid skop ons af met die eerste hoofstuk van Tredoux en<br />
Durrheim (2002). Vergelyk jou voorbeelde met die drie voorbeelde wat volledig<br />
van bladsy 3 tot 7 in die afdeling ``The advantages of quantitative methods'' in<br />
Tredoux en Durrheim (2002) beskryf word.<br />
1. Doeltreffendheid: Om syfers bekend te maak, byvoorbeeld die Suid-<br />
Afrikaanse nasionale sensusopname.<br />
2. Benadering/modellering: Om verskynsels in die weà reld te bestudeer,<br />
byvoorbeeld 'n ruimtelike model vir die verklaring van die beoordeling van<br />
mensegesigte vir eenvormigheid.<br />
3. 'n Kragtige taal: Byvoorbeeld, die weerkaart.<br />
Kwantifisering dien as steunpilaar vir twee algemene soorte funksies. Dit kan<br />
enersyds 'n infrastrukturele of administratiewe funksie verrig en andersyds steun<br />
dit argumentasie en redevoering. In die sosiale wetenskappe stel ons veral belang<br />
in die gebruik van die gegewens wat deur kwantitatiewe metodes beskikbaar gestel<br />
word om ons argumente te staaf. Ons is geneig om probabilistiese metodes toe te<br />
pas, eerder as die deterministiese model wat in sommige wetenskapsvorme gevolg<br />
word.<br />
Lees die bespreking van die funksies van kwantifisering van bladsy 3 tot 7 in<br />
Tredoux en Durrheim (2002). Gee jou eie voorbeeld van 'n bewering of stelling<br />
wat deterministies is en een wat probabilisties is.<br />
1 ........................................................................................................................<br />
2 ........................................................................................................................<br />
Vergelyk jou voorbeelde met die volgende:<br />
. afdeling 1 agtergrond<br />
bladsy 15
1. 'n Deterministiese bewering: besonder streng opvoedingspatrone in die<br />
kleinkinderjare gee aanleiding tot 'n outoriteà re persoonlikheid.<br />
Sorg dat jy die deterministiese bewering vir 'n noodwendigheids- of<br />
voldoendheidsvoorwaarde toets. Dit wil seà dat die teenwoordigheid van A<br />
noodwendig tot B lei.<br />
2. 'n Probabilistiese bewering, daarenteen, moet voorsiening maak vir die<br />
moontlikheid dat die teenwoordigheid van A nie noodwendig tot B gaan lei<br />
nie, en of dit tot B aanleiding gee of nie, kan op grond van kansverwagting<br />
verklaar word. Gevolglik beteken die bewering dat blootstelling aan die<br />
karsinogene in sigaretrook kanker veroorsaak nie dat daardie blootstelling<br />
beslis tot kanker aanleiding gaan gee nie, maar dat dit kanker sal veroorsaak<br />
in meer gevalle as wat ons met nieblootstelling te wagte kan wees.<br />
Klassifisering van statistiese tegnieke vir hierdie kursus _____________<br />
Statistiese metodes en tegnieke kan in die volgende breeÈ kategorieeÈ ingedeel word:<br />
Beskrywende statistiek: 'n Tegniek wat gebruik word om data te organiseer, op te<br />
som en te beskryf. Dit is die beskrywende navorsingsbenadering.<br />
InferensieÈ le statistiek: 'n Tegniek wat op steekproewe toegepas word om afleidings<br />
oor populasies te maak. Dit staan ook bekend as die eksperimentele<br />
navorsingsbenadering.<br />
Basiese begrippe _________________________________________<br />
Voordat jy in alle erns met jou studie van beskrywende en inferensieÈ le statistiek<br />
begin, moet jy enkele belangrike begrippe onderliggend aan statistiese dataanalise<br />
deeglik onder die knie kry. Dit sluit terme soos die volgende in:<br />
. veranderlikes en konstantes<br />
. metingskale<br />
. steekproewe, populasies, statistieke en parameters<br />
Veranderlikes ___________________________________________<br />
Hiermee neem jy jou eerste tree in die gebruik van 'n kwantitatiewe taal, naamlik<br />
om voorwerpe of entiteite in simbole en konsepte van daardie taal om te sit. Die<br />
eenvoudigste konsep is die van 'n veranderlike. Die aspekte wat ons bestudeer,<br />
word veranderlikes genoem. Wanneer ons byvoorbeeld lengte meet, praat ons van<br />
lengte as 'n veranderlike en die simbool daarvoor is X. Temperatuur en massa is<br />
ook voorbeelde van veranderlikes.<br />
Kom ons kyk na 'n voorbeeld van ons Nuwe Sterre-vertoning om te bepaal wat 'n<br />
bladsy 16 . studie-eenheid 2 die taal van statistiek
veranderlike is. Die vertoning is amptelik bekend gestel deur 'n wydverspreide<br />
mediaveldtog, waar die publiek uitgenooi is om in te skryf. Duisende inskrywings<br />
is ontvang. Is jy ook nuuskierig wie ingeskryf het? Sou jy graag self wou inskryf?<br />
Ons kan aanneem dat nie almal van die kalklig hou nie, of van 'n lewe in die<br />
vermaaklikheidsbedryf sal hou nie. Dit kan interessant wees om te weet wat die<br />
vernaamste persoonlikheidseienskappe is van die persone wat ingeskryf het. Die<br />
persoonlikheidseienskappe is dus 'n voorbeeld van 'n veranderlike wat 'n mens<br />
kan ondersoek.<br />
Taylor en Meyer (2009) het bevind dat sommige persoonlikheidseienskappe wat<br />
aansoekers van realiteitsvertonings openbaar, die volgende is:<br />
. Hulle is geneig om ``ekstroverties'' te wees en floreer op sosiale interaksie.<br />
. Hulle kan beskryf word as buigsaam en oop vir verandering, maar ook<br />
impulsief en dink nie oor die gevolge van hulle dade na nie.<br />
. Hulle het 'n sterk behoefte aan pret en opwinding.<br />
. Hulle kan dramaties, selfbevorderend en aandagsoekerig wees.<br />
. Hulle is dikwels op soek na 'n leefstyl wat om goeie kos, goeie drank en<br />
vermaak gesentreer is.<br />
Die studie van Taylor en Meyer (2009) is insiggewend en ons kan later weer na<br />
meer van hulle resultate kyk. Maar vir eers gaan ons terug na die bespreking van<br />
veranderlikes.<br />
Veranderlikes word gewoonlik deur die letters X en Y geõÈ dentifiseer. Soms gaan jy<br />
met twee of meer veranderlikes soos X en Y werk.<br />
1. Bestudeer die afdeling ``Variables and constants'' van bladsy 9 tot 13 van<br />
Tredoux en Durrheim (2002). Lees die omskrywings hieronder en pas telkens<br />
die korrekte begrip uit die gegewe lys by die omskrywing:<br />
Begrippe<br />
veranderlikes<br />
diskrete veranderlike<br />
kontinue veranderlike<br />
onafhanklike veranderlike<br />
afhanklike veranderlike<br />
Omskrywings<br />
. afdeling 1 agtergrond<br />
1.1 Die veranderlike wat deur die eksperimenteerder/navorser beheer word<br />
is die ..................<br />
1.2 Eienskappe van waarnemings wat verskillende waardes kan aanneem<br />
word .................. genoem.<br />
bladsy 17
1.3 'n Veranderlike wat enige waarde kan aanneem, is 'n ..................<br />
..................<br />
1.4 Die veranderlike wat gemeet word (die data of tellings) is die ..................<br />
..................<br />
1.5 'n Veranderlike wat 'n beperkte aantal waardes kan aanneem, is 'n<br />
...............<br />
1.6'n Hoeveelheid wat nie verander nie maar altyd dieselfde waarde behou,<br />
is 'n .......................<br />
2. Voltooi aktiwiteit 1.5 op bladsy 10 van Tredoux en Durrheim (2002).<br />
1. Wat belangrik is om te onthou, is dat veranderlikes verskillende waardes kan<br />
aanneem, afhangend van die eksperiment wat die navorser uitvoer.<br />
1.1 onafhanklike veranderlike<br />
1.2 veranderlikes<br />
1.3 kontinue veranderlike<br />
1.4 afhanklike veranderlike<br />
1.5 diskrete veranderlike<br />
1.6konstante<br />
2. Jy behoort (a), (c) en (d) nie moeilik te vind nie ± die antwoorde is onderskeidelik<br />
'n diskrete veranderlike, 'n konstante en 'n diskrete veranderlike. In<br />
die geval van (b) moet ons toegee dat 'n akkurate maatstaf sal toon dat die<br />
gewig van die maan voortdurend sal wissel. In die geval van (e) sal die getal<br />
regters 'n diskrete konstante vir 'n bepaalde tydperk wees (totdat 'n ander een<br />
aangestel word, bedank, sterf, ens)<br />
Metingskale ____________________________________________<br />
Die data wat jy as bedryfsielkundige in die organisasie sal insamel, hetsy prestasiebeoordelingsresultate,<br />
afwesigheidstellings of enige ander data, kan in een van vier<br />
soorte metingskale geklassifiseer word. Dit word spesifiek op bladsy 11 en 12 van<br />
Tredoux en Durrheim (2002) bespreek, en jy moet dit goed onder die knie kry.<br />
Ons onderskei tussen vier metingskale, naamlik die nominale, ordinale, intervalen<br />
ratio-skale.<br />
Eienskappe om tussen metingskale te onderskei ___________________<br />
Ons bespreek hieronder meer volledig die eienskappe op grond waarvan jy tussen<br />
metingskale kan onderskei. Saam met die afdeling op bladsy 11 tot 12 in Tredoux<br />
en Durrheim (2002) behoort dit vir jou 'n nuttige raamwerk te bied om tussen die<br />
vier metingskale te kan onderskei.<br />
bladsy 18 . studie-eenheid 2 die taal van statistiek
Grootte<br />
Grootte is die eienskap van ``meerheid''. 'n Skaal het 'n eienskap van grootte<br />
indien een attribuut meer is as, minder is as of gelyk is aan 'n ander attribuut<br />
(McCall, 1986).<br />
Lengte, wat 'n voorbeeld van die ratio-skaal is, het wel die eienskap van grootte.<br />
Ons kan seà dat een persoon langer of korter is as 'n ander persoon, maar ons kan<br />
nie seà dat 'n rugby- of sokkerspeler met 'n groter nommer op sy rug belangriker is<br />
of meer werk doen as 'n speler met 'n kleiner nommer nie. Die nommers op spelers<br />
se sportklere is 'n voorbeeld van die nominale skaal, wat die enigste skaal is wat<br />
nie die eienskap van grootte het nie.<br />
Gelyke intervalle 'n Skaal het die eienskap van gelyke intervalle indien die verskil tussen alle punte<br />
Absolute 0<br />
op die skaal eenvormig is.<br />
As ons die voorbeeld van lengte neem, beteken dit dat die verskil tussen 6en 8<br />
sentimeter op 'n liniaal dieselfde is as die verskil tussen 10 en 12 sentimeter. In<br />
albei gevalle is die verskil presies 2 sentimeter. 'n Sielkundige metingskaal wat 'n<br />
voorbeeld van die interval-skaal is, het ook gelyke intervalle. Kyk byvoorbeeld na<br />
die volgende skaal:<br />
Stem glad nie<br />
saam nie<br />
Stem nie<br />
saam nie<br />
Onseker Stem saam Stem volkome<br />
saam<br />
1 2 3 4 5<br />
Die intervalle tussen die verskillende tellings is in al die gevalle presies een.<br />
Nominale en ordinale skale het nie die eienskap van gelyke intervalle nie.<br />
Absolute 0 word verkry wanneer heeltemal niks bestaan van die eienskap wat<br />
gemeet word nie. As ons weereens die voorbeeld van lengte gebruik, beteken 0<br />
sentimeter dat daar geen afstand is nie. Lengte besit dus die eienskap van 'n<br />
absolute 0. So ook sou jy kon seà dat as jy windsnelheid meet en die lesing 0 is, daar<br />
geen wind van enige aard waai nie.<br />
Ten opsigte van vele menslike eienskappe is dit uiters moeilik, indien nie onmoontlik<br />
nie, om 'n absolute nulpunt te definieer. Indien ons byvoorbeeld<br />
rekenkundige vermoeÈ op 'n skaal van 0 tot 10 meet, is dit moeilik om te seà dat 0<br />
beteken die persoon het geen rekenkundige aanleg nie. Dit is moontlik dat daar 'n<br />
vlak van aanleg is wat die betrokke skaal nie meet nie of dat daar glad nie so iets<br />
soos 0-aanleg is nie (Kaplan, 1987). In die geval van temperatuur, wat 'n<br />
voorbeeld van die interval-skaal is, kan ons nie seà dat 0 o C beteken dat geen<br />
temperatuur teenwoordig is nie.<br />
Slegs die ratio-skaal besit hierdie eienskap.<br />
. afdeling 1 agtergrond<br />
bladsy 19
1. Bepaal op grond van bostaande inligting watter tipe skaal oor watter<br />
eienskap(pe) besit en voltooi dit in hierdie opsommingstabel, deur ``Ja'' of<br />
``Nee'' in die toepaslike ruimte te skryf.<br />
Metingskale en hulle eienskappe<br />
Eienskap<br />
Tipe skaal Grootte Gelyke interval Absolute 0<br />
Nominaal<br />
Ordinaal<br />
Interval<br />
Ratio<br />
2. Bestudeer die volgende twee probleemstellings.<br />
2.1 Jy wil bepaal of die jare onderrig van deelnemers aan Nuwe Sterre<br />
(byvoorbeeld matriek, voorgraadse studie, nagraadse studie) hul<br />
gewildheidsgraderings van kykers beõÈnvloed.<br />
2.2 Is daar 'n verhouding tussen die tyd wat kykers bestee om na Nuwe Sterre<br />
te kyk en hulle inkomste?<br />
Metingskaal/<br />
Onafhanklik<br />
Diskreet/<br />
Kontinu<br />
. Skryf die naam van die korrekte metingskaal wat van toepassing is op<br />
die veranderlikes wat uit die probleemstellings geõÈ dentifiseer en in die<br />
tabel weerspieeÈ l word in die regte kolom neer.<br />
. Onderskei of hierdie veranderlike die afhanklike of onafhanklike<br />
veranderlike in die probleemstelling verteenwoordig, en skrap die<br />
verkeerde alternatief.<br />
. Bepaal ook of die spesifieke veranderlike 'n kontinue of diskrete<br />
veranderlike is, en skrap weer eens die verkeerde alternatief.<br />
Jare onderrig Gewildheidsgradering<br />
Afhanklik/<br />
Onafhanklik<br />
Diskreet/<br />
Kontinu<br />
Afhanklik/<br />
Onafhanklik<br />
Diskreet/<br />
Kontinu<br />
Kyktyd Inkomste<br />
Afhanklik/<br />
Onafhanklik<br />
Diskreet/<br />
Kontinu<br />
3. Voltooi aktiwiteit 1.6op bladsy 13 van Tredoux en Durrheim.<br />
bladsy 20 . studie-eenheid 2 die taal van statistiek<br />
Afhanklik/<br />
Onafhanklik<br />
Diskreet/<br />
Kontinu
1. Metingskale en hulle eienskappe<br />
Eienskap<br />
Tipe skaal Grootte Gelyke interval Absolute 0<br />
Nominaal Nee Nee Nee<br />
Ordinaal Ja Nee Nee<br />
Interval Ja Ja Nee<br />
Ratio Ja Ja Ja<br />
2. Die volgende tabel verteenwoordig die korrekte antwoorde:<br />
Jare onderrig Gewildheidsgradering<br />
Kyktyd Inkomste<br />
Metingskaal Nominaal Interval Ratio Interval<br />
Afhanklik/<br />
Onafhanklik<br />
Diskreet/<br />
Kontinu<br />
3. Onafhanklike veranderlike<br />
(voorspeller)<br />
. afdeling 1 agtergrond<br />
Onafhanklik Afhanklik Onafhanklik Afhanklik<br />
Diskreet Kontinu Kontinu Kontinu<br />
Afhanklike veranderlike<br />
(kriterium)<br />
(a) Hoeveelheid rooiwyn ingeneem Aantal hartaanvalle<br />
(b) Diegene met of sonder troeteldiere Algemene geluk<br />
(c) Getroud/ongetroud Selfmoordsyfer<br />
Kan jy sien waarom dit nie nodig is om die rooiwyninname ooreenkomstig die<br />
per-populasie-indeks uit te druk nie?<br />
Let op dat dit moontlik is om 'n verskil tussen twee groepe (diegene wat<br />
troeteldiere het en diegene wat geen troeteldiere het nie) aan die hand van<br />
afhanklike en onafhanklike veranderlikes te konseptualiseer, en so ook die<br />
verband tussen twee kontinue veranderlikes.<br />
Populasies, steekproewe en verskillende soorte data ________________<br />
Wanneer ons met statistiek werk, is daar verskillende terme wat gebruik word.<br />
Ten opsigte van die groepe wie se inligting gebruik word, onderskei ons tussen 'n<br />
bladsy 21
populasie en 'n steekproef. Ons onderskei ook tussen numeriese waardes wat<br />
populasiedata opsom en numeriese waardes wat steekproefdata saamvat en wat<br />
onderskeidelik parameters en statistieke genoem word.<br />
Lees die afdeling ``Populations, samples, statistics and parameters'' van bladsy 13<br />
tot 15 in Tredoux en Durrheim (2002). Bestudeer die gedeeltes waarin begrippe<br />
verduidelik word en sorg dat jy elke term so goed verstaan dat jy dit in jou eie<br />
woorde kan verduidelik aan iemand wat dit nie ken nie. Hieronder volg 'n lys van<br />
belangrike terme. Gebruik die ruimte wat voorsien word om die betekenis van<br />
elke term te beskryf en gee 'n voorbeeld van elk, van die Nuwe Sterre-vertoning.<br />
Term Beskrywing Voorbeeld<br />
Populasie<br />
Steekproef<br />
Metingsdata<br />
Kategoriese Data<br />
Kyk of jou antwoorde in breeÈ trekke ooreenstem met die inligting wat in die<br />
onderstaande tabel gegee word. Jy moes minstens die skuinsgedrukte terme in jou<br />
beskrywing ingesluit het.<br />
Term Beskrywing Voorbeeld<br />
Populasie 'n volledige stel gebeure<br />
waarin jy geõÈ nteresseerd is<br />
Steekproef 'n stel waargenome tellings<br />
wat 'n deelversameling van<br />
die populasie is<br />
Parameters numeriese waardes wat<br />
populasiedata opsom<br />
Statistieke numeriese waardes wat<br />
steekproefdata opsom<br />
bladsy 22 . studie-eenheid 2 die taal van statistiek<br />
alle aansoekers vir Nuwe<br />
Sterre<br />
20 ewekansig geselekteerde<br />
aansoekers vir Nuwe Sterre<br />
die gemiddelde inkomste van<br />
alle aansoekers vir Nuwe<br />
Sterre<br />
die gemiddelde inkomste van<br />
20 ewekansig geselekteerde<br />
aansoekers vir Nuwe Sterre
. afdeling 1 agtergrond<br />
Voltooi aktiwiteit 1.7 op bladsy 14 in Tredoux en Durrheim (2002).<br />
Wat al hierdie vrae moeilik maak, is dat 'n mens seker moet wees wat die<br />
populasie van belang is. As ons daarom besluit dat die tersaaklike populasie vir al<br />
drie vrae die hele kohort leerders in Suid-Afrika is wat hul matrikulasie-eksamen<br />
in daardie bepaalde jaar afleà , kan net (a) 'n parameter wees. Maar as ons besluit<br />
dat ons vir (b) slegs die populasie leerders aan die HoeÈ rskool Platbakkies in<br />
aanmerking wil neem, sal die gemiddelde punt vir Geskiedenis aan daardie skool<br />
as 'n parameter dien. Dieselfde geld vir (c) ± 'n mens sou heel gepas kon verwys na<br />
``die populasie leerders aan die HoeÈ rskool Platbakkies op 'n bepaalde deel van 4de<br />
strand by Clifton op 1 Januarie 2001'', selfs al sou die meeste mense daardie<br />
versameling mense as 'n oninteressante populasie beskou!<br />
Ewekansige steekproefneming ________________________________<br />
Die afdeling ``Samples, populations, statistics and parameters'' in Tredoux en<br />
Durrheim (2002) bied 'n uiteensetting van ewekansige steekproefneming en<br />
statistiese inferensie. 'n Ewekansige steekproef beteken dat elke lid van die<br />
populasie 'n gelyke kans staan om vir 'n ondersoek, eksperiment of<br />
navorsingsprojek gekies te word. Dit is die enigste geldige/aanvaarbare manier<br />
om steekproefresultate ten opsigte van daardie populasie te veralgemeen. Die<br />
veralgemening van steekproefdata na populasies staan bekend as statistiese<br />
inferensie en is die sentrale doel van statistiese metodes.<br />
Jy behoort nou 'n idee te heà wat hierdie kursus in Bedryfsielkundige navorsing<br />
behels. Om seker te wees dat jy die belangrikste inligting in hierdie studie-eenheid<br />
uitgeken en begryp het, kan jy die lys in die volgende aktiwiteit nagaan.<br />
Gaan deur die volgende lys en merk elke item af indien jy seker is dat jy die terme/<br />
begrippe kan omskryf, tussen hulle kan onderskei en jou eie voorbeelde van elk<br />
kan gee:<br />
bladsy 23
Terme Omskryf Onderskei Voorbeeld<br />
beskrywende statistiek<br />
vs<br />
inferensieÈ le statistiek<br />
kontinue veranderlike<br />
vs<br />
diskrete veranderlike<br />
onafhanklike veranderlike<br />
vs<br />
afhanklike veranderlike<br />
populasie<br />
vs<br />
steekproef<br />
parameters<br />
vs<br />
statistieke<br />
Noudat jy studie-eenheid 3 bestudeer het, behoort jy<br />
. 'n veranderlike te kan omskryf<br />
. tussen beskrywende en inferensieÈ le statistiek te kan onderskei<br />
. te kan onderskei tussen die vier skale van meting en voorbeelde van elk te kan<br />
verskaf<br />
. diskrete en kontinue veranderlikes, asook onafhanklike en afhanklike<br />
veranderlikes te kan omskryf, onderskei en voorbeelde daarvan te kan verskaf<br />
Nou is jy reg om verskillende vaardighede en tegnieke te leer in die studie-eenhede<br />
wat volg.<br />
bladsy 24 . studie-eenheid 2 die taal van statistiek
3<br />
studie-eenheid drie<br />
. afdeling 1 agtergrond<br />
Basiese wiskundige<br />
berekenings wat in<br />
statistiek gebruik word<br />
Syfers: deel van ons lewe __________________________________<br />
Deesdae kan ons beswaarlik sonder syfers klaarkom ± dink net vir 'n<br />
oomblik hoeveel jy elke dag met syfers werk. Net die opstel van 'n<br />
tydtafel om te bepaal hoeveel ure jy aan elke vak gaan bestee wys al<br />
klaar jou afhanklikheid van syfers; en wie van ons probeer nie om ons begroting<br />
aan die einde van die maand te laat klop nie?<br />
Getalle en kwantifisering bied aan ons 'n baie spesiale taal wat ons in staat stel om<br />
ons in presiese terme uit te druk. Hierdie spesiale taal word wiskunde genoem. Net<br />
soos jy die basiese reeÈ ls van 'n taal moet ken om jou noukeurig in Afrikaans,<br />
Engels of Zoeloe uit te druk, moet jy ook die basiese wiskundige reeÈ ls ken om<br />
doeltreffend met syfers te kan kommunikeer.<br />
Soos jy teen hierdie tyd ook al opgemerk het, het hierdie kursus heelwat te doen<br />
met die gebruik van syfers. Dit is belangrik dat jy oor basiese rekenkundige kennis<br />
beskik ± matriekwiskunde is NIE nodig om hierdie kursus suksesvol te voltooi nie. Jy<br />
hoef dus nie 'n briljante wiskundige te wees nie, maar moet slegs sekere basiese<br />
rekenkundige beginsels bemeester om die statistiese berekenings in hierdie kursus<br />
te kan verstaan.<br />
Om gemaklik te wees met 'n module oor statistiek is dit nodig dat jy basiese<br />
wiskundige berekenings moet kan doen. Ongelukkig ervaar baie studente in<br />
Sielkunde (en Bedryfsielkunde) 'n mate van ongemak, angs en selfs vrees wanneer<br />
hulle met enige aspek van wiskunde ± byvoorbeeld formulas, berekenings,<br />
ontleding en, ja, natuurlik, statistiek ± te doen het!<br />
Sakrekenaars: noodsaaklik vir oorlewing ________________________<br />
Jy sal 'n sakrekenaar nodig heà om jou vanjaar met die statistiese ontleding te help.<br />
Indien jy nie 'n sakrekenaar het nie, sal jy een moet aankoop. Die klein, goedkoop<br />
bladsy 25
modelle is heeltemal voldoende. Om jou berekenings te vergemaklik, beveel ons<br />
egter aan dat die sakrekenaar ten minste die funksies van vierkantswortel ( p )en<br />
geheue (M+) moet heà .<br />
Die samestelling van hierdie studie-eenheid ______________________<br />
Hierdie studie-eenheid bied al die wiskundige inligting wat as agtergrond vir<br />
hierdie kursus dien. Dit behels basiese bewerkings met syfers, vergelykings,<br />
vervanging, sommasie asook die lees en verstaan van grafieke. Jy moet al die<br />
verskillende rekenkundige/wiskundige bewerkings kan doen (tutoriaal 23 en 24)<br />
en grafieke kan lees en verstaan (tutoriaal 25) wat by hierdie studie-eenheid<br />
ingesluit word om die statistieke in hierdie kursus te kan uitwerk.<br />
Die inligting in hierdie studie-eenheid vorm deel van jou voorkennis en jy is<br />
moontlik reeds vaardig in basiese syferwerk en rekenkundige bewerkings.<br />
Daarom is dit raadsaam om die selfevalueringstoetse vir tutoriaal 23 en 24 te<br />
doen. Die toets vir tutoriaal 23 is selftoets 23.1 op bladsy 445 en die toets vir<br />
tutoriaal 24 is selftoets 24.1 op bladsy 462 van Tredoux en Durrheim (2002).<br />
Gebruik hierdie selfevaluering om te bepaal of dit vir jou nodig is om tutoriaal 23<br />
en 24 te bestudeer. Sodra jy die inhoud van hierdie tutoriale onder die knie het,<br />
kan jy voortgaan met tutoriaal 25 oor hoe om grafieke te lees en te interpreteer.<br />
Ons vertrou dat jou belangstelling in die spesifieke vrae wat gevra is jou sal help<br />
om enige moontlike vrees vir wiskunde te bowe te kom. Die numeriese aspek word<br />
bloot 'n hulpmiddel om jou in staat te stel om interessante vrae te beantwoord. Op<br />
hierdie wyse sal jy hopelik jou vrees vir nommers, berekenings of formules<br />
vergeet. As jy nie 'n sterk wiskundige agtergrond het nie, is dit raadsaam om 'n<br />
paar keer deur Tutoriaal 23 en 24 van die voorgeskrewe boek te werk om die<br />
nodige vertroue en vaardighede te kry. Die gevoel van sukses wat jy sal ervaar<br />
wanneer jy die nodige berekenings kan doen, sal vergoed vir die moeite wat dit<br />
geverg het om daar te kom.<br />
Die volgende drie tutoriale behandel die wiskundige grondslag en grafieke wat<br />
deel uitmaak van hierdie studie-eenheid en wat jy op jou eie moet bestudeer:<br />
. Tutoriaal 23: ``Basic work with numbers''<br />
'n Rekenkundige oorsig word gebied wat jou leer hoe om eenvoudige<br />
algebraõÈ ese berekenings te doen.<br />
Studente wat nie van berekenings hou nie of wat vrees dat hulle nie berekenings<br />
kan doen nie, skrik wanneer hulle formules sien, want dit beteken dat<br />
berekenings gedoen moet word!! 'n Formule kan in basiese berekenings<br />
opgedeel word ± so as jy die opsommende oefeninge in Tutoriaal 23 van die<br />
voorgeskrewe boek gedoen het, behoort jy in staat te wees om enige<br />
bladsy 26 . studie-eenheid 3 basiese wiskundige berekenings wat in statistiek gebruik word
. afdeling 1 agtergrond<br />
berekenings te doen wat nodig mag wees om probleme op te los en antwoorde<br />
op vrae te kry.<br />
. Tutoriaal 24: ``Equations, substitution and summation''<br />
Ons behandel ook sommasie-notasie sodat jy die betekenis van die verskillende<br />
simbole sal verstaan en gevolglik rekenkundige berekenings sal kan uitvoer.<br />
. Tutoriaal 25: ``Reading and understanding graphs''<br />
Hierdie tutoriaal behandel grafieke wat dit moontlik maak om numeriese<br />
gegewens visueel voor te stel.<br />
Noudat jy studie-eenheid 3 bestudeer het, behoort jy die volgende te ken en te kan<br />
doen of gebruik:<br />
. die verskillende standaard rekenkundige simbole<br />
. die optel, aftrek, vermenigvuldig en deel van positiewe en negatiewe getalle<br />
. berekenings tussen hakies<br />
. eenvoudige algebraõÈ ese berekenings<br />
. die noteringstelsel om rekenkundige berekenings uit te voer<br />
. eenvoudige lyngrafieke en kategoriestippings te kan teken, interpreteer en<br />
verstaan<br />
bladsy 27
4 Voorstelling van data<br />
5 Maatstawwe van sentrale neiging<br />
6 Maatstawwe van varieerbaarheid<br />
7 Korrelasie<br />
8 Regressie
Inleiding tot beskrywende statistiek<br />
Nuwe Sterre ____________________________________________<br />
Die kompetisie tot dusver<br />
Hierdie nuwe werlikheidsvertoning het groot aanhang en opgewondenheid<br />
ontlok. Duisende aansoeke is van regoor Suid-Afrika ontvang. Om deur die<br />
aansoeke te werk om die 10 deelnemers vir die leerlingskapprogram te kies, was<br />
meer as 'n veeleisende oefening. Die navorsingspan was ook hard aan die werk en<br />
die inligting wat hulle ingesamel het, sal in die volgende vyf studie-eenhede<br />
gebruik word.<br />
Studie-eenheid 4 stel ondersoek in na die voorstelling van data ± hoe die massiewe<br />
hoeveelheid inligting opgesom en vereenvoudig en verslag oor gedoen kan word.<br />
Vrae soos: Hoeveel aansoeke is van elke provinsie ontvang? Wat is die biografiese<br />
eienskappe (ras, geslag, huwelikstatus) van die deelnemers en beoordelaars?<br />
Studie-eenheid 5 bespreek die maatstawwe van sentrale neiging ± deur metodes te<br />
ondersoek om die inligting te beskryf deur die middelpunt van die data aan te dui<br />
deur die gemiddelde, modus en mediaan te gebruik. Vrae soos: Wat is die<br />
gemiddelde telling van die beoordelaars vir die deelnemers se prestasie in die eerste<br />
week? Wat is die telling wat die meeste deur elke beoordelaar in die eerste week<br />
gegee is?<br />
Studie-eenheid 6 bespreek die maatstawwe van verieerbaarheid ± hoe die inligting<br />
beskryf kan word deur te kyk hoe die tellings verspreid is rondom die gemiddelde<br />
deur die omvang, variansie en die standaardafwyking te gebruik.<br />
Studie-eenheid 7 neem die beskrywing van die inligting verder deur na die<br />
verhouding tussen twee veranderlikes te kyk. Vrae kan bepaal of daar 'n<br />
verhouding bestaan tussen die tellings wat die deelnemers gedurende hulle<br />
voorbereidingsaktiwiteite ontvang het en hulle tellings vir hulle optrede vir<br />
daardie week.<br />
Studie-eenheid 8 maak aannames wat gegrond is op die verhouding tussen<br />
veranderlikes om voorspellings te maak. Byvoorbeeld, indien daar 'n sterk<br />
verhouding tussen voorbereiding en prestasie bestaan, kan regressie-ontleding<br />
gebruik word om 'n veranderlike te voorspel op grond van die berekende<br />
verhouding.<br />
So kom ons begin met hoe die navorsingspan die inligting kan opsom en voorstel.<br />
bladsy 30 . inleiding tot beskrywende statistiek
4<br />
studie-eenheid vier<br />
. afdeling 2 data-verwerking: beskrywend<br />
Aanbieding van data<br />
Dit is 'n bekende feit dat baie mense prente, simbole en grafiese<br />
voorstellings beter onthou as geskrewe woorde. Grafiese voorstellings<br />
is veral 'n manier om syfers sinvol te organiseer en voor te stel.<br />
Grafieke het ook 'n manier om inligting te vereenvoudig wat langer kan neem om<br />
oor te dra of te lees indien dit in woorde of net in syfers voorgestel is.<br />
Byvoorbeeld, vir die Nuwe Sterre-projek, indien jy verslag wil doen oor die<br />
aansoeke wat ontvang is, kan dit lank neem, terwyl dit maklik in tabelle en<br />
grafieke voorgestel kan word. Dit is waarom jy in hierdie studie-eenheid gaan leer<br />
om data deur middel van frekwensieverspreiding in tabelle aan te bied en ook om<br />
dit grafies deur middel van frekwensiestaafdiagramme en histogramme aan te<br />
bied. Sodra data grafies voorgestel is, is dit meer betekenisvol om dit in terme van<br />
skeefheid en kurtose te beskryf. Afgesien daarvan dat frekwensievoorstellings met<br />
kumulatiewe persentasiefrekwensies ons vertroud maak met die data, maak dit vir<br />
ons moontlik om persentiele en persentielrange uit te werk waarmee ons die<br />
posisie van sekere tellings ten opsigte van ander tellings in die distribusie kan<br />
bepaal.<br />
Dit is uit die staanspoor nodig dat ons 'n belangrike onderskeid tref tussen<br />
datasoorte wat op verskillende maniere aangebied/voorgestel moet word.<br />
Kategoriese of diskrete data (ongegroepeerde data) word in frekwensieverspreidingstabelle<br />
en staafdiagramme aangebied, terwyl kontinue data (gegroepeerde<br />
data) in frekwensieverspreidingstabelle en histogramme aangebied word.<br />
1. Lees die inleiding tot tutoriaal 2 op bladsy 18 en 19. Voltooi dan aktiwiteit 2.1<br />
op bladsy 19.<br />
2. Bestudeer die uitslae van die behandeling van tuberkulose (TB) wat in tabel<br />
2.1 op bladsy 20 van Tredoux en Durrheim (2002) gegee word. Watter<br />
afleidings (inferensies) kan jy oor die behandelingsuitslae maak deur bloot na<br />
die tabel te kyk?<br />
1. Ons het 'n lys met voorbeelde van diskrete en kontinue data saamgestel.<br />
Vergelyk jou voorbeelde daarmee.<br />
bladsy 31
Diskrete data:<br />
1. Flieke gekyk ± jy kon vyf of ses flieke gekyk het, maar nie 6,5 nie.<br />
2. KlieÈ nte gespreek in die afgelope maand ± jy kon 22 of 25 klieÈ nte bedien<br />
het, maar nie 23,25 nie.<br />
3. Sigarette gerook ± 'n mens rook gewoonlik net hele sigarette. As iemand<br />
jou vra hoeveel sigarette jy hierdie week gerook het, sal jou antwoord 13<br />
kan wees, maar nie 13,5 nie.<br />
4. Die nommers op die truie van vlugbalspelers kan 12 of 32 wees, maar nie<br />
12,56of 32,45 nie.<br />
5. Geslag ± 'n mens is o f manlik o f vroulik.<br />
6. 'n Dosis medikasie ± 'n mens kan 2,2 ml of 2,211 ml inspuit.<br />
7. Ure geslaap ± jy kan 9 ure, 9,5 ure of 9,75 ure lank slaap.<br />
8. KaffeõÈ eninname ± jy kan 7 mg, 7,1 mg of 7,25 mg kaffeõÈ en inneem.<br />
9. Salaris ± jy kan enige hoeveelheid rande en sente verdien.<br />
10. Televisie kyk ± jy kan vir enige getal ure en minute televisie kyk.<br />
2. Stem jy saam dat daar 'n magdom syfers in die tabel vervat is wat glad nie sin<br />
maak deur net daarna te kyk nie? Geen betekenisvolle patroon kan uit die stel<br />
data geõÈ dentifiseer word nie. Omdat jy gewoonlik met so 'n hele datastel in<br />
hierdie kursus gaan werk, is dit belangrik om as eerste stap onder<br />
beskrywende statistiek te leer om data grafies sinvol aan te bied sodat<br />
betekenisvolle afleidings daarvan gemaak kan word.<br />
Aanstip van data: ongegroepeerde data _________________________<br />
In die afdeling ``The frequency distribution'' op bladsy 19 van Tredoux en<br />
Durrheim (2002) het jy die begrip ``frekwensie'' die eerste keer teeÈ gekom. Die<br />
frekwensie van 'n telling verwys na die getal kere wat die gegewe telling in die<br />
datastel voorkom.<br />
'n Frekwensieverspreidingstabel en 'n frekwensiestaafdiagram word gebruik om<br />
ongegroepeerde data aan te bied.<br />
Vir die Nuwe Sterre-vertoning is 6645 aansoeke ontvang ± dit is baie papierwerk<br />
om deur te gaan en baie inligting om vas te leà en verslag oor te doen.<br />
Net 'n kort voorbeeld: kom ons neem die eerste 20 aansoeke en kyk wat die<br />
geslagsverspreiding is (V = vroulik en M = manlik):<br />
V V V V M V M M V M<br />
V M M V V V V V V V<br />
Jy sal die aantal kere tel wat V gelys is om die totale aantal vroue in die groep te<br />
bepaal en dieselfde met die mans doen.<br />
bladsy 32 . studie-eenheid 4 aanbieding van data
. afdeling 2 data-verwerking: beskrywend<br />
Geslag Telling Frekwensie<br />
V 11111111111111 14<br />
M 111111 6<br />
Jy kan hierdie voorstelling verder vat deur die persentasies in te sluit.<br />
Geslag Telling Frekwensie Persentasiefrekwensie<br />
V 11111111111111 14 70<br />
M 111111 630<br />
Totaal (N) 20 100<br />
Het jy dit reggekry om die persentasiefrekwensie te bereken? Die persentasie van<br />
elke kategorie word bereken deur die frekwensie vir die kategorie deur die totale<br />
aantal items/persone (N) te deel. Vir die vrouekategorie: 14 / 20 = 0,7 en om die<br />
persentasie te kry maal met 100 = 70%.<br />
Om te kontroleer of jy al die data-items in ag geneem het, kan jy die totaal van die<br />
frekwensiekolom bereken. Dit moet gelyk wees aan die totale aantal data-items.<br />
In die voorbeeld hierbo is daar 20 aansoeke. Die totaal van die frekwensies is ook<br />
gelyk aan 20.<br />
Soos genoem is, is 6645 aansoeke ontvang. Die aansoeke is gesorteer volgens die<br />
Suid-Afrikaanse provinsies van waar die aansoeke ontvang is. As ons dus verslag<br />
wil doen oor die aantal aansoeke wat van elke provinsie in Suid-Afrika ontvang is,<br />
kan ons die frekwensieverspreidingstabel gebruik soos hieronder aangedui.<br />
Voltooi asseblief die tabel deur die persentasies te bereken.<br />
bladsy 33
Frekwensieverspreiding vir Nuwe Sterre-aansoeke ± provinsies:<br />
Provinsie Frekwensie Persentasiefrekwensie<br />
Oos-Kaap 907<br />
Vrystaat 654<br />
Gauteng 1 506<br />
KwaZulu-Natal 1 215<br />
Limpopo 413<br />
Mpumalanga 632<br />
Noord-Kaap 321<br />
Noord-wes 211<br />
Wes-Kaap 786<br />
6 645 100<br />
Lyk jou berekenings soos die berekenings hieronder? Indien nie, gaan dit weer na.<br />
Ons doen berekenings tot twee desimale plekke.<br />
Frekwensieverspreiding vir Nuwe Sterre-aansoek ± provinsies:<br />
Provinsie Frekwensie Persentasiefrekwensie<br />
Oos-Kaap (EC) 907 13,65<br />
Vrystaat (FS) 654 9,84<br />
Gauteng (GP) 1 50622, 6<br />
KwaZulu-Natal (KZN) 1 215 18,28<br />
Limpopo (L) 413 6,22<br />
Mpumalanga (MP) 632 9,51<br />
Noord-Kaap (NC) 321 4,83<br />
Noord-wes (NW) 211 3,18<br />
Wes-Kaap (WC) 78611,83<br />
6 645 100<br />
Soos jy uit bogenoemde voorbeeld kan sien, word die inligting eenvoudig en in 'n<br />
maklik leesbare formaat vertoon.<br />
bladsy 34 . studie-eenheid 4 aanbieding van data
Noudat jy weet hoe om ongegroepeerde data met behulp van 'n frekwensieverspreidingstabel<br />
voor te stel, kan ons kyk hoe data grafies deur middel van die<br />
frekwensiestaafdiagram voorgestel word. Tredoux en Durrheim (2002) bied in<br />
figuur 2.1 op bladsy 21 'n voorbeeld van 'n frekwensiestaafdiagram. Dit is 'n<br />
grafiese voorstelling van die datastel wat in tabel 2.1 en 2.2 op bladsy 20 voorkom.<br />
Indien ons die vroeeÈ re voorbeeld van 20 aansoekers sou gebruik, sal die<br />
frekwensiestaafdiagram soos volg lyk:<br />
Frekwensie<br />
20<br />
15<br />
10<br />
5<br />
. afdeling 2 data-verwerking: beskrywend<br />
V M<br />
Geslag<br />
In 'n frekwensiestaafdiagram word elke kategorie aangedui met 'n staaf wat op<br />
die horisontale as (x-as) staan. Die stawe word deur leeÈ ruimtes of spasies van<br />
mekaar geskei wat die diskontinuõÈ teit tussen die kategorieeÈ beklemtoon.<br />
In die geval van hierdie kursus is enige grafiese voorstelling wat van jou gevra<br />
word tweedimensioneel. Waar daar met frekwensies gewerk word, word die<br />
frekwensie (f) altyd op die vertikale as en die telling (X) op die horisontale as<br />
aangeteken. Die asse moet ook altyd 'n naam kry, byvoorbeeld ``frekwensie'' en<br />
``geslag''.<br />
Onthou, indien die grafiek nie benoem word of byskrifte bevat nie, verskaf dit<br />
onvolledige inligting. Indien bogenoemde grafiek nie byskrifte bevat het nie, sou<br />
jy die stawe gesien het, maar jy sou nie geweet het waarvoor die 14 of die 6voor<br />
staan nie. Die tabelle en grafieke is 'n manier om inligting te vereenvoudig, mense<br />
moet na die tabel kan kyk en weet waarvoor die frekwensies is, dieselfde geld vir<br />
die grafieke. In bostaande grafiek is die Y-as duidelik frekwensie gemerk, X-as is<br />
duidelik geslag gemerk en jy weet die stawe is vir vroulik (V) en manklik (M).<br />
bladsy 35
1. Teken die frekwensiestaafdiagram op grond van die Nuwe Sterre-aansoeke ±<br />
Provinsies (kyk na die voltooide frekwensieverspreidingstabel hierbo).<br />
2. In die aanvangsfases was daar heelwat debat oor waar om hierdie vertoning<br />
te adverteer om aansoekers uit te nooi. Bestuur en die vervaardigers wou weet<br />
watter bemarkingskanaal die beste gewerk het. Die response was soos volg:<br />
Frekwensieverspreiding bemarking/advertering:<br />
Frekwensie<br />
1600<br />
1 400<br />
1 200<br />
1 000<br />
Bemarkingsinstrument Frekwensie<br />
Koerant (K) 399<br />
Televisie (TV) 2 193<br />
Radio (R) 1 728<br />
Pamflette (P) 1 395<br />
Vriende/familie (V/F) 598<br />
Ander (A) 199<br />
Geen respons (GR) 133<br />
1.<br />
2.1 Voltooi die frekwensieverspreidingstabel.<br />
2.2 Stel die toepaslike frekwensiestaafdiagram op.<br />
800<br />
600<br />
400<br />
200<br />
bladsy 36 . studie-eenheid 4 aanbieding van data<br />
6 645<br />
OK VS GP KZN L MP NK NW WK<br />
PROVINSIES
2.1<br />
Frekwensieverspreiding bemarking/advertering:<br />
Bemarkingsinstrument Frekwensie Persentasiefrekwensie<br />
Koerant (K) 399 6<br />
Televisie (TV) 2 193 33<br />
Radio 1 728 26<br />
Pamflette (P) 1 395 21<br />
Vriende/familie (V/F) 598 9<br />
Ander (A) 199 3<br />
Geen respons (GR) 133 2<br />
2.2<br />
Frekwensie<br />
2 200<br />
2 000<br />
1 800<br />
1600<br />
1 400<br />
1 200<br />
1 000<br />
800<br />
600<br />
400<br />
200<br />
. afdeling 2 data-verwerking: beskrywend<br />
6 645 100<br />
NK TV R P V/F A GR<br />
BEMARKINGSINSTRUMENT<br />
Aanstip van data: gegroepeerde data ___________________________<br />
Ons het tot nou toe met nominale of diskrete (ongegroepeerde) data en die<br />
voorstelling daarvan te doen gehad. Nou gaan ons die voorstelling van ordinale,<br />
intervals- en verhoudingsdata of kontinue veranderlikes (gegroepeerde data)<br />
bladsy 37
ehandel. Ons wil hier graag die eienskap vasleà dat geen gapings tussen die<br />
datatellings voorkom nie, omdat die data kontinu van aard is. Geen gapings kom<br />
dus tussen die reghoeke in die grafiek voor soos in staafdiagramme nie.<br />
In die praktyk gebeur dit dikwels dat jy met stelle data werk wat werklik 'n groot<br />
aantal items het. Dit raak dan moeilik om die frekwensie van elke gebeurtenis<br />
individueel aan te teken. Om hierdie rede maak ons gebruik van klasintervalle en<br />
teken ons die frekwensies aan vir die klasinterval en nie vir die individuele<br />
gebeurtenisse nie. Op hierdie wyse groepeer ons die data. Gegroepeerde data kan<br />
aangebied word in 'n tabel bekend as die gegroepeerde frekwensieverspreidingstabel<br />
wat grafies in die vorm van 'n histogram voorgestel kan word.<br />
Die moeilikste stap in die opstel van 'n gegroepeerde frekwensieverspreidingstabel<br />
is om te besluit hoeveel klasintervalle gebruik moet word. Raam 2.1 op bladsy 23<br />
van Tredoux en Durrheim (2002) bied riglyne aan waarmee die getal klasintervalle<br />
en die geskikte grootte daarvan bepaal kan word.<br />
Soos jy kan sien, is daar baie prosedures wat jy kan gebruik om die grootte van<br />
die interval te bereken, maar vir hierdie module sal ons altyd aandui hoe groot die<br />
interval moet wees.<br />
In die geval van gegroepeerde data, waar daar met klasintervalle gewerk word, is<br />
die volgende statistiek belangrik:<br />
. werklike ondergrens<br />
. werklike bogrens<br />
Alhoewel dit in die praktyk kan gebeur dat die grootte van klasintervalle verskil,<br />
is dit in jou geval belangrik om te onthou dat om data sinvol aan te bied, dit nodig<br />
is om gelyke klasintervalle te kies.<br />
Byvoorbeeld: 11±20<br />
21±30<br />
31±40<br />
Al hierdie klasintervalle het 'n gelyke interval van 10.<br />
Indien jy die werklike ondergrens en werklike bogrens vir hierdie voorbeeld moes<br />
bereken:<br />
Klasintervalle Werklike ondergrens Werklike bogrens<br />
11±20 10,5 20,5<br />
21±30 20,5 30,5<br />
31±40 30,5 40,5<br />
Hoe het ons hierdie waardes gekry?<br />
bladsy 38 . studie-eenheid 4 aanbieding van data
. afdeling 2 data-verwerking: beskrywend<br />
Bestudeer die afdeling ``Grouped frequency distributions'' op bladsy 22 tot 25 van<br />
Tredoux en Durrheim (2002) bokant tabel 2.3. Voltooi nou aktiwiteit 2.3 op<br />
bladsy 25.<br />
Werklike bo- en ondergrense leà halfpad tussen die sigbare limiete van aanliggende<br />
klasintervalle. Om die werklike bogrense (WBG) en werklike ondergrense (WOG)<br />
vir tabel 2.4 te bepaal, kan 'n mens die afstand tussen die sigbare bogrens van 'n<br />
interval en die sigbare ondergrens van die volgende klasinterval neem. Die afstand<br />
word dan in twee gedeel om die werklike bogrens vir die eerste interval te gee.<br />
Dieselfde syfer stel ook die werklike ondergrens van die daaropvolgende interval<br />
voor. Vir die eerste klasinterval in tabel 2.4 is 89,5 die werklike bogrens vir die<br />
interval 80±89. Die werklike ondergrens vir die interval is 79,5. Die werklike<br />
bogrens vir die interval 70±79 is 79,5 en die werklike ondergrens is 69,5. Vergelyk<br />
jou ander antwoorde deur dieselfde metode te gebruik as wat ons vir die eerste<br />
twee intervalle gebruik het.<br />
Ons moet nou nog 'n frekwensieverspreidingstabel opstel. In tabel 2.4 op bladsy<br />
26van Tredoux en Durrheim (2002) vind jy twee bekende terme, naamlik<br />
frekwensie en persentasiefrekwensie. Ons het hierdie terme gebruik toe ons<br />
ongegroepeerde data behandel het. Die nuwe begrippe in die ander twee kolomme<br />
is kumulatiewe frekwensie en kumulatiewe persentasiefrekwensie. Syfers in hierdie<br />
kolomme toon die frekwensie of die persentasie frekwensie van alle gevalle met<br />
tellings onder die bogrens van die klasinterval waarlangs hulle leà . Kumulatiewe<br />
frekwensies en persentasie frekwensies word vir elke klasinterval bereken deur die<br />
frekwensie of persentasiefrekwensie vir 'n bepaalde interval by die frekwensies of<br />
persentasiefrekwensies in alle laer intervalle op te tel.<br />
Bestudeer die afdeling ``Grouped frequency distributions'' op bladsy 25 (laaste<br />
paragraaf) en 26van Tredoux en Durrheim (2002). Stel dan 'n gegroepeerde<br />
frekwensieverspreidingstabel vir die volgende gegewens op:<br />
Die Nuwe Sterre-produksie het ook beoordelaarsposte vir die vertoning<br />
geadverteer. Uit die honderde aansoeke wat van potensieÈ le beoordelaars<br />
ontvang is, is 80 op die kortlys geplaas en moes assessering ondergaan. Hier is<br />
hulle resultate.<br />
33 48 45 70 55 57 88 54 44 29<br />
23 43 6 5 78 39 53 78 6 7 56 6 3<br />
25 32 78 65 41 33 66 56 88 68<br />
56 23 6 45 6 0 6 1 49 58 45 54<br />
76 34 54 34 80 65 50 69 34 50<br />
78 54 34 55 568645 70 45 50<br />
56 54 6 7 89 34 50 52 71 6 1 59<br />
45 55 89 7652 51 55 87 70 90<br />
bladsy 39
Bykomend tot die kolomme van die tabel op bladsy 26in Tredoux en Durrheim<br />
(2002) het ons die ``werklike grense''-kolom wat die RLL en RUL aandui.<br />
Frekwensieverspreiding: Assesseringstellings vir beoordelaars van aansoekers op die<br />
kortlys<br />
Klasinterval<br />
Werklike<br />
bogrens<br />
Frekwensie Kumulatiewe<br />
frekwensie<br />
Persentasiefrekwensie<br />
Kumulatiewe<br />
persentasiefrekwensie<br />
81±90 80,5±90,5 7 80 8,75 100<br />
71±80 70,5±80,5 8 73 10 91,25<br />
61±70 60,5±70,5 15 65 18,75 81,25<br />
51±60 50,5±60,5 23 50 28,75 62,5<br />
41±50 40,5±50,5 14 27 17,5 33,75<br />
31±40 30,5±40,5 9 13 11,25 16,25<br />
21±30 20,5±30,5 4 4 5 5<br />
80 100<br />
Histogramme word gebruik om gegroepeerde data (interval- of verhoudingsdata)<br />
grafies voor te stel. Hulle lyk soos staafdiagramme, maar verskil in die volgende<br />
opsig:<br />
. Die stawe verteenwoordig frekwensies van gevalle in klasintervalle (en nie die<br />
frekwensie van afsonderlike data-itemwaardes soos in staafdiagramme nie) wat<br />
van links na regs en in volgorde van toenemende grootte gerangskik word.<br />
. Geen oop ruimtes word tussen stawe toegelaat nie, omdat geen gapings tussen<br />
klasse voorkom soos in staafdiagramme nie.<br />
. Die stawe in die grafiese voorstelling word aangedui deur die middelpunt van<br />
elke klasinterval te gebruik. Jy sal die vergelyking vir die middelpunt van die<br />
klasinterval op bladsy 27 van Tredoux en Durrheim (2002) vind (kyk<br />
vergelyking 2.1).<br />
1. Bestudeer die afdeling ``The histogram'' op bladsy 27 tot 28 van Tredoux en<br />
Durrheim (2002). Voltooi nou aktiwiteit 2.6op bladsy 28.<br />
Die volgende aktiwiteite het betrekking op alles wat jy tot dusver oor<br />
gegroepeerde data geleer het.<br />
2. Voltooi die onderstaande sinne:<br />
2.1 Die werklike ondergrens is die ................... waarde wat in die spesifieke<br />
klasinterval kan klassifiseer.<br />
bladsy 40 . studie-eenheid 4 aanbieding van data
2.2 Die werklike bogrens is die .................... waarde wat in die spesifieke<br />
klasinterval kan klassifiseer.<br />
2.3 Die middelpunt is die .................... van die onder- en bogrens.<br />
2.4 Wanneer gegroepeerde data grafies in die vorm van histogramme<br />
voorgestel word, word die reghoek aan weerskante van die ....................<br />
op die .................... -as van die grafiek getrek.<br />
3. Bepaal die werklike ondergrens, werklike bogrens en middelpunt van die<br />
volgende stel klasintervalle.<br />
Klasinterval Werklike<br />
ondergrens<br />
1±4<br />
Werklike<br />
bogrens<br />
Middelpunt<br />
5±8 6,5<br />
9±12<br />
13±16<br />
17±20<br />
Middelpunt = gemiddelde van die boonste en onderste limiet van die<br />
klasinterval<br />
= (8 + 5)/2<br />
=6,5<br />
4. Stel 'n grafiese aanbieding op van die assesseringstellings vir beoordelaars op<br />
die kortlys.<br />
5. Voltooi oefening 3 (a) en (b) op bladsy 39 van Tredoux en Durrheim (2002).<br />
1. Ons het die middelpunt van die interval 80±89 uitgewerk en jy kan dit as 'n<br />
voorbeeld gebruik. Vergelyk jou berekening met ons s'n en bereken die ander<br />
middelpunte op dieselfde manier.<br />
Middelpunt van klasinterval = WOG +<br />
…WBG WOG†<br />
…2†<br />
Middelpunt van klasinterval 80±89 = 79,5 + ((89,5±79,5)/2)<br />
= 79,5 + 5<br />
= 84,5<br />
2. Die middelpunt vir klasinterval 80±89 is 84,5.<br />
2.1 Laagste (kleinste)<br />
2.2 Hoogste (grootste)<br />
2.3 Gemiddeld<br />
. afdeling 2 data-verwerking: beskrywend<br />
bladsy 41
2.4 middelpunt<br />
horisontale<br />
3. Jy sal sien dat die volgende klasintervalle almal dieselfde grootte van 4 het.<br />
Klasinterval Werklike<br />
ondergrens<br />
4.<br />
Frekwensie<br />
25<br />
20<br />
15<br />
10<br />
5<br />
Werklike<br />
bogrens<br />
Middelpunt<br />
1±4 0,5 4,5 2,5<br />
5±8 4,5 8,5 6,5<br />
9±12 8,5 12,5 10,5<br />
13±1612,5 16,5 14,5<br />
17±20 16,5 20,5 18,5<br />
25,5 35,5 45,5 55,5 65,5 75,5 85,5<br />
ASSESSERINGSTELLINGS<br />
5(a) Omvang = 46+ 1 = 47 en groeperings van 5 gee dus 10 klasintervalle.<br />
Dit is die standaard, en hoewel die besluit betreklik arbitreà r is, sal 'n<br />
klasinterval van 5 gebruik word.<br />
WOG 7 97,495<br />
WBG 7 102,495<br />
Middelpunt 7 (102,495 7 97,495)/2 = 100<br />
bladsy 42 . studie-eenheid 4 aanbieding van data
Tabel: Frekwensieverspreidingstabel van IK-tellings<br />
Klasinterval Frekwensie Kumulatiewe<br />
frekwensie<br />
5(b) Histogram<br />
Frekwensie<br />
14 .<br />
12 .<br />
10 .<br />
8 .<br />
6 .<br />
4 .<br />
2 .<br />
0 . .<br />
85,0<br />
.<br />
90,0<br />
. afdeling 2 data-verwerking: beskrywend<br />
.<br />
95,0<br />
.<br />
100,0<br />
.<br />
105,0 110,0<br />
IK-telling<br />
Persentasiefrekwensie<br />
.<br />
.<br />
115,0<br />
.<br />
120,0<br />
Kumulatiewe<br />
persentasiefrekwensie<br />
82,5±87,49 5 5 8 8<br />
87,5±92,49 8 13 13 21<br />
92,5±97,49 13 2622 43<br />
97,5±102,49 11 37 18 61<br />
102,5±107,49 9 4615 76<br />
107,5±112,49 5 51 8 84<br />
112,5±117,49 2 53 3 87<br />
117,5±122,49 4 57 7 94<br />
122,5±127,49 2 59 3 97<br />
127,5±132,49 1 60 2 100<br />
.<br />
125,0<br />
.<br />
130,0<br />
bladsy 43
In die geval waar 'n telling presies op die werklike bogrens van 'n klasinterval en<br />
op die daaropvolgende klasinterval se werklike ondergrens val, byvoorbeerd 14,5,<br />
kan dit in enige van die twee klasintervalle gegroepeer word. Dit bly egter<br />
belangrik om konsekwent met al hierdie grensgevalle te wees.<br />
Beskrywing van distribusies _________________________________<br />
Jy kan nou ongegroepeerde en gegroepeerde data grafies voorstel. Die<br />
frekwensiestaafdiagram en die histogram wat jy getrek het, kan dan beskryf<br />
word, sodat dit sinvol geõÈ nterpreteer kan word ten opsigte van twee<br />
hoofeienskappe, naamlik skeefheid en kurtose.<br />
. Skeefheid<br />
Bestudeer die afdeling ``Describing frequency distributions'' op bladsy 28 tot 31<br />
van Tredoux en Durrheim (2002).<br />
. Kurtose<br />
Ons verwys na die spitsheid van verspreiding as die kurtose van daardie<br />
verspreiding. Bestudeer die definisie van kurtose wat hieronder gegee word en<br />
sorg dat jy grafies tussen die verskillende soorte kurtose kan onderskei.<br />
Vervolgens haal ons die definisie en beskrywing van die soorte kurtose uit<br />
Howell (1995, pp. 40±42) aan.<br />
Kurtosis has a specific mathemathical definition, but basically it refers to the<br />
relative concentration of scores in the center, the upper and lower ends<br />
(tails), and the shoulders (between the center and the tails) of a distribution.<br />
A normal distribution ... is called mesokurtic. Its tails are neither too thin nor<br />
too thick, and there are neither too many nor too few scores concentrated in<br />
the center. If you start with a normal distribution and move scores from both<br />
the center and the tails into the shoulders, the curve becomes flatter and is<br />
called platykurtic. If, on the other hand, you moved scores from the<br />
shoulders into both the center and the tails, the curve becomes more peaked<br />
with thicker tails. Such a curve is called leptokurtic, ... Notice in this<br />
distribution that there are too many scores in the center and too many scores<br />
in the tails.<br />
Figuur 2.7 op bladsy 30 van Tredoux en Durrheim (2002) bied 'n voorbeeld van 'n<br />
spits (leptokurtiese) en 'n plat (platikurtiese) verspreiding.<br />
1. Identifiseer die twee hoofeienskappe en hulle verskillende soorte,<br />
waarvolgens distribusies beskryf kan word.<br />
2. Maak 'n vryhandskets van elke soort distribusie.<br />
bladsy 44 . studie-eenheid 4 aanbieding van data
1. Skeefheid<br />
. simmetriese distribusie<br />
. bimodale distribusie (tweetoppig)<br />
. unimodale distribusie (eentoppig)<br />
. negatief skewe distribusie (skeef na links, dws die lang stert wys na die<br />
negatiewe/klein getalle toe). 'n Voorbeeld hiervan verskyn regs in figuur<br />
2.6op bladsy 30 van Tredoux en Durrheim.<br />
. positief skewe distribusie (skeef na regs, dws die lang stert wys na die<br />
positiewe/groot getalle toe). 'n Voorbeeld hiervan verskyn links in figuur<br />
2.6op bladsy 30 van Tredoux en Durrheim.<br />
Kurtose<br />
. afdeling 2 data-verwerking: beskrywend<br />
. platikurtiese distribusie (``plat'', dws baie hoeÈ en lae waardes)<br />
. leptokurtiese distribusie (``spits'', dws min hoeÈ en lae waardes)<br />
. mesokurtiese distribusie (``normaal'')<br />
2. Normaal/Mesokurties Skeefheid Negatief skeef Kurtose Leptokurties<br />
Bimodaal Positief skeef Platikurties<br />
Persentielrange en persentiele _______________________________<br />
Om die data nog beter te verstaan, kan ons datafrekwensie-aanbiedings met<br />
kumulatiewe persentasiefrekwensies aanwend om persentiele en persentielrange<br />
uit te werk. Frekwensies maak dit vir ons moontlik om bepaalde waardes in<br />
verhouding tot ander waardes in 'n distribusie te vind, om te bepaal watter<br />
proporsie tellings hoeÈ r of laer as 'n spesifieke waarde leà en om te bepaal watter<br />
proporsie tellings tussen twee waardes leà .<br />
Dit is belangrik om te onderskei tussen die telling wat 'n individu in 'n toets<br />
bladsy 45
ehaal het en die persentielrang wat hierdie telling verteenwoordig, en die<br />
persentiel wat die punt op die skaal is wat met 'n gegewe persentielrang<br />
ooreenstem.<br />
Jy moet die volgende kan bereken en interpreteer:<br />
. persentielrang (vergelyking 2.2 op bladsy 32 van Tredoux en Durrheim (2002))<br />
. persentiele (vergelyking 2.3 op bladsy 33 van Tredoux en Durrheim (2002))<br />
. persentasies of frekwensies van tellings wat onder of bo 'n gegewe telling of<br />
tussen twee tellings leà (formules op bladsy 35 van Tredoux en Durrheim (2002))<br />
Persentiele deel 'n distribusie in 100 klein intervalle in, vanaf die 1ste tot die 100ste<br />
persentiel. Distribusies kan ook in halwes, kwarte en tiendes ingedeel word. Die<br />
50ste persentiel word ook die mediaan genoem, terwyl die 25ste en 75ste persentiel<br />
as die 1ste en 3de kwartiel bekend staan. Die 1ste, 2de, 3de ... desiel is die 10de,<br />
20ste en 30ste persentiel.<br />
Bestudeer die afdeling ``Percentile ranks and percentiles'' op bladsy 31 tot 38 van<br />
Tredoux en Durrheim (2002). Voltooi dan die volgende aktiwiteite.<br />
1. Doen oefening 3(c), (d) en (e) op bladsy 39 van Tredoux en Durrheim (2002).<br />
Jy hoef nie die frekwensietabel vir hierdie datastel op te stel nie, aangesien jy<br />
die een kan gebruik wat jy reeds in oefening 3(a) en (b) gedoen het in die<br />
aktiwiteite aan die begin van hierdie studie-eenheid.<br />
2. Gebruik die tellings van die assessering van beoordelaars op die kortlys en<br />
doen die volgende oefeninge.<br />
2.1 Watter telling word op die 35ste persentiel gevind?<br />
2.2 Bepaal die persentielrang van 70.<br />
Tabel: ESP-tellings (n=30)<br />
7 9 16 6 7 8<br />
4 7 5 11 5 9<br />
4 4 7 5 17 5<br />
8 6 5 4 4 6<br />
610 1 12 4 10<br />
bladsy 46 . studie-eenheid 4 aanbieding van data
1. 3(c) persentielrang = % onder +<br />
2.1<br />
persentielrang = 43 +<br />
=52<br />
100 97;495<br />
5<br />
telling WOG<br />
klasintervalwydte (interval %)<br />
(18)<br />
Ongeveer 52% van die tellings leà by of onder 'n telling van 100. Hierdie<br />
steekproef het 'n gemiddelde telling wat effens laer is as die vir die res<br />
van die populasie.<br />
3(d) telling van p = WOG +<br />
telling van p = 102,495 +<br />
= 107<br />
(e) persentielrang = % onder +<br />
PR % onder<br />
interval % (intervalwydte)<br />
75 61<br />
15 (5)<br />
telling WOG<br />
klasintervalwydte (interval %)<br />
Ons weet dat 75% van die distribusie by of onder 107 leà (kyk (d)). Ons<br />
moet bereken watter persentasie onder 'n telling van 92 val. As ons dit<br />
bepaal het, kan ons bereken watter persentasie tussen die twee tellings leà .<br />
persentielrang = 8 +<br />
= 19,7<br />
92 87;495<br />
5<br />
(13)<br />
Ongeveer 20% van die distribusie leà dus by of onder 92 en ongeveer 75%<br />
leà by of onder 107.<br />
Dus val 75% 7 20% = 55% van die tellings tussen 'n telling van 92<br />
en 107.<br />
telling van p = WOG +<br />
PR % onder<br />
interval % (intervalwydte)<br />
WOG = 50,5 (die werklike ondergrens van die klasinterval<br />
wat die 50ste persentielrangtelling bevat)<br />
PR = 35 (die persentielrang waarin ons belang stel)<br />
% onder = 33,75 (die kumulatiewe % frekwensie van die klasinterval<br />
onder die een waarin ons belang stel)<br />
interval % = 28,75 (die % frekwensie van die klasinterval waarin<br />
ons belang stel)<br />
telling van p = 50,5 +<br />
= 50,93<br />
. afdeling 2 data-verwerking: beskrywend<br />
35 33;75<br />
28;75<br />
(10)<br />
bladsy 47
2.2<br />
telling WOG<br />
klasintervalwydte (interval %)<br />
persentielrang =<br />
Waar:<br />
% onder +<br />
% onder = Kumulatiewe persentasiefrekwensie van die<br />
klasinterval onder die interval waarin die telling<br />
van belang val<br />
telling = die telling ten opsigte waarvan ons die<br />
persentielrang wil bepaal<br />
WOG<br />
klasinterval-<br />
= werklike ondergrens van die interval waarin die<br />
telling van belang val<br />
wydte = die wydte van die klasinterval<br />
interval % = die persentasie van die distribusie wat in die interval<br />
van belang val<br />
% onder = 62,5<br />
telling = 70<br />
WOG<br />
klasinterval-<br />
= 60,5<br />
wydte = 10<br />
interval % =<br />
persentielrang =<br />
=<br />
18,75<br />
62,5 +<br />
70<br />
80,31<br />
60; 5<br />
10<br />
(18,75)<br />
Ons wil jou graag 'n voorbeeld gee van hoe data op 'n rekenaardrukstuk<br />
aangebied word. Ons het SPSS op die datastel hieronder toegepas om 'n<br />
staafdiagram te verkry. As jy toegang tot 'n rekenaar het, sal jy hierdie gegewens<br />
op die CD vind wat die handboek vergesel. Soek onder die laaste opskrif ``A1<br />
Introduction to SPSS'' en kies dan ``Additional exercises''.<br />
Hier volg die frekwensiedata wat die ouderdomme van die verskillende<br />
deelnemers aan die opname toon.<br />
Ouderdom Frekwensie Persentasiefrekwensie<br />
10±18 jaar 17 21,3<br />
18±24 jaar 3 3,8<br />
24±30 jaar 23 28,8<br />
30±40 jaar 20 2,5<br />
40+ jaar 17 21,3<br />
bladsy 48 . studie-eenheid 4 aanbieding van data
Staafdiagram van frekwensiedata<br />
Telling<br />
30 .<br />
20 .<br />
10 .<br />
0 .<br />
10±18 jaar 24±30 jaar 2,5 40+ jaar<br />
18±24 jaar 30±40 jaar<br />
Ouderdomkategorie<br />
Noudat jy studie-eenheid 4 bestudeer het, behoort jy in staat te wees om die<br />
volgende te kan doen:<br />
. 'n Stel data in tabelvorm te kan aanbied, spesifiek as 'n gegroepeerde of<br />
ongegroepeerde frekwensieverspreidingstabel of as 'n kumulatiewe<br />
frekwensieverspreidingstabel<br />
. die volgende tipes grafieke te kan teken:<br />
± frekwensiestaafdiagramme<br />
± histogramme<br />
. distribusies op grond van die volgende twee eienskappe te kan onderskei en<br />
teken:<br />
± skeefheid<br />
± kurtose<br />
. die volgende te kan bereken en verstaan:<br />
± persentielrange<br />
± persentiele<br />
. afdeling 2 data-verwerking: beskrywend<br />
. verskillende tipes grafiese voorstellings en eienskappe daarvan op<br />
rekenaardrukstukke te kan identifiseer.<br />
bladsy 49
5<br />
studie-eenheid vyf<br />
Maatstawwe van<br />
sentrale neiging<br />
Wanneer navorsing gedoen word, word dikwels met groot stelle data<br />
gewerk. 'n Datastel is 'n versameling van al die datapunte wat in 'n<br />
bepaalde ondersoek ingesamel is en wat gewoonlik in tabelvorm<br />
aangebied word. Hierdie datastelle maak waarskynlik op die oog af geen sin nie.<br />
In studie-eenheid 4 het jy geleer dat ons 'n datastel kan saamvat of vereenvoudig<br />
deur dit visueel voor te stel. Die onderstaande stel data is gegrond op 'n gedeelte<br />
van die inligting wat in die eerste week uit die Nuwe-Sterre-aktiwiteite ingesamel<br />
is. Kyk 'n bietjie hoe die deelnemers die eerste week gevaar het. Miskien het jy toe<br />
jy hulle profiel gelees het reeds van een of twee van hulle gehou of nie gehou nie.<br />
Die kompetisie het begin!<br />
Tellings van die voorbereidingsaktiwiteite is volgens 'n 10-puntskaal gedoen, met<br />
1 wat die laagste is en 10 die hoogste. Soos wat in elke kolom aangedui is, is die<br />
telling ontvang vir die verskillende aktiwiteite in die week en die laaste kolom is 'n<br />
totale telling wanneer jy al vyf aktiwiteite bymekaar tel.<br />
Week 1: Puntetellings vir voorbereidingsaktiwiteite<br />
Deelnemers Dramaklasse Stemopleiding<br />
Vernuwing<br />
van beeld<br />
Onderhoudsvaardigheidsopleiding<br />
Opleiding in<br />
die hantering<br />
van aanhangers<br />
en media<br />
Totale<br />
puntetelling<br />
vir<br />
Week 1<br />
1. Vuyo K 8 7 7 8 8 38<br />
2. Lebo 5 65 4 4 24<br />
3. Sasha 8 7 8 4 5 32<br />
4. Susan 67 65 7 31<br />
5. David 65 5 6 4 26<br />
6. Tshepo 7 6 5 6 4 28<br />
7. Indresan 8 65 6 6 31<br />
8. Shelley 8 7 8 68 37<br />
9. Camero 7 8 67 6 34<br />
10. Kerry 9 68 7 5 35<br />
bladsy 50 . studie-eenheid 5 maatstawwe van sentrale neiging
. afdeling 2 data-verwerking: beskrywend<br />
Hierdie studie-eenheid sal 'n alternatiewe metode verduidelik waarin 'n datastel<br />
beskryf kan word, naamlik deur 'n meting van sentrale neiging te gebruik.<br />
Ons ondersoek drie maatstawwe van sentrale neiging: die gemiddelde, modus en<br />
mediaan. Hierdie maatstawwe dui almal die ``middel'' van 'n datastel aan. Die<br />
diagram hieronder bied 'n grafiese voorstelling van die drie maatstawwe. Ons<br />
verwag dat jy die toepaslike blokkies sal invul namate jy deur die studie-eenheid<br />
vorder.<br />
SENTRALE NEIGING<br />
1 2 3<br />
Bestudeer die inleiding tot hierdie tutoriaal op bladsy 40 tot 41 van Tredoux en<br />
Durrheim (2002) wat 'n kort uiteensetting van elke maatstaf van sentrale neiging<br />
bied.<br />
Elke maatstaf word meer volledig in die onderstaande paragrawe bespreek.<br />
Wat is die gemiddelde (X)? ________________________________<br />
Dink terug aan jou skooldae en jou rapport aan die einde van die jaar. Vir elke<br />
vak het jy 'n punt gekry en ook 'n gemiddelde punt vir die jaar wat jou o f laat<br />
slaag o f laat druip het. Gewoonlik is die gemiddelde persentasie van die klas ook<br />
in jou rapport aangedui en was jou ouers gelukkig met jou prestasie of moes jy<br />
verduidelik het waarom jy soveel swakker as die klasgemiddeld presteer het.<br />
Hierdie klasgemiddeld is een van die maatstawwe van sentrale neiging. Ons gaan<br />
eerstens na 'n formeler omskrywing van die gemiddeld kyk en daarna hoe 'n mens<br />
dit uitwerk.<br />
Bestudeer bladsy 41 tot 43 van Tredoux en Durrheim (2002). Let op hoe die<br />
skrywers die begrip omskryf en die formule gebruik.<br />
Hulle verwys op bladsy 43 na een van die beperkings van die gemiddeld, naamlik<br />
dat dit nie rekening hou met uitskietertellings nie. Jy kan hul bespreking op bladsy<br />
bladsy 51
43 tot 44 lees van die geknipte/gesnoeide gemiddelde wat vir die uitwerking van<br />
enige uitskietertellings in die gemiddelde waarde van 'n datastel vergoed. Hoewel<br />
jy bewus moet wees van die geknipte gemiddelde, hoef jy dit nie vir die eksamen te<br />
ken nie.<br />
1. Formuleer jou eie beskrywing van 'n gemiddelde:<br />
_________________________________________________________________<br />
_________________________________________________________________<br />
2. Kyk of jy die gemiddeld vir die volgende datastelle reg kan bereken:<br />
(Let wel: As jy vertroud is met die berekening van die gemiddeld is dit nie<br />
nodig om al ses oefeninge te doen nie. Doen slegs twee en gaan aan met die<br />
volgende vraag.)<br />
2.1 Die telling vir die dramaklasaktiwiteite van al 10 deelnemers<br />
2.2 Die telling vir die stemopleidingsaktiwiteit van al 10 deelnemers<br />
2.3 Susan se telling vir al vyf aktiwiteite<br />
2.4 Die telling vir die onderhoudsvaardigheidsopleidingaktiwiteit vir al 10<br />
deelnemers<br />
2.5 Die puntetellings vir die opleidingsaktiwiteite vir die hantering van<br />
aanhangers en die media vir al 10 deelnemers<br />
2.6Shelley se puntetellings vir al vyf aktiwiteite<br />
3. Wat is die gemiddelde puntetelling vir die voorbereidingsaktiwiteite vir Week<br />
1 van al 10 deelnemers?<br />
1. Die gemiddelde is die som van al die tellings gedeel deur die aantal tellings.<br />
2.1 Dramaklasse: 8+5+8+6+6+7+8+8+7+9 / 10 = 72 / 10 = 7,2<br />
2.2 6,5<br />
2.3 6,2<br />
2.4 5,9<br />
2.5 5,7<br />
2.67,4<br />
3 31,6<br />
Uit dit wat jy hierbo baasgeraak het, behoort die gemiddelde vir jou duidelik te wees en behoort jy<br />
. dit te kan omskryf; en<br />
. dit te kan bereken<br />
bladsy 52 . studie-eenheid 5 maatstawwe van sentrale neiging
Die volgende twee maatstawwe sal dalk vir jou vreemder wees, maar met 'n bietjie<br />
gesonde verstand en nadenke oor die algemene spreektaal en hoe die woorde<br />
gebruik word, sal die begrippe vir jou makliker wees.<br />
Wat is die mediaan? ______________________________________<br />
Die tweede maatstaf van sentrale neiging is die vreemdste, maar as jy mooi<br />
daaroor nadink, is dit dalk voor die hand liggend.<br />
Van watter woord dink jy is mediaan afgelei? Watter betekenisse kan aan die<br />
woord ``medium'' geheg word? (Dink aan die drie keuses wat jy het as jy biefstuk<br />
in 'n restaurant bestel ± goed gaar, medium of half gaar. Hoe sou biefstuk wees<br />
wat medium gaar is?)<br />
Bestudeer bladsy 45 tot 46van Tredoux en Durrheim (2002) en sorg dat jy die<br />
definisie van die term ken en weet hoe om die mediaan te bereken.<br />
Onthou om altyd die volgende drie stappe met die berekening van die mediaan toe<br />
te pas:<br />
1. Bereken altyd eers die mediaanposisie deur middel van die formule.<br />
2. Orden die data ± van die kleinste na die grootste getalle o f van die grootste na<br />
die kleinste getalle.<br />
3. Tel die posisies tot by die mediaanposisie wat jy in stap 1 bereken het en<br />
bepaal die mediaan.<br />
1. Gee jou eie definisie van die term ``mediaan'':<br />
_________________________________________________________________<br />
_________________________________________________________________<br />
2. Bereken die mediaan vir die volgende datastelle:<br />
. afdeling 2 data-verwerking: beskrywend<br />
(Let wel: As jy vertroud is met die berekening van die meidaan is dit nie nodig<br />
om al ses oefeninge te doen nie. Doen slegs twee en gaan aan met die<br />
volgende vraag.)<br />
2.1 Die telling vir die dramaklasaktiwiteite van al 10 deelnemers<br />
2.2 Die telling vir die stemopleidingsaktiwiteit van al 10 deelnemers<br />
2.3 Susan se telling vir al vyf aktiwiteite<br />
2.4 Die telling vir die onderhoudsvaardigheidsopleidingaktiwiteit vir al 10<br />
deelnemers<br />
bladsy 53
2.5 Die puntetellings vir die opleidingsaktiwiteite vir die hantering van<br />
aanhangers en die media vir al 10 deelnemers<br />
2.6Shelley se puntetellings vir al vyf aktiwiteite<br />
3. Wat is die mediaan vir die voorbereidingsaktiwiteite vir Week 1 van al 10<br />
deelnemers?<br />
1. Die mediaan is daardie telling wat presies in die middel van 'n verspreiding<br />
val as al die tellings in numeriese volgorde gerangskik is. Hierdie telling hoef<br />
nie noodwendig in die oorspronklike datastel teenwoordig te wees nie.<br />
2.1 Dramaklasse:<br />
Stap 1: Mediaanposisie = N ‡ 1<br />
2<br />
= 11/2 = 5,5de posisie<br />
Stap 2: 5; 6; 6; 7; 7; 8; 8; 8; 8; 9<br />
Stap 3: 7+8 / 2 = 7,5 (As die mediaanposisie tussen twee tellings leÃ, tel<br />
hierdie tellings by mekaar en deel deur 2. Dit gee vir jou die mediaan.)<br />
2.2 6,5<br />
2.3 6<br />
2.4 6<br />
2.5 5,5<br />
2.68<br />
3 31,5<br />
Jy wonder seker waarom jy nou moet leer om nog 'n maatstaf van sentrale neiging<br />
te bereken as jy reeds weet hoe om die gemiddelde te bepaal. Die mediaan verskil<br />
ietwat van die gemiddelde en kan soms in die plek van die gemiddelde gebruik<br />
word.<br />
Hier volg bykomende inligting oor die verskil tussen die mediaan en die gemiddelde:<br />
. Die wesenlike verskil tussen die gemiddelde en die mediaan is dat die<br />
gemiddelde die waarde van elke telling in die distribusie weerspieeÈ l, terwyl die<br />
mediaan grootliks gegrond is op die posisie van die middelpunt van die<br />
distribusie, sonder om die spesifieke waarde van baie van die tellings in ag te<br />
neem.<br />
. Kyk goed na die volgende tabel:<br />
Tellings Gemiddelde Mediaan<br />
12345 3 3<br />
123450 12 3<br />
1234100 22 3<br />
bladsy 54 . studie-eenheid 5 maatstawwe van sentrale neiging
. afdeling 2 data-verwerking: beskrywend<br />
. Slegs die laaste getal in elke stel tellings verskil. Die gemiddelde weerspieeÈ l<br />
hierdie verskille, maar die mediaan nie. Die spesifieke waarde van die ekstreme<br />
tellings beõÈ nvloed nie die mediaan nie, maar wel die gemiddelde.<br />
Kortom, as jou datastel 'n paar ekstreme uitskieter-datapunte bevat, kan jy die<br />
mediaan in plaas van die gemiddelde bereken sodat jou maatstaf van sentrale<br />
neiging nie deur die uitskietertellings geraak word nie.<br />
Jy het nou die tweede vorm van sentrale neiging bestudeer en behoort<br />
. die mediaan te kan omskryf; en<br />
. die mediaanposisie te kan bepaal om die mediaan te kan bereken.<br />
Wat is die modus? _______________________________________<br />
Die modus is die telling met die hoogste frekwensie in 'n distribusie (dit wil seà , die<br />
telling wat die meeste voorkom).<br />
Bestudeer bladsy 46tot 47 van Tredoux en Durrheim (2002). Sorg dat jy die<br />
definisie van die term ken en weet hoe om die modus te bereken.<br />
1. Formuleer jou eie omskrywing van die term ``modus''.<br />
_________________________________________________________________<br />
_________________________________________________________________<br />
2. Kyk of jy die modus vir die volgende datastelle reg kan bereken:<br />
(Let wel: As jy vertroud is met die berekening van die modus is dit nie nodig<br />
om al ses oefeninge te doen nie. Doen slegs twee en gaan aan met die<br />
volgende vraag.)<br />
2.1 Die telling vir die dramaklasaktiwiteite van al 10 deelnemers<br />
2.2 Die telling vir die stemopleidingsaktiwiteit van al 10 deelnemers<br />
2.3 Susan se telling vir al vyf aktiwiteite<br />
2.4 Die telling vir die onderhoudsvaardigheidsopleidingaktiwiteit vir al 10<br />
deelnemers<br />
2.5 Die puntetellings vir die opleidingsaktiwiteite vir die hantering van<br />
aanhangers en die media vir al 10 deelnemers<br />
2.6Shelley se puntetellings vir al vyf aktiwiteite<br />
3. Wat is die modus vir die voorbereidingsaktiwiteite vir Week 1 van al 10<br />
deelnemers?<br />
1. Die modus is die telling wat die meeste voorkom, dit wil seà , die hoogste<br />
frekwensie het.<br />
2.1 Dramaklasse: 5; 6; 6; 7; 7; 8; 8; 8; 8; 9, dus die modus is = 8.<br />
bladsy 55
3 31<br />
2.2 6en 7 (bimodaal)<br />
2.3 6en 7 (bimodaal)<br />
2.4 6<br />
2.5 4<br />
2.68<br />
Die aktiwiteite hierbo het jou sekerlik in staat gestel om:<br />
. die modus te kan omskryf; en<br />
. dit te kan bereken<br />
Wat beteken sentrale neiging? _______________________________<br />
Voltooi die diagram aan die begin van die studie-eenheid deur die drie<br />
maatstawwe van sentrale neiging in die toepaslike blokkies in te vul.<br />
Noudat jy die diagram aan die begin van die studie-eenheid voltooi het, het jy al<br />
drie die maatstawwe van sentrale neiging baasgeraak. Maar het jy al gedink wat<br />
sentrale neiging behels? Hoekom stel ons as bedryfsielkundiges (en ander mense)<br />
belang in maatstawwe van sentrale neiging? Wat is die nut, voordele en nadele<br />
daarvan?<br />
Sit terug en dink 'n bietjie oor die konsep sentrale neiging. Probeer nou jou eie<br />
omskrywing van sentrale neiging formuleer op grond van die kennis wat jy in die<br />
voorgaande baasgeraak het.<br />
Die figuur hieronder toon die relatiewe posisies van die modus, mediaan en<br />
gemiddelde vir verskillende distribusies.<br />
bladsy 56 . studie-eenheid 5 maatstawwe van sentrale neiging
Gemiddelde, mediaan en modus vir verskillende distribusies<br />
Gemiddelde<br />
Mediaan<br />
Modus<br />
Modus Gemiddelde<br />
Mediaan<br />
Bron: McCall (1986)<br />
. afdeling 2 data-verwerking: beskrywend<br />
Modus Gemiddelde Modus<br />
Mediaan<br />
Gemiddelde Modus<br />
Mediaan<br />
Tredoux en Durrheim (2002) toon op bladsy 49 hoe die mediaan, modus en<br />
gemiddelde met behulp van Microsoft Excel uitgewerk kan word. Hoewel jy<br />
hierdie berekeninge nie vir die eksamen in Microsoft Excel moet kan doen nie,<br />
moet jy tog kennis neem van hoe die antwoorde in hierdie rekenaarprogram<br />
voorgestel word.<br />
Nadat jy hierdie studie-eenheid sorgvuldig bestudeer het, behoort jy<br />
. te verstaan wat sentrale neiging beteken en te weet dat die gemiddelde, mediaan<br />
en modus die algemeenste maatstawwe van sentrale neiging is<br />
. die gemiddelde, mediaan en modus van 'n datastel te kan beskryf en bereken;<br />
en<br />
. enkele voor- en nadele van die maatstawwe van sentrale neiging te kan<br />
identifiseer<br />
bladsy 57
6<br />
studie-eenheid ses<br />
D<br />
C<br />
B<br />
A<br />
3 "<br />
Maatstawwe van<br />
varieerbaarheid<br />
In die voorgaande studie-eenheid het jy geleer van die verskillende<br />
maatstawwe van sentrale neiging: die modus, mediaan en gemiddelde.<br />
Hierdie maatstawwe van sentrale neiging dui aan waar die middelpunt van<br />
'n groep tellings leà . Die berekening van die maatstawwe van varieerbaarheid bied<br />
nog 'n tegniek wat gebruik kan word om 'n groep tellings te beskryf. Hierdie<br />
metode behels meer as bloot die bepaling van die middelpunt van 'n groep tellings.<br />
Ons gee nou 'n voorbeeld om die verwantskap tussen maatstawwe van<br />
varieerbaarheid en maatstawwe van sentrale neiging te verduidelik.<br />
Gestel dat jy betrokke was by 'n ondersoek wat in jou organisasie gedoen is. Julle het<br />
die spanningsdruk by werknemers in vier verskillende departemente gemeet,<br />
naamlik in die departement finansies, mensehulpbronne, bemarking en klieÈ ntediens.<br />
Kyk nou na die vier stelle data van die tellings vir die stresvlakke van die<br />
personeel in die vier departemente. Al die departemente toon dieselfde<br />
gemiddelde, naamlik 5.<br />
A: Departement Finansies: 4 5 6<br />
B: Departement Mensehulpbronne: 3 5 7<br />
C: Departement KlieÈ ntediens: 2 5 8<br />
D: Departement Bemarking: 1 5 9<br />
Ons kan dit grafies voorstel:<br />
0 1 2 3 4 5 6 7 8 9 10<br />
bladsy 58 . studie-eenheid 6 maatstawwe van varieerbaarheid
. afdeling 2 data-verwerking: beskrywend<br />
Jy sal merk dat al die werknemers oor die algemeen dieselfde mate van<br />
spanningsdruk ervaar het (jy het 'n gemiddelde van 5 uit 10 vir al vier<br />
departemente verkry). Maar as jy die res van die inligting bestudeer wat in die<br />
datastelle voorkom, sal jy merk dat elk van die datastelle verskil ten opsigte van<br />
hoe die werknemers se tellings rondom die gemiddelde van 5 versprei is.<br />
Trek nou die pyltjies op die ander datastelle in die figuur in, van die gemiddelde tot<br />
by die onderskeie datapunte, soos ons vir die Departement Finansies gedoen het.<br />
Jy kan nou self sien dat die pyltjies van Departement A na Departement D al hoe<br />
langer word. Dit beteken dat in die Departement Finansies ongeveer al die<br />
werknemers 'n gemiddelde vlak van stres ervaar, maar dat in die Departement<br />
Bemarking sommige persone uiters lae stresvlakke ervaar, sommiges 'n<br />
gemiddelde vlak van stres en ander uiters hoeÈ stresvlakke.<br />
Dit is wat met varieerbaarheid bedoel word. Dit is 'n aanduiding van die mate<br />
waarin individuele waarnemings of tellings rondom hul sentrale waardes<br />
konsentreer of daarvan afwyk, met ander woorde hoeveel hulle rondom die<br />
sentrale waardes varieer (wissel). In ons voorbeeld hierbo word die<br />
varieerbaarheid al hoe groter namate ons van die Departement Finansies na die<br />
Departement Bemarking beweeg.<br />
Bestudeer die inleiding tot tutoriaal 4 op bladsy 52 tot 54 van Tredoux en<br />
Durrheim (2002) waarin die begrip varieerbaarheid aan die hand van twee<br />
voorbeelde verduidelik word. Verduidelik nou self die doel van die maatstawwe<br />
van varieerbaarheid.<br />
Die maatstawwe van varieerbaarheid word gebruik om aan te dui hoe wyd<br />
verspreid tellings in 'n datastel is. Dit toon met ander woorde die verspreiding van<br />
die tellings om die sentrale punt. In ons voorbeeld van die stresvlakke in<br />
verskillende departemente kon ons die verspreiding waarneem van die tellings vir<br />
die spanningsdruk wat die werknemers in elke departement ervaar het.<br />
Dit is noemenswaardig (soos Tredoux en Durrheim (2002) ook meld) dat<br />
varieerbaarheid die grondslag vorm van heelparty ander statistiese konsepte en<br />
prosedures, veral waar dit gaan om die begryping van inferensieÈ le statistiek<br />
(indien nodig, verwys na studie-eenheid 2 vir 'n omskrywing van inferensieÈ le<br />
statistiek).<br />
Nuwe Sterre Week 1:<br />
Die kompetisie is aan die gang!!! Aan die einde van week een is die deelnemers<br />
gevra om 'n uitvoering van 'n liedjie van enige topkunstenaar in Suid-Afrika te<br />
bladsy 59
gee en die beoordelaars het hulle evalueer. Die uitvoerings is geeÈ valueer deur 'n<br />
10-puntskaal te gebruik, met 1 wat die laagste en 10 die hoogste is. Soos in elke<br />
kolom aangedui, is die punte van elk van die beoordelaars bymekaar getel en die<br />
laaste kolom is 'n totale puntetelling wat verkry is deur al die beoordelaars se<br />
punte vir elke deelnemer bymekaar te tel.<br />
Week 1: Uitvoeringstellings<br />
Deelnemers Stella<br />
Debark<br />
Beoordelaar<br />
1<br />
Ricco<br />
Milan<br />
Beoordelaar<br />
2<br />
Zee M<br />
Beoordelaar<br />
3<br />
Angie<br />
Motseneka<br />
Beoordelaar<br />
4<br />
Brian<br />
Mahlangu<br />
Beoordelaar<br />
5<br />
Totale<br />
puntetellings<br />
vir<br />
Week 1<br />
1. Vuyo K 7 668 8 35<br />
2. Lebo 8 67 65 32<br />
3. Sasha 4 7 65 4 26<br />
4. Susan 5 7 8 68 34<br />
5. David 8 8 7 65 34<br />
6. Tshepo 667 65 30<br />
7. Indresan 4 7 65 628<br />
8. Shelley 7 67 7 633<br />
9. Cameron 7 8 8 9 5 37<br />
10. Kerry 6 9 8 7 8 36<br />
Die verskillende maatstawwe van varieerbaarheid __________________<br />
Omvang<br />
Noudat ons na die begrip varieerbaarheid gekyk het, kan ons gaan kyk na die<br />
verskillende wyses waarop dit gemeet kan word, dit wil seà , die verskillende<br />
maatstawwe van varieerbaarheid. In jou geval is drie maatstawwe belangrik om te<br />
ken, naamlik:<br />
. omvang<br />
. variansie<br />
. standaardafwyking<br />
Volgens Tredoux en Durrheim (2002) is omvang die eenvoudigste maatstaf van<br />
varieerbaarheid. Dit is die verskil tussen die hoogste en die laagste tellings in 'n<br />
datastel. Die formule daarvoor is dus soos volg:<br />
omvang = hoogste telling 7 laagste telling<br />
1. Bereken die omvangstellings vir die volgende aspekte in die datastel van<br />
uitvoeringstellings wat hierbo verskaf is.<br />
bladsy 60 . studie-eenheid 6 maatstawwe van varieerbaarheid
Variansie<br />
(Let wel: as jy vertroud is met die berekening van die omvang is dit nie nodig<br />
om al ses oefeninge te doen nie, doen slegs twee en gaan aan met die volgende<br />
vraag.)<br />
1.1 Beoordelaar 2: Ricco Milan se puntetellings vir al 10 deelnemers<br />
1.2 Sasha se puntetellings van al vyf beoordelaars<br />
1.3 Kerry se puntetellings van al vyf beoordelaars<br />
1.4 Beoordelaar 5: Brian Mahlangu se puntetellings vir al 10 deelnemers<br />
1.5 Vuyo K se puntetellings van al vyf beoordelaars<br />
1.6Tshepo se puntetellings van al vyf beoordelaars<br />
2. Wat is die omvang van die puntetellings vir die prestasies van al die<br />
deelnemers vir Week 1?<br />
3 11<br />
. afdeling 2 data-verwerking: beskrywend<br />
1.1 Beoordelaar 2: Ricco Milan: Omvang = hoogste puntetelling ± laagste<br />
puntetelling = 9 ± 6= 3.<br />
1.2 3<br />
1.3 3<br />
1.4 4<br />
1.5 2<br />
1.62<br />
LET WEL: Tredoux en Durrheim (2002) verduidelik begrippe soos die<br />
roupuntomvang (crude range), uitgebreide omvang (extended<br />
range) en interkwartielomvang (interquartile range). Die<br />
inligting wat ons hierbo bied, is egter al wat jy oor die<br />
omvang hoef te ken.<br />
Hierdie tweede maatstaf van varieerbaarheid is sekerlik die een wat jy keer op keer<br />
sal eien soos wat jy met die kursus vorder. Variansie is 'n integrale deel van die<br />
meeste formules by inferensieÈ le statistiek. Dit is raadsaam om variansie deeglik te<br />
bestudeer om te verstaan wat dit beteken, dit te kan bereken en te interpreteer.<br />
Bestudeer die afdeling oor die gemiddelde afwyking en die variansie op bladsy 56<br />
tot 60 van Tredoux en Durrheim (2002).<br />
Let daarop dat jy nie die gemiddelde afwyking hoef te kan beskryf of bereken nie,<br />
maar dat jy wel hierdie werk moet bestudeer omdat dit jou gaan help om die<br />
bladsy 61
egrip variansie te verstaan. Let ook daarop dat die berekeningsoefeninge vir die<br />
variansie gedoen sal word wanneer jy die nodige afdelings vir standaardafwyking<br />
bestudeer het.<br />
Wanneer jy die variansie interpreteer moet jy die volgende in gedagte hou:<br />
. Hoe kleiner die variansie is, hoe nader val die individuele tellings aan die<br />
gemiddelde.<br />
. Hoe groter die variansie is, hoe verder is die individuele tellings om die<br />
gemiddelde versprei.<br />
Die standaardafwyking<br />
Die standaardafwyking is die vierkantswortel van die variansie en word deur s<br />
genoteer. Bestudeer die afdeling in Tredoux en Durrheim (2002) oor die<br />
standaardafwyking, maar slaan die bespreking van die variansiekoeÈ ffisieÈ nt<br />
gerus oor.<br />
Die standaardafwyking is die maatstaf van varieerbaarheid wat die meeste in die<br />
praktyk gebruik word.<br />
Jy sal merk dat Tredoux en Durrheim (2002) eers verduidelik hoe om die variansie<br />
en standaardafwyking vir 'n populasie te bereken. In hierdie kursus verwag ons<br />
dat jy die omvang, variansie en standaardafwyking vir slegs 'n steekproef moet<br />
kan bepaal. Dit is wel nuttig om eers te verstaan hoe om hierdie berekenings vir 'n<br />
populasie te kan doen. Kyk goed na die berekening van die variansie en<br />
standaardafwyking in die uitgewerkte voorbeeld wat Tredoux en Durrheim (2002)<br />
op bladsy 66 gee.<br />
Bestudeer nou die afdeling oor die beraming van populasieparameters uit<br />
steekproefdata op bladsy 61 tot 62 van Tredoux en Durrheim (2002).<br />
Kies die regte antwoord uit die gegewe moontlikhede in die volgende items:<br />
1. Die simbool vir die steekproefvariansie is:<br />
(1) X<br />
2 (2)<br />
(3) s 2<br />
2. Ons gebruik (N 7 1) in die variansieformule omdat<br />
(1) dit ons 'n beter skatting van die populasievariansie gee<br />
(2) dit makliker is om met (N 7 1) te deel; en<br />
(3) dit die verskil tussen distribusies makliker uitwys<br />
bladsy 62 . studie-eenheid 6 maatstawwe van varieerbaarheid
. afdeling 2 data-verwerking: beskrywend<br />
3. Bereken die variansie en standaardafwyking van die volgende puntetellings<br />
wat in die uitvoeringstellingsdatastel voorkom.<br />
(Let wel: indien jy vertroud is met die berekening van die variansie en<br />
standaardafwyking is dit nie nodig om al ses oefeninge te doen nie, doen slegs<br />
twee en gaan aan met die volgende vraag.)<br />
3.1 Beoordelaar 2: Ricco Milan se puntetellings vir 10 deelnemers<br />
3.2 Sasha se puntetellings van al vyf beoordelaars<br />
3.3 Kerry se puntetellings van al vyf beoordelaars<br />
3.4 Beoordelaar 5: Brian Mahlangu se puntetellings vir al 10 deelnemers<br />
3.5 Vuyo K se puntetellings van al vyf beoordelaars<br />
3.6Tshepo se puntetellings van al vyf beoordelaars<br />
4. Wat is die variansie en standaardafwyking van die puntetellings vir die<br />
prestasies van al die deelnemers vir Week 1?<br />
Jy wil nou vasstel hoe hierdie tellings versprei is ten aansien van die sentrale<br />
waardes en hoe dit ten opsigte van hierdie sentrale waardes varieer. Om dit te<br />
doen, moet jy die volgende bereken: gemiddelde, modus, mediaan, omvang,<br />
variansie en standaardafwyking.<br />
5. Hieronder word 'n aantal statistiese tegnieke en notasies gegee. Vul dit in die<br />
onderstaande sinoptiese kaart in die regte spasie in.<br />
Omvang X<br />
s Variansie<br />
Modus Gemiddelde<br />
Standaardafwyking Mediaan<br />
s 2<br />
Tegnieke om data en steekproewe met een veranderlike te interpreteer<br />
Maatstawwe van sentrale neiging Maatstawwe van varieerbaarheid<br />
bladsy 63
1. Alternatief (3) is die regte antwoord. Alternatief (2) verteenwoordig die<br />
populasievariansie, terwyl alternatief (1) die gemiddelde vir 'n datastel X is.<br />
2. Dit is belangrik om te onthou dat die variansieformule altyd (N ±1) is, omdat<br />
dit ons 'n beter skatting van die populasievariansie gee.<br />
3. Soos voorheen genoem is, is dit raadsaam om altyd eers die volgende tabel te<br />
voltooi voor enige berekenings gedoen word.<br />
Deelnemers Ricco Milan<br />
Beoordelaar 2<br />
X<br />
X 2<br />
1. Vuyo K 4 16<br />
2. Lebo 7 49<br />
3. Sasha 9 81<br />
4. Susan 10 100<br />
5. David 3 9<br />
6. Tshepo 12 144<br />
7. Indresan 7 49<br />
8. Shelley 636<br />
9. Cameron 11 121<br />
10. Kerry 5 25<br />
N=10 X =70 X 2 = 500<br />
3.1 Variansie:<br />
s2 X = X2 … X† 2<br />
N<br />
N 1<br />
…70† 2<br />
10<br />
= 500<br />
10 1<br />
= 500 ± 490 / 9<br />
= 1,11<br />
Standaardafwyking:<br />
sX = s2 q<br />
X<br />
p<br />
= 1; 11 = 1,05<br />
3.2 1,7 1,3<br />
3.3 8,7 2,95<br />
3.4 2,2 1,48<br />
3.5 1,0 1,0<br />
3.60,5 0,71<br />
bladsy 64 . studie-eenheid 6 maatstawwe van varieerbaarheid
4 12,5 3,54<br />
5. Die volgende is 'n eenvoudige samevatting van die statistiese tegnieke en die<br />
notasies wat daarvoor gebruik word, wat jy in studie-eenheid 5 (tutoriaal 3 in<br />
Tredoux en Durrheim (2002)) en studie-eenheid 6(tutoriaal 4 in Tredoux en<br />
Durrheim (2002)) geleer het.<br />
Tegnieke om data en steekproewe met een veranderlike te interpreteer<br />
Maatstawwe van sentrale neiging Maatstawwe van varieerbaarheid<br />
Modus Mediaan Gemiddelde Omvang Variansie Standaardafwyking<br />
X s 2 s<br />
Alle variansies en standaardafwykings is positiewe getalle. Indien jy 'n negatiewe<br />
antwoord kry en/of die vierkantswortel van 'n negatiewe getal probeer bereken,<br />
het jy beslis 'n fout begaan. Gaan jou berekenings na!<br />
Ons het in die inleiding tot hierdie studiegids gemeld dat verskeie<br />
rekenaarprogramme beskikbaar is om die statistieke te bereken wat in hierdie<br />
kursus verduidelik word. Tredoux en Durrheim (2002) stel enkele programme<br />
bekend, waaronder Microsoft Excel. Aan die einde van die betrokke tutoriaal (bl<br />
66±67) verduidelik die skrywers ook hoe om die variansie en standaardafwyking<br />
in Microsoft Excel te bereken. Bestudeer hierdie gedeelte van die handboek sodat<br />
jy 'n ander manier ken om statistieke te bereken as jy 'n datastel sou teeÈ kom wat te<br />
groot is om die vereiste statistieke met die hand uit te werk.<br />
Tredoux en Durrheim (2002) verwys na die gebruik van die formules wat reeds in<br />
die program ingevoer is waarmee die berekenings gedoen kan word. Om hierdie<br />
ingeboude formules in te skryf, kan jy die stappe hieronder volg:<br />
Plaas die merker (cursor) in die sel waarin jy die formule wil inskryf (gewoonlik<br />
aan die einde van jou datastel).<br />
Klik op Insert aan die bokant van die skerm.<br />
Kies Function op die kieslys.<br />
. afdeling 2 data-verwerking: beskrywend<br />
bladsy 65
Klik op die woord Statistical in die linkerkantste venster.<br />
Rol af met die merker en lig die standaardafwyking of variansie vir die steekproef<br />
uit deur daarop te klik.<br />
Klik op OK.<br />
Tik die nommer in van die eerste en laaste sel wat jy by jou berekenings wil insluit<br />
en skei die twee nommers met 'n dubbelpunt. As dit reeds korrek ingevul is, klik<br />
op OK.<br />
Die antwoord behoort outomaties in die sel te verskyn waarin jy jou merker aan<br />
die begin geplaas het.<br />
Onthou dat jy Microsoft Excel nie vir die eksamen hoef te kan gebruik nie. Ons<br />
wil jou net hieroor inlig sodat jy ander hulpbronne vir statistiese berekenings ken<br />
en kan benut.<br />
In hierdie studie-eenheid het ons enkele maatstawwe van die verspreiding van<br />
tellings rondom die gemiddelde ondersoek. Die belangrikste maatstawwe is die<br />
variansie en die standaardafwyking wat 'n vername rol gaan speel in jou studie<br />
van die statistiek in hierdie module.<br />
Noudat jy studie-eenheid 6bestudeer het, behoort jy<br />
. te weet wat varieerbaarheid is en dat die drie tipes maatstawwe wat die meeste<br />
gebruik word omvang, variansie en standaardafwyking is; en<br />
. omvang, variansie en standaardafwyking te kan definieer, bereken en<br />
interpreteer.<br />
bladsy 66 . studie-eenheid 6 maatstawwe van varieerbaarheid
7<br />
studie-eenheid sewe<br />
Korrelasie<br />
In studie-eenhede 5 en 6het jy kennis gemaak met datastelle waarin daar net<br />
een veranderlike voorkom. Jy het geleer hoe om hierdie veranderlike te<br />
beskryf met statistieke soos die volgende:<br />
. die gemiddelde (X), en<br />
. die standaardafwyking (s).<br />
. afdeling 2 data-verwerking: beskrywend<br />
In hierdie studie-eenheid kry jy te doen met datastelle met twee veranderlikes.<br />
Jy het sekerlik al met data te doen gekry met twee veranderlikes, X en Y,<br />
byvoorbeeld<br />
X ± prestasie op 'n IOP2601 werkopdrag<br />
Y ± prestasie op 'n IOP2062 werkopdrag<br />
of<br />
X ± aantal foute gemaak deur fabriekswerkers op 'n monteerband<br />
Y ± tyd wat die fabriekswerkers neem om 'n spesifieke taak op die monteerband te<br />
doen.<br />
Indien 'n mens hierdie veranderlikes in aanmerking wil bring, sal jy vrae soos die<br />
volgende kan stel: As studente goed vaar in 'n werkopdrag vir IOP2601, sal hulle<br />
dan ewe goed vaar in 'n opdrag vir IOP2062? Maak fabriekswerkers meer foute<br />
met 'n monteertaak as hulle vinniger werk?<br />
Hierdie vrae dui daarop dat 'n mens die twee veranderlikes gelyktydig wil beskou<br />
en ook die uitwerking wat hulle op mekaar uitoefen, wil ondersoek. Hoe sal die<br />
een veranderlike onder die invloed van die ander fluktueer? Ons wil dus die<br />
verwantskap of korrelasie tussen hierdie twee veranderlikes bepaal.<br />
Wat beteken korrelasie? ____________________________________<br />
Formeel gesproke beantwoord 'n statistiek soos korrelasie bogenoemde vrae, met<br />
ander woorde dit bied die antwoord op die vraag: wat is die verband tussen X en<br />
Y? In hierdie studie-eenheid gaan jy leer hoe om die verwantskap tussen twee<br />
veranderlikes te bepaal met 'n statistiek bekend as korrelasie wat deur die simbool<br />
r voorgestel word.<br />
bladsy 67
Strooiingsdiagramme ______________________________________<br />
Jy wonder seker nou: ons het pas na korrelasie verwys en nou spring ons na 'n<br />
nuwe begrip: strooiingsdiagram. Hoekom? Die antwoord is eenvoudig ± 'n<br />
strooiingsdiagram is eintlik net 'n grafiese voorstelling van korrelasie.<br />
Soos jy weet, is die publiek ook by die Nuwe Sterre-vertoning betrokke ± kykers<br />
kan vir hulle gunsteling ``ster-in-wording'' stem en hulle kan ook deur middel van<br />
'n sosiale netwerkfasiliteit op die Nuwe Sterre-webtuiste met hulle kommunikeer.<br />
In Week 1 het die kykers reeds gesels en vir hulle gunstelinge gestem. Hierdie<br />
aktiwiteite is gekwantifiseer deur die skaal van 1 tot 10 te gebruik, waar 1 die<br />
laagste is en 10 die hoogste telling.<br />
. 1±10: die deelnemers<br />
. X: puntetelling op grond van internet-interaksie<br />
. Y: Tellings op grond van stemming<br />
Telling op grond van stemming<br />
Deelnemers Puntetelling op grond van<br />
internet-interaksie<br />
Puntetelling op grond van internet-interaksie<br />
Tellings op grond van<br />
stemming<br />
1 2 2<br />
2 3 5<br />
3 2 4<br />
4 5 6<br />
5 5 3<br />
6 3 3<br />
7 7 5<br />
8 4 4<br />
9 6 5<br />
10 8 7<br />
Bestudeer die onderstaande strooiingsdiagram van hierdie data wat deur die<br />
rekenaar gegenereer is:<br />
bladsy 68 . studie-eenheid 7 korrelasie
Kon jy agterkom hoe die strooiingsdiagram geteken word?<br />
As jy na die tabel hierbo kyk, sal jy sien dat die datapunte vir deelnemers 1 en 2<br />
soos volg is<br />
Puntetelling op grond van<br />
stemming<br />
Deelnemer X Y<br />
y<br />
8<br />
7<br />
6<br />
5<br />
4<br />
3<br />
2<br />
1<br />
1 2 2<br />
2 3 5<br />
. afdeling 2 data-verwerking: beskrywend<br />
Op die onderstaande diagram is hierdie twee datapunte reeds met swart kolle<br />
aangedui.<br />
x<br />
1 2 3 4 5 6 7 8<br />
Puntetelling op grond van internet-interaksie<br />
Sien jy dat Deelnemer 1 se datapunt reg bokant 2 op die x-as en regs van 2 op die<br />
y-as is? Dit is hoe so 'n datapunt geplot word.<br />
Skryf die regte syfer op die volgende twee stippellyne in:<br />
Deelnemer 2 se datapunt is bokant ... op die x-as, en regs van ... op die y-as. (Die<br />
twee syfers is 3 en 5.) Maak seker of Deelnemer 2 se datapunt korrek op die<br />
grafiek aangedui is. Jy behoort nou te verstaan hoe 'n strooiingsdiagram geteken<br />
word.<br />
Gebruik nou die tabel met al 10 werknemers se data en teken die datapunte vir<br />
Deelnemers 3 tot 10 op die grafiek, al het jy die korrek voltooide<br />
rekenaargegenereerde strooiingsdiagram reeds gesien. Jou leerdoelwit is om dit<br />
self te kan teken.<br />
Wanneer jy klaar is, moet jou strooiingsdiagram lyk soos die reeds voltooide<br />
rekenaargegenereerde een. Vergelyk dit daarmee.<br />
bladsy 69
Die korrelasiekoeÈffisieÈnt ____________________________________<br />
Noudat jy strooiingsdiagramme kan plot, kom ons keer terug na korrelasie, of om<br />
meer spesifiek te wees, die korrelasiekoeÈ ffisieÈ nt.<br />
Berekening van die korrelasiekoeÈfisieÈnt _________________________<br />
Blaai agtertoe in jou studiegids waar 'n lys van formules voorsien word. Soek die<br />
formule langs die simbool r. Ons gaan hierdie formule gebruik om die<br />
korrelasiekoeÈ ffisieÈ nt te bereken. Hierdie formule staan bekend as Pearson se<br />
produkmoment-korrelasiekoeÈ ffisieÈ nt en word algemeen gebruik om korrelasie te<br />
bereken.<br />
Onthou jy nog die verskillende berekeninge van die sommasienotasie wat jy in<br />
studie-eenheid 3 en tutoriaal 24 geleer het? Indien nie, blaai gou terug en verfris<br />
jou geheue. Jy sal altyd weet wat N is, dus as jy die waardes X, Y , X 2 , Y 2 ,<br />
XY , X Y , bereken het, hoef jy dit net te vervang in die formule en die<br />
oorblywende berekeninge te doen.<br />
Werk deur die praktiese voorbeeld hieronder wat jou sal wys hoe om te werk te<br />
gaan as ons jou 'n opdrag soos die volgende gee:<br />
Bereken die verband tussen die puntetellings op grond van die internet-interaksie<br />
(X) op die sosiale netwerkwebtuiste en die stemming (Y) vir die 10 deelnemers.<br />
(Hierdie is dieselfde as die data wat jy gebruik het om die strooiingsdiagram<br />
vroeeÈ r te plot.)<br />
bladsy 70 . studie-eenheid 7 korrelasie<br />
Deelnemer X Y<br />
1 2 2<br />
2 3 5<br />
3 2 4<br />
4 5 6<br />
5 5 3<br />
6 3 3<br />
7 7 5<br />
8 4 4<br />
9 6 5<br />
10 8 7
X Y X 2<br />
2 2 4 4 4<br />
3 5 9 25 15<br />
2 4 4 16 8<br />
5 625 3630<br />
5 3 25 9 15<br />
3 3 9 9 9<br />
7 5 49 25 35<br />
4 4 161616<br />
65 3625 30<br />
8 7 6 4 49 56<br />
SX =45 SY =44 SX 2 = 241 SY 2 = 214 SXY = 218<br />
Nadat jy nou die tabel hierbo voltooi het, is dit net nodig om die notasies met die<br />
syfers te vervang.<br />
r =<br />
N XY X Y<br />
‰N X2 … X† 2 Š‰N Y 2 … Y † 2 p<br />
Š<br />
10 218 …45†…44†<br />
=<br />
‰10 241 …45† 2 Š‰10 214 …44† 2 p<br />
Š<br />
=<br />
=<br />
p 2180 1980<br />
‰2 410 2 025Š‰2 140 1936Š<br />
200 p<br />
‰385Š‰204Š<br />
= 200 p<br />
8 540<br />
= 200<br />
280;24988<br />
= 0; 71365<br />
= 0,71<br />
'n KorrelasiekoeÈ ffisieÈ nt kan net 'n waarde van ±1 tot 1 aanneem.<br />
Dus, as jou antwoord ooit kleiner as () 1 is, kontroleer jou<br />
berekeninge! Jy het beslis iewers 'n berekeningsfout gemaak!<br />
Probeer nou om die volgende oefening self te doen:<br />
. afdeling 2 data-verwerking: beskrywend<br />
1. Is daar 'n verband tussen die puntetellings wat deelnemers behaal het vir die<br />
voorbereidingsaktiwiteite en hul uitvoerings teenoor die beoordelaars aan die<br />
einde van die eerste week?<br />
Y 2<br />
XY<br />
bladsy 71
Deelnemers Voorbereidingsaktiwiteite<br />
X<br />
Uitvoerings-puntetellings<br />
Y<br />
1 38 35<br />
2 24 32<br />
3 32 26<br />
4 31 34<br />
5 26 34<br />
628 30<br />
7 31 28<br />
8 37 33<br />
9 34 37<br />
10 35 36<br />
N=10 SX = 316 SY = 325<br />
Om bogenoemde navorsingvraag te beantwoord, bereken die produkmomentkorrelasie-koeÈ<br />
ffisient vir bogenoemde data.<br />
2. Wat is die verhouding tussen die puntetellings vir die deelnemers se onderhoudsvaardigheidskursus<br />
en die aanhangers- en mediahanterings-kursus<br />
onderskeidelik?<br />
bladsy 72 . studie-eenheid 7 korrelasie<br />
Deelnemers Onderhoudsvaardigheidskursus<br />
Aanhangers- en mediahanteringskursus<br />
1 8 8<br />
2 4 4<br />
3 4 5<br />
4 5 7<br />
5 6 4<br />
6 6 4<br />
7 6 6<br />
8 6 8<br />
9 7 6<br />
10 7 5<br />
N=10 SX =59 SY =57
Bereken die produkmomentkorrelasie-koeÈ ffisieÈ nt vir hierdie data.<br />
Onthou dat jy moet begin met die voltooiing van die tabel deur al die<br />
``sommasienotasies'' te doen. Dit maak dinge makliker vir jou vir al die<br />
berekenings wat jy later moet doen, jy sal slegs die waardes in hierdie<br />
sommasienotasietabel in die verskillende formules vervang. So maak seker jy<br />
werk baie akkuraat en dat al jou berekenings reg is. Voordat jy paniekerig word<br />
en dink jou antwoord is verkeerd, gaan jou berekenings na.<br />
1 0,31<br />
2 0,42<br />
So wat beteken hierdie antwoorde vir ons oor die verband tussen hierdie<br />
veranderlikes? Om verslag te gee dat daar 'n verhouding van 0,31 tussen<br />
voorbereidingsaktiwiteite en uitvoeringstellings is, beteken nie veel nie. Daarom<br />
moet ons die korrelasiekoeÈ ffisieÈ nt interpreteer.<br />
Interpretasie van die korrelasiekoeÈffisieÈnt ________________________<br />
Ons gaan vier wyses van interpretering van 'n korrelasiekoeÈ ffisieÈ nt met jou behandel:<br />
. Aard<br />
. Sterkte<br />
. Afleidings<br />
. Gemeenskaplike variansie<br />
Aard<br />
Wat die aard van 'n korrelasiekoeÈ ffisieÈ nt betref, kan 'n korrelasie o f negatief o f<br />
positief wees:<br />
. positief (0,00 tot 1,00)<br />
of<br />
. negatief (±1,00 tot 0,00)<br />
. afdeling 2 data-verwerking: beskrywend<br />
Bepaal die aard van die korrelasie deur na die antwoord te kyk. As die antwoord<br />
wat jy verkry het positief is, is die verband ook positief en omgekeerd. Maar wat<br />
beteken 'n positiewe of negatiewe verwantskap?<br />
Volgens Tredoux en Durrheim (2002, p. 184 beteken 'n r van ±1 'n perfekte<br />
negatiewe korrelasie ('n perfekte inverse relasie waarin die waarde van Y afneem<br />
namate die waarde van X toeneem), terwyl 'n r van +1 'n perfekte positiewe<br />
korrelasie beteken (waar die waarde van X en Y saam toeneem en afneem).<br />
Jy kan ook die aard van 'n korrelasie bepaal deur na die strooiingsdiagram van<br />
die twee veranderlikes te kyk. As die datastel strek vanaf die linkerkantste hoek<br />
bladsy 73
onder na die regterkantste hoek bo, is die verband positief (namate X toeneem,<br />
neem die waardes van Y ook toe). Strek die datastel egter van die linkerkantste<br />
hoek bo na die regterkantste hoek onder, is die verwantskap negatief (namate X<br />
toeneem, neem die waardes van Y af). Hierdie verhoudings word grafies<br />
voorgestel in figuur 10.4 en 10.5 op bladsy 172 van Tredoux en Durrheim (2002).<br />
Voorbeelde van 'n positiewe korrelasie<br />
. Algemeen. Hoe meer snye brood 'n persoon daagliks vir middagete nuttig, hoe<br />
groter sal die persoon se gewig wees. Dit is 'n positiewe korrelasie omdat 'n<br />
toename in een veranderlike (die aantal snye brood) met 'n toename in die<br />
ander veranderlike korreleer (gewig).<br />
. In die werksituasie. Hoe meer jare opleiding 'n persoon ontvang het, hoe hoeÈ ris<br />
die persoon se salaris.<br />
Voorbeelde van 'n negatiewe korrelasie<br />
. Algemeen. Hoe swaarder die vrag wat 'n voertuig dra, hoe minder kilometers<br />
sal dit op 'n tenk brandstof kan afleà . Dit is 'n negatiewe korrelasie omdat 'n<br />
toename in een veranderlike (gewig van die vragmotor) met 'n afname in die<br />
ander veranderlike (getal kilometers per tenk) korreleer.<br />
. In die werksituasie. Hoe meer werksdae fabriekswerkers afwesig is, hoe laer is<br />
die fabriek se uitset.<br />
Sterkte<br />
Beskou die strooiingsdiagram wat jy vroeeÈ r in hierdie studie-eenheid voltooi het.<br />
Dui hierdie strooiingsdiagram 'n positiewe of 'n negatiewe verwantskap aan?<br />
Dit is effens moeiliker om die sterkte van 'n verband te interpreteer.<br />
Die korrelasiekoeÈ ffisieÈ nt is 'n punt op 'n skaal vanaf ±1 tot 1. As die waarde van r<br />
gelyk is aan 0, is daar geen korrelasie en dus geen verband tussen X en Y nie. Hoe<br />
nader daardie waarde aan enige van hierdie twee syfers leà , hoe sterker is die<br />
verband tussen die veranderlikes.<br />
Hieronder is 'n skaal om 'n korrelasiekoeÈ ffisieÈ nt te interpreteer. Kom ons noem<br />
dit ons korrelasie-interpretasieskaal. Jy moet dit kan gebruik om<br />
korrelasiekoeÈ ffisieÈ nte mee te interpreteer.<br />
. swak (0,00 tot 0,39)<br />
of<br />
. matig (0,40 tot 0,79)<br />
of<br />
. sterk (0,80 tot 1,00)<br />
bladsy 74 . studie-eenheid 8 korrelasie
Afleiding<br />
Figuur 10.7 op bladsy 172 van Tredoux en Durrheim (2002) bied 'n illustrasie van<br />
'n swak korrelasie.<br />
Interpreteer die volgende korrelasiekoeÈ ffisieÈ nte:<br />
1. ± 0,95<br />
2. 0,35<br />
3. 0,82<br />
4. ± 0,70<br />
5. 2,48<br />
6. 0,0<br />
Gemeenskaplike variansie<br />
. afdeling 2 data-verwerking: beskrywend<br />
1. Sterk negatiewe korrelasie<br />
2. Swak positiewe korrelasie<br />
3. Sterk positiewe korrelasie<br />
4. Matige negatiewe korrelasie<br />
5. 'n Onmoontlike korrelasie Ð hierdie waarde dui op 'n foutiewe berekening of<br />
'n drukfout! (Lees weer die vorige wenk.)<br />
6. Geen korrelasie<br />
Samevattend: Jy het nou van twee fasette van korrelasie geleer, naamlik die sterkte<br />
en aard daarvan.<br />
. Die aard van die korrelasie (dit wil seà positief of negatief) word deur die rigting<br />
van die lyn daarvan bepaal.<br />
. Die sterkte van die korrelasie word deur die konsentrasie van punte bepaal: hoe<br />
nader hulle aan 'n reguit lyn leà hoe sterker is die korrelasie.<br />
Jy moet ook die korrelasiekoeÈ ffisieÈ nt kan gebruik om afleidings te maak ten<br />
opsigte van die twee veranderlikes waartussen die korrelasie bereken is.<br />
As die korrelasie byvoorbeeld 0,68 is tussen die mate van werksbevrediging en<br />
kwaliteit van werklewe, wat 'n matige positiewe korrelasie (volgens die korrelasieinterpretasieskaal)<br />
is, sal die afleiding wees dat mense wat 'n hoeÈ mate van<br />
werksbevrediging ervaar, ook 'n hoeÈ kwaliteit werklewe ervaar.<br />
Ons wil jou nou reeds voorstel aan die r 2 interpretasie van korrelasie (jy sal weer<br />
hiervan leer in studie-eenheid 9). Dit is die proporsie variansie in X-tellings wat<br />
toe te skryf is aan variansie in Y-tellings, dit wil seà gedeelde/gemeenskaplike<br />
variansie tussen X en Y. Dus<br />
bladsy 75
2 : proporsie gemeenskaplike variansie, wat bereken word deur die<br />
korrelasiekoeÈ ffisieÈ nt (r) te kwadreer<br />
r 2 6 100: persentasie gemeenskaplike variansie<br />
LET WEL: Slegs r 2 kan na 'n persentasie omgeskakel word, nie r nie.<br />
'n Korrelasie (r) kan nie regstreeks as 'n persentasie uitgedruk word nie. Dit is<br />
heeltemal verkeerd om te seà dat 'n korrelasie van byvoorbeeld 0,75 op 'n<br />
korrelasie van 75% tussen X en Y dui.<br />
Bestudeer die afdeling ``Correlation coefficients cannot be directly compared'' op<br />
bladsy 191 tot 192 van Tredoux en Durrheim (2002).<br />
Die volgende figuur bied 'n grafiese voorstelling van enkele waardes van r, r 2 en<br />
r 2 6 100:<br />
Korrelasie as gemeenskaplike variansie<br />
X Y r = 0,00 X Y r = 0,60<br />
r 2<br />
= 0,00 r 2<br />
= 0,36<br />
r 2 6 100 = 0% r 2 6 100 = 36%<br />
X Y r = 0,20 X Y r = 0,80<br />
r 2<br />
= 0,04 r 2<br />
= 0,64<br />
r 2 6 100 = 4% r 2 6 100 = 64%<br />
X Y r = 0,40 XY r = 1,00<br />
r 2<br />
= 0,16 r 2<br />
= 1,00<br />
r 2 6 100 = 16% r 2 6 100 = 100%<br />
Die voorafgaande bespreking van die aard, sterkte, afleiding en gemeenskaplike<br />
variansie van korrelasie verduidelik hoe om 'n korrelasiekoeÈ ffisieÈ nt te<br />
interpreteer. Dit is belangrik om te sorg dat jou interpretasie van 'n korrelasiekoeÈ<br />
ffisieÈ nt sinvol is. Daar is bepaalde wyses waarop die korrelasie-koeÈ ffisieÈ nt NIE<br />
beskou of geõÈ nterpreteer moet word nie. Ons het reeds genoem dat 'n korrelasiekoeÈ<br />
ffisieÈ nt nie direk as 'n persentasiewaarde uitgedruk moet word nie. Die<br />
volgende moet ook in ag geneem word:<br />
. Korrelasies verwys na die lineeà re verwantskap tussen twee veranderlikes.<br />
'n Lineeà re verwantskap beteken dat die verband tussen die twee veranderlikes as<br />
bladsy 76 . studie-eenheid 7 korrelasie
'n reguit lyn op 'n strooiingsdiagram getoon kan word. As die datapunte van twee<br />
veranderlikes in 'n ander patroon behalwe 'n reguit lyn op 'n strooiingsdiagram<br />
val, noem ons dit 'n kromlynige verwantskap. Dit word in figuur 10.8 op bladsy<br />
172 van Tredoux en Durrheim (2002) uitgebeeld. Lees ook die gedeelte op bladsy<br />
191 van Tredoux en Durrheim (2002) wat hierdie verskynsel verder belig.<br />
. Die gemiddelde van korrelasiekoeÈ ffisieÈ nte moet nie bereken word nie.<br />
Lees die afdeling op bladsy 191 van Tredoux en Durrheim (2002) wat hierdie saak<br />
uiteensit.<br />
. Korrelasie en oorsaaklikheid<br />
Korrelasie impliseer nie 'n oorsaak-gevolg-verhouding tussen veranderlikes nie.<br />
Neem kennis hiervan en onthou dit wanneer jy 'n korrelasiekoeÈ ffisieÈ nt<br />
interpreteer. Vermy dus woorde soos ``veroorsaak'', ``beõÈ nvloed'' en ``gee<br />
aanleiding tot''.<br />
Indien r = 0,85 vir tellings in 'n werkopdrag en 'n eksamen, beteken dit slegs dat<br />
'n hoeÈ telling in die een gepaardgaan met 'n hoeÈ telling in die ander (of 'n lae<br />
telling in een met 'n lae telling in die ander). Dit beteken nie dat goeie prestasie in<br />
die eksamen veroorsaak is deur goeie prestasie in die werkopdrag nie. (Prakties<br />
beteken dit: moenie dink jy hoef nie te leer vir die eksamen indien jy 'n goeie<br />
telling in 'n werkopdrag behaal het nie!) Lees die afdeling op bladsy 190 van<br />
Tredoux en Durrheim (2002) waar die kwessie van oorsaak en gevolg bespreek<br />
word.<br />
Vul die ontbrekende woorde in:<br />
'n Positiewe korrelasie tussen motivering en produktiwiteit beteken dat werkers<br />
met hoeÈ tellings in 'n meting van motivering .................... tellings in 'n<br />
produktiwiteitmaatstaf het, of dat .................... tellings in een gepaardgaan met<br />
lae tellings in die ander. Dit beteken nie dat hoeÈ produktiwiteit deur gemotiveerde<br />
werkers .................... word nie.<br />
hoeÈ lae veroorsaak<br />
. afdeling 2 data-verwerking: beskrywend<br />
Interkorrelasiematrikse<br />
Moenie skrik vir hierdie begrip nie! In werkopdragte en in die eksamen vra ons<br />
gewoonlik vir jou om die korrelasiekoeÈ ffisieÈ nt tussen net twee veranderlikes te<br />
bereken. In navorsingsprojekte het 'n mens egter meesal baie veranderlikes in 'n<br />
datastel en wil 'n navorser die korrelasies van almal met mekaar bepaal (twee op<br />
'n keer). In hierdie geval gee statistiese ontledingspakkette gewoonlik die<br />
antwoorde in matriksvorm.<br />
bladsy 77
Kyk na die interkorrelasiematriks hieronder en skryf die korrelasies tussen die<br />
gevraagde veranderlikes neer:<br />
Variable Overall Teach Exam Knowledge Grade Enroll<br />
Overall 1,0000 0,8039 0,59560,6818 0,3008 70,2396<br />
Teach 0,8039 1,0000 0,7197 0,5263 0,4691 70,4511<br />
Exam 0,59560,7197 1,0000 0,4515 0,6100 70,5581<br />
Knowledge 0,6818 0,5263 0,4515 1,0000 0,2242 70,1279<br />
Grade 0,3008 0,4691 0,6100 0,2242 1,0000 70,3371<br />
Enroll 70,2396 70,4511 70,5581 70,1279 70,3371 1,0000<br />
(Uit Howell, D.C. 2004. Fundamental statistics for the Behavioral Sciences. 5th edition. London:<br />
Thomson Learning.)<br />
1. Overall en Knowledge: r = .....<br />
2. Exam en Teach: r = .....<br />
3. Exam en Grade: r = .....<br />
4. Knowledge en Knowledge: r = .....<br />
5. Teach en Enroll: r = .....<br />
6. Grade en Exam: r = .....<br />
1. r = 0,68<br />
2. r = 0,72<br />
3. r = 0,61<br />
4. r = 1,00 (Onthou? Die korrelasie van 'n veranderlike met homself is altyd<br />
1,00, met ander woorde 'n perfekte positiewe korrelasie.)<br />
5. r = 0,45<br />
6. r = 0,61 (Vanselfsprekend moet hierdie antwoord dieselfde wees as by vraag<br />
3 omdat dit nie saak maak in watter volgorde die veranderlikes<br />
genoem word nie.)<br />
Faktore wat korrelasies kan beõÈnvloed<br />
Heelparty faktore kan 'n invloed op korrelasie uitoefen, onder meer die volgende:<br />
. Uitskieters in 'n datastel<br />
. Homogeniteit van die populasie<br />
. Beperkings in die omvang van veranderlikes<br />
Bestudeer hierdie faktore op bladsy 185 en 192 tot 195 van Tredoux en Durrheim<br />
(2002). Sorg dat jy hierdie faktore goed genoeg begryp sodat jy dit kortliks kan<br />
omskryf.<br />
bladsy 78 . studie-eenheid 7 korrelasie
'n Ander tipe korrelasie<br />
Dit is nodig dat jy weet dat korrelasies ook bereken kan word vir intervaldata wat<br />
getransformeer is na 'n stel syfers in rangorde of data wat slegs in rangorde<br />
beskikbaar is. (Onthou jy nog die ordinale metingskaal van studie-eenheid 2?)<br />
Spearman se koeÈ ffisieÈ nt kan in sulke gevalle gebruik word. Neem slegs kennis van<br />
wat Tredoux en Durrheim (2002) op bladsy 186tot 187 hieroor seà ± jy hoef nie<br />
hierdie berekenings te kan doen nie.<br />
Lees raam 11.1 en 11.2 op bladsy 188 tot 189 van Tredoux en Durrheim (2002).<br />
Sorg dat jy die korrelasiekoeÈ ffisieÈ nt (r) op die drukstukke kan identifiseer. Onthou<br />
ook dat slegs korrelasies met 'n beduidendheidswaarde (p-waarde) van minder as<br />
0,05 of 0,01 is statisties beduidend. 'n Mens moet daarom altyd kyk na die pwaarde<br />
(beduidendheidswaarde) op die drukstukke ook.<br />
Dis tyd vir 'n bietjie hersiening! Bestudeer die opsomming op bladsy 198 van<br />
Tredoux en Durrheim (2002) waarin die belangrikste sake rakende korrelasie<br />
saamgevat word.<br />
1. Interpreteer die korrelasiekoeffisieÈ nt vir:<br />
1.1 0,71 (internet-interaksie en stemming)<br />
1.2 0,31 (voorbereidingsaktiwiteite en uitvoeringstellings)<br />
1.3 0,42 (onderhoudsvaardigheidskursus en aanhangers- en<br />
mediahanteringskursus)<br />
2. Wat is jou afleiding met betrekking tot die verband tussen die veranderlikes?<br />
2.1 Internet-interaksie en stemming<br />
2.2 Voorbereidingsaktiwiteite en uitvoeringstelling<br />
2.3 Onderhoudsvaardigheidskurus en aanhangers- en mediahanteringskursus<br />
3 Oefening 2 op bladsy 199 in Tredoux en Durrheim (2002)<br />
1.1 Sterk positiewe korrelasie<br />
1.2 Swak positiewe korrelasie<br />
1.3 Matige positiewe korrelasie<br />
. afdeling 2 data-verwerking: beskrywend<br />
2.1 Hoe meer die internet-interaksie met die deelnemers, hoe groter is die kans<br />
dat die deelnemers meer stemme kry.<br />
2.2 Hoe hoeÈ r deelnemers se tellings gedurende hulle voorbereidingsaktiwiteite,<br />
hoe groter is die kans dat hulle hoeÈ r punte vir hul uitvoering kry, maar tot 'n<br />
geringe mate.<br />
bladsy 79
2.3 Soos die telling vir die onderhoudsvaardigheidskursus toeneem, so sal die<br />
puntetellings vir aanhangers- en mediahanteringskursus matig toeneem.<br />
3. Onthou dat die korrelasiekoeÈ ffisieÈ nt nie direk as 'n persentasiewaarde<br />
bereken kan word nie. Slegs r 2 (gemeenskaplike variansie van twee<br />
veranderlikes) kan as 'n persentasiewaarde geõÈ nterpreteer word. Dit<br />
behoort jou in staat te stel om die oefening te voltooi. Met ander woorde,<br />
as jy die persentasiewaarde in die regterkantste kolom deur 100 deel, gee dit<br />
jou die antwoord vir r 2 . Trek dan eenvoudig die vierkantswortel van r 2 om die<br />
antwoord vir r in die linkerkantste kolom te verkry. Om die regterkantste<br />
kolom te voltooi, neem jy die waarde van r wat in die linkerkantste kolom<br />
gegee is, kwadreer dit om die waarde van r 2 te verkry en vermenigvuldig<br />
hierdie antwoord dan met 100 om die persentasiewaarde te bereken. As jy dit<br />
gedoen het, behoort jou voltooide tabel so te lyk:<br />
KorrelasiekoeÈ ffisieÈ nt Gemeenskaplike variansie<br />
van twee veranderlikes<br />
1,0 100%<br />
0,85 72%<br />
0,82 68%<br />
0,79 62%<br />
0,63 40%<br />
0,50 25%<br />
0,45 20%<br />
0,3613%<br />
0,22 5%<br />
0,19 3,6%<br />
0 0%<br />
Noudat jy hierdie studie-eenheid bestudeer het, behoort jy in staat te wees om die<br />
volgende te kan doen:<br />
. die begrip korrelasie te kan omskryf<br />
. 'n strooiingsdiagram te kan teken en interpreteer op grond van die verband<br />
tussen die veranderlikes<br />
. Pearson se produkmoment-korrelasiekoeÈ ffisieÈ nt te kan bereken<br />
. 'n korrelasiekoeÈ ffisieÈ nt te kan interpreteer in terme van:<br />
± sterkte (met die korrelasie-interpretasieskaal)<br />
± aard (met die korrelasie-interpretasieskaal)<br />
± afleidings wat gemaak kan word<br />
± proporsie en persentasie gemeenskaplike variansie<br />
bladsy 80 . studie-eenheid 7 korrelasie
. afdeling 2 data-verwerking: beskrywend<br />
. die korrelasie tussen twee spesifieke veranderlikes in 'n korrelasiematriks te kan<br />
aflees<br />
. die faktore wat korrelasie kan beõÈ nvloed, te verstaan<br />
. een ander tipe korrelasie, naamlik Spearman se koeÈ ffisieÈ nt kortliks te kan<br />
omskryf<br />
. die korrelasiekoeÈ ffisieÈ nt op 'n rekenaardrukstuk te kan identifiseer en<br />
interpreteer<br />
bladsy 81
8<br />
studie-eenheid agt<br />
Regressie<br />
Kom ons kyk eers na die term regressie. In alledaagse taal het die woord<br />
die ongunstige betekenis van afname of agteruitgang. Ons sou<br />
byvoorbeeld na regressie in 'n persoon se fisieke toestand kon<br />
verwys wanneer iemand se gesondheid verswak. In die statistiek het hierdie<br />
term egter 'n heel ander betekenis.<br />
Wat is regressie? ________________________________________<br />
Regressie word in die statistiek gebruik om voorspellings te maak op grond van<br />
inligting wat reeds verkry is. Die onderliggende aanname is dat 'n verwantskap<br />
tussen veranderlikes bestaan. Empiries bevestigde verwantskappe word nagegaan<br />
om voorspellings oor soortgelyke data te maak.<br />
Die blote feit dat ons woorde verband en verwantskap gebruik om te verduidelik<br />
wat die term regressie beteken, behoort 'n aanduiding te wees dat regressie ten<br />
nouste met korrelasie saamhang en selfs daarop berus.<br />
Voorspelling is nog 'n sleutelterm wat uit hierdie verduideliking van regressie na<br />
vore kom. Ons maak van regressieanalise gebruik om 'n veranderlike op grond<br />
van die berekende verwantskap met 'n ander veranderlike te voorspel.<br />
Verskeie dinge in die alledaagse lewe toon 'n bepaalde verwantskap met mekaar<br />
en inligting oor sulke veranderlikes kan gebruik word om voorspellings deur<br />
middel van regressie te maak.<br />
Bestudeer bladsy 160 tot 162 van Tredoux en Durrheim (2002) waar die skrywers<br />
'n kort oorsig van korrelasie bied en na die verband daarvan met regressieanalise<br />
verwys.<br />
Vir ons berekenings van regressie gebruik ons dieselfde datastel van tellings op 'n<br />
internet-interaksiewebtuiste en stemming wat in die vorige studie-eenheid oor<br />
korrelasie gebruik is.<br />
bladsy 82 . studie-eenheid 8 regressie
Deelnemers X Y X 2<br />
8<br />
7<br />
6<br />
5<br />
4<br />
3<br />
Stemming Vir jou gerief herhaal ons die tabel hieronder.<br />
2<br />
1<br />
1 2 2 4 4 4<br />
2 3 5 9 25 15<br />
3 2 4 4 16 8<br />
4 5 625 3630<br />
5 5 3 25 9 15<br />
6 3 3 9 9 9<br />
7 7 5 49 25 35<br />
8 4 4 161616<br />
9 65 3625 30<br />
10 8 7 64 49 56<br />
N=10 SX=45 SY=44 SX 2 =241 SY 2 =214 SXY=218<br />
Die gemiddelde van die X-waardes: X = 4,5<br />
Die gemiddeld van die Y -waardes: Y = 4,4<br />
. afdeling 2 data-verwerking: beskrywend<br />
In studie-eenheid 7 het jy die X- enY-waardes op 'n strooiingsdiagram geteken.<br />
Hierdie strooiingsdiagram is rekenaarmatig gegenereer en word hieronder gegee.<br />
1 2 3 4 5 6 7 8 9<br />
Internet-interaksie tellings<br />
Die regressielyn _________________________________________<br />
Gebruik 'n liniaal en trek 'n ligte stippellyn met potlood deur die punte op die<br />
strooiingsdiagram. Doen dit op so 'n manier dat die lyn die beste aanduiding van<br />
die verspreiding van die punte gee. Lees nou die gedeelte ``The best fitting line'' op<br />
bladsy 162 tot 163 van Tredoux en Durrheim (2002).<br />
Y 2<br />
XY<br />
bladsy 83
Op die heel eenvoudigste vlak word die verwantskap tussen twee stelle data as 'n<br />
reguit lyn uitgebeeld. Hierdie reguit lyn is bloot 'n benadering van die waardes wat<br />
dit voorstel en kan nooit presies deur al die waardes loop nie, behalwe wanneer<br />
die korrelasie perfek is. Die regressielyn maak dit dus vir ons moontlik om<br />
voorspellings te maak.<br />
In die aktiwiteit hierbo het jy geskat waar die bes passende lyn op die<br />
strooiingsdiagram sou leà . Die posisie van hierdie lyn kan egter wetenskaplik<br />
bereken word om te verseker dat ons voorspellings so akkuraat moontlik is. Ons<br />
bereken die posisie van die regressielyn deur van die regressievergelyking gebruik<br />
te maak.<br />
Die regressievergelyking ___________________________________<br />
Die regressielyn wat ons gaan bereken is 'n reguit lyn en daarom is die formule vir<br />
die regressielyn oftewel die regressievergelyking in die algemene formaat van 'n<br />
reguit lyn, naamlik<br />
YÃ = bX + a<br />
met YÃ = die voorspelde Y-waarde (waarde op die Y-as)<br />
b = die helling van die lyn<br />
a = die Y-afsnit (die plek waar die lyn die Y-as sny)<br />
en X = die voorspellerveranderlike (waarde op die X-as)<br />
Lees die bespreking van die regressiekoeÈ ffisieÈ nt op bladsy 163 tot 164 van<br />
Tredoux en Durrheim (2002). Let daarop dat hierdie skrywers se formule vir die<br />
regressielyn effens anders lyk in die sin dat a eerste in hulle formule staan. Dit is<br />
net 'n kwessie van voorkeur. Jy kan die formule wat in hierdie gids aangebied<br />
word as die korrekte een beskou vir gebruik in werkopdragte en die eksamen.<br />
Berekening van die waardes in die regressievergelyking _____________<br />
As jy weer kyk na die regressievergelyking wat hierbo gegee is, sal jy sien dat daar<br />
links in die vergelyking een veranderlike is (YÃ) en regs in die vergelyking drie<br />
veranderlikes (b, a en X). Daar is formules waarmee die waardes van b en a<br />
bereken word deur van die oorspronklike datastel se waardes gebruik te maak<br />
(sien die tabel van waardes vroeeÈ r in hierdie studie-eenheid).<br />
Indien 'n spesifieke waarde vir X gegee word en die b- ena-waardes is reeds<br />
bereken, dan kan die ooreenstemmende YÃ-waarde bereken word.<br />
Die formule vir die b-waarde, wat die helling van die regressielyn gee, word eerste<br />
bladsy 84 . studie-eenheid 8 regressie
gegee. Indien die berekende b-waarde positief is, dui dit op 'n regressielyn met 'n<br />
positiewe helling. So 'n lyn sal van links onder na regs bo loop. Indien die<br />
berekende b-waarde negatief is, dui dit op 'n regressielyn met 'n negatiewe helling.<br />
So 'n lyn met 'n negatiewe helling sal van links bo na regs onder loop. Die formule<br />
om die b-waarde te bereken is soos volg:<br />
b =<br />
N XY … X†… Y †<br />
N X 2 … X† 2<br />
VroeeÈ r in hierdie studie-eenheid is 'n tabel met waardes gegee. Hierdie X- enYwaardes<br />
gaan nou gebruik word om die waardes in die regressievergelyking te<br />
bereken. Jy het al die nodige inligting in die tabel om die onderskeie waardes te<br />
kan bereken. Gebruik nou die tabel-waardes en bereken die b-waarde met die<br />
formule wat hierbo gegee is.<br />
Die korrekte berekening van die b-waarde behoort so te lyk:<br />
b =<br />
= 10…218† …45†…44†<br />
= 2 180 1 980<br />
= 200<br />
385<br />
N XY … X†… Y †<br />
N X 2 … X† 2<br />
10…241† …45† 2<br />
2 410 2 025<br />
= 0,51948<br />
= 0,52<br />
In die regressievergelyking YÃ =bX+ahet ons nou reeds die b-waarde bereken<br />
en ons weet dat dit die helling van die lyn verteenwoordig. Die a-waarde in die<br />
regressievergelyking gee die Y-afsnit, met ander woorde die plek waar die reguit<br />
lyn die Y-as sny. Op die Y-as is alle X-waardes gelyk aan 0. Die a-waarde (Yafsnit),<br />
is dus die Y-waarde wanneer die X-waarde gelyk is aan 0. Die formule vir<br />
die a-waarde is soos volg:<br />
a = Y bX.<br />
. afdeling 2 data-verwerking: beskrywend<br />
Y is die gemiddeld van die Y-waardes en X is die gemiddeld van die X-waardes<br />
wat direk onder die tabel van data vroeeÈ r in hierdie studie-eenheid gegee is.<br />
bladsy 85
Gebruik nou die b-waarde wat jy reeds bereken het, asook die gemiddeldes van die<br />
X- enY-waardes en bereken dan die a-waarde<br />
a = Y bX<br />
=( )7 ( ) ( )<br />
= 7<br />
=<br />
Jy het nou die b-waarde sowel as die a-waarde bereken. Skryf die twee waardes<br />
hier onder:<br />
b =<br />
a =<br />
a = Y bX<br />
= 4,4 7 (0,52) (4,5)<br />
= 4,4 72,34<br />
= 2,06<br />
b = 0,52<br />
a = 2,06<br />
Die regressievergelyking vir hierdie stel data is dus:<br />
YÃ = bX + a<br />
= 0,52X + 2,06<br />
Berekening van waardes deur die regressievergelyking te gebruik ______<br />
Wanneer ons die b-waarde en die a-waarde van die regressievergelyking vir 'n<br />
spesifieke stel data bereken het, kan die regressievergelyking gebruik word om<br />
voorspellings ten opsigte van nuwe data te maak. Deur die regressievergelyking<br />
het ons die verwantskap tussen die X-waardes en Y-waardes van die datastel wat<br />
voorgestel word deur 'n reguitlynformule. Ons kan nou vir enige nuwe X-waarde<br />
die ooreenstemmende Y-waarde bereken met die regressievergelyking omdat ons<br />
op grond van die aanvanklike data die aanname maak dat alle X-waardes en Ywaardes<br />
volgens dieselfde patroon (formule) bymekaar pas.<br />
Bestudeer die voorbeeld wat Tredoux en Durrheim (2002) onder die opskrif<br />
``Making predictions'' op bladsy 167 bied.<br />
Gebruik nou die regressievergelyking wat jy hierbo bereken het om vir elk van die<br />
volgende X-waardes (internet-interaksietelling) die ooreenstemmende Y-waarde<br />
(stemmingtellings) te bereken.<br />
bladsy 86 . studie-eenheid 8 regressie
Bereken die stemmingtelling van 'n persoon wat 'n telling van 1 op die internetinteraksie<br />
behaal het:<br />
Vir X =1: YÃ =bX+a<br />
=( )(1)+( )<br />
= _____<br />
Bereken nou ook die stemmingtelling van 'n persoon wat 'n telling van 10 op die<br />
internet-interaksie behaal het:<br />
Vir X = 10: YÃ =bX+a<br />
= ( ) (10) + ( )<br />
. afdeling 2 data-verwerking: beskrywend<br />
= _____<br />
Vir die X-waarde van 1 is die ooreenstemmende Y-waarde gelyk aan 2,58. Dit<br />
beteken dat die getallepaar (1; 2,58) op die regressielyn sal val.<br />
Vir 'n X-waarde van 10 is die ooreenstemmende berekende Y-waarde gelyk aan<br />
7,26. Dit beteken dat die geordende getallepaar (10; 7,26) ook op die regressielyn<br />
sal val.<br />
Onthou dat sodra die b-waarde en die a-waarde bereken is, dan verwys die<br />
regressievergelyking na een spesifieke reguit lyn. Enige punt (getallepaar) wat dan<br />
met daardie vergelyking bereken word, sal dan op die lyn leà .<br />
Dit is redelik maklik om vir 'n gegewe X-waarde die ooreenstemmende Y-waarde<br />
te bereken deur die regressievergelyking te gebruik en die bekende waardes te<br />
vervang. Gebruik die regressievergelyking om die ooreenstemmende Y-waarde te<br />
bereken indien die X-waarde bekend is. Die getallepaar (X;Y) wat so verkry word<br />
(met YÃ =bX+a), sal altyd op die spesifieke regressielyn val.<br />
Vir interessantheid: Die kooÈ rdinaat (X; Y ) sal altyd op die regressielyn val. Deur<br />
die gemiddeldes van die twee stelle waardes te bereken, kan jy reeds een<br />
kooÈ rdinaat kry wat op die regressielyn sal val.<br />
Twee maniere om die grafiek van die regressielyn te skets ___________<br />
'n Reguit lyn word uniek gekenmerk deur die plek waar dit deur die Y-as gaan en<br />
die helling van die lyn. 'n Spesifieke reguit lyn kan op meer as een manier geteken<br />
word. Ons gaan vir jou twee verskillende maniere wys om dieselfde reguit lyn te<br />
teken.<br />
bladsy 87
Metode 1:<br />
. In die eerste metode maak ons gebruik van die feit dat enige twee punte wat op<br />
'n reguit lyn leà met mekaar verbind kan word om die lyn te teken:<br />
. Gebruik dieselfde X-waardes (X =1enX = 10) wat in die vorige aktiwiteit<br />
gebruik is om ooreenstemmende Y-waardes te bereken. Die twee getallepare (1;<br />
2,58) en (10; 7,26) sal albei op die regressielyn leà met die regressievergelyking:<br />
YÃ = 0,52X + 2,06.<br />
± Gebruik 'n gekleurde pen en plot die twee punte op die strooiingsdiagram<br />
wat vroeeÈ r in hierdie studie-eenheid gebruik is. Verbind die twee punte om<br />
'n reguit lyn te vorm.<br />
Metode 2:<br />
. Vir die tweede metode maak ons gebruik van die Y-afsnitpunt (a) van die<br />
regressievergelyking YÃ = bX + a en enige ander getallepaar wat op die<br />
regressielyn sal leà om die regressielyn te teken. Die regressielyn wat ons mee<br />
werk is steeds:<br />
YÃ = 0,52X + 2,06.<br />
. Die Y-afsnit is dus gelyk aan 2,06, wat beteken dat die lyn by die Y-waarde<br />
gelyk aan 2,06deur die Y-as sal gaan. (Jy sal hierdie Y-waarde kry wanneer jy<br />
X = 0 stel in die regressievergelyking. Op die Y-as is X = 0.)<br />
± Gebruik nou 'n ander kleur pen as by die eerste metode hierbo en merk die<br />
waarde 2,06op die Y-as. Merk ook die getallepaar wat gevorm word deur<br />
die twee gemiddelde waardes (X; Y ) naamlik (4,5; 4,4). (Jy sou hier ook<br />
enige ander getallepaar kon gebruik wat op hierdie lyn val, dit wil seà wat<br />
met behulp van dieselfde formule bereken is.) Trek 'n lyn deur die twee<br />
punte.<br />
. Wanneer jy volgens metode 1 die lyn trek deur die twee punte met 'n liniaal te<br />
verbind, gee dit vir jou die regressielyn wat die grafiese voorstelling is van die<br />
formule wat bereken is.<br />
. As jy volgens metode 2 die Y-afsnit en byvoorbeeld die kooÈ rdinaat (X; Y ) met<br />
mekaar verbind, sal jy sien dat jy steeds besig is om dieselfde lyn te teken. Die<br />
nuwe lyn behoort presies bo-op die vorige lyn te leà (mits jy natuurlik netjies en<br />
noukeurig werk).<br />
Jou grafiek behoort so te lyk:<br />
bladsy 88 . studie-eenheid 8 regressie
Stemming<br />
. afdeling 2 data-verwerking: beskrywend<br />
Internet-interaksie<br />
Onthou ook om altyd die volgende inligting op jou grafiek aan te dui:<br />
± die name van die veranderlikes op die X-as en Y-as van die grafiek,<br />
byvoorbeeld X-as: internet-interaksiestelling, en Y-as: stemming.<br />
± die regressielynvergelyking, byvoorbeeld YÃ = 0,52X + 2,06<br />
± die afsnit, byvoorbeeld a = 2,06<br />
± alle berekende getallepare (X; Y), byvoorbeeld (1; 2,58) en (10; 7,26)<br />
en/of<br />
die gemiddelde waardes (X; Y ) bv. (4,5; 4,4).<br />
Die akkuraatheid van voorspelling _____________________________<br />
Lees die gedeelte oor die standaard-skattingsfout op bladsy 168 tot 170 van<br />
Tredoux en Durrheim (2002). Jy hoef geen berekenings in hierdie afdeling te kan<br />
doen nie, maar jy moet die begrip akkuraatheid van voorspelling of standaardskattingsfout<br />
kan omskryf.<br />
bladsy 89
Regressie en oorsaaklikheid _________________________________<br />
Bestudeer die gedeelte ``A common difficulty with predictions based on regression<br />
models'' op bladsy 171 van Tredoux en Durrheim (2002) waar die skrywers<br />
verduidelik dat afleidings met betrekking tot oorsaaklikheid met groot<br />
omsigtigheid uit regressieanalises gemaak behoort te word.<br />
Ons gaan voort met dieselfde datastel waarmee julle in studie-eenheid 7 gewerk<br />
het. Die volledige berekeningstabelle word verskaf:<br />
1. Jy wil die deelnemers se uitvoeringstellings voorspel.<br />
1.1 Bereken die helling.<br />
1.2 Bereken die ``afsnit''.<br />
1.3 Bereken die uitvoeringstelling vir deelnemers met voorbereidingstellings<br />
van 25 en 30.<br />
1.4 Gee 'n grafiese verteenwoordiging van die regressielyn deur die ``afsnit''<br />
[soos in (1.2) bereken] en die geskatte waardes [soos in (1.3) bereken] op<br />
hierdie regressielyn.<br />
Deelnemers<br />
Voorbereidingsaktiwiteite<br />
X<br />
Uitvoeringtellings<br />
Y X 2<br />
1 38 35 1444 1225 1330<br />
2 24 32 5761024 768<br />
3 32 261024 676 832<br />
4 31 34 961 1156 1054<br />
5 2634 6761156884<br />
628 30 784 900 840<br />
7 31 28 961 784 868<br />
8 37 33 1369 1089 1221<br />
9 34 37 11561369 1258<br />
10 35 361225 12961260<br />
N=10 SX = 316 SY = 325 SX 2<br />
= 10176<br />
X Y = (316) (325) = 102700<br />
X 2 = (316) 2<br />
X 2 = (325) 2<br />
= 99856<br />
= 105625<br />
Gemiddeld van X = 316/10 = 31,6<br />
Gemiddeld van Y = 325/10 = 32,5<br />
bladsy 90 . studie-eenheid 8 regressie<br />
Y 2<br />
SY 2<br />
= 10675<br />
XY<br />
SXY<br />
= 10315
2. Jy wil die deelnemers se hantering van die aanhanger- en mediatellings<br />
voorspel.<br />
2.1 Bereken die helling.<br />
2.2 Bereken die ``afsnit''.<br />
2.3 Bereken die deelnemers se hantering van die aanhanger- en<br />
mediatellings met onderhoudsvaardigheidskursustellings van 3 en 9<br />
onderskeidelik.<br />
2.4 Gee 'n grafiese verteenwoordiging van die regressielyn deur die ``afsnit''<br />
[soos in (2.2) bereken] en die geskatte waardes [soos in (2.3) bereken] op<br />
hierdie regressielyn.<br />
Deelnemers Onderhoudsvaardigheidskursus<br />
X<br />
Aanhangers en<br />
mediatellings<br />
Y X 2<br />
1 8 8 6 4 6 4 6 4<br />
2 4 4 161616<br />
3 4 5 1625 20<br />
4 5 7 25 49 35<br />
5 64 361624<br />
664 361624<br />
7 66363636<br />
8 6 8 36 6 4 48<br />
9 7 649 3642<br />
10 7 5 49 25 35<br />
N=10 SX =59 SY =57 SX 2<br />
X Y = (59) (57) = 3363<br />
X 2 = (59) 2<br />
X 2 = (57) 2<br />
= 3481<br />
Gemiddeld van X = 59/10<br />
= 3249<br />
= 5,9<br />
Gemiddeld van Y = 57/10 = 5,7<br />
= 363<br />
Y 2<br />
SY 2<br />
= 347<br />
XY<br />
SXY<br />
= 344<br />
Indien jou berekenings korrek is, behoort jy die volgende antwoorde te heà :<br />
1.1 0,24<br />
1.2 24,92<br />
1.3 [25 ; 30,9] & [30 ; 32]<br />
. afdeling 2 data-verwerking: beskrywend<br />
bladsy 91
1.4<br />
Uitvoeringtellings<br />
40<br />
35<br />
30<br />
25<br />
20<br />
15<br />
10<br />
5<br />
0<br />
10<br />
9<br />
8<br />
7<br />
6<br />
5<br />
4<br />
3<br />
2<br />
1<br />
0<br />
a = 24,9<br />
2.1 0,52<br />
2.2 2,63<br />
2.3 [3 ; 4,19] & [9 ; 7,31]<br />
2.4<br />
Tellings vir aanhangers en mediahanteringskursus<br />
YÃ = 0,24 (X) + 24,9<br />
[30; 32]<br />
5 10 15 20 25 30 35 40<br />
Voorbereidingsaktiwiteite<br />
a = 24,9<br />
bladsy 92 . studie-eenheid 8 regressie<br />
YÃ = 0,52 (X) + 2,63<br />
[3; 4, 19]<br />
[9; 7, 31]<br />
1 2 3 4 5 6 7 8 9 10<br />
Onderhoudsvaardigheidskursus
Bestudeer raam 10.1 en 10.2 op bladsy 175 tot 178 van Tredoux en Durrheim<br />
(2002). Let op waar die helling (b-waarde) en die afsnit (a-waarde) op die uitvoer<br />
aangedui word. Neem kennis dat jy deur regressieanalise ook die korrelasie (r)<br />
verkry.<br />
Noudat jy studie-eenheid 8 bestudeer het, behoort jy<br />
. afdeling 2 data-verwerking: beskrywend<br />
. te kan verduidelik wat regressie is en hoe dit gebruik word<br />
. die algemene regressievergelyking te kan identifiseer en gebruik<br />
. die formule vir die b-waarde te ken en die b-waarde te kan bereken<br />
. die formule vir die a-waarde te ken en die a-waarde te kan bereken<br />
. gegewe X-waardes te kan gebruik om deur vervanging in die vergelyking die<br />
ooreenstemmende YÃ-waardes te bereken<br />
. die regressielyn grafies te kan voorstel<br />
. te kan verduidelik hoe die akkuraatheid van voorspelling en korrelasie met<br />
mekaar verband hou.<br />
bladsy 93
9 Basiese konsepte van<br />
waarskynlikheid<br />
10 Die normaalverspreiding<br />
11 Steekproefdistribusies en<br />
hipotesetoetsing<br />
12 Hipotesetoetse vir gemiddeldes: t-toetse<br />
13 Hipotesetoetse vir gemiddeldes: eenrigting-variansieontleding<br />
14 Die chi-kwadraattoets<br />
15 OnderskeidingsvermoeÈ<br />
l
Inleiding<br />
Nuwe Sterre ____________________________________________<br />
Die sukses van die vertoning tot dusver<br />
bladsy 96<br />
Die Nuwe Sterre-vertoning het selfs groter belangstelling in die media ontlok as<br />
wat aanvanklik verwag is. Die aantal kykers het alle vooruitskattings oortref en<br />
selfs die sosiale netwerktuiste het meer as 10 000 besoekers per dag sedert die<br />
bekendstelling van die vertoning gehad! Vuyo K is na die eerste twee weke van die<br />
vertoning as die mededingendste deelnemer deur haar mededeelnemers aangewys.<br />
Alhoewel sy regtig goed in die voorbereidingsaktiwiteite gevaar het en relatief hoeÈ<br />
punte van die beoordeelaars ontvang het, is sy nie so gewild onder die kykers nie.<br />
En die kykers se stem tel inderdaad! Die grootste teleurstelling van die vertoning<br />
tot dusver is dat Sasha onttrek het. Sy was een van die gewildste deelnemers op die<br />
sosiale netwerktuiste, maar het na die eerste week besluit dat haar studies by<br />
Unisa voorkeur bo haar aspirasies vir 'n sangloopbaan moet geniet. Angie<br />
Motseneka is die eerste beoordeelaar wat uitgestem is. Die stemmery was eenparig<br />
van kykers sowel as deelnemers!<br />
Een van die redes waarom die vertoning so 'n groot opgewondenheid in die media<br />
ontlok het, is die feit dat verskeie rolspelers van die gemeenskap hul mening<br />
uitgespreek het. Wat toon hierdie vertoning oor die toestand van die breeÈ r<br />
samelewing? Wat wys die deelnemers oor die aspirasies van ons jeug in Suid-<br />
Afrika. InferensieÈ le statistiek kan ons help om sommige van hierdie vrae te<br />
beantwoord. InferensieÈ le statistiek maak van steekproewe gebruik om afleidings<br />
oor populasies te maak. Die volgende paar studie-eenhede sal 'n aantal temas van<br />
inferensieÈ le statistiek dek.<br />
Studie-eenheid 9 verskaf 'n basiese inleiding tot die konsep van waarskynlikheid.<br />
Dit is 'n beginsel wat inferensieÈ le statistiek onderleà en sal ook die grondslag van 'n<br />
aantal ander statistiese tegnieke vorm.<br />
Studie-eenheid 10 bespreek die standaard-normaalverspreiding. Hierdie<br />
verspreiding is 'n metode om te bepaal waar 'n individu se telling val in<br />
verhouding tot 'n groep ander individue se tellings. Dit kan die navorsingspan van<br />
Nuwe Sterre help om vrae soos die volgende te beantwoord: Wat is die aantal<br />
aansoekers wat hoeÈ r as die gemiddelde ``ekstrovert'' telling vir die groter<br />
populasie in Suid-Afrika behaal het?<br />
Studie-eenheid 11 verskaf 'n inleiding tot hipotesetoetsing. Die navorsingspan van
. afdeling 3 data-verwerking: inferensieel<br />
Nuwe Sterre het moontlik 'n aantal verwagtings (hipoteses) oor die interaksies en<br />
uitkomste van die vertoning. Dit moet egter wetenskaplik bewys word. Dit is die<br />
proses van hipotesetoetsing.<br />
Studie-eenheid 12 handel oor hipotesetoetsing waar twee groepe betrokke is.<br />
Byvoorbeeld, daar kan 'n vergelyking wees tussen mans en vroue of ouer en<br />
jonger kykers of applikante vir die Nuwe Sterre-vertoning.<br />
Studie-eenheid 13 ondersoek hipotesetoetsing waar meer as twee groepe betrokke<br />
is. 'n Mens kan byvoorbeeld belangstel om te weet wat die verskil tussen die<br />
deelnemers se houdings voor, tydens en na die vertoning is.<br />
Studie-eenheid 14 bespreek hipotesetoetsing wat op kategoriese data van<br />
toepassing gemaak word (kyk na studie-eenheid 2 vir 'n beskrywing van<br />
kategoriese data). 'n Mens kan byvoorbeeld die deelnemers in lae, medium en<br />
hoeÈ presteerders indeel en ondersoek instel of daar 'n verskil is met betrekking tot<br />
hierdie drie groepe ten opsigte van hul buigsaamheid.<br />
Studie-eenheid 15 bespreek die konsep van onderskeidingsvermoeÈ . Dit is 'n<br />
instrument wat gebruik kan word om die graad van akkuraatheid van ons<br />
navorsingsbevindings te bepaal. Aangesien die Nuwe Sterre-vertoning ietwat<br />
kontroversieel kan wees en baie aandag van die media ontlok het, wil 'n mens<br />
seker wees oor die gevoltrekkings wat deur die navorsers gemaak word.<br />
bladsy 97
9<br />
studie-eenheid nege<br />
Basiese konsepte van<br />
waarskynlikheid<br />
Waarskynlikheid het baie te make met kans ten opsigte van die een of<br />
ander teoretiese stel waardes. As ons byvoorbeeld dink aan die<br />
opskiet van 'n muntstuk om uitslag te gee oor die een of ander besluit<br />
soos byvoorbeeld watter span eerste gaan kolf in krieket, het ons met kans te<br />
make. Teoreties is daar twee moontlike uitkomste, kruis of munt. Elke uitkoms is<br />
ewe moontlik en elkeen het op sy eie 'n kans of 'n waarskynlikheid van 1 uit 2 ( 1 /2;<br />
0,5 of 50%) om te realiseer.<br />
Benewens die daaglikse gebruike vir die konsep van waarskynlikheid, word dit<br />
ook algemeen in statistiese berekenings toegepas. Jy sal in studie-eenheid 10 van<br />
die normaalverspreiding leer. Lees nou die laaste paragraaf op bladsy 84 en die<br />
eerste paragraaf op bladsy 85 van Tredoux en Durrheim (2002) waar die verband<br />
tussen waarskynlikheid en die normaalverspreiding verduidelik word. Jy gaan in<br />
studie-eenheid 15 met die konsep onderskeidingsvermoeÈ kennis maak.<br />
OnderskeidingsvermoeÈ word daar omskryf as die waarskynlikheid om reg te<br />
besluit om 'n onwaar nulhipotese te verwerp. Die definisie bevat 'n aantal<br />
begrippe wat in hierdie stadium vir jou vreemd mag voorkom, soos ``verwerp'' en<br />
``onwaar nulhipotese''. Jy hoef jou nie nou daaraan te steur nie. Maar jy moet wel<br />
daarop let dat die woord waarskynlikheid in die definisie van<br />
onderskeidingsvermoeÈ voorkom.<br />
Hierdie is slegs 'n paar terreine in die statistiek waarin waarskynlikheid 'n uiters<br />
belangrike rol speel. Om 'n groot verskeidenheid ander statistiese berekenings te<br />
verstaan, moet jy dus eers die konsep waarskynlikheid onder die knie kry.<br />
Daar bestaan geen eenvoudige definisie van die begrip waarskynlikheid nie. Dit<br />
word soms uitgedruk op grond van die getal gunstige gevalle in teenstelling met<br />
die totale aantal ewe moontlike gevalle. In die voorbeeld van 'n muntstuk is die<br />
waarskynlikheid van 'n bepaalde uitkoms een uit twee, terwyl dit in die geval van<br />
'n dobbelsteen een uit ses (0,17 of 17%) is. Tredoux en Durrheim (2002) gee 'n<br />
definisie van waarskynlikheid op bladsy 74 van hul boek en beskryf dit as die<br />
aantal ``suksesse'' gedeel deur die totale aantal gebeurtenisse.<br />
bladsy 98 . studie-eenheid 9 basiese konsepte van waarskynlikheid
Bestudeer Tredoux en Durrheim (2002) vanaf bladsy 70 tot aan die bokant van<br />
bladsy 74. Hierdie gedeelte bied 'n basiese inleiding tot waarskynlikheid en sluit<br />
enkele toepassings ten opsigte van frekwensie en kansspeletjies in.<br />
Omdat ons aanneem dat jy die begrip waarskynlikheid nou verstaan, wil ons<br />
voortgaan met eenvoudige berekenings van waarskynlikheid.<br />
Bestudeer die afdeling ``The multiplication and addition rules of probability'' op<br />
bladsy 74 tot 76van Tredoux en Durrheim (2002).<br />
Jou vermoeÈ om waarskynlikheid korrek te bereken, sal regstreeks afhang van jou<br />
begrip van enkele terme en reeÈ ls wat toegepas moet word wanneer hierdie<br />
berekenings gedoen word en wat in hierdie gedeelte van Tredoux en Durrheim<br />
(2002) behandel word.<br />
1. Verduidelik die volgende terme en gee 'n voorbeeld van elk:<br />
. onafhanklike gebeurtenis<br />
. onderling uitsluitend<br />
. omvattendheid<br />
2. Wanneer gebruik ons die volgende reeÈ ls?<br />
. OptellingsreeÈ l(Probability law of disjunctions)<br />
. VermenigvuldigingsreeÈ l(Probability law of conjunctions)<br />
1. . Onafhanklike gebeurtenis: Gebeurtenis waar die voorkoms<br />
geen effek het op die waarskynlikheid<br />
van die voorkoms van 'n<br />
ander gebeurtenis nie.<br />
. Onderling uitsluitend: Wanneer die voorkoms van een<br />
gebeurtenis die voorkoms van 'n<br />
ander gebeurtenis uitsluit.<br />
. Omvattendheid: 'n Stel gebeure wat alle moontlike<br />
uitkomste voorstel.<br />
2. . Die optellingsreeÈ l (Law of disjunctions):<br />
. Die vermenigvuldigingsreeÈ l(Law of<br />
conjunctions):<br />
. afdeling 3 data-verwerking: inferensieel<br />
Wanneer gebeurtenisse onderling<br />
uitsluitend is.<br />
Wanneer gebeurtenisse onafhanklik<br />
is.<br />
bladsy 99
Diskrete en kontinue veranderlikes ____________________________<br />
Ons het in studie-eenheid 2 reeds onderskei tussen diskrete en kontinue<br />
veranderlikes. Jy sal sien dat die aard van die veranderlikes ook by<br />
waarskynlikheidsteorie 'n rol speel. 'n Kontinue veranderlike, byvoorbeeld<br />
lengte, kan tussenwaardes aanneem, terwyl 'n diskrete veranderlike,<br />
byvoorbeeld aantal kinders per gesin, net spesifieke waardes kan aanneem. By<br />
die verdelingskromme van 'n kontinue veranderlike is daar dus 'n interval van<br />
waardes ter sprake. Daar word verwys na die kans dat 'n spesifieke veranderlike<br />
binne 'n bepaalde interval val, eerder as die kans dat dit 'n bepaalde waarde sal<br />
aanneem.<br />
Bestudeer die afdeling oor binomiaalverspreiding op bladsy 79 tot 82 van Tredoux<br />
en Durrheim (2002). Die binomiaalverspreiding verteenwoordig die verspreiding<br />
vir diskrete veranderlikes. Lees ook die gedeelte op bladsy 83 tot 85 wat handel<br />
oor die normaalverspreiding, oftewel die distribusie vir kontinue veranderlikes.<br />
Beantwoord die volgende vraag ter opsomming van hierdie studie-eenheid:<br />
1. Die sosiale netwerkfasiliteit op die Nuwe Sterre-webtuiste het 'n kompetisie<br />
uitgevaardig. Hulle het kykers uitgenooi om te raai watter deelnemer studeer<br />
tans Bedryfsielkunde. Gelukkig het jy en jou vriendin dit opgetel in 'n<br />
onderhoud wat die media vantevore met sommige van die deelnemers gevoer<br />
het en weet dat dit Sasha is. Jy is daarom taamlik seker van jou antwoord.<br />
Die wenner van die kompetisie kan DVD's en CD's ter waarde van R5 000<br />
wen en die tweede prys is CD's ter waarde van R1 000. Jou vriendin het 35<br />
inskrywings ingestuur en jy 30. Jy het pas gelees dat 200 inskrywings geslaagd<br />
was.<br />
1.1 Wat is die waarskynlikheid dat jou vriendin die eerste prys sal wen?<br />
1.2 Indien jy nie die eerste prys wen nie, wat is die waarskynlikheid dat jy<br />
die tweede prys sal wen? (Die inskrywing van die eerstepryswenner word<br />
nie in die houer teruggeplaas nie.)<br />
1.3 Wat is die waarskynlikheid dat julle twee die eerste en tweede prys sal<br />
wen?<br />
1.1 p (vriendin) =<br />
35<br />
200<br />
= 0,175<br />
= 0,18<br />
1.2 p (self) =<br />
30<br />
199<br />
= 0,15<br />
bladsy 100 . studie-eenheid 9 basiese konsepte van waarskynlikheid
1.3 Stap 1: Waarskynlikheid dat jy die eerste prys wen en jou vriendin die tweede<br />
prys.<br />
p (vriendin) 6 p (self) = 35 30<br />
200<br />
6<br />
199<br />
= (0,18)(0,15)<br />
= 0,027<br />
= 0,03<br />
Stap 2: Waarskynlikheid dat jou vriendin die eerste prys wen en jy die tweede<br />
prys.<br />
p (vriendin) 6 p (self) = 30 35<br />
200<br />
6<br />
199<br />
= (0,15)(0,18)<br />
= 0,027<br />
= 0,03<br />
Stap 3: Die antwoord is dus 0,03 + 0,03 = 0,06<br />
. afdeling 3 data-verwerking: inferensieel<br />
Noudat jy studie-eenheid 9 bestudeer het, behoort jy<br />
. die basiese terminologie en reeÈ ls van waarskynlikheid te kan omskryf<br />
. tussen diskrete en kontinue veranderlikes te kan onderskei<br />
. waarskynlikhede te kan bereken soos in die oefeninge wat in hierdie studieeenheid<br />
aangebied is.<br />
bladsy 101
10<br />
studie-eenheid tien<br />
Die normaal-<br />
verspreiding<br />
Ons kan 'n groot verskeidenheid veranderlikes in ons daaglikse lewe<br />
ondersoek. Mense se lengte is een voorbeeld hiervan. Gestel ons neem<br />
lengte as 'n veranderlike. Besonder min mense is buitengewoon kort en<br />
net so min is buitengewoon lank. Die meeste mense het 'n gemiddelde lengte. Ons<br />
kan dieselfde van ander menslike eienskappe seà . As ons die verspreiding van<br />
lengte (waar slegs 'n paar mense besonder kort, die meeste mense middelmatig<br />
lank en net enkele mense besonder lank is) grafies moet uitbeeld, sal die distribusie<br />
soos in die grafiek hieronder lyk.<br />
Hierdie verspreiding word die normaalverspreiding genoem. Dink aan die<br />
klokvormige normaalverspreiding as 'n kontinue frekwensieverspreiding. Indien<br />
data volgens hierdie normaalvorm versprei is, beteken dit dat min persone oor<br />
baie min van 'n bepaalde eienskap beskik en dat ewe min persone besonder baie<br />
van daardie eienskap het. Die meeste persone het 'n gemiddelde hoeveelheid van<br />
die eienskap. Die normaalverspreiding vorm die grondslag vir die gebruik van<br />
baie van die statistiese tegnieke waarvan jy in hierdie kursus gaan leer.<br />
Die normaalverspreiding het die volgende eienskappe, waarvan sommige reeds in studie-eenheid 4<br />
bespreek is:<br />
. Klokvormig. 'n Normale verspreiding het 'n duidelik herkenbare klokvorm met<br />
een definitiewe piek, en is dus unimodaal.<br />
. Simmetries. Die figuur vorm 'n presiese spieeÈ lbeeld om die middellyn. Omdat<br />
die normaalverspreiding simmetries is, word net die positiewe helfte se waardes<br />
in die tabel vir z-waardes gegee. Die ander helfte se waardes is presies dieselfde,<br />
net die tekens verskil.<br />
. Die oppervlak of proporsie onder die normaalverspreiding is gelyk aan 1,00 in<br />
bladsy 102 . studie-eenheid 10 die normaalverspreiding
. afdeling 3 data-verwerking: inferensieel<br />
desimale terme of gelyk aan 100% as 'n persentasie. Aangesien die figuur<br />
simmetries is, beteken dit dat die oppervlak van die linkerkantste helfte 50% (of<br />
0,5) beslaan en die regterkantste helfte die ander 50% (of 0,5).<br />
Baie sielkundige toetse maak ook die aanname dat die eienskap(pe) wat gemeet<br />
word normaal versprei is. Die meeste sielkundige toetse van intelligensie en aanleg<br />
is gegrond op die aanname van normale verspreiding van daardie eienskappe.<br />
Daarom word normtabelle vir toetse opgestel sodat toetsprestasie van individue in<br />
vergelyking met die van 'n normgroep geõÈ nterpreteer kan word. Die aanname is<br />
dat die eienskap binne die normgroep normaal versprei is.<br />
Hieruit kan jy aflei dat ons die normaalverspreiding gebruik om 'n relatiewe<br />
posisie in 'n distribusie te bepaal of om byvoorbeeld vas te stel waar 'n individu<br />
ten opsigte van ander op 'n normaalverspreiding leà .<br />
Jy sal merk dat hierdie studie-eenheid hoofsaaklik uit aktiwiteite bestaan. Deur<br />
hierdie aktiwiteite te doen, sal jy besef hoe waardevol die normaalverspreiding vir<br />
praktiese gebruik is.<br />
Die standaard-normaalverspreiding ____________________________<br />
Om 'n individu se posisie in verhouding tot ander in 'n normaalverspreiding te<br />
bepaal, moet ons weet wat die gemiddeld en variansie van die verspreiding is. Soos<br />
jy jou kan voorstel, sal die gemiddeld en variansie vir lengte as 'n veranderlike<br />
verskil van die gemiddeld en variansie van gewig as 'n veranderlike op 'n<br />
normaalverspreiding. Dit is daarom onmoontlik om te weet wat die waardes van<br />
die normaalverspreiding van elke veranderlike is wat ons wil ondersoek. So in<br />
plaas daarvan om die normaalverspreidingstellings te heà vir elke veranderlike wat<br />
ons ondersoek, het statistici een standaard-normaalverspreiding ontwikkel. Die<br />
waardes op die standaard-normaalverspreiding word as z-tellings vertoon. Die<br />
statistici het ook 'n manier geõÈ dentifiseer om 'n telling van enige veranderlike tot<br />
'n z-telling om te skakel sodat ons die standaard-normaalverspreiding kan gebruik<br />
om die verspreiding van 'n telling in verhouding tot ander tellings waarin ons<br />
belangstel, te bepaal.<br />
Bestudeer die inleiding tot tutoriaal 6op bladsy 90 tot 91 van Tredoux en<br />
Durrheim (2002) om 'n oorsig te verkry van wat jy tot dusver oor die<br />
normaalverspreiding geleer het. Lees dan die afdeling oor die standaardnormaalverspreiding<br />
op bladsy 91 tot 93 (voordat jy tabelle vir z-tellings gebruik).<br />
Tredoux en Durrheim (2002) verduidelik dat, wanneer ons met verskillende<br />
datastelle werk wat almal normaal versprei is, ons eenvormigheid kan verkry deur<br />
al die datastelle na 'n standaardvorm om te skakel.<br />
bladsy 103
Hierdie standaard-normaalverspreiding beskik oor dieselfde eienskappe as die<br />
normaalverspreiding asook die volgende:<br />
. 'n Standaard-normaalverspreiding toon 'n gemiddelde van 0 en 'n<br />
standaardafwyking van 1.<br />
. Die standaard-normaalverspreiding word beskryf op grond van eenhede van<br />
standaardafwyking bekend as z-tellings.<br />
. Hierdie z-tellings wissel van drie standaardafwykings onder die gemiddelde tot<br />
drie standaardafwykings bokant die gemiddelde.<br />
Maak 'n gewoonte daarvan wanneer jy met z-tellings werk om altyd 'n sketsie van<br />
die normaalverspreiding te maak. Dui die middellyn daarop aan met z = 0. Alle<br />
negatiewe z-tellings sal in die linkerkantste helfte leà en alle positiewe z-tellings sal<br />
in die regterkantste helfte leà . Jou skets moet ooreenstem met die grafiek wat aan<br />
die begin van die studiegids gegee word.<br />
Om die standaard-normaalverspreiding te kan gebruik, word die z-tellings in<br />
tabelvorm gegee.<br />
Bestudeer nou die afdeling oor die gebruik van z-tellings op bladsy 93 tot 97 van<br />
Tredoux en Durrheim. (Laat Boks 6.1 op bladsy 97 tot 98 uit.) Figuur 3 op bladsy<br />
93 is net 'n klein deel van tabel A1.1 in bylae 1. Neem kennis dat, aangesien 'n<br />
normaalverspreiding simmetries is, slegs die waardes vir die positiewe helfte in die<br />
tabel vir z-waardes gegee word. Die waardes vir die ander helfte is presies<br />
dieselfde, behalwe dat die tekens verskil. So indien jy 'n negatiewe z-telling het,<br />
gebruik net die ooreenstemmende positiewe z-telling in die tabel om die toepaslike<br />
verhouding af te lees.<br />
Nadat jy hierdie afdeling in Tredoux en Durrheim (2002) bestudeer het, behoort<br />
jy vertroud te wees met tabel A1.1 en behoort jy proporsies vir verskeie z-tellings<br />
te kan bepaal.<br />
Soos reeds in hierdie studie-eenheid gemeld, vestig ons ons aandag op die<br />
verspreiding van verskillende veranderlikes in ons daaglikse lewe en nie<br />
noodwendig op die verspreiding van z-tellings nie.<br />
Bestudeer die afdeling op bladsy 98 tot 99 van Tredoux en Durrheim (2002) wat<br />
verduidelik hoe die statistiese weà reld (die standaard-normaalverspreiding)<br />
toegepas kan word om die regte weà reld (veranderlikes wat in ons daaglikse<br />
bestaan voorkom) te interpreteer en afleidings daaroor te maak.<br />
bladsy 104 . studie-eenheid 10 die normaalverspreiding
Soos voorheen genoem en uit hierdie bespreking in Tredoux en Durrheim (2002)<br />
afgelei kan word, is die standaard-normaalverspreiding besonder nuttig,<br />
aangesien enige stel tellings wat normaal versprei is na standaardtellings<br />
omgeskakel kan word sodat direkte vergelyking van data uit verskillende<br />
datastelle moontlik is. Die formule vir hierdie omskakeling is soos volg:<br />
z = X<br />
. afdeling 3 data-verwerking: inferensieel<br />
Sodra tellings na standaardtellings (z-tellings) omgeskakel is, kan ons die<br />
standaardtabel gebruik. Hierdie omskakeling verander nie die verspreiding van<br />
die tellings nie, maar bloot die wyse waarop dit voorgestel word. Vergelyk<br />
byvoorbeeld ``A'' met ``a''. Albei karakters stel die eerste letter van die alfabet<br />
voor ± dieselfde inligting word net in verskillende vorms voorgestel.<br />
Bestudeer die afdeling oor die omskakeling van x-tellings na z-tellings op bladsy<br />
100 tot 102 van Tredoux en Durrheim (2002).<br />
Jy ken nou die definisie en eienskappe van 'n normaalverspreiding. Jy het ook al<br />
die definisie en eienskappe van die standaard-normaalverspreiding geleer. Boonop<br />
weet jy ook hoe om tellings wat as normaalveranderlikes (x-tellings) voorkom, om<br />
te sit in tellings wat in die standaard-normaalverspreiding pas (z-tellings).<br />
Dink na oor die volgende scenario. Een van die eienskappe wat as deel van die<br />
psigometriese assessering van die deelnemers van die Nuwe Sterre-vertoning<br />
gemeet is, is ``ReeÈ lnavolging''. Dit is die mate waartoe 'n persoon geneig sal wees<br />
om die verwagte reeÈ ls en regulasies van die samelewing te volg. Die navorsers wat<br />
aangestel is om verskeie aspekte van die Nuwe Sterre-vertoning te ondersoek, wil<br />
weet of die deelnemers aan die vertoning geneig is om 'n laer puntetelling te behaal<br />
as die gemiddeld wat oor die algemeen van individue in die gemeenskap verwag<br />
kan word. Hulle besluit om die puntetellings van die deelnemers te vergelyk met<br />
die data van die normgroep wat hulle tot hulle beskikking het. Die data van die<br />
normgroep is normaal verspreid en bestaan uit 'n groep individue tussen 18 en 36<br />
jaar oud (N=1 250) met 'n gemiddelde (m)-telling van 7 en 'n standaardafwyking<br />
(s) van 2 op die meting van ``ReeÈ lnavolging''. Die deelnemers het 'n gemiddelde<br />
telling van minder as 5 vir ``ReeÈ lnavolging'' behaal, terwyl dit bekend is dat uiters<br />
konsensieuse individue ongeveer 10 op hierdie meting behaal.<br />
Hulle het jou gevra om die volgende vrae te beantwoord:<br />
(a) Bereken die ooreenstemmende z-telling vir 'n persoon met 'n telling van 5 vir<br />
``ReeÈ lnavolging''.<br />
(b) Bereken die ooreenstemmende z-telling vir 'n persoon met 'n telling van 10 vir<br />
``ReeÈ lnavolging''.<br />
(c) Bepaal die proporsie van gevalle met 'n telling van minder as 5 vir<br />
``ReeÈ lnavolging''.<br />
bladsy 105
(d) Bepaal die persentasie van gevalle met 'n telling van minder as 5 vir<br />
``ReeÈ lnavolging''.<br />
(e) Bepaal die aantal gevalle met 'n telling tussen 5 en 10 vir ``ReeÈ lnavolging''.<br />
Voordat jy hierdie vrae probeer antwoord, raai ons jou aan om die volgende<br />
aktiwiteite te voltooi. Hierdie aktiwiteite sal jou in staat stel om die vrae sinvol<br />
aan te pak.<br />
Langs elke z-telling wat in die tabel gegee word, word drie verskillende waardes gegee:<br />
. Mean to z<br />
. Larger portion<br />
. Smaller portion<br />
Onthou dat die totale proporsie of oppervlak onder die normaalverspreiding<br />
gelyk is aan 1,0. Die oppervlak van die linkerkantste helfte onder die kromme (dit<br />
wil seà by die negatiewe z-tellings) is gelyk aan 0,5 en net so is die oppervlak van die<br />
regterkantste helfte onder die kromme (by die positiewe z-tellings) ook gelyk aan<br />
0,5.<br />
Instruksies Kommentaar<br />
Maak 'n diagrammatiese voorstelling<br />
van 'n tipiese gestandaardiseerde normaalverspreiding<br />
en dui die proporsie<br />
onder die kromme as 0,5 by elkeen van<br />
die twee helftes aan.<br />
So 'n voorstelling behels 'n skets van 'n<br />
normaalkromme met 'n vertikale lyn<br />
deur die middel en z = 0 daar aangedui.<br />
Hierdie skets word slegs gebruik<br />
om die oppervlak onder die kromme<br />
van die twee helftes voor te stel.<br />
Wanneer daar gevra word na die proporsie groter as 'n bepaalde telling, verwys<br />
dit na die proporsie regs van die bepaalde telling se posisie. Proporsie kleiner as<br />
verwys weer na die proporsie links van die bepaalde punt. Om te weet waar die<br />
bepaalde punt op die kromme sal leà , moet die z-telling eers bereken word. Daar is<br />
vyf moontlikhede met die aandui van oppervlaktes:<br />
. Positiewe z-telling: groter as (regs van) = ``smaller portion'' in tabel<br />
. Positiewe z-telling: kleiner as (links van) = ``larger portion'' in tabel<br />
. Negatiewe z-telling: groter as (regs van) = ``larger portion'' in tabel<br />
. Negatiewe z-telling: kleiner as (links van) = ``smaller portion'' in tabel<br />
. Twee z-tellings: tussen die twee tellings = ``mean to z''-waardes in tabel<br />
bladsy 106 . studie-eenheid 10 die normaalverspreiding
Instruksies Kommentaar<br />
Maak vyf sketse van die normaalverspreiding<br />
om die vyf moontlikhede<br />
wat hierbo genoem is grafies (diagrammaties)<br />
voor te stel.<br />
Dui op die eerste twee figure z =<br />
+1,5 met 'n vertikale lyn in die<br />
regterkantste helfte aan.<br />
Dui op die derde en vierde figuur 'n ztelling<br />
van z = 72 aan met 'n<br />
vertikale lyn in die linkerkantste helfte.<br />
Op die vyfde figuur moet jy twee ztellings<br />
aandui, z = +1,5 in die<br />
regterkantste helfte en z = 72,0 in<br />
die linkerkantste helfte.<br />
Onthou dat 'n positiewe z-telling altyd<br />
regs van die middellyn (z = 0) sal<br />
wees en 'n negatiewe z-telling altyd<br />
links van die middellyn (z = 0).<br />
Onthou verder dat groter as (4) ``regs<br />
van'' beteken en kleiner as (5) ``links<br />
van''.<br />
Ons gaan jou nou wys hoe om die verskillende moontlikhede voor te stel.<br />
POSITIEWE z-TELLING ± AFLEES VAN PROPORSIES<br />
Instruksies Kommentaar<br />
Gebruik eers die eerste twee figure<br />
(waar die positiewe z-telling van 1,5<br />
aangedui is).<br />
Skryf groter as (4) onder die eerste<br />
figuur en kleiner as (5) onder die<br />
tweede figuur. Kleur nou die gepaste<br />
area in op die twee figure.<br />
Soek nou die gepaste waarde in tabel<br />
A1.1 om die spesifieke area by elke<br />
diagram as 'n proporsie aan te dui.<br />
. afdeling 3 data-verwerking: inferensieel<br />
Waar daar groter as (4) staan, moet<br />
jy die area regs van die gemerkte ztelling<br />
inkleur. Waar daar kleiner as<br />
(5) staan, moet jy die area links van<br />
die gemerkte z-telling inkleur.<br />
By die eerste figuur (positiewe z-telling<br />
en groter as (4)) sou jy die kleiner<br />
proporsie ingekleur het. By die tweede<br />
figuur (positiewe z-telling en kleiner as<br />
(5)) sou jy die groter proporsie<br />
ingekleur het.<br />
Die kleiner proporsie by 'n z-telling<br />
van 1,5 is gelyk aan 0,0668 (sien tabel<br />
A1.1) en die groter proporsie by<br />
z = 1,5 is gelyk aan 0,9332.<br />
In die volgende gedeelte gaan jy nou figure 3 en 4 gebruik om die proporsies in te<br />
kleur waar daar met 'n negatiewe z-telling gewerk word.<br />
bladsy 107
NEGATIEWE z-TELLING ± AFLEES VAN PROPORSIES<br />
Instruksies Kommentaar<br />
Gebruik nou figuur 3 en 4 (waar die<br />
negatiewe z-telling van z = 72<br />
aangedui is). Skryf groter as (4)<br />
onder die eerste figuur en kleiner as<br />
(5) onder die tweede figuur. Kleur<br />
nou die gepaste area in op die twee<br />
figure.<br />
Soek nou die gepaste waarde in tabel<br />
A1.1 om die spesifieke area by elke<br />
diagram as 'n proporsie aan te dui.<br />
Waar daar groter as (4) staan, moet<br />
jy die area regs van die gemerkte ztelling<br />
inkleur. Waar daar kleiner as<br />
(5) staan, moet jy die area links van<br />
die gemerkte z-telling inkleur.<br />
By die derde figuur (negatiewe z-telling<br />
en groter as (4)) sou jy die groter<br />
proporsie ingekleur het. By die vierde<br />
figuur (negatiewe z-telling en kleiner as<br />
(5)) sou jy die kleiner proporsie<br />
ingekleur het.<br />
Die kleiner proporsie by 'n z-telling<br />
van 2,0 is gelyk aan 0,0228 (sien tabel<br />
A1.1) en die groter proporsie by<br />
z = 2,0 is gelyk aan 0,9772.<br />
In die volgende gedeelte gaan ons nou kyk wat gebeur as jy wil kyk na die area<br />
(proporsie) tussen twee verskillende z-tellings. Hier werk ons met die area kleiner<br />
as (links van) die een waarde, maar terselfdertyd ook die area groter as (regs van)<br />
die tweede waarde. Weer eens sal dit vir jou baie duideliker word as jy 'n grafiese<br />
voorstelling daarvan maak. In hierdie gedeelte sal jy gebruik maak van die ``mean<br />
to z''-kolom in tabel A1.1 (alhoewel jy die antwoord ook met ander waardes sou<br />
kon bereken).<br />
bladsy 108 . studie-eenheid 10 die normaalverspreiding
TWEE z-TELLINGS ± PROPORSIE TUSSEN TWEE TELLINGS<br />
Instruksies Kommentaar<br />
Gebruik nou die vyfde skets van die<br />
normaalverspreiding wat jy geteken<br />
het. Dui daarop z = +1,5 (regs van<br />
z = 0) SOWEL AS z =7 2,0 (links<br />
van z = 0) op hierdie figuur aan.<br />
Skryf 72,0 5 z 5 1,5 onder hierdie<br />
figuur. Kleur nou die gepaste area in<br />
op die figuur in.<br />
Soek nou die gepaste waarde in tabel<br />
A1.1 om die spesifieke area wat jy<br />
ingekleur het as 'n proporsie aan te<br />
dui.<br />
. afdeling 3 data-verwerking: inferensieel<br />
Jy moes die area TUSSEN die twee zwaardes<br />
ingekleur het (kleiner as<br />
z = +1,5 en terselfdertyd groter as<br />
z = 72,0).<br />
Hier is dit makliker om van die ``mean<br />
to z''-waardes van tabel A1.1 gebruik<br />
te maak. Die area tussen die twee zwaardes<br />
word deur twee helftes verteenwoordig.<br />
Die linkerkantste deel is<br />
die waarde van z = 72,0 tot by die<br />
middellyn (z = 0), terwyl die<br />
regterkantste deel die proporsie tussen<br />
z = 1,5 en die middellyn (z =0)<br />
is.<br />
Die ``mean to z''-proporsie by 'n ztelling<br />
van 2,0 is gelyk aan 0,4772 (sien<br />
tabel A1.1) en die ``mean to z''-telling<br />
by z = 1,5 is gelyk aan 0,4332. Hierdie<br />
twee tellings moet bymekaargetel word<br />
om die proporsie tussen die twee<br />
tellings te kry. (Die antwoord is<br />
0,9104.)<br />
Enige proporsie kan ook as 'n persentasie uitgedruk word deur dit met 100 te<br />
vermenigvuldig. Byvoorbeeld: 0,9772 kan geskryf word as 97,72%, terwyl 0,0228<br />
as 2,28% geskryf kan word.<br />
Wanneer ons die proporsie bereken het, kan ons ook uitwerk watter aantal<br />
persone daardie proporsie verteenwoordig. Die aantal persone word verkry deur<br />
die proporsie (of persentasie) met die totale aantal gevalle te vermenigvuldig.<br />
bladsy 109
AANTAL GEVALLE VERTEENWOORDIG DEUR `N PROPORSIE (OF<br />
PERSENTASIE)<br />
Instruksies Kommentaar<br />
Bereken die aantal gevalle van 'n<br />
totaal van 80 gevalle wat deur die<br />
proporsie 0,7653 (of 76,53%)<br />
voorgestel word.<br />
Jy moet die totale aantal gevalle (80)<br />
met die proporsie (of persentasie)<br />
vermenigvuldig. Dit gee 'n antwoord<br />
van 61,24, wat afgerond word tot 61.<br />
. Onthou dat waar daar met persone<br />
gewerk word, die antwoord altyd tot<br />
die naaste syfer afgerond word.<br />
Jy moet die volgende stappe volg elke keer wat jy met z-tellings werk:<br />
. Maak 'n skets van die normaalverspreiding met z = 0 in die middel.<br />
. Bereken die z-telling (gebruik die formule).<br />
. Teken die berekende z-telling op jou skets. Onthou, positiewe z-tellings kom<br />
regs van z = 0 en negatiewe z-tellings kom links van z = 0.<br />
. Bepaal of jy die gedeelte links van () die bepaalde<br />
z-waarde moet inkleur en kleur dit in.<br />
. Lees die korrekte proporsie (larger portion, smaller portion of mean to z) in die<br />
tabel af by die bepaalde z-waarde en teken dit so op jou skets aan.<br />
. Skryf die nodige berekening neer en gee jou finale antwoord in die korrekte<br />
formaat.<br />
Probeer nou om die vrae wat ons vroeeÈ r gestel het te beantwoord.<br />
Jou antwoorde behoort so te lyk:<br />
(a) (X =5)<br />
z = X<br />
= 5 7<br />
2<br />
= 2<br />
2<br />
= 71<br />
bladsy 110 . studie-eenheid 10 die normaalverspreidingg
(b) (X = 10)<br />
z = X<br />
= 10 7<br />
= 3<br />
2<br />
2<br />
= 1,5<br />
(c) Proporsie = 0,15866<br />
. afdeling 3 data-verwerking: inferensieel<br />
. Kyk na die skets by Vraag (a).<br />
. Jy het reeds z = ±1 bereken by Vraag (a).<br />
. Blaai na tabel A1.1 in Tredoux en Durrheim.<br />
. Soek waar z = 1 in die tabel.<br />
. Die grysgekleurde area is waaroor hierdie vraag handel en jy kan<br />
sekerlik sien dat dit die smaller portion onder hierdie normaaldistribusie<br />
is.<br />
. Kyk langs z = 1 onder smaller portion in Tabel A1.1 en jy sal die<br />
waarde 0,15866 sien.<br />
(d) Proporsie = 0,15866 (jou antwoord op Vraag (c))<br />
Dus is die persentasie = 15,87%<br />
(e) Onthou dat die totale oppervlakte onder die standaard-normaalverspreiding<br />
= 1.<br />
Dus is die grysgekleurde proporsie = 0,927.<br />
1 7 (0,06681 + 0,15866) = 1 ± 0,22547 = 0,77453<br />
Jy sal dieselfde antwoord kry indien jy die twee mean to z proporsies (0,43319<br />
en 0,44134) in die figuur bymekaar tel.<br />
N = 1 250 (Dit word by die begin in die vraag gegee)<br />
Die aantal gevalle = 0,77453 6 1 250<br />
= 968,16<br />
;968 persone<br />
Ons kan uit hierdie berekenings sien dat die deelnemers van die Nuwe Sterrevertoning<br />
binne die laagste 15% van individue in die samelewing tussen die<br />
ouderdom 18 tot 36jaar val met betrekking tot die mate waartoe hulle normale<br />
bladsy 111
eeÈ ls en regulasies nakom. Dit kom daarom voor dat hulle meer geneig is om<br />
risiko's te neem en die status quo uit te daag as die gemiddelde individu in hierdie<br />
ouderdomsgroep in die gemeenskap.<br />
Ons kan nie net x-tellings in z-tellings omskakel nie, maar ook z-tellings in xtellings<br />
omsit.<br />
Bestudeer die toepaslike afdeling op bladsy 102 tot 103 van Tredoux en Durrheim<br />
(2002) en doen dan die volgende oefening.<br />
Gestel ons moet die grense bepaal waarbinne 80% van persone se tellings sal val<br />
as ons weet dat die gemiddelde van die tellings gelyk is aan 45,7 en die<br />
standaardafwyking gelyk is aan 11,42.<br />
GRENSE VAN SEKERHEID<br />
Instruksies Kommentaar<br />
Teken weer 'n normaalverspreiding<br />
met z = 0 in die middel.<br />
Merk nou twee grense aan weerskante<br />
van z = 0 en kleur die gedeelte tussen<br />
hierdie twee grense in.<br />
Merk die ingekleurde deel as gelyk aan<br />
80% (0,80) met 40% links van z =0<br />
en 40% regs van z =0.<br />
Vind nou die ooreenstemmende ztelling<br />
wat die areas sal gee soos wat<br />
op jou skets aangedui is.<br />
Indien jy nie die presiese waarde in die<br />
tabel (A1.1) kry nie, gebruik die<br />
waarde wat numeries die naaste is<br />
aan die waarde wat jy gesoek het.<br />
Die twee z-waardes wat die naaste aan<br />
0,4000 (40%) kom, is<br />
z = 1,29 (mean to z = 0,4015) en<br />
z = 1,28 (mean to z = 0,3997).<br />
Aangesien 0,3997 nader aan 0,40 is,<br />
neem ons z = 1,28 as die korrekte<br />
antwoord.<br />
bladsy 112 . studie-eenheid 10 die normaalverspreiding<br />
Die 80% is presies simmetries rondom<br />
z = 0 versprei, sodat 40% links van<br />
z = 0 en 40% regs van z = 0 leà .<br />
Die oorblywende 20% van die area<br />
(proporsie) onder die kromme sal in<br />
die twee stertgedeeltes vorm. Die<br />
oorblywende 20% word dus in twee<br />
gedeel met 10% in die linkerkantste<br />
stertgedeelte en 10% in die regterkantste<br />
stertgedeelte.<br />
Soek die z-waarde wat 'n ``mean to z''telling<br />
van 0,4000 (40%) gee sodat die<br />
area tussen die negatiewe z-telling met<br />
hierdie waarde en die positiewe xtelling<br />
met hierdie waarde 'n totale<br />
area van 80% sal beslaan. (Onthou dat<br />
die normaalverspreiding heeltemal<br />
simmetries is.)<br />
Jy kon ook vir die z-waarde met 'n<br />
``smaller portion'' van 0,1000 gesoek<br />
het, en sou op die manier by presies<br />
presies dieselfde z-waardes uitgekom<br />
het.
. afdeling 3 data-verwerking: inferensieel<br />
Om nou bogenoemde z-telling korrek te interpreteer, moet jy weer kyk na die<br />
skets wat jy gemaak het. Ons het nou bereken dat 80% van alle tellings tussen z =<br />
±1,28 en z = +1,28 sal leà . Dit beteken prakties dat 80% van alle waardes tussen<br />
die volgende twee berekende waardes sal leà :<br />
. die gemiddelde minus 1,28 maal die standaardafwyking (gee die onderste grens)<br />
. die gemiddelde plus 1,28 maal die standaardafwyking (gee die boonste grens)<br />
Onthou dat ons vir jou geseà het dat die gemiddelde gelyk is aan 45,7 en die<br />
standaardafwyking is gelyk aan 11,42. Vir hierdie spesifieke geval sal 80% van alle<br />
tellings leà tussen:<br />
. Ondergrens: 45,7 7 1,28(11,42) = 45,7 7 14,62 = 31,08; en<br />
. Bogrens: 45,7 + 1,28(11,42) = 45,7 + 14,62 = 60,32.<br />
Tagtig persent (80%) van die persone se waardes sal dus tussen 31,08 en 60,32 leà .<br />
Daar is twee vaste grense wat baie algemeen gebruik word en wat belangrik is om<br />
te onthou: 95% en 99%. Die z-waardes vir 95% is +1,96en vir 99% is dit<br />
+2,58.<br />
Hier is 'n grafiek wat die areas onder die normaaldistribusiekurwe aantoon.<br />
bladsy 113
Bestudeer die uitgewerkte voorbeeld op bladsy 104 van Tredoux en Durrheim<br />
(2002).<br />
Bestudeer raam 6.2 op bladsy 104 tot 105 van Tredoux en Durrheim sodat jy weet<br />
hoe om 'n sigblad te gebruik om z-berekenings te doen.<br />
Noudat jy studie-eenheid 10 bestudeer het, behoort jy<br />
. die normaalverspreiding te kan beskryf<br />
. die standaard-normaalverspreiding te kan beskryf en 'n grafiese voorstelling<br />
daarvan te kan maak<br />
. lineeà re transformasies te kan doen soos die berekening van z-waardes en ook<br />
die aflees van tabelwaardes<br />
. grense te kan bepaal vir die mate van sekerheid van waarnemings<br />
bladsy 114 . studie-eenheid 10 die normaalverspreiding
11<br />
studie-eenheid elf<br />
. afdeling 3 data-verwerking: inferensieel<br />
Steekproefdistribusies<br />
en hipotesetoetsing<br />
Moenie skrik vir hierdie lang en skynbaar ingewikkelde titel nie. Kom<br />
ons kyk na al die terme in hierdie studie-eenheid se opskrif.<br />
Steekproef _____________________________________________<br />
As ons as navorsers belang sou stel om die gemiddelde lengte van al die mans in<br />
Suid-Afrika te bepaal, sou dit onmoontlik wees. Stem jy saam dat dit heeltemal te<br />
veel geld, mense en tyd sou neem om dit te doen? Jy sal al die mans tot in al die<br />
uithoeke van Suid-Afrika moet gaan soek en al sou dit moontlik wees om almal<br />
op te spoor, is die fisiese meet van al die mans onrealisties. Hierdie is maar een<br />
voorbeeld waar dit prakties onmoontlik is om van die hele populasie gebruik te<br />
maak. Soos jy in studie-eenheid 2 gesien het,'n populasie is 'n hele versameling<br />
voorwerpe of entiteite ± in ons voorbeeld hierbo, is dit al die mans in Suid-Afrika.<br />
Aangesien dit nie altyd moontlik is om die hele versameling of alle mans te betrek<br />
nie, gebruik ons eerder 'n deelversameling van die populasie. Ons noem hierdie<br />
deelversameling van die populasie 'n steekproef.<br />
Ons wil egter meestal bepaalde afleidings oor 'n hele populasie maak. As ons dink<br />
aan die voorbeeld waarin ons die gemiddelde ouderdom bereken van alle Nuwe<br />
Sterre-kykers, is dit tog duidelik dat dit heelwat makliker sou wees om met 'n<br />
kleiner groep ('n steekproef) te werk. Ons kan dan die aanname maak dat wat vir<br />
die steekproef geld, ook op die populasie van toepassing is. Die gemiddelde<br />
ouderdom van die kykers in die steekproef sou dan as die gemiddelde ouderdom<br />
van alle Nuwe Sterre-kykers beskou kon word. Ons kan dus veralgemenings van<br />
die steekproef na die populasie vorm. In so 'n geval sou ons spesifieke<br />
navorsingstegnieke op 'n steekproef toepas om afleidings (gevolgtrekkings) oor<br />
die populasie te maak. Dit is wat met inferensieÈ le statistiek bedoel word. Ons<br />
gebruik inferensieÈ le statistiek dus om van 'n steekproef na 'n populasie te<br />
veralgemeen.<br />
Hoe regverdigbaar is die gebruik van steekproewe in plaas van populasies? _____<br />
Jy het nou seker vir jouself die vraag afgevra: hoe seker kan ons wees dat alles wat<br />
waar is van die steekproef, ook waar sal wees van die populasie? Anders gestel, as<br />
bladsy 115
die resultate uit ons navorsing toon dat die gemiddelde ouderdom van kykers in<br />
die steekproef 26jaar oud is, hoe seker kan ons wees dat die gemiddelde<br />
ouderdom van al Nuwe Sterre-kykers in die populasie ook 26jaar oud sal wees?<br />
Hierdie is 'n vraag waarmee navorsers te doen gekry het, maar dit doeltreffend<br />
opgelos het ± deur 'n populasie te definieer wat nie te groot is nie en die<br />
gemiddelde van die totale populasie ten opsigte van 'n eienskap, byvoorbeeld<br />
lengte te verkry. Verskillende ewekansige steekproewe uit dieselfde populasie word<br />
daarna geneem en die gemiddeld van elke steekproef ten opsigte van die eienskap<br />
word gemeet. Die eksperiment word op verskeie populasies uitgevoer en<br />
verskillende eienskappe word ook telkens gemeet. Die gemiddelde van al die<br />
steekproewe se gemiddeldes toon dat dit nooit veel verskil van die populasie se<br />
gemiddelde nie. Daarom is dit regverdigbaar om van 'n steekproef na 'n populasie<br />
te veralgemeen.<br />
Steekproefneming ________________________________________<br />
Steekproefneming is die proses waardeur 'n deelversameling van die hele<br />
populasie geõÈ dentifiseer en groepeer word. Ewekansige steekproefneming<br />
beteken dat die steekproef op so 'n wyse geõÈ dentifiseer en ingesamel word dat<br />
elke lid van die populasie 'n gelyke kans het om deel van die steekproef te wees.<br />
Dit is die beste manier om te verseker dat jou steekproef so kenmerkend moontlik<br />
van die populasie is. Met ander woorde, die steekproef verteenwoordig die<br />
populasie.<br />
Distribusies ____________________________________________<br />
'n Distribusie (verspreiding/verdeling) is 'n grafiese voorstelling van die totale<br />
datastel. Jy het in studie-eenheid 10 reeds van die standaard-normaalverspreiding<br />
geleer.<br />
Hou die betekenis van hierdie konsepte in gedagte terwyl ons nou verduidelik wat<br />
steekproefdistribusies is.<br />
Steekproefdistribusies ___________________________________________<br />
Bestudeer bladsy 108 tot 113 van Tredoux en Durrheim (2002) waar die begrippe<br />
populasies, ewekansige steekproewe en inferensie/afleiding hersien word om die<br />
begrip steekproefdistribusie te verduidelik. 'n Definisie vir die begrip<br />
steekproefdistribusie verskyn in die middel van bladsy 112.<br />
Die vryhandskets hieronder bied 'n voorstelling van die begrip<br />
steekproefdistribusie.<br />
bladsy 116 . studie-eenheid 11 steekproefdistribusies en hipotesetoetsing
Populasiedistribusie met<br />
gemiddelde m, variansie s 2<br />
en standaardafwyking s<br />
Frekwensiedistribusie van alle<br />
moontlike steekproewe van<br />
grootte N vanuit die populasie,<br />
elk met gemiddelde X,<br />
variansie s 2 en standaardafwyking<br />
s<br />
Steekproefdistribusie van die<br />
gemiddelde met gemiddelde x,<br />
variansie s2 x (bekend as die variansiefout<br />
van die gemiddelde) en standaardafwyking<br />
sx (bekend as<br />
die standaardfout van die gemiddelde)<br />
. afdeling 3 data-verwerking: inferensieel<br />
Die steekproefdistribusie van 'n statistiek<br />
X1<br />
Soos reeds geseà , is dit bykans onmoontlik om die gemiddelde van die populasie te<br />
bereken en daarom bereken ons eerder die steekproefgemiddelde, wat as X<br />
genoteer word. Ons neem aan dat alles wat waar is van X, ook waar sal wees van<br />
die populasiegemiddelde, wat as m genoteer word. Omdat ons uiteindelik<br />
belangstel wat in die hele populasie aangaan eerder as in die steekproef,<br />
gebruik ons die m-notasie in berekeninge, en nie X nie.<br />
Noudat jy die term steekproefdistribusies verstaan, gaan ons voort met 'n<br />
bespreking van die tweede begrip in die titel van hierdie studie-eenheid, naamlik<br />
hipotesetoetsing.<br />
Wanneer ons inferensieÈ le statistiek bereken, gebruik ons steekproewe om<br />
m<br />
X3<br />
m X<br />
X2<br />
bladsy 117
afleidings oor populasies te maak. Net so gebruik ons steekproefdistribusies om<br />
afleidings oor populasiedistribusies te maak. Anders gestel, ons gebruik 'n<br />
steekproefdistribusie om 'n hipotese oor 'n populasiegemiddelde te toets.<br />
Wat is 'n hipotese? _______________________________________<br />
Die meeste wetenskaplike navorsingsondersoeke is pogings om 'n hipotese te toets<br />
wat deur die navorser geformuleer is. 'n Hipotese is in werklikheid 'n idee ± 'n<br />
verwagting dat daar 'n verband tussen twee of meer veranderlikes bestaan. Die<br />
navorser maak gewoonlik 'n spesifieke voorspelling aangaande die uitkoms van<br />
sy/haar eksperiment. Indien hierdie voorspelling deur die resultaat van die<br />
ondersoek bevestig word, onderskryf dit die hipotese.<br />
Tredoux en Durrheim (2002, p. 128) beskryf 'n hipotese as 'n tentatiewe<br />
konstatering/stelling van 'n verhouding tussen twee veranderlikes. Die skrywers<br />
verwys ook na Neuman se definisie wat beweer dat hipoteses bloot ingeligte<br />
raaiskote oor die werking van die sosiale weà reld is.<br />
Sover het ons nog net teoreties gepraat. Kom ons verwys terug na die voorbeeld<br />
aan die begin van hierdie studie-eenheid waar ons belang gestel het in die<br />
ouderdom van al die Nuwe Sterre-kykers. Gestel ons as bedryfsielkundiges wil<br />
egter nie net weet wat die gemiddelde ouderdom van die kykers is nie. Ons stel<br />
ook belang om te weet of die kykers 'n verskillende gemiddelde ouderdom van<br />
besoekers aan die webtuiste het. Die vraag wat ons ons afvra is of die twee groepe<br />
verskil, met ander woorde of die gemiddelde ouderdom van 'n kykersteekproef<br />
wat verkry is beduidend sal verskil van die gemiddelde ouderdom vir 'n steekproef<br />
van besoekers aan die webtuiste. So ons stel 'n navorsingsprobleem, wat ons<br />
verder as 'n stelling kan definieer wat as 'n navorsingshipotese bekend staan.<br />
Hierdie stelling of navorsingshipotese kan die volgende wees: ``Daar is 'n verskil<br />
tussen die ouderdom van kykers en besoekers aan die webtuiste vir die Nuwe<br />
Sterre-vertoning.''<br />
Waar pas hipoteses in by die navorsingsproses? __________________<br />
Ons as bedryfsielkundiges kan egter nie sommer net op gesigswaarde seà dat die<br />
besoekers aan die webtuiste jonger is as die TV-kykers nie en daarom moet ons<br />
wetenskaplik te werk gaan. Dit gebeur deur middel van hipotesetoetsing en die<br />
formulering van 'n navorsingshipotese soos ons hierbo gedoen het. Daarna word<br />
daar deur 'n proses gewerk om die navorsingsvraag statisties (wetenskaplik) te<br />
beantwoord.<br />
Die proses wat gevolg moet word staan bekend as hipotesetoetsing. Tredoux en<br />
Durrheim (2002, p. 128) beskryf dit as 'n logiese en empiriese prosedure waardeur<br />
hipoteses formeel opgestel en dan aan empiriese toetsing onderwerp word. Die<br />
proses van hipotesetoetsing behels 'n aantal stappe.<br />
bladsy 118 . studie-eenheid 11 steekproefdistribusies en hipotesetoetsing
. afdeling 3 data-verwerking: inferensieel<br />
Die nege stappe in statistiese hipotesetoetsing ____________________<br />
Ons gaan vervolgens die nege stappe in die proses van hipotesetoetsing bespreek en sistematies daardeur<br />
werk. Die stappe is die volgende:<br />
1. formuleer die nulhipotese<br />
2. formuleer die alternatiewe hipotese<br />
3. bepaal of dit 'n een- of tweekantige toets is<br />
4. bepaal die beduidendheidsvlak<br />
5. bereken die toetsstatistiek<br />
6. bepaal die grade van vryheid<br />
7. bepaal die kritieke waarde<br />
8. verwerp of nie-verwerp die nulhipotese<br />
9. interpreteer die bevindinge<br />
Jy sal merk dat Tredoux en Durrheim (2002) soms 'n ander getal stappe in 'n<br />
ander volgorde gebruik. Jy moet egter altyd die bostaande nege stappe volg in die<br />
volgorde waarin dit in hierdie module aangebied word. Sodoende sal jy makliker<br />
met die stappe van hipotesetoetsing vertroud raak en dit beter onthou.<br />
Soos geseà , gaan ons in hierdie gedeelte deur die nege afsonderlike en baie<br />
belangrike stappe werk om wetenskaplik uitspraak te kan gee oor ons<br />
navorsingshipotese. Jy gaan met baie nuwe terme te doen kry, maar as jy dit<br />
baasraak, gaan dit vir jou tot voordeel wees, aangesien ons in studie-eenhede 12,<br />
13 en 14 telkens daarmee gaan werk.<br />
Daar is 'n vaste prosedure wat gevolg word by hipotesetoetsing en as jy vertroud<br />
is met die verskillende begrippe en die stappe, sal dit maklik wees om dit elke keer<br />
toe te pas en in hipotesetoetsing te gebruik. As jy die stappe goed verstaan en<br />
toepas, ken jy die basiese proses wat in alle navorsing gevolg word, en kan jy dit<br />
suksesvol in jou werksituasie gebruik om bedryfsielkundige ondersoeke te doen en<br />
sodoende werksprobleme op te los. Kom ons werk nou sistematies deur die nege<br />
stappe.<br />
Stap 1: Formuleer die nulhipotese<br />
Die nulhipotese is 'n ontkennende stelling wat ons maak oor die moontlike verskil<br />
tussen wat ons as bedryfsielkundiges wil toets. Ons seà dat daar nie 'n verskil is<br />
tussen wat ons ook al ondersoek nie, of dat albei die veranderlikes byvoorbeeld<br />
ewe groot, lank of swaar is.<br />
Voordat jy jou eie nulhipotese kan formuleer, moet jy eers 'n bietjie voorbereiding<br />
doen. Hersien Tredoux en Durrheim (2002) se uiteensetting van hipotesetoetsing<br />
en die nulhipotese op bladsy 128. Kyk ook na die voorbeelde van nulhipoteses<br />
boaan bladsy 129. Lees ook weer die navorsingsvraag en hipotese wat ons oor die<br />
bladsy 119
ouderdom van kykers en besoekers aan die webtuiste van Nuwe Sterre gestel het<br />
en probeer om 'n nulhipotese hiervoor te formuleer:<br />
_____________________________________________________________________<br />
_____________________________________________________________________<br />
_____________________________________________________________________<br />
_____________________________________________________________________<br />
'n Tipiese nulhipotese op bogenoemde vraag sou soos volg lui:<br />
. Daar is nie 'n verskil tussen die ouderdom van kykers en besoekers aan die<br />
webtuiste nie.<br />
Ons kan dit ook ietwat anders formuleer, byvoorbeeld:<br />
. TV-kykers en besoekers aan die webtuiste is ewe oud.<br />
Albei stellings seà dieselfde, of hoe? Het jy dit ook so geskryf deur die een of die<br />
ander stelwyse te gebruik?<br />
Ons kan 'n nulhipotese ook simbolies formuleer deur die simbool H0 vir die<br />
nulhipotese en m vir die gemiddelde van die steekproefdistribusie te gebruik.<br />
H0: mTV = mwebsite of alternatiewelik mTV 7 mwebsite =0<br />
Ons gee vir jou nog 'n volledige voorbeeld om deur te werk:<br />
'n Tipiese navorsingshipotese lui soos volg:<br />
'n Bedryfsielkundige wil bepaal of daar 'n beduidende verskil tussen die tellings vir<br />
emosionele intelligensie van aansoekers vir Nuwe Sterre en die deelnemers wat<br />
gekies is om aan Nuwe Sterre deel te neem.<br />
Hieruit kan die nulhipotese soos volg geformuleer word:<br />
. In woorde: Daar is geen verskil tussen die emosionele intelligensie van<br />
aansoekers en deelnemers nie<br />
of:<br />
. Die tellings vir emosionele intelligensie van aansoekers en<br />
deelnemers is ewe goed<br />
. In simbole: H0: mA = mD; of<br />
mA 7 mD= 0<br />
Is dit vir jou duidelik hoe om dit te doen?<br />
Stap 2: Formuleer die alternatiewe hipotese<br />
In hierdie gedeelte word die formulering van die alternatiewe hipotese bespreek.<br />
Die alternatiewe hipotese is soortgelyk aan die navorsingshipotese en<br />
teenoorgesteld aan die nulhipotese. (Onthou jy nog hoe om die nulhipotese in<br />
bladsy 120 . studie-eenheid 11 steekproefdistribusies en hipotesetoetsing
woorde en in simbole te formuleer?) Die alternatiewe hipotese is nie ontkennend<br />
soos die nulhipotese nie, maar bevestigend soos die navorsingshipotese,<br />
byvoorbeeld, daar is 'n verskil tussen wat jy ook al meet.<br />
Die alternatiewe hipotese is soortgelyk aan die navorsingshipotese en<br />
teenoorgesteld aan die nulhipotese. (Onthou jy nog hoe om die nulhipotese in<br />
woorde en in simbole te formuleer?) Die alternatiewe hipotese is nie ontkennend<br />
soos die nulhipotese nie, maar bevestigend soos die navorsingshipotese,<br />
byvoorbeeld, daar is 'n verskil tussen wat jy ook al meet.<br />
. nie-rigtinggewend ± die twee veranderlikes is nie gelyk nie (=) ± daar is 'n<br />
verskil in die ouderdom tussen TV-kykers en besoekers aan die webtuiste<br />
. rigtinggewend ± die een veranderlike is kleiner as die ander een (5) ± TVkykers<br />
is jonger as besoekers aan die webtuiste<br />
. rigtinggewend ± die een veranderlike is groter as die ander een (4) ± TV-kykers<br />
is ouer as besoekers aan die webtuiste<br />
Die formulering van die alternatiewe hipotese ten opsigte van rigting word in die<br />
oorspronklike probleemstelling geõÈ mpliseer, byvoorbeeld die navorser verwag dat<br />
TV-kykers ouer as besoekers aan die webtuiste is.<br />
Om saam te vat wat jy sopas oor die formulering van 'n alternatiewe hipotese<br />
geleer het, moet jy nou bladsy 129 tot 130 van Tredoux en Durrheim (2002)<br />
bestudeer.<br />
Ons gee 'n voorbeeld hoe om die alternatiewe hipotese te formuleer en gebruik<br />
dieselfde navorsingshipotese as vantevore.<br />
Die navorsingshipotese is:<br />
'n Navorser wil bepaal of daar 'n beduidende verskil tussen die emosionele<br />
intelligensie van aansoekers en deelnemers aan Nuwe Sterre is.<br />
Die alternatiewe hipotese kan soos volg geformuleer word:<br />
. In woorde: Daar is 'n verskil tussen die tellings vir emosionele intelligensie<br />
van aansoekers en deelnemers aan die Nuwe Sterre-kompetisie<br />
of<br />
Die emosionele intelligensietellings van aansoekers en deelnemrs<br />
is nie ewe goed nie<br />
. In simbole: H1: mA = mD; of<br />
H1: mAM 7 mD = 0<br />
Is dit vir jou duidelik hoe dit gedoen word?<br />
. afdeling 3 data-verwerking: inferensieel<br />
Stap 3: Bepaal of dit 'n een- of tweekantige toets is<br />
In stap 3 bepaal ons of ons met 'n eenkantige of 'n tweekantige toets te doen het.<br />
Dit hang gewoonlik af of ons vermoed dat die een veranderlike wat ons wil<br />
bladsy 121
ondersoek, groter of kleiner as die ander veranderlike is, byvoorbeeld dat mans<br />
langer is as dames. In so 'n geval het ons 'n eenkantige toets (rigtinggewend).<br />
Indien ons egter onseker is of dit langer of korter gaan wees, werk ons met 'n<br />
tweekantige toets (nie-rigtinggewend).<br />
Doen die volgende oefeninge:<br />
1. 'n Eenkantige toets is nie rigtinggewend nie.<br />
2. 'n Tweekantige toets is altyd nie-rigtinggewend.<br />
1. onwaar<br />
2. waar<br />
a = 0,05<br />
!<br />
a/2 = 0,025<br />
!<br />
!<br />
Waar Onwaar<br />
Hieronder volg skematiese voorstellings van een- en tweekantige toetse. Onthou<br />
dat die alfa-vlakke verwys na die proporsie of die oppervlak van die<br />
verwerpingsgebied.<br />
Eenkantige toets (rigtinggewende toets)<br />
Dit is 'n toets wat ekstreme uitkomstes in slegs een end van die verspreiding<br />
verwerp.<br />
Tweekantige toets (nie-rigtinggewende toets)<br />
a/2 = 0,025<br />
a = 0,05<br />
Dit is 'n toets wat ekstreme uitkomstes in beide kante van die verspreiding<br />
verwerp.<br />
bladsy 122 . studie-eenheid 11 steekproefdistribusies en hipotesetoetsing<br />
!
Maak seker jy weet wanneer 'n toets eenkantig of gerig is, en wanneer 'n toets<br />
tweekantig of niegerig is. Beantwoord dan die volgende vraag:<br />
Identifiseer die volgende alternatiewe hipoteses as een- of tweekantig:<br />
1. H1: m1 4 m2<br />
2. H1: mA = mB<br />
3. H1: mA 5 mB<br />
4. H1: m1 7 m2 =0<br />
5. H1: m1 7 m2 4 0<br />
6. H1: mA 7 mB =0<br />
1. eenkantig<br />
2. tweekantig<br />
3. eenkantig<br />
4. tweekantig<br />
5. eenkantig<br />
6. tweekantig<br />
Die praktiese oefening wat jy in bogaande aktiwiteit gehad het, behoort jou in<br />
staat te stel om te weet wat 'n een- en 'n tweekantige toets is en wanneer om elkeen<br />
te gebruik.<br />
Stap 4: Bepaal die beduidendheidsvlak<br />
. afdeling 3 data-verwerking: inferensieel<br />
In hierdie gedeelte verwys ons kortliks na die bepaling van die vlak van<br />
beduidendheid. Dit hou verband met stap 3 en die besluit om of 'n eenkantige of<br />
tweekantige toets te gebruik.<br />
Bestudeer bladsy 132 tot 134 van Tredoux en Durrheim (2002). Hier verduidelik<br />
die skrywers wat die vlak van beduidendheid is asook die soorte foute wat<br />
daarmee gepaardgaan.<br />
Samevattend kan geseà word dat ons gewoonlik met 'n 5%- en/of 1%-vlak van<br />
beduidendheid werk. Daar word nie van jou as student verwag om hierdie besluit te<br />
neem nie en ons sal altyd vir jou aandui watter vlak om te gebruik, naamlik 0,05 of<br />
0,01.<br />
'n Tipe I-fout beteken dat 'n nulhipotese verwerp word wanneer dit waar is. 'n<br />
Tipe II-fout beteken dat 'n nulhipotese nie verwerp word wanneer dit onwaar is<br />
nie.<br />
bladsy 123
Die onderskeidingsvermoeÈ van 'n toets verwys na die waarskynlikheid van 'n<br />
juiste verwerping van 'n onwaar nulhipotese ± jy gaan in studie-eenheid 15 meer<br />
hieroor leer.<br />
Stap 5: Bereken die toetsstatistiek<br />
Samevattend:<br />
Ons het tot dusver nog net steekproefstatistiek bereken ± statistiek wat uit 'n<br />
steekproef bereken is en hoofsaaklik gebruik is om die steekproef vir die<br />
gemiddelde (X) te beskryf. 'n Toetsstatistiek is die uitslag van 'n statistiese toets.<br />
Ons verwys na toetsstatistiek wanneer ons een of ander statistiese tegniek gebruik<br />
om data met mekaar te vergelyk. In hierdie kursus (IOP2601) gebruik ons net<br />
enkele statistieke (die t-toets, F-toets of chi-kwadraattoets), hoofsaaklik wanneer<br />
ons wil bepaal of daar beduidende verskille tussen steekproefgemiddeldes is.<br />
Toetsstatistieke waarin die gemiddelde 'n rol speel, kan in twee kategorieeÈ<br />
ingedeel word: die wat op slegs twee steekproewe (t-toets) betrekking het en die<br />
wat vir meer as twee steekproewe (F-toets) geld. In die geval van slegs twee<br />
steekproewe kan die steekproewe verwant of nieverwant (onafhanklik) wees.<br />
Laastens gaan jy kennis maak met die toetsing van frekwensies in een of meer<br />
groepe (chi-kwadraattoets).<br />
Jy sal merk dat die z-toets verduidelik word in die tutoriaal in Tredoux en<br />
Durrheim (2002) waarna ons jou verwys. Hierdie toetsstatistiek is een wat jy nie<br />
vir hierdie module hoef te ken nie. Die spesifieke tutoriaal in die handboek is tog<br />
nuttig wat betref die uiteensetting van die konsepte wat ons in hierdie studieeenheid<br />
gebruik, hoewel 'n ander statistiese toets gebruik word. Jy kan dit dus<br />
deurwerk as 'n voorbeeld.<br />
. Twee steekproewe<br />
± t-toets vir verwante steekproewe<br />
± t-toets vir nie-verwante steekproewe<br />
. Drie (of meer) steekproewe<br />
± F-toets (eenrigting-variansieontleding)<br />
. Een of meer veranderlikes met frekwensies<br />
± chi-kwadraattoets<br />
Jy hoef jou nie nou oor die spesifieke toetsstatistieke te kwel nie. In die studieeenhede<br />
wat volg, sal jy leer hoe om dit te bereken. Wat jy nou wel moet weet, is<br />
dat toetsstatistieke (soos t, F en chi-kwadraat) na die antwoorde verwys wat jy<br />
verkry wanneer jy 'n hipotese empiries (statisties) toets en jou berekening van die<br />
toetsstatistieke ooreenkom met die nege stappe van hipotesetoetsing.<br />
bladsy 124 . studie-eenheid 11 steekproefdistribusies en hipotesetoetsing
Stap 6: Bepaal die grade van vryheid<br />
Dit is ook nodig om die grade van vryheid te bepaal sodat jy jou berekenings<br />
sinvol kan interpreteer. Dit is nie vir jou nodig om die teorie aangaande die grade<br />
van vryheid te ken nie, maar jy moet dit korrek kan bereken volgens die formule<br />
wat elke soort toetsstatistiek vergesel. Ons gaan dit in die volgende studie-eenhede<br />
verduidelik en ook die toepaslike formules in elke studie-eenheid bespreek.<br />
Stap 7: Bepaal die kritieke waarde<br />
. afdeling 3 data-verwerking: inferensieel<br />
Die bepaling van die kritieke waarde is ook van belang in die interpretering van<br />
jou antwoord en gaan nou saam met die grade van vryheid wat jy in die vorige<br />
stap gedoen het. Jy het op bladsy 133 van Tredoux en Durrheim geleer wat die<br />
verwerpingsgebied behels. Die kritieke waarde begrens die verwerpingsgebied en<br />
is met ander woorde daardie waarde wat die beginpunt van die verwerpingsgebied<br />
aandui. 'n Kritieke waarde toon aan dat alle tellings bo of onder daardie punt in<br />
die 5%- of 1%-vlak van beduidendheid val.<br />
Jy kan nie die kritieke waarde bepaal sonder dat jy die volgende in berekening bring nie:<br />
. of dit 'n een- of tweekantige toets is<br />
. wat die beduidendheidsvlak is<br />
. wat die grade van vryheid is<br />
Jy hoef nie hierdie kritieke waardes te bereken nie, maar jy moet dit van die<br />
relevante tabelle kan aflees wat agter in Tredoux en Durrheim (2002) ingesluit<br />
word. Die tabel met die kritieke waardes vir die t-toets verskyn op bladsy 487, die<br />
kritieke waardes vir die F-toets op bladsy 489 tot 490 en die kritieke waardes vir<br />
die chi-kwadraattoets op bladsy 492.<br />
Moenie bekommerd wees as jy hierdie tabelle nie nou verstaan nie; jy gaan in die<br />
studie-eenhede wat volg, leer hoe om elkeen te gebruik.<br />
Stap 8: Verwerp die nulhipotese of moenie die nulhipotese verwerp nie<br />
In hierdie afdeling gaan jy leer hoe om te besluit wanneer jy die nulhipotese (soos<br />
jy hierbo geformuleer het) moet verwerp sodat jy 'n besluit oor jou<br />
probleemstelling kan maak. Gelukkig hoef jy nie lukraak daaroor te besluit nie,<br />
maar jy moet wel 'n eenvoudige besluitnemingsreeÈ l onthou:<br />
. Indien toetsstatistiek 4 kritieke waarde is, word H0 verwerp.<br />
. Indien toetsstatistiek 5 kritieke waarde is, word H0 nie verwerp nie.<br />
Met ander woorde, indien die berekende waarde van jou toetsstatistiek (die<br />
antwoord op die berekening van t, F en chi-kwadraat) binne die<br />
verwerpingsgebied val, moet die nulhipotese verwerp word.<br />
bladsy 125
Onthou dat ons altyd met absolute waardes werk. Dit wil seà dat jy die negatiewe<br />
teken in jou besluit ignoreer en selfs 'n negatiewe waarde as positief lees.<br />
'n Ander manier om te besluit of die nulhipotese verwerp of nie verwerp moet<br />
word nie, is om die normaalkromme grafies voor te stel. Jy sal hierdie metode<br />
moontlik makliker vind om te interpreteer. 'n Voorbeeld van so 'n grafiese<br />
voorstelling verskyn op bladsy 135 van Tredoux en Durrheim (2002).<br />
Stap 9: Interpreteer die bevinding<br />
Die laaste stap is die interpretasie van die verwerping of die nie-verwerping van<br />
die nulhipotese ten opsigte van die oorspronklike probleemstelling. Dit behels 'n<br />
formulering van die uitkoms van die probleemstelling in woorde om aan te dui of<br />
daar wel 'n verskil is of nie tussen die twee gemiddeldes wat jy empiries getoets<br />
het, byvoorbeeld, daar is 'n verskil in lengte tussen mans en vrouens in Suid-<br />
Afrika.<br />
Noudat ons deur die hele proses van wetenskaplike hipotesetoetsing gewerk het,<br />
en finaal ons statistiese bevindinge geõÈ nterpreteer het, het ons dit herlei na ons<br />
oorspronklike probleemstelling en die navorsingshipotese wat daaruit<br />
voortgevloei het. In die proses behoort ons die oorspronklike navorsingsvraag<br />
opgelos het.<br />
Tredoux en Durrheim (2002) bied op bladsy 136tot 137 'n uitgewerkte voorbeeld<br />
van die proses van wetenskaplike hipotesetoetsing. Bestudeer dit en let op die<br />
verskillende stappe wat gevolg word. Soos reeds genoem werk Tredoux en<br />
Durrheim (2002) nie op presies dieselfde wyse as in die nege stappe hierbo<br />
uiteengesit nie, maar jy moet vasstel in watter mate hulle die stappe wel insluit.<br />
Sorg dat jy elke stap asook die logika onderliggend daaraan verstaan.<br />
Sonder om nou na die studiegids te verwys, skryf die nege stappe in die proses van<br />
hipotesetoetsing neer. (WENK: doen dit op 'n stukkie netjiese karton en plak dit<br />
bo jou lessenaar op sodat jy voortdurend daarna kan verwys.)<br />
Nou behoort jy 'n deeglike prentjie te heà van die proses van hipotesetoetsing wat<br />
gevolg word in navorsing, beginnende by 'n probleemstelling of<br />
navorsingshipotese en al die verskillende stappe waardeur gewerk moet word<br />
om finaal te kan seà of daar 'n beduidende verskil bestaan tussen die gemiddelde<br />
tellings wat tussen twee of drie groepe verkry is. In die volgende studie-eenhede<br />
gaan jy dit prakties toepas en deur die hele proses werk.<br />
bladsy 126 . studie-eenheid 11 steekproefdistribusies en hipotesetoetsing
Skematiese voorstelling van studie-eenhede 12, 13 en 14 ____________<br />
In studie-eenheid 11 is reeds melding gemaak van sommige tipes toetsstatistieke<br />
vir hipotesetoetsing.<br />
Hier is 'n grafiese voorstelling van die verskillende tipes statistiese toetse vir<br />
metingsdata (studie-eenhede 12 en 13) sowel as vir kategoriese data (studieeenheid<br />
14).<br />
Dit dien vir jou as 'n soort geheuekaart (mind map) vir die verskillende soorte<br />
toetse in inferensieÈ le statistiek.<br />
Twee<br />
groepe/<br />
steekproewe<br />
"<br />
Metingsdata<br />
(Kwantitatief)<br />
"<br />
Drie of<br />
meer<br />
groepe/<br />
steekproewe<br />
"<br />
Een<br />
klassifikasie<br />
veranderlike:<br />
`Goodness-offit'<br />
test<br />
Kategoriese data<br />
(Frekwensie)<br />
"<br />
Chi-kwadraat<br />
Twee klassifikasie<br />
veranderlikes:<br />
Tweerigtingtabel<br />
Studie-eenheid 14<br />
Verwante Onafhanklike<br />
groepe groepe<br />
t-toets t-toets Onafhanklike Verwante<br />
Studie- Studie- groepe groepe<br />
eenheid 12 eenheid 12 F-Toets F-Toets<br />
ANOVA Herhaalde-metings<br />
ANOVA<br />
Een Twee of meer<br />
onafhanklikke onafhanklike<br />
veranderlike veranderlikes<br />
Eenrigting Faktoriale<br />
ANOVA ANOVA<br />
. afdeling 3 data-verwerking: inferensieel<br />
Studie- Nie deel van hiereenheid<br />
13 die kursus nie<br />
Nie deel van<br />
hierdie kursus nie<br />
bladsy 127
12<br />
studie-eenheid twaalf<br />
Hipotesetoetse vir<br />
gemiddeldes: t-toetse<br />
Ons het reeds hipotesetoetsing in studie-eenheid 11 bespreek en in hierdie<br />
studie-eenheid gaan ons 'n hipotese empiries toets sodat ons<br />
wetenskaplik kan seà of daar 'n beduidende verskil tussen die<br />
gemiddeldes van twee stelle tellings bestaan. Dit is iets waarmee ons dikwels in<br />
die werksituasie gekonfronteer word ± om die verskil tussen twee stelle data te<br />
bepaal. Onthou jy nog die voorbeeld van studie-eenheid 11 oor die emosionele<br />
intelligensie van aansoekers en deelnmers aan Nuwe Sterre.<br />
Verskillende tipes toetsstatistiek kan met behulp van hipoteses getoets word,<br />
afhangend van die tipe data waarmee ons werk. In hierdie studie-eenheid<br />
behandel ons die verskillende t-toetse: die t-toets vir onafhanklike groepe en die ttoets<br />
vir twee verwante groepe. Hierdie toetse word in tutoriaal 9 in Tredoux en<br />
Durrheim (2002) bespreek.<br />
Bestudeer die konsepte en enkele aannames waaraan die data moet voldoen op<br />
wat op bladsy 142 tot 147 van Tredoux en Durrheim (2002) bespreek word. Jy<br />
behoort dan ook die beginsels van hipotesetoetsing te verstaan.<br />
Hipotesetoetse vir gemiddeldes: twee onafhanklike steekproewe ________<br />
Ons bespreek nou hipotesetoetsing vir twee onafhanklike steekproewe en gaan<br />
dieselfde stappe volg as wat ons in studie-eenheid 11 voorgehou het. Ons gaan ook<br />
aandag gee aan die aanpassings wat nodig is wanneer verskille in homogeniteit<br />
van variansie voorkom en wanneer die grootte van steekproewe verskil.<br />
Wat is die doel met hipotesetoetsing vir twee onafhanklike steekproewe? _<br />
Die doel van hipotesetoetsing vir twee onafhanklike gemiddeldes is om jou te help<br />
besluit of die waargenome verskil tussen twee steekproefgemiddeldes toevallig<br />
ontstaan het en of dit 'n ware verskil tussen populasies verteenwoordig. In die taal<br />
van hipotesetoetsing is die doel van die t-toets om ons te help besluit of die<br />
nulhipotese van geen verskil tussen die gemiddeldes van die twee populasies,<br />
verwerp moet word of nie verwerp moet word nie.<br />
bladsy 128 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse
Wat beteken twee onafhanklike steekproewe? _____________________<br />
Ons praat van twee onafhanklike steekproewe as daar geen verband tussen die<br />
groepe bestaan nie, of as daar geen verband tussen individuele pare deelnemers<br />
oor die twee steekproewe is nie, dit wil seà , as die deelnemers in slegs een van die<br />
twee groepe van 'n eksperiment dien.<br />
Volg die redenasie oor steekproefdistribusies van die verskille tussen gemiddeldes.<br />
(Weet jy nog wat 'n steekproefdistribusie is? Indien nie, lees eers weer die relevante<br />
gedeeltes in studie-eenheid 11 ± jy sal uit die inleiding agterkom dat ons hier met<br />
die steekproefdistribusie van die verskil tussen gemiddeldes te make het.)<br />
1. Voltooi ook die onderstaande:<br />
Die steekproefdistribusie van die verskil tussen gemiddeldes is:<br />
_________________________________________________________________<br />
_________________________________________________________________<br />
_________________________________________________________________<br />
_________________________________________________________________<br />
2. Omdat ons steekproeftrekking onafhanklik vir elke<br />
populasie is, sal die steekproefgemiddeldes ook<br />
onafhanklik wees.<br />
3. Die gemiddelde van die steekproefdistribusie sal<br />
m1 7 m2 wees.<br />
4. Manlike en vroulike aansoekers vir NUWE<br />
STERRE sal twee onafhanklike groepe<br />
onderskeidelik verteenwoordig.<br />
. afdeling 3 data-verwerking: inferensieel<br />
Waar Onwaar<br />
1. Die verspreiding van die verskille tussen gemiddeldes van herhaalde<br />
steekproefneming uit dieselfde populasie(s).<br />
2. Waar<br />
3. Waar<br />
4. Waar<br />
Hoe bereken ons die t-toets vir onafhanklike steekproewe? ___________<br />
Noudat jy weet wat onafhanklike groepe is en waarom ons 'n t-toets vir<br />
onafhanklike steekproewe gebruik, is die volgende stap om empiries te bepaal of<br />
daar 'n beduidende verskil tussen die gemiddeldes van die twee onafhanklike<br />
steekproewe is. Dit behels 'n redelik eenvoudige berekening as jy die formule gebruik<br />
bladsy 129
wat Tredoux en Durrheim (2002) as vergelyking 9.4 op bladsy 150 voorsien. Jy kan<br />
dalk eerder net die formule gebruik wat in die lys van formules agterin hierdie gids<br />
voorsien word. Jy hoef nie die agtergrond te ken nie, maar moet die formule leer.<br />
Bestudeer die voorbeeld wat volg en sorg dat jy weet hoe die toetsstatistiek (in<br />
hierdie geval die t-toets vir onafhanklike groepe) bereken word. Die t-toets word<br />
uitgevoer volgens die nege stappe wat in studie-eenheid 11 uiteengesit is. Het jy<br />
onthou om die stappe op 'n stukkie karton neer te skryf en bo jou lessenaar te<br />
plak? Indien nie, kan jy dit nou doen voordat jy met die voorbeeld aangaan. Jy<br />
moet goed vertroud wees met die logiese opeenvolging van die stappe en jy moet<br />
hierdie stappe in die eksamen kan volg sodat jy die relevante toetsstatistiek kan<br />
gebruik om die probleemstelling statisties op te los. Hierdie nege stappe kan op<br />
dieselfde wyse vir ander toetsstatistiek (soos die t-toets vir verwante groepe en die<br />
F-toets) gebruik word ± dit is nog 'n goeie rede waarom jy die verskillende stappe<br />
nou onder die knie moet kry.<br />
'n Navorser wil graag bepaal of daar 'n beduidende verskil is tussen die algehele<br />
vermaaklikheidstellings wat manlike en vroulike kykers aan Nuwe Sterre toegeken<br />
het. Sy verkry die tellings van 20 ewekansig geselekteerde kykers en besluit om<br />
beduidendheid op die 5%- en die 1%-vlak te toets.<br />
Data<br />
Manlike kykers Vroulike kykers<br />
X X 2<br />
Y Y 2<br />
4 16 2 4<br />
3 9 1 1<br />
2 4 5 25<br />
5 25 3 9<br />
1 1 3 9<br />
6 36 4 16<br />
2 4 4 16<br />
1 1 1 1<br />
7 49 5 25<br />
6 36 5 25<br />
X = 37 Y = 33<br />
X 2 = 181 Y 2 = 131<br />
X 3,7 3,3<br />
s 2 4,88 2,47<br />
N 10 10<br />
bladsy 130 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse
Stap 1: Formuleer die nulhipotese<br />
In woorde<br />
Daar is geen verskil tussen die vermaaklikheidstellings van manlike en vroulike<br />
kykers van Nuwe Sterre nie.<br />
of<br />
Mans en vroue vind Nuwe Sterre ewe vermaaklik.<br />
In simbole<br />
H0 : mm 7 mv =0<br />
of<br />
H0 : mm = mv Stap 2: Formuleer die alternatiewe hipotese<br />
In woorde<br />
Daar is 'n verskil tussen manlike en vroulike kykers se vermaaklikheidstellings vir<br />
Nuwe Sterre.<br />
of<br />
Mans en vroue vind nie Nuwe Sterre ewe vermaaklik nie.<br />
In simbole<br />
H1 : mm 7 mv = 0<br />
of<br />
H1 : mm = mv<br />
Stap 3: Bepaal of die toets een- of tweekantig is<br />
In hierdie voorbeeld (soos die waarmee jy te doen sal kry) word die besluit op 'n<br />
eenkantige of 'n tweekantige toets aan jou oorgelaat. Jy moet dus die<br />
probleemstelling bestudeer en kyk of dit rigtinggewend of nie-rigtinggewend is.<br />
In geval van die voorbeeld wat ons deurwerk, word daar slegs ondersoek of daar<br />
'n verskil is tussen die gemiddeldes van die twee groepe en nie of die een groep<br />
beter of swakker as die ander groep presteer nie. Gevolglik werk ons dus met 'n<br />
nierigtinggewende hipotese en sal ons die tweekantige toets gebruik.<br />
Stap 4: Bepaal die vlak van beduidendheid<br />
. afdeling 3 data-verwerking: inferensieel<br />
Gelukkig hoef jy nie hieroor 'n besluit te neem nie, aangesien ons altyd sal<br />
spesifiseer by watter vlak van beduidendheid jy die hipotese moet toets. In hierdie<br />
geval spesifiseer ons twee vlakke, naamlik 0,05 en 0,01.<br />
bladsy 131
Stap 5: Bereken die toetsstatistiek<br />
As gevolg van ons probleemstelling (let op die feit dat die twee groepe onafhanklik<br />
is) maak ons gebruik van die t-toets vir nie-verwante groepe en word die volgende<br />
formule gebruik:<br />
X2<br />
t ˆ X1<br />
S2 1<br />
N1 ‡ S2 q<br />
2<br />
N2<br />
3; 7 3; 3<br />
ˆ q<br />
4;88<br />
10<br />
‡ 2;46<br />
10<br />
0; 4<br />
ˆ p<br />
0; 488 ‡ 0; 246<br />
0; 4<br />
ˆ p<br />
0; 734<br />
0; 4<br />
ˆ<br />
0; 857<br />
ˆ 0; 47<br />
Stap 6: Bepaal die grade van vryheid<br />
df = N1 + N2 7 2<br />
=10+107 2<br />
=18<br />
Stap 7: Bepaal die kritieke waarde<br />
Gebruik tabel A1.2 op bladsy 487 van Tredoux en Durrheim (2002) om die<br />
kritieke waardes af te lees.<br />
t0,05 (18) = 2,101<br />
t0,01 (18) = 2,878<br />
Stap 8: Besluit of die nulhipotese verwerp moet word of nie verwerp moet word nie<br />
Uit die berekenings wat ons gedoen het asook die tabelle het ons bepaal dat:<br />
. die waarde van die toetsstatistiek 0,47 is; en<br />
. die kritieke waarde op die 0,05-vlak 2,101 en op die 0,01-vlak 2,878 is.<br />
Gebruik die volgende besluitnemingsreeÈ ls:<br />
. verwerp H0 as die toetsstatistiek > die kritieke waarde is<br />
. moenie H0 verwerp as die toetsstatistiek 5 die kritieke waarde is nie<br />
Vir a = 0,05 Vir a = 0,01<br />
0,47 5 2,101 0,47 5 2,878<br />
; H0 word nie verwerp nie ;H0 word nie verwerp nie<br />
(Onthou: Dit is onwetenskaplik en verkeerd om te seà dat ons die nulhipotese<br />
aanvaar.)<br />
bladsy 132 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse
. afdeling 3 data-verwerking: inferensieel<br />
Stap 9: Interpreteer die bevindings<br />
Die navorser kan met 99% sekerheid tot die gevolgtrekking kom dat daar geen<br />
verskil is tussen manlike en vroulike kykers ten opsigte van hul vermaaklikheidstellings<br />
wat hul toeken aan die Nuwe Sterre-program nie.<br />
Hierdie is die eenvoudigste vorm van die t-toets vir onafhanklike groepe.<br />
Waarom voeg ons variansies saam? ___________________________<br />
Wanneer ons met steekproewe te doen kry wat nie ewe groot is nie, is dit nodig om<br />
die variansies van die twee steekproewe saam te voeg (pool). Tredoux en<br />
Durrheim (2002) verduidelik hierdie hierdie proses op bladsy 150. Sorg dat jy die<br />
formule vir saamgevoegde variansies kan gebruik deur vergelyking 9.5 en 9.6in<br />
Tredoux en Durrheim (2002) sorgvuldig te bestudeer.<br />
Om deeglik vertroud te raak met die gebruik van die t-toets en die verskillende<br />
fasette daaraan verbonde, sal dit tot jou voordeel wees om 'n oefening op jou eie<br />
te doen. Doen oefening 1 op bladsy 158 van Tredoux en Durrheim (2002). Volg<br />
die stappe vir hipotesetoetsing wat jy teen hierdie tyd al goed ken.<br />
. Volg veral al die stappe in die proses soos die formulering van die nul- en<br />
alternatiewe hipoteses en die besluit op 'n een-/tweekantige toets.<br />
. Werk dan met jou sakrekenaar deur die stappe in die berekening van die<br />
toetsstatistiek en bepaal ook die grade van vryheid.<br />
. Soek die kritieke waardes in die tabel op en pas die beslissingsreeÈ ls toe.<br />
. Skryf ook jou interpretasie oor die verwerping/nie-verwerping van die<br />
nulhipoteses neer.<br />
Jy het nou al weer 'n paar nuwe vaardighede geleer en in hierdie stadium behoort jy die volgende te kan<br />
doen:<br />
. te weet wanneer om 'n onafhanklike t-toets te gebruik<br />
. 'n hipotese te toets deur die t-toets vir onafhanklike groepe te gebruik en 'n<br />
toetsstatistiek te bereken. Jy moet dit ook kan doen in gevalle wanneer die<br />
steekproefgrootte nie dieselfde is nie, en wanneer die variansie van die een<br />
steekproef vier keer groter as die van die ander is<br />
. 'n finale gevolgtrekking ten opsigte van jou navorsingshipoteses te kan maak<br />
Lees die voorbeeld hieronder en sorg dat jy die t-waarde op die drukstuk kan<br />
identifiseer en interpreteer.<br />
bladsy 133
Oefening 2<br />
Datastel 8<br />
Vir die t-toets vir onafhanklike steekproewe moet die tellings vir albei groepe<br />
in 'n enkele veranderlike ingeskryf word. Dan moet 'n skynveranderlike<br />
ingeskryf word om elke groep mee te identifiseer. Ek het die afhanklike<br />
veranderlike ``laugh'' genoem en die onafhanklike veranderlike ``parent''.<br />
Die nommer 1 is aan twee-ouergesinne toegeken en die nommer 2 aan<br />
eenouergesinne.<br />
t-Toets vir onafhanklike groepe<br />
Roep die kieslys ``Analyse'' op. Kies die opsie ``Compare means'' en dan<br />
weer die opsie ``Independent Samples T-Test''. Kies in die dialoogblokkie die<br />
toetsveranderlike (DV) en die groeperingsveranderlike (IV). Definieer die<br />
groepveranderlike deur die laagste en hoogste waarde vir die skynveranderlike<br />
aan te dui ± in ons geval is die laagste waarde 1 (2-ouergesinne) en 2 (1ouergesinne).<br />
Die rekenaaruitvoer verskyn hieronder:<br />
Soos jy teen hierdie tyd weet, speel gelyke variansies 'n rol in 'n t-toets. In bostaande drukstuk, is die<br />
eerste toets (Levene se toets) om vir die aanname van gelyke variansies te toets. Indien dit betekenisvol<br />
(minder as 0,05 of 0,01) is, lees ons die tweede ry data. Indien dit nie die geval is nie, lees ons die eerste<br />
ry. In die kolom met die opskrif sig (tweekantig) kyk ons weer of die waarde minder as 0,05 of 0,01 is.<br />
Indien dit minder as 0,05 is, is die t-toets betekenisvol, wat 'n statisties beduidende verskil aandui.<br />
bladsy 134 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse
Nieparametriese ekwivalent van die t-toets vir onafhanklike steekproewe<br />
Die vreemde term ``nieparametries'' in hierdie opskrif het jou sekerlik opgeval. Jy<br />
sal leer wat 'n nieparametriese toets is en hoe dit van 'n parametriese statistiese<br />
toets verskil wanneer jy die inleiding tot tutoriaal 20 in Tredoux en Durrheim<br />
(2002) bestudeer.<br />
In hierdie afdeling ondersoek ons teoreties die nieparametriese ekwivalent van die<br />
t-toets vir twee onafhanklike steekproewe, naamlik die Mann-Whitney-toets. As<br />
bedryfsielkundige moet jy weet wat om te doen as jou data nie normaal versprei is<br />
nie. Dit word in hierdie gedeelte verduidelik.<br />
In hierdie gedeelte is daar nie veel om baas te raak nie. Bestudeer die eerste<br />
paragraaf op bladsy 391 van Tredoux en Durrheim (2002).<br />
Noudat jy hierdie gedeelte deurgewerk het, behoort jy die nieparametriese<br />
ekwivalent van die t-toets vir twee onafhanklike steekproewe te kan noem. Jy hoef<br />
dit nie te kan beskryf of die formule daarvoor te ken nie.<br />
Hiermee volstaan ons met ons bespreking van t-toetse vir twee onafhanklike<br />
steekproewe. Ons gaan ons nou by hipotesetoetse vir twee verwante steekproewe<br />
bepaal.<br />
Wat is verwante steekproewe? _______________________________<br />
Wat beteken verwante steekproewe? Is dit dieselfde as onafhanklike steekproewe?<br />
Wanneer verwys ons na verwante steekproewe en wanneer na onafhanklike<br />
steekproewe? Hierdie onderskeid sal vir jou duidelik wees wanneer jy hierdie<br />
studie-eenheid voltooi het. Daarna gaan ons na die ander tipes toetsstatistiek kyk.<br />
1. Onthou jy nog wanneer ons steekproewe as onafhanklik klassifiseer? Die<br />
presiese teenoorgestelde geld nou vir verwante steekproewe.<br />
Stel eers 'n lys op van die eienskappe van onafhanklike steekproewe. Voltooi dan<br />
die tabel vir verwante steekproewe. (Lees die inleiding op bladsy 155 van Tredoux<br />
en Durrheim (2002) om jou met hierdie aktiwiteit te help.)<br />
1.<br />
. afdeling 3 data-verwerking: inferensieel<br />
Onafhanklike steekproewe Verwante steekproewe<br />
bladsy 135
. Sorg dat jy verstaan wat die begrip verwante steekproewe beteken.<br />
. Gebruik die kennis wat jy opgedoen het om die volgende oefeninge te<br />
doen:<br />
2 Ons werk hier met twee stelle data van dieselfde<br />
deelnemers (dws persone wat deel vorm van die<br />
steekproef).<br />
3 Ons verwag dat die twee stelle syfers (veranderlikes)<br />
gaan korreleer.<br />
4 Ons neem korrelasie in ag by die berekening van die<br />
t-statistiek.<br />
5 Die enigste manier waarop ons verwante<br />
steekproewe kry, is wanneer een subjek twee<br />
tellings bydra.<br />
Waar Onwaar<br />
1. Onafhanklike steekproewe is steekproewe wat ingesluit word by slegs een van<br />
die twee steekproewe in 'n eksperiment en verwante steekproewe is<br />
steekproewe wat afhanklik is.<br />
2 Waar<br />
3. Waar<br />
4. Onwaar<br />
5. Onwaar<br />
Kom ons verduidelik meer volledig wat met verwante steekproewe bedoel word,<br />
aangesien jy sal moet weet wanneer 'n probleemstelling of 'n navorsingshipotese<br />
met verwante of onafhanklike steekproewe te doen het.<br />
Daar word geseà dat twee groepe mense of deelnemers volgens 'n veranderlike<br />
afgepaar word indien daar vir elke lid wat aan een groep toegewys word, 'n ander<br />
lid aan die ander groep toegewys word wat ten opsigte van daardie veranderlike<br />
met die persoon in die eerste groep ooreenstem. Subjekpare word sodoende<br />
geselekteer sodat die lede van elke paar so eenders moontlik ten opsigte van die<br />
relevante veranderlike of veranderlikes is. Veranderlikes soos intelligensie,<br />
ouderdom, lengte, oogkleur, geslag, ensovoorts, kan gebruik word om persone<br />
of deelnemers af te paar. In Engels gebruik ons die woord ``matched''.<br />
Om saam te vat: die enigste manier waarop verwante steekproeftellings verkry word is:<br />
. deur dit af te paar (``match''); en<br />
. deurdat een subjek twee tellings bydra.<br />
bladsy 136 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse
Hoe bereken ons die toetsstatistiek vir verwante steekproewe? _________<br />
Noudat jy weet wat 'n verwante groep is, is die volgende stap om empiries te<br />
bepaal of daar 'n beduidende verskil tussen die gemiddeldes van die twee verwante<br />
steekproewe is. Dit behels 'n redelike eenvoudige berekening met behulp van 'n<br />
spesifieke formule. Voordat jy egter die formule kan gebruik en toepas, moet jy<br />
eers met die berekening van verskiltellings vertroud wees. Dit vereis dat jy moet<br />
weet hoe om die gemiddelde (D) en die standaardafwyking van die verskiltellings<br />
(sD) te bereken.<br />
Hierdie is nie nuwe formules nie, maar is dieselfde formules wat jy gebruik het vir<br />
die berekening van die gemiddelde in studie-eenheid 5 en vir die<br />
standaardafwyking in studie-eenheid 6.<br />
'n Praktiese voorbeeld bied altyd 'n nuttige leerervaring. Dit sal daarom sinvol<br />
wees om eers die gedeelte ``Creating the variable D'' op bladsy 152 van Tredoux<br />
en Durrheim te lees vir 'n voorbeeld van hoe om die t-toets te bereken. As jy<br />
onseker is oor hoe om al die verskillende stappe van die formule te bereken,<br />
hersien die formule vir X en s in studie-eenheid 5 en 6onderskeidelik. Tredoux en<br />
Durrheim (2002) gee die berekende waarde van D in tabel 9.2 op bladsy 153.<br />
Voltooi die volgende:<br />
. afdeling 3 data-verwerking: inferensieel<br />
1. 'n Verskiltelling is<br />
_________________________________________________________________<br />
_________________________________________________________________<br />
_________________________________________________________________<br />
_________________________________________________________________<br />
2. Kontroleer die berekening van die verskiltelling in die voorbeeld. Is dit vir jou<br />
duidelik wanneer die tellings 'n positiewe of negatiewe waarde kry?<br />
_________________________________________________________________<br />
_________________________________________________________________<br />
_________________________________________________________________<br />
_________________________________________________________________<br />
3. Kontroleer die berekening van die t-toets in die voorbeeld. Kry jy dieselfde<br />
antwoord?<br />
_________________________________________________________________<br />
_________________________________________________________________<br />
_________________________________________________________________<br />
_________________________________________________________________<br />
4. Skryf die formule vir die grade van vryheid hier neer.<br />
_________________________________________________________________<br />
bladsy 137
_________________________________________________________________<br />
_________________________________________________________________<br />
_________________________________________________________________<br />
Die antwoorde verskyn op bladsy 153 van Tredoux en Durrheim (2002). Noudat<br />
jy die volledige voorbeeld met al die stappe noukeurig deurgelees het, is dit amper<br />
tyd om jou begrip daarvan te toets.<br />
Voordat jy 'n oefening op jou eie doen, moet jy eers die volledige voorbeeld<br />
hieronder deurwerk sodat jy kan sien hoe ons verwag dat jy die verskillende<br />
stappe moet uitvoer.<br />
Hier volg 'n volledig uitgewerkte voorbeeld van hoe om die t-toets vir verwante<br />
groepe te doen. Werk deur die voorbeeld en kontroleer al die berekenings. Sorg<br />
dat jy al die stappe in die proses verstaan.<br />
Voorbeeld van 'n t-toets vir verwante groepe<br />
Die navorsingspan wil graag bepaal of daar 'n verskil is tussen die<br />
gelukkigheidsvlakke van deelnemers voor en na die leerlingskapprogram. Hulle<br />
besluit om die hipotese op beide die 0,05- en 0,01-vlak van beduidendheid te toets.<br />
Die span gaan soos volg te werk:<br />
Data<br />
Voor Na<br />
4 5<br />
3 8<br />
7 6<br />
6 6<br />
5 6<br />
4 4<br />
5 7<br />
4 7<br />
3 6<br />
2 4<br />
bladsy 138 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse
Stap 1: Formuleer die nulhipotese<br />
In woorde<br />
Daar is geen verskil tussen die gelukkigheidsvlakke van deelnemers voor en na die<br />
leerlingskapprogram nie<br />
of<br />
Deelnemers is ewe gelukkig voor en na die leerlingskapprogram<br />
In simbole<br />
H0 : mV 7 mN =0<br />
of<br />
H 0 : m V = m N<br />
Stap 2: Formuleer die alternatiewe hipotese<br />
In woorde<br />
Daar is 'n verskil tussen die gelukkigheidsvlakke van deelnemers voor en na die<br />
leerlingskapprogram.<br />
of<br />
Deelnemers is nie ewe gelukkig voor en na die program nie<br />
In simbole<br />
H1 : mV 7 mN = 0<br />
of<br />
H1 : mV = mN<br />
Stap 3: Bepaal of die toets een- of tweekantig is<br />
Ons werk met 'n nie-rigtinggewende hipotese en sal die tweekantige toets gebruik.<br />
Stap 4: Bepaal die vlak van beduidendheid<br />
Ons het twee vlakke gespesifiseer, naamlik 0,05 en 0,01.<br />
Stap 5: Bereken die toetsstatistiek<br />
Ons gebruik die t-toets vir verwante groepe en die volgende formule:<br />
D 0<br />
t ˆ<br />
SD p<br />
N<br />
. afdeling 3 data-verwerking: inferensieel<br />
Om die formule te kan gebruik, is dit eers nodig om die verskiltellings te bereken. Dit<br />
word gedoen deur die tabel te voltooi en daarna sekere berekenings te doen om die<br />
gemiddelde en die standaardafwyking te verkry. Ons doen dit soos volg:<br />
bladsy 139
Voor Na D D 2<br />
D = D<br />
N<br />
4 5 ±1 1<br />
3 8 ±5 25<br />
7 6 1 1<br />
6 6 0 0<br />
5 6±1 1<br />
4 4 0 0<br />
5 7 ±2 4<br />
4 7 ±3 9<br />
3 6±3 9<br />
2 4 ±2 4<br />
SD = 716 SD 2 = 54<br />
= 16<br />
10<br />
= 71,6<br />
Om die formule vir die t-toetsberekening te kan gebruik, is dit nodig om eers die<br />
variansie van die data te bereken. As jy terugblaai na studie-eenheid 6, sal jy sien<br />
dat jy dit reeds gedoen het en die volgende formule vir die X-waardes gebruik het:<br />
s 2<br />
X ˆ X2 … X2 †<br />
N<br />
N 1<br />
In geval van die t-toets vir verwante groepe, het ons twee stelle tellings. Die logiese<br />
manier is om die verskil tussen die twee stelle tellings te bereken en dan die<br />
variansie van die verskiltellings te verkry.<br />
Die data in die D-kolom (D vir ``Difference scores'') is 'n stel X-veranderlikes, dus<br />
vervang jy net die X in die formule hierbo deur 'n D soos volg:<br />
s 2<br />
D = D2 … D2 †<br />
N<br />
= 54<br />
= 54 25;6<br />
= 28;4<br />
9<br />
N 1<br />
… 16† 2<br />
10<br />
9<br />
9<br />
= 3,16<br />
bladsy 140 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse
sD = s2 p<br />
D<br />
p<br />
= 3; 16<br />
= 1,78<br />
Die standaardafwyking is dus 1,78.<br />
t =<br />
= 1;6 0<br />
D 0<br />
S<br />
pD<br />
N<br />
= 1;6<br />
1;78<br />
3;16<br />
= 1;6<br />
0;56<br />
1;78<br />
p<br />
10<br />
= 2; 86<br />
Stap 6: Bepaal die grade van vryheid<br />
Gebruik die volgende formule:<br />
df = N ± 1<br />
=10±1<br />
=9<br />
Stap 7: Bepaal die kritieke waarde<br />
Gebruik tabel A1.2 op bladsy 487 van Tredoux en Durrheim (2002) om die<br />
kritieke waardes af te lees.<br />
t0,05 (9) = + 2,262<br />
t0,01 (9) = + 3,250<br />
Stap 8: Besluit of die nulhipotese verwerp/nie verwerp moet word nie<br />
t = 72,86; ;|t| = 2,86(Onthou ons werk met absolute waardes en<br />
ignoreer dus die minusteken.)<br />
Vir a = 0,05<br />
2,86 4 2,262<br />
; Ons verwerp dus die nulhipotese.<br />
Vir a = 0,01<br />
2,86 5 3,250<br />
; Ons kan dus nie die nulhipotese verwerp nie.<br />
. afdeling 3 data-verwerking: inferensieel<br />
bladsy 141
Stap 9: Interpreteer die bevindings<br />
Die span kan met 95% sekerheid seà dat daar 'n verskil is in die<br />
gelukkigheidsvlakke van deelnemers voor en na die leerlingskappprogram, maar<br />
kan dit nie met 99% sekerheid seà nie.<br />
Is dit vir jou duidelik hoe ons in die verskillende stappe te werk gegaan het? Indien<br />
nie, moet jy die voorbeeld hersien. Indien jy tevrede voel dat jy 'n goeie idee het<br />
wat al die stappe behels, kan jy die volgende aktiwiteit hieronder doen.<br />
Doen self die uitgewerkte voorbeeld 3 op bladsy 154 van Tredoux en Durrheim<br />
(2002) sonder om na die verskillende stappe en oplossings te kyk. Vergelyk jou<br />
antwoord met die skrywers s'n om te kyk of dit ooreenstem.<br />
'n Volgende stap in die proses van hipotesetoetsing is die bepaling van die getal<br />
grade van vryheid en die aflees van die kritieke waarde daarvan in tabel A1.2. As<br />
jy dit eers reggekry het, is dit baie maklik.<br />
Gaan die besluitnemingsreeÈ ls soos verduidelik in stap 8 in hierdie studie-eenheid<br />
na en volg die redenasie oor die verwerping of nieverwerping van die nulhipotese.<br />
As jy daarmee klaar is, doen dan die volgende oefeninge:<br />
1. Toets jou vaardigheid om die volgende kritieke waardes in die toepaslike<br />
tabel op te soek:<br />
1.1 eenkantige toets, 29df, 1%-betekenispeil<br />
1.2 eenkantige toets, 16df, 5%-betekenispeil<br />
1.3 tweekantige toets, 8df, 2%-betekenispeil<br />
1.4 tweekantige toets, 29df, 2%-betekenispeil<br />
1.5 tweekantige toets, 23df, 10%-betekenispeil<br />
2. Sou jy H0 in die volgende omstandighede verwerp? Waarom?<br />
2.1 t-toetsstatistiek = 2,302 en kritieke waarde = 2,508<br />
2.2 t-toetsstatistiek = 2,682 en kritieke waarde = 3,792<br />
2.3 t-toetsstatistiek = 3,248 en kritieke waarde = 2,704<br />
1.1 2,462<br />
1.2 1,746<br />
1.3 2,896<br />
1.4 2,462<br />
1.5 1,714<br />
bladsy 142 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse
2.1 nee<br />
2.2 nee<br />
2.3 ja<br />
In hierdie stadium het jy nou deeglik deur volledige voorbeelde van hipotesetoetsing met twee verwante<br />
steekproewe gewerk en behoort jy:<br />
. te kan verduidelik wat met 'n verwante steekproef bedoel word<br />
. te weet wanneer om 'n t-toets vir verwante groepe te gebruik<br />
. 'n hipotese te toets deur die t-toets vir verwante groepe te gebruik en 'n<br />
toetsstatistiek te bereken<br />
. 'n finale gevolgtrekking ten opsigte van jou navorsingshipotese te kan maak<br />
Datastel 7<br />
Bestudeer die voorbeeld wat volg en sorg dat jy die t-waarde op die drukstuk kan<br />
identifiseer en interpreteer.<br />
Sleutel die data in soos hierlangs aangedui.<br />
t-Toets vir verwante steekproewe<br />
Maak die kieslys ``Analyse'' oop. Kies die opsie ``Compare means'' en<br />
dan die opsie ``Paired samples T-test''. Die dialoogblokkie word<br />
hieronder gegee. Jy moet albei stelle waarnemings selekteer en dit in die<br />
venster vir ``Paired variables'' inskryf. Klik ``OK'' om die prosedure te<br />
laat loop.<br />
. afdeling 3 data-verwerking: inferensieel<br />
bladsy 143
Nieparametriese ekwivalent van die t-toets vir verwante steekproewe<br />
Oefening 3<br />
In hierdie gedeelte gaan ons die nieparametriese ekwivalent van die t-toets vir<br />
twee verwante groepe, naamlik Wilcoxson se tekenrangtoets vir afgepaarde pare<br />
teoreties bestudeer. As bedryfsielkundige moet jy weet wat om te doen as jou data<br />
nie normaal versprei is nie. Dit word in hierdie gedeelte verduidelik.<br />
Aangesien jy nie die nieparametriese ekwivalente in besonderhede hoef te ken nie,<br />
sal dit voldoende wees om die laaste paragraaf op bladsy 389 van Tredoux en<br />
Durrheim (2002) te bestudeer.<br />
Doen oefening 3 en 4 op bladsy 158 en 159 van Tredoux en Durrheim (2002) vir<br />
bykomende oefening.<br />
In hierdie ondersoek behels die ontwerp dat ons twee metings van elke subjek<br />
neem; met ander woorde herhaalde metings. Ons kan egter nie twee metings van<br />
elke persoon kry nie, omdat party nie tydens die tweede meting beskikbaar is nie.<br />
Ons gaan hierdie situasie te bowe kom deur middel van gevalskrapping ± ons<br />
ignoreer eenvoudig die data van 'n persoon van wie ons nie twee metings het nie.<br />
Ons aanvanklike (volledige) tabel met data lyk so:<br />
Subject 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15<br />
Time 1 13 12 1614 13 15 17 13 14 1613 1613 19 12<br />
Time 2 9 10 NA NA 10 NA 11 10 NA 17 9 8 NA 16NA<br />
As ons daardie subjekte van wie ons nie twee metings het nie, uitlaat (subjekte 3,<br />
4, 6, 9, 13 en 15), lyk ons tabel nou so:<br />
Subject 1 2 5 7 8 10 11 12 14<br />
Time 1 13 12 13 17 13 1613 1619<br />
Time 2 9 10 10 11 10 17 9 8 16<br />
Ons gaan met hierdie data werk en nie met die data in die oorspronklike tabel nie.<br />
Aangesien hierdie ontwerp herhaalde metings behels, moet ons eerstens<br />
veranderlike D skep. Doen dit deur keer 1 van keer 2 vir elke subjek af te trek<br />
(dws D = Time 2 ± Time 1). Die data vir D lyk nou so:<br />
bladsy 144 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse
Subject 1 2 5 7 8 10 11 12 14<br />
Time 1 13 12 13 17 13 1613 1619<br />
Time 2 9 10 10 11 10 17 9 8 16<br />
D ±4 ±2 ±3 ±6 ±3 1 ±4 ±8 ±3<br />
Ons sal voortaan nie meer die data van Time 1 of Time 2 gebruik nie, maar slegs<br />
die data van D.<br />
Ons begin deur die gemiddelde, die standaardafwyking en n vir D uit te werk.<br />
D ˆ 3; 5556 sD ˆ 2; 5055 ND ˆ 9<br />
Ons skatting van die standaardfout word deur middel van die volgende formule<br />
bepaal:<br />
sD<br />
p<br />
N<br />
As ons ons waardes in die vergelyking gebruik, kry ons:<br />
2; p5055<br />
9<br />
= 2; 5055<br />
3<br />
= 0; 8351<br />
Nou kan ons t bereken. Die formule is:<br />
t ˆ D<br />
… sD p †<br />
N<br />
En ons het reeds al daardie waardes, daarom bereken ons<br />
t ˆ<br />
3; 556<br />
0; 8351<br />
t ˆ 4; 257<br />
Nou moet ons bepaal of die verskil statisties beduidend is. Hiervoor benodig ons<br />
die grade van vryheid.<br />
En dit is<br />
df = N7 1<br />
df =97 1<br />
df =8<br />
Nou moet ons bepaal of dit 'n eenkantige of tweekantige toets is. Volgens die<br />
navorsingshipotese wil ons slegs bepaal of die substantia nigra kleiner geword het ±<br />
dit is dus 'n eenkantige toets. Ons alternatiewe hipotese is gevolglik:<br />
H1 : time2 < time1<br />
. afdeling 3 data-verwerking: inferensieel<br />
Ons gaan die ``standaard''-alfawaarde van 0,05 gebruik.<br />
bladsy 145
Oefening 4<br />
Nou gebruik ons hierdie inligting om 'n kritieke t-waarde in ons t-tabel op te soek.<br />
Die kritieke waarde vir df = 8, eenkantig, alfa = 0,05 is 1,860. Ons t-waarde is<br />
4,257 (ons ignoreer die minusteken vir hierdie vergelyking).<br />
Ons waarde is groter as die kritieke waarde, daarom verwerp ons die nulhipotese<br />
en aanvaar die alternatiewe hipotese. Dit blyk dat die gemiddelde deursnee van<br />
die substantia nigra in psigotiese pasieÈ nte na 'n tydperk kleiner word.<br />
Hier gebruik ons twee metings van dieselfde korfbalspan, hoewel die ontwerp nie<br />
herhaalde metings behels nie. Die rede is dat die omstandighede nie elke keer<br />
dieselfde was nie ± ons ondersoek die uitwerking van die afrigter en nie die span<br />
nie, met die gevolg dat die twee stelle data eintlik onafhanklik is.<br />
Hoewel data ontbreek (minder spelle is met die eerste afrigter gespeel as met die<br />
tweede), hoef ons ons nie daaraan te steur nie (ons hoef ons slegs daaroor te<br />
bekommer as ons besig is met 'n ontwerp vir herhaalde metings).<br />
Eerstens moet ons 'n nulhipotese formuleer. Vir 'n t-toets vir onafhanklike<br />
steekproewe is dit:<br />
H0 : coach2 ˆ coach1<br />
Die eerste stap is om die gemiddelde, n en die variansie vir elke groep te bepaal.<br />
Die variansies is:<br />
Xcoach1 ˆ 86; 25 S 2<br />
coach1 24; 214 N coach1 ˆ 8<br />
Xcoach2 ˆ 79; 9167 S 2<br />
coach2 732; 62 N coach2 ˆ 12<br />
Aangesien die steekproewe verskil is dit nodig om die variansies saam te voeg<br />
(pool).<br />
s2 p = …n1 1†s2 1 ‡…n2 1†S2 n1 ‡ n2 2<br />
2<br />
= …8 1†24; 214 ‡…12 1†732; 62<br />
8 ‡ 12 2<br />
= 169; 498 ‡ 8058; 82<br />
18<br />
= 457,13<br />
Nou kan ons hierdie waarde in ons formule vir die t-toets vir onafhanklike<br />
steekproewe gebruik. Die formule is:<br />
t = X1 X2<br />
s<br />
s 2 p<br />
N1<br />
‡ s2 p<br />
N2<br />
bladsy 146 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse
Ons het reeds al hierdie waardes, daarom skryf ons hulle in en bereken:<br />
t =<br />
t =<br />
86; 25 79; 91<br />
9; 758<br />
6; 34<br />
9; 758<br />
t = 0; 65<br />
Noudat ons oor 'n t-waarde beskik, moet ons bepaal of dit statisties beduidend is.<br />
Hiervoor benodig ons grade van vryheid.<br />
df = N1 +N2 ±2<br />
= 8 + 12 ± 2<br />
= 18<br />
Ons gaan dus 18 grade van vryheid gebruik.<br />
Is dit nou 'n eenkantige of 'n tweekantige toets? Volgens die navorsingshipotese<br />
wil ons bepaal of die span anders presteer het met die nuwe afrigter ± ons stel met<br />
ander woorde belang in o f positiewe o f negatiewe kans. Dit is dus 'n tweekantige<br />
toets. Hieruit lei ons ons alternatiewe hipotese af, naamlik:<br />
H1 :Xcoach1 6ˆ Xcoach2<br />
. afdeling 3 data-verwerking: inferensieel<br />
Ons gaan die ``standaard''-alfawaarde van 0,05 gebruik.<br />
Ons gebruik hierdie inligting nou om 'n kritieke t-waarde in ons tabel op te soek.<br />
Die kritieke waarde vir df = 18, tweekantig, alfa = 0,05 is 2,1009. Ons twaarde<br />
is 0,65.<br />
Ons waarde is minder as die kritieke waarde, daarom kan ons die nulhipotese nie<br />
verwerp nie. Die gemiddelde telling met elke afrigter was dieselfde. Dit blyk<br />
daarom dat die span dieselfde prestasie lewer onder die nuwe afrigter as onder die<br />
vorige een.<br />
Oorweeg die volgende navorsingsvraag van die Nuwe Sterre-program:<br />
``Is manlike stemmers geneig om hoeÈ r punte vir vroulike deelnemers as vir<br />
manlike deelnemers te gee?'' Dui aan watter ontledingstegniek die toepaslike<br />
een sal wees om hierdie navorsingsvraag te beantwoord en verduidelik/<br />
motiveer jou antwoord.<br />
In hierdie geval is die geslag van die stemmers bloot 'n seleksieveranderlike (wat<br />
beteken die tellings van vroulike stemmers sal nie in hierdie navorsingvraag<br />
oorweeg word nie). Vir die manlike stemmers sou 'n mens die tellings oorweeg wat<br />
hulle vir die deelnemers gegee het. Die tellings van die twee geslagsgroepe van die<br />
deelnemers sal oorweeg word om te evalueer of data 'n statisties beduidende<br />
bladsy 147
verskil in die gemiddelde tellings van die twee groepe is. Dit impliseer 'n t-toets<br />
(waarin twee groepe vergelyk word) en dit sal die t-toets vir onafhanklike groepe<br />
wees (aangesien die manlike en vroulike deelnemers nieverwant/onafhanklike<br />
groepe is).<br />
bladsy 148 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse
13<br />
studie-eenheid dertien<br />
"<br />
"<br />
Hipotesetoetse vir<br />
gemiddeldes:<br />
eenrigting-<br />
variansieontleding<br />
Jy het reeds kennis gemaak met die t-toets in studie-eenheid 12. Nou gaan jy<br />
een spesifieke soort F-toets bestudeer, naamlik eenrigtingvariansieontleding,<br />
algemeen bekend as<br />
ANOVA<br />
"<br />
Analysis of Variance<br />
Vir die doel van hierdie eenheid kombineer ons twee tutoriale uit die<br />
voorgeskrewe boek, naamlik tutoriaal 14 en 15.<br />
Wat is variansieontleding (ANOVA)? ___________________________<br />
Toe jy die opskrif van hierdie studie-eenheid gelees het, het jy waarskynlik 'n<br />
gedeelte daarvan herken: variansie (van studie-eenheid 6, waar jy geleer het hoe<br />
om dit te bereken). Nou wonder jy sekerlik: wat is variansieontleding?<br />
1. Om hierdie vraag te beantwoord, moet jy die inleiding op bladsy 252 tot 254<br />
van Tredoux en Durrheim (2002) bestudeer. Verwys ook na die skematiese<br />
voorstelling op die laaste bladsy van studie-eenheid 11 om vas te stel waar en<br />
wanneer die ANOVA gebruik kan word.<br />
Voltooi die volgende sin:<br />
ANOVA is<br />
. afdeling 3 data-verwerking: inferensieel<br />
___________________________________________________________________<br />
___________________________________________________________________<br />
bladsy 149
2. Lees bladsy 255 tot 262 van Tredoux en Durrheim (2002) om te verstaan<br />
waarom die ANOVA in plaas van t-toetse gebruik word. Skryf dan kort<br />
aantekeninge oor die rede(s) vir die gebruik van ANOVA.<br />
_________________________________________________________________<br />
_________________________________________________________________<br />
_________________________________________________________________<br />
_________________________________________________________________<br />
3. Onthou jy die drie aannames waarvan jy in die voorafgaande studie-eenheid<br />
geleer het? ANOVA berus op dieselfde beginsels wat op bladsy 281 tot 283<br />
van Tredoux en Durrheim (2002) behandel word.<br />
Noem drie aannames waarop ANOVA berus:<br />
3.1. _____________________________________________________________<br />
3.2. _____________________________________________________________<br />
3.3. _____________________________________________________________<br />
Hierdie aktiwiteit is nogal lank, maar dit sal jou help om te verstaan wat hierdie toetsstatistiek behels.<br />
1. Die antwoord is op bladsy 260 van Tredoux en Durrheim (2002).<br />
2. Die antwoord word saamgevat in die laaste paragraaf op bladsy 256van<br />
Tredoux en Durrheim (2002), net bo die opskrif ``The logic of ANOVA''.<br />
3. As jy hierdie drie aannames ken, sal jy die rasionaal vir ANOVA verstaan.<br />
Die drie aannames is:<br />
1. Die tellings is normaal versprei rondom die populasiegemiddelde.<br />
2. Homogeniteit van variansie, met ander woorde die variansies van die<br />
tellings van die populasies is dieselfde.<br />
3. Die waarnemings is onafhanklik van mekaar.<br />
Die afhanklike veranderlike by ANOVA is altyd een of ander meting Ð op 'n<br />
intervalskaal (onthou jy nog hierdie begrip van studie-eenheid 2?) vir parametriese<br />
toetse en op 'n ordinale skaal (kyk ook studie-eenheid 2) vir nieparametriese<br />
toetse. Eenrigting-ANOVA is 'n parametriese toets (met ander woorde dit is op 'n<br />
normaalverspreiding gegrond). Ons sal aan die einde van hierdie studie-eenheid<br />
vir jou 'n nieparametriese (distribusievrye) ekwivalent noem. Die navorser het nie<br />
beheer oor die afhanklike veranderlike nie. Dit is die uitkoms van die<br />
manipulering van die onafhanklike veranderlike.<br />
Die onafhanklike veranderlike is die een wat deur die navorser manipuleer word.<br />
Hy of sy besluit op die aantal vlakke daarvan en sien toe dat die deelnemers in<br />
elke groep net aan een van die vlakke onderwerp word.<br />
bladsy 150 . studie-eenheid 13 hipotesetoetse vir gemiddeldes: eenrigtingvariansieontleding
Die vlakke van die onafhanklike veranderlike kan in twee tipes verdeel word:<br />
1. Kwantitatief (intervalmeting)<br />
byvoorbeeld: Aantal ure studie per week (6, 8, 10, 12 ure)<br />
2. Kwalitatief (nominale meting)<br />
byvoorbeeld: Metode van onderrig (lesing, selfstudie, video,<br />
rekenaargesteund)<br />
Verwys na studie-eenheid 2 as jy nie meer seker is wat afhanklike en onafhanklike<br />
veranderlike beteken nie.<br />
Skep 'n aantal verskillende eksperimente, elk met sy eie onafhanklike en<br />
afhanklike veranderlike. Onthou dat die onafhanklike veranderlike uit drie of<br />
meer groepe of vlakke moet bestaan om vir 'n ANOVA-ontwerp te kwalifiseer. 'n<br />
Veranderlike soos geslag as die enigste onafhanklike veranderlike is dus foutief.<br />
Hier is slegs enkele voorbeelde. Jy kan die meeste van die onafhanklike<br />
veranderlikes (aan die linkerkant) met die meeste van die afhanklike<br />
veranderlikes (aan die regterkant) met mekaar kombineer, solank dit 'n sinvolle<br />
studie behels.<br />
Het jy ook aan hierdie of soortgelyke voorbeelde gedink? Jy het dalk unieke<br />
voorbeelde van jou eie. Vergelyk dit net met ons voorbeeld om te bepaal of jou<br />
redenering korrek was.<br />
Onafhanklike veranderlike Afhanklike veranderlike<br />
Departemente<br />
. Personeel<br />
. Produksie<br />
. Bemarking<br />
Dienstydperk<br />
. Kort: 0 tot 2 jaar<br />
. Medium: 3 tot 9 jaar<br />
. Lank: 10 jaar en langer<br />
Bestuursvlakke<br />
. President<br />
. Vise-president<br />
. Hoof- uitvoerende amptenaar<br />
. Algemene bestuurder<br />
. afdeling 3 data-verwerking: inferensieel<br />
Motivering van personeel<br />
(gemeet met 'n vraelys)<br />
Getal ongelukke op<br />
'n produksielyn<br />
Kwaliteit van werklewe<br />
meting<br />
bladsy 151
Onafhanklike veranderlike Afhanklike veranderlike<br />
Verskillende skofte<br />
. Oggend<br />
. Middag<br />
. Aand<br />
. Nag<br />
Opleidingstegnieke<br />
. Lesing<br />
. Video<br />
. Selfstudie<br />
. Rekenaargesteun<br />
. Werkwinkel<br />
Produktiwiteit<br />
(gemeet aan die aantal<br />
eenhede vervaardig)<br />
Getal foute tydens uitvoering<br />
van 'n praktiese taak<br />
Onafhanklike veranderlike Afhanklike veranderlike<br />
Onderrig<br />
Aantal ure per week waarin aktief<br />
na Nuwe Sterre gekyk is<br />
. Laerskoolleerder<br />
. HoeÈ rskoolleerder<br />
. Student op tersieà re vlak<br />
. Jong volwassene<br />
. Ouer volwassene<br />
Die logika van variansieontleding _____________________________<br />
Tredoux en Durrheim (2002) verduidelik die beginsels van ANOVA noukeurig op<br />
bladsy 256tot 262. Jy hoef geen berekenings hier te kan doen nie ± ons sal die<br />
berekenings wat jy wel moet kan doen binnekort behandel.<br />
Om die logika van ANOVA vir jou nog duideliker te maak, kom ons kyk hoe<br />
ander outeurs (Fox, Levin & Harkins, 1993; Porter & Hamm, 1986) dit<br />
verduidelik.<br />
Die totale varieerbaarheid in 'n stel tellings bestaan uit twee komponente:<br />
. Varieerbaarheid binne groepe. Dit meet die normale varieerbaarheid of<br />
ewekansige foute in die data.<br />
Dit is die fouteffek, dit wil seà , varieerbaarheid wat die gevolg is van ewekansige<br />
steekproeftrekking en kansgebeurtenisse.<br />
. Varieerbaarheid tussen groepe. Dit meet die verskil tussen groepgemiddeldes.<br />
Dit is die behandelingseffek, dit wil seà , meting van die effek van die<br />
eksperimentele behandeling van proefpersone.<br />
bladsy 152 . studie-eenheid 13 hipotesetoetse vir gemiddeldes: eenrigtingvariansieontleding
Die F-verhouding is die verhouding van die varieerbaarheid tussen groepe teenoor<br />
die varieerbaarheid binne groepe en kan so in 'n vergelyking weergegee word:<br />
F =<br />
varieerbaarheid tussen groepe<br />
varieerbaarheid binne groepe<br />
= behandelingseffek<br />
fouteffek<br />
Wanneer die behandelingseffek die fouteffek met 'n sekere kritieke waarde<br />
oorskry, is die F-toets betekenisvol en lei ons af dat daar 'n betekenisvolle verskil<br />
tussen groepgemiddeldes is en verwerp ons die nulhipotese.<br />
Praktiese voorbeeld<br />
Hier is 'n voorbeeld van 'n eksperiment (Fox, Levin & Harkins, 1993, pp 218±219)<br />
wat hierdie onderwerp grafies baie goed vir jou sal illustreer. Moenie skrik vir die<br />
vier groepe nie ± jy sal gou sien dit maak geensins die verduideliking meer<br />
kompleks as met drie groepe nie (onthou, ANOVA word gebruik wanneer jy drie<br />
of meer groepe het).<br />
Mense wat baie angstig is wanneer hulle 'n openbare toespraak maak, is ewekansig aan een van vier<br />
behandelingsgroepe toegewys vir 'n terapeutiese prosedure:<br />
1. sistematiese desensiteringsprosedure<br />
2. insigterapie<br />
3. plasebo-behandelingkontrole ± proefpersone praat oor hulle probleem<br />
4. geen behandelingkontrole ± geen intervensie vind plaas nie<br />
Na blootstelling aan 'n behandeling moet die deelnemers 'n openbare toespraak<br />
hou terwyl die mate van angs wat hulle toon, gemeet word.<br />
Die resultate van die eksperiment is soos volg:<br />
. Varieerbaarheid binne groepe<br />
Laag<br />
Sistematiese<br />
desensiteringprosedure<br />
| |<br />
X1jiKX1<br />
Insigterapie Plasebobehandelingkontrole<br />
| |<br />
. afdeling 3 data-verwerking: inferensieel<br />
| |<br />
X2jiKX2 X3jiKX3<br />
Mate van angs<br />
Geen<br />
behandelingkontrole<br />
| |<br />
X4jiKX4<br />
Let op die varieerbaarheid binne enige groepgemiddelde (X1, X2, X3, X4) en enige<br />
individuele telling (X1, X2, X3, X4) binne daardie groep.<br />
Hoog<br />
bladsy 153
. Varieerbaarheid tussen groepe<br />
Laag<br />
Sistematiese<br />
desensiteringprosedure<br />
Insigterapie Plasebobehandelingkontrole<br />
Mate van angs<br />
Geen<br />
behandelingkontrole<br />
|<br />
|<br />
|<br />
|<br />
X1<br />
3 " X2<br />
3 " X3<br />
3 " X4<br />
Let daarop dat die mate van angs as 'n funksie van die behandeling (terapeutiese<br />
tegniek) tussen groepe wissel (X1; X2; X3; X4) van lae angs in groep 1 tot hoeÈ angs<br />
in groep 4.<br />
Veronderstel jy as bedryfsielkundige in Organisasie XYZ wil die kwaliteit van<br />
werklewe van werknemers in die drie departemente, Personeel, Produksie en<br />
Bemarking ondersoek.<br />
Ontwerp jou eie eksperiment en stel die varieerbaarheid binne en tussen die groepe<br />
grafies voor.<br />
Uiteraard is geen terugvoering moontlik nie. Vergelyk jou sketse met die hierbo ±<br />
vervang die vier tipes terapeutiese tegnieke met die drie departemente in jou eie<br />
eksperiment.<br />
Berekenings vir ANOVA ____________________________________<br />
Nou is dit weer tyd om jou sakrekenaar in die hande te kry! Die berekeninge wat<br />
jy nou gaan leer is die enigste wat jy hoef te kan doen wanneer 'n datastel aan jou<br />
verskaf word.<br />
Bestudeer bladsy 262 tot 266 van Tredoux en Durrheim (2002) en sorg dat jy al die<br />
berekenings verstaan ± probeer ook om die voorbeeld op bladsy 267 op jou eie uit<br />
te werk voordat jy na die oplossing kyk.<br />
1. Onthou om altyd ANOVA-resultate in 'n opsommingstabel te rapporteer<br />
(voorbeeld hieronder) nadat jy die berekeninge gedoen het, selfs al vra ons dit<br />
nie direk so in 'n werkopdrag of die eksamen nie.<br />
2. Hou in gedagte dat SS, MS en F nooit 'n negatiewe waarde kan heà nie ± al<br />
die SS-enMS-waardes is kwadrate. Indien jy dus negatiewe waardes vir enige<br />
van hierdie statistieke tydens jou berekeninge kry, het jy beslis iewers 'n<br />
berekeningsfout gemaak! Soek die fout (in die eksamen ook)!<br />
bladsy 154 . studie-eenheid 13 hipotesetoetse vir gemiddeldes: eenrigtingvariansieontleding<br />
Hoog
3. As 'n vinnige manier om jou interim-berekeninge te kontroleer, doen die vyf<br />
berekeninge hieronder wanneer jy jou opsommingstabel voltooi het.<br />
Voorbeeld van 'n opsommingstabel<br />
Bron df SS MS F<br />
Groep 2 44,78 22,39 8,08<br />
Fout 15 41,50 2,77<br />
Totaal 17 86,28<br />
1. dfgroup + dferror = dftotal : 2 + 15 = 17<br />
2. SSgroup + SSerror = SStotal : 44,78 + 41,50 = 86,28<br />
3. SSgroup 7 dfgroup = MSgroup : 44,78/2 = 22,39<br />
4. SSerror 7 df error =MSerror : 41,50/15 = 2,77<br />
5. MSgroup 7 MSerror = F : 22,39/2,77 = 8,08<br />
Hierdie feite sal jou ook in staat stel om 'n gedeeltelike voltooide<br />
opsommingstabel te voltooi.<br />
1. Doen hierdie oefening wat ons gevind het in Fox, Levin en Harkins (1993,<br />
pp. 259±260).<br />
In a study of worker satisfaction, shift workers whose work hours had been<br />
on a phase-advance schedule (progressively earlier starting times e.g.<br />
midnight, 16:00, and 08:00) were changed to a phase-delay schedule<br />
(progres-sively later starting times). One-half of these subjects remained on<br />
a weekly rotation, while the others moved to a three-week period between<br />
changes. A control group of nonrotating workers was included for<br />
comparison. Test the null hypothesis that shifts in shifts had no effect on<br />
satisfaction.<br />
Set a = 0,01 and test the null hypothesis:<br />
H0 : one = three = control<br />
SATISFACTION LEVEL<br />
Phase-delay<br />
one-week<br />
Phase-delay<br />
three-weeks<br />
Control<br />
group<br />
13 18 7<br />
11 169<br />
14 19 11<br />
10 21 9<br />
12 13 18<br />
8 18 12<br />
(21-point scale; the higher the score, the greater the satisfaction)<br />
. afdeling 3 data-verwerking: inferensieel<br />
bladsy 155
2. Vul die waardes vir N en k in die tabel hieronder in. Soek die kritieke Fwaardes<br />
op (tabelle A1.4 en A1.5 in Tredoux en Durrheim (2002)) en<br />
antwoord ``Ja'' of ``Nee'' op die vraag ``Verwerp H0'' op grond van die<br />
berekende F-waarde in die eerste kolom.<br />
F N k dfgroup dferror Alpha Kritieke<br />
F<br />
5,45 2 18 0,05<br />
5,45 2 18 0,01<br />
4,95 3 12 0,01<br />
8,064 15 0,05<br />
6,22 5 24 0,05<br />
3. Voltooi die opsommingstabel hieronder<br />
Bron df SS MS F<br />
Groep 225<br />
Fout 18 5<br />
Totaal 23<br />
1. XA = ``Phase delay one-week''<br />
XB = ``Phase delay three-weeks''<br />
XC = ``Control group''<br />
Verwerp<br />
H0?<br />
XA XB XC Total<br />
X 11,33 17,50 11,00 13,28<br />
s 2,162,74 3,85 4,17<br />
XA XB XC X 2 A X 2 B X 2 C<br />
13 18 7 169 324 49<br />
11 169 121 25681<br />
14 19 11 196361 121<br />
10 21 9 100 441 81<br />
12 13 18 144 169 324<br />
8 18 12 64 324 144<br />
68 105 66 794 1 875 800<br />
SX = 68 + 105 + 66 = 239<br />
SX 2 = 794 + 1 875 + 800 = 3 469<br />
_________________________________________________________________<br />
bladsy 156 . studie-eenheid 13 hipotesetoetse vir gemiddeldes: eenrigting-variansieontleding
Nulhipotese H 0 : A ˆ B ˆ C<br />
Een moontlike alternatiewe hipotese H1 : mA = mB = mC<br />
Ander moontlike alternatiewe hipoteses H1 : mA 4 mB 4 mC<br />
SS total = X 2 … X† 2<br />
= 3469<br />
N<br />
…239† 2<br />
18<br />
= 3469 57 121<br />
18<br />
= 3469 3173; 39<br />
= 295; 61<br />
SS group = n …Xj<br />
X::) 2<br />
H1 : mA 5 mB 5 mC<br />
ens.<br />
= 6[(11,33 7 13,28) 2 + (17,5 7 13,28) 2 + (11,0 7 13,28) 2 ]<br />
= 6 [(71,95) 2 + (4,22) 2 +(72,28) 2 ]<br />
= 6[3,80 + 17,81 + 5,20] = 6(26,81)<br />
= 160,86<br />
SSerror = SStotal 7 SSgroup<br />
= 295,61 7 160,86<br />
= 134,75<br />
dftotal = N 7 1 dfgroup = k 7 1 dferror = k(n 7 1)<br />
= 18 7 1 = 3 7 1 = 3(6 7 1)<br />
= 17 = 2 = 15<br />
MSgroup= SSgroup/dfgroup<br />
= 160,86/2<br />
= 80,43<br />
MSerror = SSerror/dferror<br />
= 134,75/15<br />
= 8,98<br />
F = MSgroup<br />
MSerror<br />
= 80; 43<br />
8; 98<br />
= 8,96<br />
. afdeling 3 data-verwerking: inferensieel<br />
bladsy 157
2.<br />
3.<br />
Bron df SS MS F<br />
Groep 2 160,86 80,43 8,96<br />
Fout 15 134,75 8,98<br />
Totaal 17 295,61<br />
F 0, 01 (2,15) = 6,36 Vanaf tabel A1.5<br />
F calc = 8,96<br />
8,96 4 6,36<br />
; Verwerp H0<br />
Interpretasie<br />
Daar is 'n betekenisvolle verskil in werkers se tevredenheid tussen die drie<br />
groepe skofwerkers. Dit kan met 99% sekerheid beweer word.<br />
F N k dfgroup dferror Alpha Kritieke<br />
F<br />
Verwerp<br />
H0?<br />
5,45 21 3 2 18 0,05 3,55 Ja<br />
5,45 21 3 2 18 0,01 6,01 Nee<br />
4,95 164 3 12 0,01 5,95 Nee<br />
8,0620 5 4 15 0,05 3,06 Ja<br />
6,22 30 6 5 24 0,05 2,62 Ja<br />
Bron df SS MS F<br />
Groep 5 225 45 9<br />
Fout 18 90 5<br />
Totaal 23 315<br />
'n Beter begrip van ANOVA _________________________________<br />
Voordat jy jou studie van Tredoux en Durrheim (2002) hervat, wil ons graag 'n<br />
nuttige, konkrete voorstelling van ANOVA deur David Johnson (1989), 'n<br />
sielkundige wat onderrig in statistiek gee, aan jou voorhou. Sy tegniek lei studente<br />
tot 'n intuõÈ tiewe begrip van die beginsels van tussengroepevariansie (MSgroep) en<br />
binnegroepvariansie (MSfout) en die onderlinge verhouding daartussen. As jy dit<br />
noukeurig bestudeer, kan jy dit nuttig vind.<br />
bladsy 158 . studie-eenheid 13 hipotesetoetse vir gemiddeldes: eenrigting-variansieontleding
Die eksperiment<br />
Die data word verkry uit 'n hipotetiese eksperiment. Drie onafhanklike groepe<br />
bestaande uit vyf deelnemers elk word aan een van drie vlakke van 'n<br />
onafhanklike veranderlike blootgestel. Die spektrum van moontlike response op<br />
die afhanklike veranderlike is tussen 0 en 4.<br />
Die resultate<br />
Vyf moontlike uitkomste van die eksperiment word hieronder uiteengesit. Die<br />
datastel en opsommingstabel word saam met 'n verduideliking aangebied.<br />
Uitslag 1 ___________________________________________________________<br />
Data<br />
Groep 1 Groep 2 Groep 3<br />
1 1 1<br />
1 1 1<br />
1 1 1<br />
1 1 1<br />
1 1 1<br />
Opsommingstabel<br />
Bron df SS MS F<br />
Groep 2 0 0 ±<br />
Fout 12 0 0<br />
Totaal 14 0<br />
Jy besef sekerlik dat hierdie uitkoms hoogs onwaarskynlik is. Let op dat daar geen<br />
veranderlikheid in die data tussen en binne groepe is nie en dat dit aanleiding gee<br />
tot gemiddelde kwadrate van 0 in die opsommingstabel.<br />
Uitslag 2 ___________________________________________________________<br />
Data<br />
. afdeling 3 data-verwerking: inferensieel<br />
Groep 1 Groep 2 Groep 3<br />
1 1 3<br />
1 1 3<br />
1 1 3<br />
1 1 3<br />
bladsy 159
Opsommingstabel<br />
Bron df SS MS F<br />
Groep 2 13,33 6,67 ±<br />
Fout 12 0 0<br />
Totaal 14 13,33<br />
Tussengroepvariansie word ingevoer deur al vyf waardes in groep 3 na 3 te<br />
verhoog.<br />
Dit dui op die moontlike uitwerking van die onafhanklike veranderlike wat<br />
gemanipuleer word. Groep 3 is klaarblyklik anders die ander twee groepe<br />
(MSgroep = 6,67); daar is egter geen binnegroepvariansie nie (MSfout = 0).<br />
Uitslag 3 ___________________________________________________________<br />
Data<br />
Groep 1 Groep 2 Groep 3<br />
0 1 3<br />
1 1 3<br />
1 1 3<br />
1 1 3<br />
2 1 3<br />
Opsommingstabel<br />
Bron df SS MS F<br />
Groep 2 13,33 6,67 39,24<br />
Fout 12 2 0,17<br />
Totaal 14 15,33<br />
'n Derde datastel voer binnegroepvariansie by groep 1 in. Hierdie datastel bevat<br />
dieselfde mate van tussengroepvariansie as die vorige een, dit wil seà die<br />
gemiddeldes bly onveranderd. Let op hoe die invoer van nie-eenderse tellings in<br />
groep 1 die waarde van die gemiddelde kwadraat vir binnegroepvariansie verhoog<br />
(MSfout = 0,17). Let ook op die waarde van die F-statistiek (F = 39,24).<br />
bladsy 160 . studie-eenheid 13 hipotesetoetse vir gemiddeldes: eenrigting-variansieontleding
Uitslag 4 ___________________________________________________________<br />
Data<br />
Groep 1 Groep 2 Groep 3<br />
0 0 3<br />
1 1 3<br />
1 1 3<br />
1 1 3<br />
2 2 3<br />
Opsommingstabel<br />
Bron df SS MS F<br />
Groep 2 13,33 6,67 20,21<br />
Fout 12 4 0,33<br />
Totaal 14 17,33<br />
Hierdie datastel verskil van die vorige een in slegs een aspek: bykomende<br />
binnegroepvariansie is bygevoeg deur die waardes in groep 2 te verander om aan te<br />
pas by die in groep 1. Vergeleke met die vorige datastel bly die tussengroepgemiddelde<br />
kwadraat onveranderd, maar die binnegroepgemiddelde kwadraat is<br />
groter (MSfout = 0,33). As gevolg daarvan is die waarde van F kleiner (F =<br />
20,21).<br />
Uitslag 5 ___________________________________________________________<br />
Data<br />
. afdeling 3 data-verwerking: inferensieel<br />
Groep 1 Groep 2 Groep 3<br />
0 0 2<br />
1 1 3<br />
1 1 3<br />
1 1 3<br />
2 2 4<br />
bladsy 161
Opsommingstabel<br />
Bron df SS MS F<br />
Groep 2 13,33 6,67 13,34<br />
Fout 12 60,5<br />
Totaal 14 19,33<br />
Bykomende binnegroepvariansie word ingevoer deur twee waardes in groep 3 te<br />
verander. Let op die onveranderde tussengroepgemiddelde kwadraat en die<br />
verhoogde binnegroepgemiddelde kwadraat (MSfout = 0,5) in vergelyking met die<br />
voorafgaande datastel. As gevolg hiervan is die F-statistiek kleiner as voorheen<br />
(F = 13,34).<br />
Daar het jy dit! Ons is seker jy sal die begrippe betreffende ANOVA asook die<br />
wyse waarop die dinamiese verwantskap van tussengroep- en binnegroepvariansie<br />
die F-statistiek bepaal, nou baie beter verstaan.<br />
Die vervaardigers van Nuwe Sterre is geõÈ nteresseerd in die kykersgedrag van hulle<br />
gehoor. Hulle vra die navorsingspan om vas te stel of daar 'n verskil is tussen die<br />
aantal ure wat die volgende drie groepe na Nuwe Sterre kyk:<br />
. Studente op tersieà re vlak<br />
. Jong volwassenes (30)<br />
Die navorsingspan selekteer 27 kykers op ewekansige wyse, 9 uit elk van die drie<br />
bogenoemde groepe. Hulle neem die aantal ure waar wat hulle oor 'n tydperk van<br />
twee weke na Nuwe Sterre kyk.<br />
Die aantal ure is dus die afhanklike veranderlike.<br />
Die navorsingspan het jou die data hieronder gegee en jou gevra om te bepaal wie<br />
die meeste na Nuwe Sterre gekyk het.<br />
Studente Jong volwassenes Ouer volwassenes<br />
12 14 17<br />
10 10 16<br />
13 10 12<br />
12 8 10<br />
9 10 18<br />
10 10 10<br />
15 12 15<br />
8 8 11<br />
17 11 10<br />
bladsy 162 . studie-eenheid 13 hipotesetoetse vir gemiddeldes: eenrigting-variansieontleding
Die navorsingspan het alreeds die gemiddeldes en standaardafwykings, wat<br />
hieronder verskaf word uit nuuskierigheid bereken:<br />
Studente Jong<br />
volwassenes<br />
Ouer<br />
volwassenes<br />
Totaal<br />
X 11,78 10,33 13,22 11,78<br />
s 2,91 1,87 3,27 2,90<br />
Hulle het opgemerk dat ouer volwassenes waarskynlik die meeste gekyk het,<br />
omdat daardie groep se gemiddelde die hoogste is. Jy het hulle vertel dat geen<br />
gevolgtrekking slegs op grond van die gemiddeldes gemaak kan word nie en dat jy<br />
jou gevolgtrekking aan hulle sal meedeel nadat jy die volgende nulhipotese getoets<br />
het:<br />
mS = mJV = mOV<br />
Jy het besluit om a = 0,05 te gebruik.<br />
1. Doen die toepaslike statistiese toets, naamlik die F-toets en gee jou antwoord<br />
in 'n opsommingstabel.<br />
2. Maak jou gevolgtrekking.<br />
1.<br />
2.1 Wat is die kritieke waarde?<br />
2.2 Verwerp jy H0?<br />
2.3 Wat is jou antwoord aan die navorsingspan? (Onthou dat hulle nie<br />
noodwendig weet wat bedoel word met verwerping of nieverwerping van<br />
die nulhipotese nie.)<br />
XS = Studente<br />
XS = 11,78<br />
XJV = Jong<br />
volwassenes<br />
XJV = 10,33<br />
. afdeling 3 data-verwerking: inferensieel<br />
XOV = Ouer<br />
volwassenes<br />
XOV = 13,22<br />
XS XJV XOV X2 S X2 JV X2 OV<br />
12 14 17 144 196289<br />
10 10 16100 100 256<br />
13 10 12 169 100 144<br />
12 8 10 144 64 100<br />
9 10 18 81 100 324<br />
10 10 10 100 100 100<br />
15 12 15 225 144 225<br />
8 8 11 64 64 121<br />
17 11 10 289 121 100<br />
10693 119 1 316989 1 659<br />
SX = 106+ 93 + 119 = 318<br />
SX 2 = 1 316 + 989 + 1 659 = 3 964<br />
Totaal<br />
X::: = 11,78<br />
bladsy 163
SS total = X 2 … X† 2<br />
= 3964<br />
N df total = N 7 1<br />
…318† 2<br />
27<br />
= 3964 101 124<br />
27<br />
= 3964 3745; 33<br />
= 218; 67<br />
= 27 7 1<br />
= 26<br />
SSgroup = n …Xj X::† 2<br />
dfgroup = k 7 1<br />
= 9[(11,78 7 11,78) 2 + (10,33 7 11,78) 2 + = 3 7 1<br />
(13,22 7 11,78) 2 ]<br />
= 9[(0)<br />
= 2<br />
2 +(71,45) 2 + (1,44) 2 ]<br />
= 9[0 + 2,10 + 2,07] = 9(4,17)<br />
= 37,53<br />
SSerror = SStotal 7 SSgroup dferror = k(n 7 1)<br />
= 218,67 7 37,53 = 3(9 7 1)<br />
= 181,14 = 24<br />
MSgroup = SSgroup / dfgroup<br />
= 37,53/2<br />
= 18,77<br />
MSerror = SSerror / dferror<br />
= 181,14/24<br />
= 7,55<br />
F = MSgroup<br />
MSerror<br />
= 18; 77<br />
7; 55<br />
= 2,49<br />
Bron df SS MS F<br />
Groep 2 37,53 18,77 2,49<br />
Fout 24 181,14 7,55<br />
Totaal 26218,67<br />
2. Jou gevolgtrekking<br />
2.1 F0,05 (2, 24) = 3,40<br />
2.2 Nee<br />
(Omdat 2,49 5 3,40)<br />
bladsy 164 . studie-eenheid 13 hipotesetoetse vir gemiddeldes: eenrigting-variansieontleding
. afdeling 3 data-verwerking: inferensieel<br />
2.3 Daar is geen betekenisvolle verskil tussen die kykersure van die drie<br />
groepe nie. Ek kan dit met 95% sekerheid seà .<br />
Geeneen van die groepe het dus meer na Nuwe Sterre gekyk nie. Dit blyk of die<br />
program gewild is onder 'n wyer gehoor en nie net 'n sekere ouderdomsgroep nie.<br />
'n Nieparametriese ekwivalent van ANOVA _______________________<br />
Die Kruskal-Wallis eenrigting-ANOVA is die nieparametriese of distribusievrye<br />
ekwivalent van die standaardeenrigting-ANOVA of F-toets. Hierdie tegniek<br />
veronderstel dat die afhanklike veranderlike 'n onderliggende kontinue distribusie<br />
van minstens ordinale meting toon. Bestudeer die eerste paragraaf en die eerste sin<br />
van die tweede paragraaf op bladsy 392 tot 393 van Tredoux en Durrheim (2002).<br />
Voltooi die tabel deur die nieparametriese toetse in te vul:<br />
Parametries Nieparametriese ekwivalent<br />
1. t-toets vir twee onafhanklike<br />
steekproewe<br />
2. t-toets vir twee verwante steekproewe<br />
3. F-toets (ANOVA)<br />
Ons gebruik die data van 'n oefening in 'n ander bron (Lehman, 1991, p. 376,<br />
oefening 3) om 'n tipiese rekenaaruitvoer met behulp van SPSS for Windows aan<br />
jou te illustreer.<br />
Die data is die tyd (in minute) wat studente geneem het om vier verskillende<br />
lengtes toetse bestaande uit 10, 15, 20 en 25 vier-alternatiefmeerkeuse-items, te<br />
voltooi. Die navorsingsvraag hier is: Is daar 'n betekenisvolle verskil in die tyd wat<br />
die studente neem om toetse wat uit verskillende aantal meerkeuse-items bestaan,<br />
te voltooi? Die data word in die tabel hieronder verskaf.<br />
bladsy 165
Aantal toetsitems<br />
10 15 20 25<br />
13 17 18 16<br />
10 5 17 21<br />
13 13 10 28<br />
5 14 23 32<br />
611 24 24<br />
612 17 12<br />
2 3 10 9<br />
12 1627 18<br />
17 18 21 18<br />
12 8 24 9<br />
12 14 23 5<br />
2 7 8 15<br />
17 13 14 10<br />
3 16 1 7<br />
7 14 8 30<br />
1 18 10 5<br />
Werk deur die drukstuk en let veral op hoe die resultate weergegee word.<br />
Lees ook die voorbeeld wat Tredoux en Durrheim (2002) op bladsy 276tot 280<br />
onder die opskrif ``Using SPSS to do one-way ANOVA'' bespreek.<br />
bladsy 166 . studie-eenheid 13 hipotesetoetse vir gemiddeldes: eenrigting-variansieontleding
Onthou om die betekenisvolheid van die f-toets (dat daar 'n verskil is) te<br />
interpreteer op grond van die waarde in die ``sigof F'' kolom. Indien die waarde in<br />
hierdie kolom
14<br />
studie-eenheid veertien<br />
Die chi-kwadraattoets<br />
Inhierdie studie-eenheid gaan ons die eerste keer werk met kwalitatiewe<br />
(kategoriese) data. Sover het ons nog net te doen gehad met kwantitatiewe<br />
data. Wanneer jy as bedryfsielkundige in die werksituasie met frekwensies te<br />
doen kry, moet jy tog op een of ander manier kan vasstel of daar beduidende<br />
verskille tussen die frekwensies is. Die toetsstatistiek wat ons hiervoor gebruik<br />
word, is die chi-kwadraat w 2 - toets. Ons gaan in hierdie studie-eenheid met twee<br />
tipes w 2 - toetse werk en leer hoe om die resultate te interpreteer.<br />
As 'n mens dink aan die Nuwe Sterre-projek kan 'n aantal biografiese<br />
veranderlikes deel wees van die vrae wat gevra word. Biografiese veranderlikes<br />
is dikwels kategoriese veranderlikes. Dit sal beteken dat die chi-kwadraattoets is<br />
die toepaslike metode van data-ontleding om die verhouding tussen hierdie<br />
veranderlikes te ondersoek.<br />
Waarom gebruik ons die chi-kwadraattoets? ______________________<br />
Die chi-kwadraattoets help ons om frekwensie of kategoriese data sinvol te<br />
ontleed. Onthou jy nog die verskil tussen kategoriese en metingsdata?<br />
As jy nog die verskil tussen die twee ken, voltooi die tabel hieronder deur die<br />
eienskappe van elke tipe in te vul. Indien jy dit nie onthou nie, raadpleeg eers<br />
studie-eenheid 2 waar die betekenis van kategoriese en metingsdata en die verskil<br />
daartussen behandel word. Voltooi dan die tabel.<br />
Metingsdata Kategoriese data<br />
bladsy 168 . studie-eenheid 14 die chi-kwadraattoets
. afdeling 3 data-verwerking: inferensieel<br />
Dit kom daarop neer dat kategoriese data die getal observasies (tellings) in elke<br />
kategorie verteenwoordig, terwyl metingsdata verkry word deur objekte te meet.<br />
Watter tipes chi-kwadraattoetse kry ons? ________________________<br />
Soos reeds gemeld, kan ons slegs met twee kategoriese veranderlikes werk: 'n eenklassifikasieveranderlike<br />
en 'n twee-klassifikasieveranderlike.<br />
Bestudeer die afdeling ``Classifications'' op bladsy 365 van Tredoux en Durrheim<br />
(2002) sodat jy kan verstaan hoe 'n populasie op verskillende wyses geklassifiseer<br />
kan word.<br />
. Som dan vir jou die verskil tussen 'n een- en 'n twee-klassifikasieveranderlike in<br />
die tabel hieronder op:<br />
Een-klassifikasieveranderlike Twee-klassifikasieveranderlike<br />
Noudat jy weet wat die verskil tussen die twee is, gaan ons vir jou in die volgende<br />
afdeling verduidelik hoe om dit te bereken.<br />
Wanneer word die twee-klassifikasieveranderlikes: chi-kwadraatgebeurlikheidstabel<br />
gebruik? _________________________________<br />
Dikwels kan die data waarmee ons werk, nie geklassifiseer word as net een<br />
veranderlike nie. Soms werk ons met data wat in twee kategorieeÈ val, en waar die<br />
veranderlike (data) ook as twee veranderlikes geklassifiseer word. In sodanige<br />
gevalle word na 'n gebeurlikheidstabel (contingency table) verwys.<br />
Bestudeer die gedeelte ``Contingency tables'' op bladsy 365 tot 366 van Tredoux<br />
en Durrheim (2002) om hierdie konsep beter te begryp.<br />
bladsy 169
. Gebruik jou sakrekenaar om die berekenings in tabel 19.1 op bladsy 366 van<br />
Tredoux en Durrheim (2002) na te gaan.<br />
. Formuleer jou eie beskrywing van 'n gebeurlikheidstabel:<br />
__________________________________________________________________<br />
__________________________________________________________________<br />
__________________________________________________________________<br />
Het jy in jou beskrywing die volgende ingesluit? Ons werk met 'n klassifikasie<br />
waarin die waarneming gelyktydig geklassifiseer is ten opsigte van twee<br />
veranderlikes.<br />
Wanneer word die een-klassifikasieveranderlike gebruik? Die chi-kwadraatpasgehaltetoets<br />
__________________________________________<br />
Waar ons met net een veranderlike werk, gebruik ons die pasgehaltetoets<br />
(goodness of fit test). Dit is die spesifieke naam vir die tipe chi-kwadraattoets. Die<br />
veronderstelling hier is dat ons slegs een stel waargenome data vergelyk met 'n<br />
teoretiese voorspelling van frekwensies, dit wil seà ons werk met waargenome (O)<br />
en verwagte (E) tellings.<br />
Ons maak nou kennis met bepaalde formules en simbole. Om jou te help om<br />
daarmee vertroud te raak moet jy die afdeling ``w 2 significance test'' op bladsy 366<br />
tot 371 van Tredoux en Durrheim (2002) bestudeer. Hierdie gedeelte is lank en al<br />
die berekenings, formules en simbole is bes moontlik verwarrend. Kom ons<br />
verdeel die afdeling sodat jy die belangrikste elemente makliker snap.<br />
. Vergewis jou van die simbole in die formules en hoe om dit te bereken.<br />
. Kontroleer die berekenings met jou sakrekenaar.<br />
. Sorg ook dat jy die waarde in tabel A1.7 op bladsy 492 van Tredoux en<br />
Durrheim (2002) korrek kan aflees.<br />
Benewens die toetsstatistiek wat verskil, behoort die proses vir jou bekend te wees,<br />
aangesien dit dieselfde prosedure is wat met alle hipotesetoetsing gevolg word (bv<br />
met die berekening van die t- en die F-toets).<br />
Probeer nou om die volgende aktiwiteite te doen om jou vaardigheid in die<br />
toepassing van die chi-kwadraattoets te bepaal. Onthou om al die stappe te volg<br />
wat jy in studie-eenheid 11 geleer het. Begin dus met die formulering van die<br />
nulhipotese en volg die stappe totdat jy jou bevindings interpreteer.<br />
bladsy 170 . studie-eenheid 14 die chi-kwadraattoets
1. Die programbestuurders van Nuwe Sterre wou vasstel of daar 'n verskil was<br />
tussen mans en vroue se mening ten opsigte daarvan of stemmers toegelaat<br />
moet word om vir die beoordelaars ook te stem. Jy is genader om die<br />
navorsing te onderneem. Die volgende vraag is aan 'n groep van 60 stemmers<br />
(30 mans en 30 vroue) gestel:<br />
Dink jy dat stemmers toegelaat moet word om vir beoordelaars ook te stem?<br />
Die deelnemers is gevra om slegs een van drie response te kies: ja, nee of onseker.<br />
Van die 30 mans het 9 ja geantwoord, 12 het nee geseà en 9 was onseker. Van die<br />
vroue het 15 ja geseà , 2 het nee geseà en 13 was onseker.<br />
Verskil mans en vroue beduidend oor hulle opinie rakende stemmery vir die beoordelaars?<br />
1.1 Stel 'n gebeurlikheidstabel op om die gegewe inligting voor te stel.<br />
1.2 Doen die nodige berekenings om te bepaal of daar 'n beduidende verskil is<br />
tussen die twee geslagte ten opsigte van hulle opinie rakende stemmery vir<br />
die beoordelaars.<br />
1.3 Werk op 'n beduidenheidsvlak van 0,05. Wat is jou afleiding? (Verwys na die<br />
navorsingsprobleem.)<br />
1.1<br />
Ja Nee Onseker Totaal<br />
Mans 9 (12) 12 (7) 9 (11) 30<br />
Vroue 15 (12) 2 (7) 13 (11) 30<br />
Totaal 24 14 22 60<br />
Die syfers tussen hakies is die verwagte frekwensies, bereken volgens die<br />
formule:<br />
Eij = Ri Cj<br />
N<br />
Vir ons vraag:<br />
E11 =<br />
E12 =<br />
E13 =<br />
E21 =<br />
E22 =<br />
E23 =<br />
30 24<br />
60<br />
30 14<br />
60<br />
30 22<br />
60<br />
30 24<br />
60<br />
30 14<br />
60<br />
30 22<br />
60<br />
= 12<br />
= 7<br />
= 11<br />
= 12<br />
= 7<br />
= 11<br />
. afdeling 3 data-verwerking: inferensieel<br />
bladsy 171
1.2 2 =<br />
= …9 12†2<br />
= … 3†2<br />
…O E† 2<br />
E<br />
12 ‡<br />
12<br />
52 ‡ 7<br />
…12 7†2<br />
7 ‡<br />
‡ … 2†2<br />
11<br />
32 ‡ 12<br />
…9 11†2<br />
11 ‡<br />
‡ … 5†2<br />
7<br />
…15 12†2<br />
12 ‡<br />
22 ‡ 11<br />
= 0; 75 ‡ 3; 75 ‡ 0; 36 ‡ 0; 75 ‡ 3; 75 ‡ 0; 36<br />
= 9,36<br />
1.3 a = 0,05<br />
df = (R ± 1) (C ± 1)<br />
= (2 ± 1)(3 ± 1)<br />
= 2<br />
2<br />
calc = 9; 36 2 crit ˆ 5; 99<br />
9,36 4 5,99<br />
; Verwerp H0<br />
…2 7†2<br />
7 ‡<br />
…13 11†2<br />
11<br />
; Daar is 'n betekenisvolle verskil tussen mans en vroue met betrekking<br />
tot hul mening oor stemmery vir die beoordelaars.<br />
Dink na oor die volgende addisionele vrae vir die Nuwe Sterre-projek wat ook<br />
deur die analise van Chi-kwadraat bereken kan word:<br />
. V1: Is daar 'n verskil in hoe kykers deelnemers beoordeel op grond van hulle<br />
haarkleur (blonde, rooi of bruin hare?) (chi-kwadraat)<br />
. V2: Is daar 'n verskil in hoe manlike en vroulike beoordelaars deelnemers<br />
beoordeel op grond van hulle liggaamsgewig?<br />
. V3: Ten opsigte van die beoordelaars wat deel van die siftingsproses is ± is daar<br />
'n verhouding tussen die rassegroep van 'n individuele beoordelaar en die<br />
rassegroep van die kandidate vir wie hulle 'n hoeÈ , gemiddelde of lae punt gee?<br />
Speel klein frekwensies 'n rol? _______________________________<br />
Ja, dit speel 'n rol. Selfs wanneer die frekwensies klein is, oefen hulle 'n invloed op<br />
'n toets uit. Soms word die frekwensies as proporsies uitgedruk, maar word<br />
gewoonlik weer na frekwensies omgeskakel. Dit is ook moontlik om nieonafhanklike<br />
observasies te doen. Lees die afdeling ``Measures of association in<br />
tables based on the 2 statistic'' op bladsy 371 tot 374 van Tredoux en Durrheim<br />
(2002).<br />
Bestudeer die uitgewerkte voorbeeld op bladsy 381 van Tredoux en Durrheim<br />
(2002) en sorg dat jy die 2 -waarde in die drukstukke kan identifiseer en<br />
interpreteer.<br />
bladsy 172 . studie-eenheid 14 die chi-kwadraattoets
. afdeling 3 data-verwerking: inferensieel<br />
Jy het nou heelwat nuwe kennis opgedoen. 'n Opsomming daarvan sal 'n oorsig<br />
bied van jou begrip daarvan. Jy behoort in staat te wees om die volgende te doen:<br />
. te weet wanneer om die chi-kwadraattoets toe te pas<br />
. die chi-kwadraattoets (pasgehaltetoets) vir twee of meer kategorieeÈ te kan<br />
bereken<br />
. te kan verduidelik wat 'n gebeurlikheidstabel is<br />
. te weet wanneer om 'n gebeurlikheidstabel te gebruik<br />
. die chi-kwadraattoets vir twee-klassifikasieveranderlikes te kan bereken<br />
. die resultate te kan interpreteer op grond van die verwerping of die<br />
nieverwerping van die nulhipotese<br />
bladsy 173
15<br />
studie-eenheid vyftien<br />
OnderskeidingsvermoeÈ<br />
OnderskeidingsvermoeÈ (power) is 'n konsep wat vandag al hoe<br />
belangriker word in navorsing. Al hoe meer skrywers van<br />
wetenskaplike artikels verduidelik die onderskeidingsvermoeÈ van<br />
hulle navorsing. Om hierdie rede is dit belangrik dat jy eerstens die konsep van<br />
onderskeidingsvermoeÈ verstaan, en dan ook hoe om onderskeidingsvermoeÈ (soos<br />
dit byvoorbeeld in wetenskaplike artikels bereken word) te interpreteer.<br />
Die basiese begrip ``onderskeidingsvermoeÈ'' ______________________<br />
Veronderstel jy doen navorsing oor die invloed van rook op die gesondheid van<br />
personeel in 'n gebou. In jou navorsing gebruik jy twee steekproewe, naamlik 'n<br />
departement waar daar glad nie gerook word nie en 'n departement waar baie<br />
personeel rook. Jou nulhipotese stel dat daar geen verskil in die gesondheid van<br />
personeel wat nie rook in die twee departemente is nie. Jou resultate toon dat jy nie<br />
die nulhipotese kan verwerp nie, dit wil seà daar is geen verskil in die gesondheidsvlak<br />
van die personeel wat nie rook in die twee departemente nie. Op grond van<br />
jou resultate stel die organisasie nie 'n rookbeleid in nie. Jy publiseer jou resultate<br />
in 'n wetenskaplike artikel. Na vyf jaar lees 'n professsor wat in jou soort<br />
navorsing gespesialiseer het jou resultate en kom agter dat jy 'n statistiese fout<br />
begaan het. Jou resultate was dus verkeerd en jy moes in der waarheid jou<br />
nulhipotese verwerp het wat beteken dat daar wel 'n verskil in die gesondheidsvlakke<br />
van die personeel in die twee departemente was wat nie rook nie.<br />
In die Nuwe Sterre-kompetisie waar die pryse hoeÈ moneteà re waarde het, moet die<br />
organiseerders verseker dat die resultate en die grondslag waarop besluite gemaak<br />
word, bo verdenking is. As die kwessie vanuit 'n kwantitatiewe perspektief<br />
benader word, is versekering van voldoende onderskeidingsvermoeÈ een manier om<br />
in staat te wees om besluite wat geneem is, te verdedig.<br />
1. Beskou die scenario soos hierbo gestel, en beantwoord dan die volgende vrae:<br />
1.1 Watter soort statistiese fout het jy begaan? Verduidelik jou antwoord.<br />
1.2 Die verkeerdelike nieverwerping van die nulhipotese hou implikasies vir<br />
die organisasie en die personeel in. Kan jy sommige van hierdie<br />
implikasies lys?<br />
bladsy 174 . studie-eenheid 15 onderskeidingsvermoeÈ
. afdeling 3 data-verwerking: inferensieel<br />
2. Om die begrip onderskeidingsvermoeÈ te verstaan moet jy die gedeelte ``Error<br />
and statistical tests'' op bladsy 231 tot 232 van Tredoux en Durrheim (2002)<br />
bestudeer. Jy sal sodoende ook Tipe I- en Tipe II-foute beter verstaan.<br />
Hierdie scenario dui op die belangrikheid van die korrekte verwerping van die<br />
onwaar nulhipotese.<br />
1.1 In studie-eenheid 11 het jy geleer wat 'n tipe II-fout, wat ook as b (beta)<br />
genoteer word, beteken. As jy deur die afdeling ``Error and statistical tests''<br />
op bladsy 231 tot 232 van Tredoux en Durrheim (2002) werk, sal jy sien dat<br />
dit baie nou verband hou met die konsep van onderskeidingsvermoeÈ .<br />
1.2 Voor die hand liggende implikasies sluit die volgende in:<br />
. Die tyd en geld wat jy aan die eksperiment gemors het<br />
. Produktiwiteit wat verlore gaan omdat personeel siek word en van die<br />
werk afwesig is as gevolg van die rokery<br />
. Mediese fondse wat met eise van siek personeel belas word<br />
2. Jy moet veral aandag gee aan die interpretasie van figuur 13.1 op bladsy 233<br />
tot 234 van Tredoux en Durrheim (2002).<br />
Dit behoort nou vir jou duidelik te wees dat dit ernorme implikasies in die meeste<br />
navorsingsituasies kan inhou indien die nulhipotese nie verwerp word nie waar<br />
daar in der waarheid 'n verskil tussen groepe is. Dit is waarom die konsep van<br />
onderskeidingsvermoeÈ so belangrik is. Die waarskynlikheid om die regte besluit te<br />
neem om die vals nulhipotese (H0) te verwerp, staan bekend as onderskeidingsvermoeÈ<br />
en word as 1± genoteer.<br />
Interpretasie van 'n onderskeidingsvermoeÈwaarde __________________<br />
Die onderskeidingsvermoeÈ kan vir 'n t-toets vir verwante en onafhanklike<br />
steekproewe bereken word, maar is 'n ingewikkelde proses. Hoewel ons nie van<br />
jou sal verwag om hierdie berekenings te kan doen nie, moet jy wel die<br />
onderskeidingsvermoeÈ waarde wat deur hierdie proses bereken is, kan interpreteer.<br />
In hul inleiding op bladsy 230 tot 231 gebruik Tredoux en Durrheim (2002) die<br />
analogie van die strafhof om die interpretasie van die onderskeidingsvermoeÈ -<br />
waarde te verduidelik.<br />
Soos jy kan sien, verwag ons net van jou om bladsy 230 tot 234 van Tredoux en<br />
Durrheim (2002) te bestudeer. Die res van hierdie hoofstuk is nie op jou van<br />
toepassing nie.<br />
1. Hersien die reeÈ ls in studie-eenheid 11 wat bepaal wanneer jy die nulhipotese<br />
moet verwerp of nie moet verwerp nie.<br />
bladsy 175
2. Verduidelik wat bedoel word met onderskeidingsvermoeÈ = 0,6.<br />
3. Wat is die vlak van sekerheid wat van die statistiese proses vereis sal word om<br />
te verseker dat die uitkoms van die stemming in Nuwe Sterre bo verdenking is?<br />
1. Hierdie reeÈ ls sal jou weer nuttig te pas kom om onderskeidingsvermoeÈ te<br />
verstaan.<br />
2. Wanneer ons seà dat die onderskeidingsvermoeÈ vir 'n spesifieke<br />
navorsingstudie gelyk is aan 0,6, bedoel ons dat as die nulhipotese vals is<br />
tot die mate wat ons verwag dit vals is, die waarskynlikheid 0,6is dat die<br />
resultate ons tot die verwerping van die nulhipotese sal lei. Hoe groter die<br />
onderskeidingsvermoeÈ vir 'n eksperiment is, hoe groter is die waarskynlikheid<br />
dat ons die vals nulhipotese sal verwerp, en hoe hoeÈ r is die<br />
onderskeidingsvermoeÈ van die eksperiment.<br />
3. 0,8.<br />
'n Toepassingsarea vir onderskeidingsvermoeÈ ____________________<br />
Bedryfsielkunde as vakgebied is een van die baie wat van meta-analise gebruik<br />
maak. Dit is 'n statistiese metode wat gebruik word om die resultate van<br />
onafhanklike navorsingstudies te kombineer. Meta-analise word hoofsaaklik in<br />
wetenskaplike artikels gebruik wat navorsing in 'n spesifieke area bespreek (Aron<br />
& Aron, 1994).<br />
Noudat jy studie-eenheid 15 bestudeer het behoort jy in staat te wees om die<br />
volgende te doen:<br />
. Die konsep van onderskeidingsvermoeÈ te kan omskryf en te weet waarom dit<br />
belangrik is<br />
. 'n Berekende onderskeidingsvermoeÈ waarde te kan interpreteer<br />
bladsy 176 . studie-eenheid 14 die chi-kwadraattoets
Nuwe Sterre<br />
Die sangkompetisie skop binnekort af! _______________________________<br />
Die Nuwe Sterre-leerlingskapprogram het verlede week op 'n hoeÈ noot ten einde<br />
geloop! Dit was so 'n moordende proses dat die organiseerders ietwat bekommerd<br />
was dat die deelnemers nie nog in die sangkompetisie ook sal kan deelneem nie!<br />
Die totale voorkomsverandering was die gunsteling deel van die leerlingskapprogram,<br />
vir die deelnemers sowel as die kykers! Teen alle verwagtings in het<br />
Vuyo K nie na die finale rondte deurgedring nie! Die vyf gekose deelnemers om<br />
aan die sangkompetisie deel te neem, is David, Tshepo, Shelly, Kerry en<br />
Cameron. Volgens hulle profiele in studie-eenheid 1, wie dink jy staan die grootste<br />
kans om te wen?<br />
bladsy 177
16 Data-analise:<br />
'n fiktiewe<br />
organisasie
Studie-eenheid 16: Data-analise: 'n fiktiewe organisasie<br />
bladsy 180<br />
Die studie-eenheid in hierdie afdeling is uniek in die sin dat jy niks nuuts gaan<br />
byleer nie. Jy gaan wel 'n geleentheid kry om alles toe te pas wat jy tot dusver<br />
geleer het. Hierdie studie-eenheid is dus eintlik selfevalueringsoefeninge.
16<br />
studie-eenheid sestien<br />
Data-analise: 'n<br />
fiktiewe organisasie<br />
Let daarop dat sommige vrae in hierdie studie-eenheid anders gevra word<br />
as vroeeÈ r in die ander studie-eenhede of in die werkopdragte. Moenie<br />
bekommer nie, die vrae in die eksamen sal in 'n formaat wees soos in die<br />
ander studie-eenhede en die werkopdragte! Die rede waarom ons die vrae hier soms<br />
anders gevra het, is om dit 'n meer realistiese oefening te maak ten opsigte van die<br />
vrae wat jy in 'n werksituasie sal moet kan beantwoord. 'n Werkgewer gaan net<br />
vir jou die probleemstelling gee en van jou verwag om self te weet watter stappe jy<br />
alles moet uitvoer om by die antwoord uit te kom.<br />
Noudat jy die studiemateriaal van hierdie kursus voltooi het, kan jy al begin<br />
droom van jou werk as bedryfsielkundige in 'n maatskappy. Gee jou verbeelding<br />
vrye teuels en geniet die volgende praktiese oefening.<br />
Verbeel jou jy is die bedryfsielkundige in diens van maatskappy MetalCan<br />
International wat metaalblikkies vervaardig. Dit is 'n fabriek wat 24 uur per dag<br />
produksie moet lewer en gevolglik word werkers in drie verskillende skofte<br />
ingedeel.<br />
Die tye van die drie skofte is soos volg: Die bestuursvlakke in die Produksieafdeling<br />
is die volgende:<br />
. Skof 1: 06:00±14:00 . Produksiebestuurder<br />
. Skof 2: 14:00±22:00 . Senior Skofleier<br />
. Skof 3: 22:00±06:00 . Skofleier<br />
. Skofwerker<br />
Die maatskappy het mans sowel as vroue van verskillende ouderdomme tydens al<br />
drie die skofte in diens. Daar is altesaam 350 werkers by die maatskappy. Tien<br />
werkers uit elke skofbeurt is ewekansig geselekteer en inligting van elkeen van die<br />
geselekteerde werkers word in die tabel hieronder gegee. Hierdie werkers is almal<br />
fabriekwerkers wat verpakking van die finale produkte doen. Om die vrae te<br />
beantwoord wat hierna gevra gaan word, moet jy hierdie inligting gebruik.<br />
Stel vir elke vraag 'n nuwe tabel op waarin jy slegs die nodige inligting uit die<br />
meestertabel in daardie tabel oorskryf. Dit sal jou berekeninge vergemaklik om<br />
net die nodige data vir die berekeninge byderhand te heà .<br />
bladsy 181
Die volgende inligting word verskaf vir die persone wat in die steekproef<br />
opgeneem is:<br />
. naam (van en voorletters)<br />
. skofnommer<br />
. ouderdom (in jare)<br />
. dienstydperk (by hierdie firma ± gegee in maande)<br />
. geslag (M = manlik, V = vroulik)<br />
. motoriese aanlegtelling (op skaal wat telling vir handvaardigheid gee)<br />
. produktiwiteitstelling (gemiddelde aantal produkte verpak oor laaste 5 skofte)<br />
Naam Skof Ouderdom Dienstyd Geslag Motoriese<br />
aanleg<br />
Produktiwiteit<br />
Khumalo, N 1 30 68 M 40 140<br />
Solomon, K 1 23 36M 32 120<br />
Shaw, I 1 25 15 V 41 130<br />
Mogale, S 1 19 6M 28 115<br />
Naidoo, P 1 42 41 M 38 130<br />
Peters, M 1 24 10 V 32 118<br />
Britz, K 1 43 60 M 43 153<br />
Singh, S 1 32 24 V 37 135<br />
Shizane, P 1 28 22 M 41 148<br />
Coetzee, N 1 41 48 M 36120<br />
Miller, A 2 2628 M 24 90<br />
Masego, P 2 31 20 V 30 140<br />
Ndimang, N 2 30 12 V 31 128<br />
Quele, P 2 27 5 M 40 146<br />
Valmer, B 2 24 38 M 41 140<br />
April, C 2 55 144 V 38 145<br />
Nkomo, D 2 48 12 M 36130<br />
Surrey, F 2 33 47 M 35 140<br />
Govender, S 2 25 8 M 40 145<br />
Mokoena, C 2 42 50 M 41 130<br />
Zitumane, P 3 25 10 M 35 130<br />
Lange, K 3 37 14 M 38 142<br />
Hatting, S 3 32 6V 42 136<br />
Bartlett, G 3 44 48 V 29 112<br />
bladsy 182 . studie-eenheid 16 data-analise: 'n fiktiewe organisasie
Naam Skof Ouderdom Dienstyd Geslag Motoriese<br />
aanleg<br />
Produktiwiteit<br />
Olivier, M 3 41 78 V 41 128<br />
Nkosi, T 3 28 15 V 33 116<br />
Richard, A 3 4624 M 34 111<br />
Jacobs, L 3 50 120 V 48 150<br />
Maluleke, T 3 41 60 M 29 102<br />
Collins, G 3 39 20 M 32 120<br />
Die res van die studie-eenheid bestaan uit 'n klomp vrae wat deel van hierdie een<br />
lang aktiwiteit vorm. Terugvoer word aan die einde van die studie-eenheid gegee.<br />
Vraag 1<br />
Voltooi die onderstaande tabel deur langs elke veranderlike hieronder aan te dui<br />
watter tipe metingskaal ter sprake is.<br />
Veranderlike Soort metingskaal<br />
(nominaal, ordinaal,<br />
interval of verhouding)<br />
Skofgroep<br />
Ouderdom<br />
Dienstyd<br />
Geslag<br />
Handvaardigheid/<br />
Motoriese-aanlegtelling<br />
Produktiwiteitstelling<br />
Bestuursvlak<br />
Vraag 2<br />
. afdeling 4 toepassing<br />
Een van die tellings wat gegee is, is 'n motoriese-aanlegtelling wat 'n meting van<br />
handvaardigheid is. Hierdie telling gee na bewering 'n aanduiding van die persoon<br />
se uiteindelike produktiwiteit binne die werksituasie.<br />
2.1 Bereken die gemiddeld van die motoriese-aanlegtellings van die groep wat<br />
skof 1 werk en ook vir die groep wat skof 3 werk.<br />
2.2 Bereken die modus van die produktiwiteitstellings van die groep wat skof 2<br />
werk.<br />
2.3 Bereken die mediaan van die produktiwiteitstellings van die werkers van skof<br />
3.<br />
bladsy 183
2.4 Gee 'n frekwensieverdeling van die ouderdomme van die persone wat in die<br />
steekproef opgeneem is deur die ouderdomme in 5-jaar intervalle te groepeer.<br />
Stel 'n frekwensietabel op. Dui ook die middelpunt van elke interval in die<br />
frekwensietabel aan.<br />
2.5 Teken die histogram van die frekwensieverdeling in vraag 2.4.<br />
2.6Beskryf die verspreiding van hierdie histogram ten opsigte van die volgende:<br />
. Modaliteit: unimodaal / bimodaal / trimodaal<br />
. Skeefheid: positief skeef / negatief skeef<br />
. Kurtose: platikurties / mesokurties / leptokurties<br />
2.7 Bereken die variansie en standaardafwyking van die motoriese-aanlegtellings<br />
vir skofgroep 1 asook vir skofgroep 3.<br />
2.8 Bereken die verband tussen die motoriese-aanlegtellings en die<br />
produktiwiteitstellings van die hele groep.<br />
Opmerking: Die kwadrate van sommige syfers mag onmoontlik wees om te<br />
bereken met sakrekenaars wat net agt karakters kan hanteer.<br />
Interpreteer dan die korrelasiekoeÈ ffisieÈ nt en seà ook wat jou afleiding is ten opsigte<br />
van die verband is.<br />
Vraag 3<br />
Jy wil die motoriese-aanlegtellings gebruik om werkprestasie (produktiwiteit) te<br />
voorspel.<br />
3.1 Watter veranderlike is die voorspellerveranderlike?<br />
3.2 Bereken die veranderlikes wat in die regressievergelyking gebruik word,<br />
naamlik:<br />
. bereken b<br />
. bereken a<br />
3.3 Gee die finale regressieformule.<br />
3.4 Wat sal die voorspelde produktiwiteitstelling wees van 'n persoon wat 'n<br />
telling van 30 op die motoriese-aanlegtoets kry?<br />
3.5 Maak 'n grafiese voorstelling van die regressielyn.<br />
Vraag 4<br />
Beskou vir hierdie vraag hierdie groep van 30 werkers as die totale populasie van<br />
werkers wat normaal versprei is. Hulle gemiddeld ten opsigte van motoriese<br />
aanleg is 32,53 en die standaardafwyking is 11,98. Beantwoord nou die volgende<br />
vrae:<br />
4.1 Bereken die ooreenstemmende z-telling vir 'n persoon met 'n routelling van<br />
41.<br />
bladsy 184 . studie-eenheid 16 data-analise: 'n fiktiewe organisasie
4.2 Bereken die ooreenstemmende z-telling vir 'n persoon met 'n routelling van<br />
31.<br />
4.3 Bepaal die proporsie gevalle met 'n routelling kleiner as 31.<br />
4.4 Bepaal die persentasie gevalle met 'n routelling groter as 41.<br />
4.5 Bepaal die aantal werkers wie se motoriese-aanlegtellings tussen 31 en 41 val.<br />
Vraag 5<br />
Enkele gevalle binne die maatskappy dui daarop dat mans moontlik meer betaal<br />
word as vroue, alhoewel hulle dieselfde werk doen en naastenby dieselfde<br />
ondervinding het. Beweringe oor verskille in die produktiwiteit het nou kop<br />
uitgesteek as deel van die probleem en jy is gevra om ondersoek in te stel. Bestuur<br />
het na aanleiding van bogenoemde gevra dat die syfers ten opsigte van die<br />
produktiwiteit van die twee geslagte aan hulle beskikbaar gestel moet word.<br />
Gebruik die inligting wat in die tabel gegee is om vas te stel of daar 'n verskil<br />
tussen die produktiwiteit van mans en vroue is.<br />
5.1 Stel 'n gepaste nulhipotese in woorde en in simbole.<br />
5.2 Stel 'n gepaste alternatiewe hipotese in woorde en in simbole.<br />
5.3 Bereken die gepaste toetsstatistiek en beantwoord die navorsingsvraag.<br />
Vraag 6<br />
As jy dienstyd oorweeg, kan jy ses persone in skofgroep 1 afpaar met ses persone<br />
met dieselfde lengte dienstydperk in skofgroep 3. Skofgroep 1 werk van 06:00 tot<br />
14:00 terwyl skofgroep 3 van 22:00 saans tot 06:00 die volgende oggend werk. Jy<br />
wil vasstel of daar 'n verskil tussen die produktiwiteitstellings van skofgroep 1 en<br />
skofgroep 3 is. Doen al die nodige berekeninge (beginnende met die stel van 'n<br />
nul- en alternatiewe hipotese) om die vraag te beantwoord.<br />
Vraag 7<br />
Gebruik twee ouderdomsgroepe naamlik die groep persone wat jonger as 30 is in<br />
een groep en die groep persone wat ouer as 40 is in die ander groep. Bepaal of daar<br />
'n verskil tussen die motoriese-aanlegtellings van hierdie twee groepe is. Wys alle<br />
stappe duidelik en doen alle nodige berekeninge om die vraag te kan beantwoord.<br />
Vraag 8<br />
. afdeling 4 toepassing<br />
8.1 Is daar 'n beduidende verskil tussen die ouderdomme van die drie<br />
verskillende skofgroepe? Doen alle nodige berekeninge om die antwoord te<br />
bepaal.<br />
8.2 Evalueer die praktiese waarde wat hierdie berekening vir jou as<br />
bedryfsielkundige het in twee of drie sinne.<br />
bladsy 185
Vraag 9<br />
Die hoof- uitvoerende beampte (HUB) (Chief Executive Officer) van die<br />
maatskappy het die volgende gemiddeldes en standaardafwykings van<br />
produktiwiteitsdata vir die drie skofte bekom:<br />
Skof 1 Skof 2 Skof 3<br />
X 130,9 133,4 124,7<br />
s 13,08 16,65 15,16<br />
Hy het samesprekings met jou aangevra en die volgende gesprek het plaasgevind:<br />
HUB: ``Dit lyk asof skof 2 die produktiefste in die maatskappy is, terwyl skof 1<br />
kort op hulle hakke is. Die produktiwiteit van skof 3 is regtig swak. Stem<br />
jy saam?''<br />
Jy: `` 'n Mens kan nie aflei of daar 'n betekenisvolle verskil is in die<br />
produktiwiteit van die drie skofte is deur slegs na die gemiddeldes te kyk<br />
nie.''<br />
HUB: ``Kan jy die data verder verwerk? Ek moet weet of daar 'n betekenisvolle<br />
verskil is.''<br />
Jy: ``Sekerlik, ek moet net 'n statistiese toets bekend as `Eenrigting ANOVA'<br />
doen om jou vraag te kan beantwoord. Ek sal my afleiding aan jou<br />
rapporteer met 99% sekerheid.''<br />
HUB: ``Dankie.''<br />
Vraag 10<br />
Die produksiebestuurder wou vasstel of daar 'n verskil in die voorkeur tussen<br />
manlike en vroulike werkers is vir die skof wat hulle sou verkies om te werk. Die<br />
senior skofleier het die volgende response gekry van 280 werkers op die vraag:<br />
``Watter skof verkies jy?''<br />
Skof 1 Skof 2 Skof 3<br />
Manlik 60 22 30<br />
Vroulik 40 68 60<br />
Die produksiebestuurder het jou gevra om die data te ontleed om sy vraag te kan<br />
beantwoord.<br />
bladsy 186 . studie-eenheid 16 data-analise: 'n fiktiewe organisasie
Vraag 1<br />
Veranderlike Soort veranderlike<br />
(nominaal, ordinaal,<br />
interval of verhouding)<br />
Skofgroep nominaal<br />
Ouderdom ratio<br />
Dienstyd ratio<br />
Geslag nominaal<br />
Handvaardigheid/<br />
Motoriese-aanlegtelling<br />
interval<br />
Produktiwiteitstelling ratio<br />
Bestuursvlak ordinaal<br />
Vraag 2<br />
2.1 Gemiddelde van die motoriese aanlegtellings van skofgroep 1 en skofgroep 3<br />
Skofgroep 1: (X1) = X1<br />
N1<br />
= 368<br />
10<br />
= 36,8<br />
Skofgroep 3: (X3) = X3<br />
N3<br />
= 361<br />
10<br />
= 36,1<br />
2.2 Modus van die produktiwiteitstellings van skofgroep 2<br />
Produktiwiteitstellings: 90 140 128 146140 145 130 140 145 130<br />
Geordende tellings: 90 128 130 130 140 140 140 145 145 146<br />
Modus = 140<br />
. afdeling 4 toepassing<br />
Motoriese aanlegtellings<br />
Skofgroep 1<br />
(X1)<br />
Skofgroep 3<br />
(X3)<br />
40 35<br />
32 38<br />
41 42<br />
28 29<br />
38 41<br />
32 33<br />
43 34<br />
37 48<br />
41 29<br />
3632<br />
Som 368 361<br />
bladsy 187
o f met 'n frekwensietabel Prod-2 Frek W<br />
90 1<br />
128 1<br />
130 2<br />
Modus = 140 iiiiK 140 3<br />
145 2<br />
1461<br />
2.3 Bereken die mediaan van die produktiwiteitstellings van skofgroep 3<br />
Produktiwiteitstellings (skofgroep 3):<br />
130 142 136112 128 116111 150 102 120<br />
Geordende tellings:<br />
102 111 112 116120 128 130 136142 150<br />
~<br />
N ‡ 1<br />
Mediaanposisie =<br />
2<br />
= 10 ‡ 1<br />
2<br />
= 5,5<br />
Mediaanwaarde leà tussen 120 en 128 (gemiddelde van die twee tellings)<br />
; 120 ‡ 128<br />
2<br />
= 248<br />
2<br />
= 124<br />
2.4 Frekwensieverdeling van ouderdomme<br />
Ouderdomsinterval Frekwensie Kumulatiewe<br />
frekwensie<br />
Middelpunt<br />
van interval<br />
16±20 1 1 18<br />
21±25 67 23<br />
26±30 6 13 28<br />
31±35 4 17 33<br />
36±40 2 19 38<br />
41±45 7 2643<br />
46±50 3 29 48<br />
51±55 1 30 53<br />
bladsy 188 . studie-eenheid 16 data-analise: 'n fiktiewe organisasie
2.5 Histogram van frekwensieverdeling van ouderdomme gegee in vraag 2.4<br />
Frekwensie<br />
6<br />
5<br />
4<br />
3<br />
2<br />
1<br />
0 3 8 13 18 23 28 33 38 43 48 53<br />
Ouderdom in jare<br />
Het jy die fout in die grafiek hierbo opgemerk? Indien nie, kyk na die<br />
frekwensietabel op die vorige bladsy en korrigeer dit op die grafiek. (Die<br />
posisies van die histogram en frekwensiepoligoon vir die intervalle 36±40 en<br />
41±45 is foutief in die grafiek as 3 en 6in plaas van 2 en 7 onderskeidelik<br />
aangedui.)<br />
2.6 . bimodaal<br />
. positief skeef<br />
. leptokurties<br />
2.7 Variansie en standaardafwyking van motoriese aanlegtellings vir skofgroep 1<br />
(X1) en skofgroep 3 (X3)<br />
… X 1 † 2<br />
N<br />
s2 X1 = X2 1<br />
N 1 s2 X3 = X2 3<br />
= 13752<br />
9<br />
…368† 2<br />
10<br />
= 13752 13542;4<br />
9 =<br />
= 209;6<br />
9<br />
= 13369<br />
N 1<br />
9<br />
… X 3 † 2<br />
N<br />
…361† 2<br />
10<br />
13369 13032;1<br />
9<br />
= 336;9<br />
9<br />
= 23,28888 = 37,43333<br />
= 23,29 = 37,43<br />
p<br />
s = 23; 29<br />
X1<br />
p<br />
s = 37; 43<br />
X3<br />
= 4,82597 = 6,11800<br />
= 4,83 = 6,12<br />
. afdeling 4 toepassing<br />
X1 X2 1 X3 X2 3<br />
40 1 600 35 1 225<br />
32 1 024 38 1 444<br />
41 1 681 42 1 764<br />
28 784 29 841<br />
38 1 444 41 1 681<br />
32 1 024 33 1 089<br />
43 1 849 34 1 156<br />
37 1 369 48 2 304<br />
41 1 681 29 841<br />
361 29632 1 024<br />
Som 368 13 752 361 13 369<br />
bladsy 189
2.8 Verband tussen motoriese aanlegtellings (X) en produktiwiteitstellings (Y)<br />
van die hele groep (al drie skofgroepe)<br />
r = p<br />
=<br />
p<br />
N XY … X†… Y †<br />
‰N X 2 … X† 2 Š‰N Y 2 … Y † 2 Š<br />
30…142 550† …1 085†…3890†<br />
‰30…40 085† …1 085† 2 Š‰30…510 906† …3890† 2 Š<br />
4 276 500 4 220 650<br />
= p<br />
‰1 202 550 1 177 225Š‰15 327 180 15 132 100Š<br />
=<br />
=<br />
=<br />
p 55 850<br />
…25 325†…195 080†<br />
55 850<br />
4 940 401 000<br />
p 55 850<br />
70 287;98617<br />
= 0; 79458<br />
= 0; 79<br />
Daar is 'n sterk positiewe verband.<br />
" Hoekom sterk?<br />
Jy kan dit so interpreteer: Dit<br />
is net 0,01 minder as 0,80 (die<br />
onderste grens van sterk op die<br />
korrelasie-interpretasieskaal<br />
soos gegee in studie-eenheid 8).<br />
Hoe beter 'n persoon se motoriese aanleg, hoe hoeÈ r die persoon se<br />
produktiwiteitstelling.<br />
Vraag 3<br />
Voorspelling van werkprestasie (produktiwiteit) op grond van motoriese<br />
aanlegtellings deur 'n regressievergelyking op te stel.<br />
3.1 Motoriese aanleg Y = 129,67 (Y = Produktiwiteit)<br />
3.2 ^Y = bX ‡ a<br />
b =<br />
= 30…142 550† …1 085†…3890†<br />
= 4 276 500 4 220 650<br />
= 55 850<br />
X = 36,17 (X = Motoriese aanleg)<br />
N XY … X†… Y †<br />
N X 2 … X† 2 a = Y bX<br />
30…40 085† …1 085† 2 = 129,67 ± (2,21)(36,17)<br />
1 202 550 1 177 225 = 129,67 ± 79,9357<br />
25 325<br />
= 49,7343<br />
= 2,20533 = 49,73<br />
= 2,21<br />
Y = Y<br />
N<br />
X = X<br />
N<br />
ˆ 3890<br />
30<br />
ˆ 1 085<br />
30<br />
ˆ 129; 67<br />
ˆ 36; 17<br />
bladsy 190 . studie-eenheid 16 data-analise: 'n fiktiewe organisasie
3.3 ^Y ˆ 2; 21X ‡ 49; 73<br />
3.4 Vir X = 30:<br />
Y = 2,21(30) + 49,73<br />
= 66,3 + 49,73<br />
= 116,03<br />
3.5<br />
120<br />
100<br />
80<br />
60<br />
40<br />
20<br />
Vraag 4<br />
4.1 z = X<br />
4 Produktiwiteit<br />
^Y = 2,21X + 49,73<br />
a = 49,73 of (0; 49,73)<br />
4<br />
(30; 116,03)<br />
5 10 15 20 25 30 35 40<br />
Motoriese-aanlegtelling<br />
ˆ 32; 53 = 11; 98<br />
= 41 32; 53<br />
11; 98<br />
= 8; 47<br />
11; 98<br />
= 0,71<br />
4.2 z = X<br />
= 31 32; 53<br />
= 1; 53<br />
11; 98<br />
11; 98<br />
= 70,13<br />
. afdeling 4 toepassing<br />
bladsy 191
4.3<br />
4.4<br />
4.5<br />
(z = 0)<br />
z = 0,13<br />
z=70,13<br />
Vraag 5<br />
"<br />
"<br />
(z = 0 z = 0,71<br />
~<br />
"<br />
"<br />
~ ~<br />
z=0<br />
z=0,71<br />
Ondersoek of daar 'n verskil tussen die<br />
produktiwiteit van mans en vroue is.<br />
P(z ±0,13)<br />
= 0,4483<br />
P(z 4 0,71)<br />
= 0,2389<br />
= 23,89%<br />
bladsy 192 . studie-eenheid 16 data-analise: 'n fiktiewe organisasie<br />
P(70,13 < z < 0,71)<br />
= 0,0517 + 0,2611<br />
= 0,3128<br />
30 6 0,31287 = 9,38<br />
; 9 persone
5.1 Daar is geen verskil<br />
tussen mans en vroue<br />
se produktiwiteitstellings<br />
nie.<br />
H0 : M = V<br />
5.2 Daar is 'n beduidende<br />
verskil tussen<br />
mans en vroue se<br />
produktiwiteitstellings.<br />
5.3<br />
H1 : M = V<br />
t = XM XV q<br />
= 129;05 130;73<br />
=<br />
=<br />
= 1; 68<br />
p<br />
S 2 p<br />
N M ‡ S2 p<br />
N V<br />
231;54<br />
19<br />
‡ 231;54<br />
11<br />
1; 68<br />
p<br />
12; 186 ‡ 21; 049<br />
1; 68<br />
p<br />
33; 235<br />
5; 76<br />
= 70,29<br />
Mans XM Vrouens XV X2 M X2 V<br />
140 130 19 600 16 900<br />
120 118 14 400 13 924<br />
115 135 13 225 18 225<br />
130 140 16900 19 600<br />
153 128 23 409 16384<br />
148 145 21 904 21 025<br />
120 13614 400 18 496<br />
90 112 8 100 12 544<br />
146128 21 31616384<br />
140 11619 600 13 456<br />
130 150 16900 22 500<br />
140 19 600<br />
145 21 025<br />
130 16900<br />
130 16900<br />
142 20 164<br />
111 12 321<br />
102 10 404<br />
120 14 400<br />
S 2 452 1 438 321 468 189 438<br />
XM= XM<br />
N<br />
XV = XV<br />
N<br />
=129,05 = 130,73<br />
s2 M = X2 M<br />
N 1<br />
= 321 468<br />
18<br />
… XM† 2<br />
N<br />
…2 452† 2<br />
19<br />
s2 V = X2 V<br />
N 1<br />
= 189 438<br />
= 321 468 136 437;05<br />
18 =<br />
= 5030;947<br />
18<br />
= 1 452;18<br />
10<br />
… XV† 2<br />
N<br />
… 438† 2<br />
11<br />
189 438 187 985;82<br />
10<br />
10<br />
=279,50 = 145,22<br />
s 2 p =…NM 1†s 2 M ‡…NV 1†s 2 V<br />
NM ‡ NV 2<br />
18…279;50† ‡…10†…145;22†<br />
19 ‡ 11 2<br />
= 5031‡ 1452;20<br />
28<br />
Tweekantige toets<br />
df = NM + NV7 2 = 19 + 11 7 2=28<br />
ta =0,05 = 2,0484<br />
ta =0,01 = 2,7633<br />
. afdeling 4 toepassing<br />
= 231,54<br />
bladsy 193
Berekende t-waarde = 70,29<br />
|t| 5 t krities op 5% en op 1% -vlak.<br />
; Verwerp nie H0 nie<br />
; Kan nie met 99% sekerheid seà dat daar 'n verskil is tussen mans en vroue se<br />
produktiwiteit is nie, dit wil seà geen betekenisvolle verskil nie.<br />
Vraag 6<br />
Is daar 'n verskil tussen die produktiwiteitstellings van skofgroep 1 en skofgroep 3<br />
as jy persone met dieselfde dienstyd vergelyk?<br />
D = D<br />
N<br />
ˆ 64<br />
6<br />
s2 D = D2 … D† 2<br />
N<br />
N 1<br />
…64† 2<br />
6<br />
ˆ 10; 67<br />
= 4022<br />
5<br />
= 4022 682; 67<br />
5<br />
= ˆ<br />
3339; 33<br />
5<br />
= 667,87<br />
sD = s2 p p<br />
D ˆ 667; 87<br />
= 25,84<br />
H 0 : D =0<br />
H1 : D<br />
= 0<br />
df = N 7 1=5<br />
Tweekantige toets<br />
t0;05 = 2,5706<br />
t0;01 = 4,0321<br />
|t bereken|
Vraag 7<br />
Bepaal of daar 'n verskil tussen die motoriese-aanlegtellings van die<br />
ouderdomsgroep jonger as 30 (X) en die groep ouer as 40 (Y) is.<br />
H0 : X 1 = X2<br />
H1 : X 1 = X2<br />
t = X1 X2<br />
S2 1<br />
N1 ‡ S2 q<br />
2<br />
N2<br />
= 35; 18 37; 55<br />
=<br />
=<br />
= 2; 37<br />
q<br />
34;96<br />
11<br />
‡ 32;67<br />
11<br />
2; 37<br />
p<br />
3; 1782 ‡ 2; 97<br />
2; 37<br />
p<br />
6; 1482<br />
2; 480<br />
= 70,96<br />
Tweekantig<br />
df = N1 ‡ N2 2<br />
= 20<br />
t0;05 = 2,0860<br />
t0;01 = 2,8453<br />
|t|
Vraag 8<br />
8.1 Is daar 'n verskil tussen die ouderdomme van die drie skofgroepe?<br />
H 0: m 1 = m 2 = m 3<br />
H 1: m 1 = m 2 = m 3<br />
SS total = X 2 … X† 2<br />
ˆ 37 979<br />
N<br />
…1 031† 2<br />
30<br />
= 37 979 735 432,03<br />
= 2546,97<br />
SSgroup = n …Xj X::† 2<br />
= 10[(30,7 7 34,37) 2 + (34,1 734,37) 2 + (38,3 7 34,37) 2 ]<br />
= 10[(73,67) 2 +(7 0,27) 2 + 3,93) 2 ]<br />
= 10[13,468 + 0,072 + 15,444]<br />
= 10(28,984)<br />
= 289,84<br />
SSerror = SStotal 7 SSgroup<br />
= 2 546,97 7 289,84<br />
= 2 257,13<br />
X1 X2 X3 X2 1 X2 2 X3 2<br />
30 26 25 900 676 625<br />
23 31 37 529 961 1 369<br />
25 30 32 625 900 1 024<br />
19 27 44 361 729 1 936<br />
42 24 41 1 764 576 1 681<br />
24 55 28 5763 025 784<br />
43 48 461 849 2 304 2 116<br />
32 33 50 1 024 1 089 2 500<br />
28 25 41 784 625 1 681<br />
41 42 39 1 681 1 764 1 521<br />
S 307 341 383 10 093 12 649 15 237<br />
|‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚{z‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚} |‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚{z‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚}<br />
X ˆ 1031 X 2 ˆ 37 979<br />
X1 = 30,7<br />
X2 = 34,1<br />
X3 = 38,3<br />
X:: = 34,37<br />
Bron df SS MS F<br />
F0,05 & 3,35 Group 2 289,87 144,94 1,73<br />
F0,01 & 5,49 Error 27 2 257,1 83,60<br />
Fcalc < Fcrit Total 29 2 546,97<br />
; Verwerp nie H0 nie.<br />
; Daar is geen beduidende verskil tussen die ouderdomsgroepe van die<br />
verskillende skoftye nie.<br />
8.2 Jy het geen beduidende verskil tussen die ouderdomme van die drie<br />
skofgroepe gevind nie. Was jou reaksie op hierdie antwoord ``Wat daarvan?''<br />
Indien wel, is jy reg ± hierdie resultaat as sodanig het nie werklik praktiese<br />
waarde nie.<br />
bladsy 196 . studie-eenheid 16 data-analise: 'n fiktiewe organisasie
Vraag 9<br />
Die belangrikste boodskap vir jou is dus: Onthou dat statistiese ontledings<br />
altyd gedoen word met die oog daarop om vrae te beantwoord deur sinvolle<br />
resultate te bekom.<br />
Indien bepaalde resultate nie gebruikswaarde het nie, is dit sinloos om die<br />
berekeninge uit te voer. Dit is baie belangrik dat jy deurgaans 'n kritiese<br />
ingesteldheid sal behou!<br />
Is daar 'n betekenisvolle verskil in die produktiwiteit van die drie skofte?<br />
H 0 : m Skof 1 = m Skof 2 = m Skof 3<br />
H1 : mSkof 1 = mSkof 2 = mSkof 3<br />
X1 = Skof 1 X2 = Skof 2 X3 = Skof 3<br />
X1 = 130,9 X2 = 133,4 X3 = 124,7 X.. = 129,67<br />
X 1 X 2 X 3 X 2 1 X 2 2 X 2 3<br />
140 90 130 19 600 8 100 16 900<br />
120 140 142 14 400 19 600 20 164<br />
130 128 136 16900 16384 18 496<br />
115 146112 13 225 21 31612 544<br />
130 140 128 16900 19 600 16384<br />
118 145 11613 924 21 025 13 456<br />
153 130 111 23 409 16900 12 321<br />
135 140 150 18 225 19 600 22 500<br />
148 145 102 21 904 21 025 10 404<br />
120 130 120 14 400 16900 14 400<br />
1 309 1 334 1 247 172 887 180 450 157 569<br />
SStotal = X 2 … X† 2<br />
SX = 1 309 + 1 334 + 1 247 = 3 890<br />
SX 2 = 172 887 + 180 450 + 157 569 = 510 906<br />
N dftotal = N 1<br />
= 510 906<br />
…3890† 2<br />
30<br />
= 510 906<br />
101 124<br />
30<br />
= 510 906 7 504 403,33<br />
= 6502,67<br />
. afdeling 4 toepassing<br />
=307 1<br />
=29<br />
bladsy 197
SSgroup = n …Xj X::† 2<br />
dfgroup = k 7 1<br />
= 10‰…130; 9 129; 67† 2 ‡ =37 1<br />
…133; 4 129; 67† 2 ‡ …124; 7 129; 67† 2 Š =2<br />
= 10‰…1; 23† 2 ‡ …3; 73† 2 ‡ … 4; 97† 2 Š<br />
= 10‰1; 51 ‡ 13; 91 ‡ 24; 7Š<br />
= 401,27<br />
SSerror = SStotal SSgroup dferror = k(n 7 1)<br />
= 6502,67 7 401,27 = 3(10 7 1)<br />
= 6101,41 = 27<br />
MSgroup = SSgroup=dfgroup<br />
= 401,27 / 2<br />
= 200,64<br />
MSerror = SSerror=dferror<br />
= 6101,4 / 27<br />
= 225,98<br />
F = MSgroup<br />
MSerror<br />
= 200;64<br />
225;98<br />
= 0,89<br />
Bron df SS MS F<br />
Groep 2 401,27 200,60,89<br />
Fout 27 6101,40 225,98<br />
Totaal 29 6502,67<br />
Jou afleiding<br />
Kritieke waarde: F0,01 (2,27) = 5,49<br />
[Deur interpolasie: 27 grade van vryheid is halfpad tussen 26en 28 en die kritieke<br />
waarde van 5,49 is presies halfpad tussen 5,53 en 5,45.<br />
(5,53 + 5,45 = 10,98 7 2 = 5,49).]<br />
0,89 5 5,49<br />
; Kon nie H0 verwerp nie<br />
Daar is dus geen betekenisvolle verskil nie.<br />
bladsy 198 . studie-eenheid 16 data-analise: 'n fiktiewe organisasie
Jou antwoord aan die HUB<br />
``Alhoewel die gemiddeldes verskil en dus 'n verskil in produktiwiteit van die drie<br />
skofte weerspieeÈ l, is die verskil nie staties betekenisvol nie. Dit kan met 99%<br />
sekerheid afgelei word. Prakties gesproke, is daar geen rede vir jou aanvanklike<br />
kommer oor die vlak van produktiwiteit van enige van die drie skofte in ons<br />
maatskappy nie.''<br />
Vraag 10<br />
Is daar 'n betekenisvolle verskil tussen mans en vroue ten opsigte van die skof wat<br />
hulle verkies?<br />
Die frekwensies van antwoorde (in gebeurlikheidstabelformaat) is soos volg:<br />
Skof 1 Skof 2 Skof 3 Totaal<br />
Mans 60(40) 22(36) 30(36) 112<br />
Vroue 40(60) 68(54) 60(54) 168<br />
Totaal 100 90 90 280<br />
Die syfers in hakies is die verwagte frekwensies, wat volgens die onderstaande<br />
formule bereken is:<br />
Eij = Ri Cj<br />
N<br />
E11 =<br />
E12 =<br />
E13 =<br />
112 100<br />
280 = 40 E21 =<br />
112 90<br />
280 = 36 E22 =<br />
112 90<br />
280 = 36 E23 =<br />
2 = …O E† 2<br />
= …60 40†2<br />
= …20†2<br />
40<br />
= 400<br />
40<br />
E<br />
40 ‡<br />
‡ … 14†2<br />
36<br />
‡ 196<br />
36<br />
…22 36†2<br />
36 ‡<br />
‡ 36<br />
36<br />
‡ … 6†2<br />
36<br />
‡ 400<br />
60<br />
…30 36†2<br />
36 ‡<br />
‡ … 20†2<br />
60<br />
‡ 196<br />
54<br />
…40 60†2<br />
60 ‡<br />
…14†2<br />
‡ 54<br />
‡ 36<br />
54<br />
= 10 + 5,44 +1 +6,66 + 3,62 + 0,66<br />
= 27,38<br />
df = (R 7 1)(C 7 1)<br />
= (2 ± 1)(3 ± 1)<br />
= 2<br />
. afdeling 4 toepassing<br />
168 100<br />
280<br />
168 90<br />
280<br />
= 6 0<br />
= 54<br />
168 90<br />
280 ˆ 54<br />
‡ …6†2<br />
54<br />
…68 54†2<br />
54 ‡<br />
…60 54†2<br />
54<br />
bladsy 199
2<br />
2<br />
0;05…2† ˆ5; 99<br />
0:01 …2† ˆ9; 21<br />
27,41 > 5,99 27,41 > 9,21<br />
;Verwerp H0<br />
Interpretasie<br />
;Verwerp H0<br />
Daar is 'n betekenisvolle verskil tussen mans en vroue ten opsigte van die skof wat<br />
hulle verkies om te werk. Die aanname kan met 99 persent sekerheid gemaak<br />
word.<br />
Deur hierdie oefening het jy nou 'n oorsig gekry van sommige vrae waarmee 'n<br />
bedryfsielkundige te doen kan kry. In enige werksituasie is daar 'n verskeidenheid<br />
van probleme wat opgelos moet word of vrae wat beantwoord moet word. Dit is<br />
die taak van die bedryfsielkundige om hierdie probleme of vrae op 'n<br />
wetenskaplike manier te ondersoek en op te los of antwoorde te kry. Sodoende<br />
help die bedryfsielkundige mee om die maatskappy meer effektief te laat<br />
funksioneer en om die werkgewers sowel as die werknemers gelukkig te hou.<br />
bladsy 200 . studie-eenheid 16 data-analise: 'n fiktiewe organisasie
verwysings<br />
. afdeling 4 verwysings<br />
Aron, A. & Aron, E.N. (1994). Statistics for psychology. Englewood Cliffs, NJ:<br />
Prentice-Hall.<br />
Brown, T.S., & Brown, J.T. (1995). Prerequisite course grades and attitude<br />
toward statistics. College Student Journal, 29, 502±507.<br />
Christensen, L.B. (1994). Experimental methodology (6th ed). Boston: Allyn &<br />
Bacon.<br />
Cohen, J. (1992). A power primer. Psychological Bulletin, 112(1), 155±159.<br />
Fox, J.A., Levin, J., & Harkins, S. (1993). Elementary statistics in behavioral<br />
research. New York, NY: Harper Collins.<br />
Hair, J.F. (Jr), Anderson, R.E., Tatham, R.L. & Black, W.C. (1995). Multivariate<br />
data analysis: with readings (4th ed). Englewood Cliffs, NJ: Prentice-Hall.<br />
Howell, D.C. & Howell, C.T. (1995). Instructor's resource manual for fundamental<br />
statistics for the behavioral sciences (3rd ed). Belmont, CA: Duxbury.<br />
Johnson, D.E. (1989). An intuitive approach to teaching analysis of variance.<br />
Teaching of Psychology, 16(2), 67±68.<br />
Kaplan, R.M. (1987). Basic statistics for the behavioral sciences. Boston: Allyn &<br />
Bacon.<br />
Leedy, P.D. (1993). Practical research: Planning and design (5th ed). New York,<br />
NY: Macmillan.<br />
Leedy, P.D., & Ormrod, J.E. (2010). Practical Research: Planning and design. (9th<br />
ed). Upper Saddle River, New Jersey: Pearson.<br />
Lehman, R.S. (1991). Statistics and research design in the behavioral sciences.<br />
Belmont, CA: Wadsworth.<br />
McCall, R.B. (1986). Fundamental statistics for behavioral sciences (4th ed). San<br />
Diego: Harcourt Brace Jovanovich.<br />
Onwuegbuzie, A.J. (2000). Attitude toward statistics assessments. Assessment and<br />
Evaluation in Higher Education, 25(4), 321±339.<br />
bladsy 201
ladsy 202 . verwysings<br />
Porter, J.H. & Hamm, R.J. (1986). Statistics: Applications for the behavioral<br />
sciences. Monterey, CA: Brooks/Cole.<br />
Schau, C (2003). Students' attitudes: The ``other'' important outcome in statistics<br />
education. Joint Statistical Meetings, San Francisco, CA. Retrieved June, 24,<br />
2009, from the World Wide Web: http://evaluationandstatistics.com/<br />
JSM2003.pdf<br />
Spatz, C., & Johnston, J.O. (1984). Basic statistics: Tales of distributions (3rd ed).<br />
Monterey, CA: Brookes/Cole.<br />
Taylor, N., & Meyer, K. (2009). Personality characteristics of reality show<br />
applicants. Paper presented at the 15th South African Psychology Congress,<br />
12±14 August 2009, Cape Town, South Africa.<br />
Tredoux, C., & Durrheim, K. (eds.) (2002). Numbers, hypotheses and conclusions:<br />
A course in statistics for the social sciences. (1st ed). Lansdowne, Cape Town:<br />
UCT Press.
ylae: lys van formules<br />
middelpunt van klasinterval = WOG ‡<br />
persentielrang = % onder +<br />
…WBG WOG †<br />
2<br />
telling WOG<br />
klasintervalwydte<br />
(interval %)<br />
PR % onder<br />
telling van p = WOG ‡ interval % (intervalwydte)<br />
Mo = Most frequently occurring score<br />
Median Location =<br />
X ˆ X N<br />
N ‡ 1<br />
2<br />
Y ˆ Y N<br />
Range = Highest score minus lowest score<br />
s2 x ˆ X2 … X† 2<br />
N<br />
N 1<br />
s2 Y ˆ Y2 … Y† 2<br />
N<br />
N 1<br />
N XY X Y<br />
r ˆ<br />
‰N X2 … X† 2 Š‰N Y2 … Y† 2 p<br />
Š<br />
b ˆ<br />
sx ˆ S2 p<br />
x<br />
q<br />
sy ˆ S 2 y<br />
N XY … X†… Y†<br />
N X 2 … X† 2 a ˆ Y bX<br />
^Y ˆ bX ‡ a<br />
z ˆ X<br />
. afdeling 4 bylae<br />
bladsy 203
t ˆ<br />
D O<br />
p<br />
SD<br />
N<br />
df = N ±1<br />
t ˆ X1 X2<br />
s df = N1 +N2 ±2<br />
S 2 1<br />
N1<br />
‡ S2 2<br />
N2<br />
S 2 P ˆ …N1 1†s 2 1 ‡ …N2 1†s 2 2<br />
N1 ‡ N2 2<br />
SStotal = X 2 … X† 2<br />
SSgroup = n …Xj<br />
N<br />
X::† 2<br />
SSerror = SStotal ± SSgroup<br />
MSgroup =SSgroup /dfgroup<br />
F ˆ MSgroup<br />
MSerror<br />
w 2 =<br />
…O E†2<br />
E<br />
t ˆ X1 X2<br />
s<br />
S 2 p<br />
N1<br />
‡ S2 p<br />
N2<br />
dftotal = N ±1<br />
dfgroup = k ±1<br />
dferror = k(n ±1)<br />
MSerror = SSerror /dferror<br />
Eij ˆ Ri Cj<br />
N<br />
df = k ±1 df = (R ±1)(C ±1)<br />
bladsy 204 . bylae: lys van formules