01.05.2013 Views

Untitled

Untitled

Untitled

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

# 2011 Universiteit van Suid-Afrika<br />

Alle regte voorbehou<br />

Gedruk en uitgegee deur die<br />

Universiteit van Suid-Afrika<br />

Muckleneuk, Pretoria<br />

IOP2601/1/2012±2018<br />

98767631<br />

3B2<br />

IPS Styl


inhoud<br />

Bladsy<br />

Voorwoord iv<br />

AGTERGROND<br />

Studie-eenheid 1 Inleiding tot navorsing en statistiek 2<br />

2 Die taal van statistiek 14<br />

3 Basiese wiskundige berekenings wat in statistiek gebruik<br />

word 25<br />

DATA-VERWERKING: BESKRYWEND<br />

4 Aanbieding van data 31<br />

5 Maatstawwe van sentrale neiging 50<br />

6Maatstawwe van varieerbaarheid 58<br />

7 Korrelasie 67<br />

8 Regressie 82<br />

DATA-VERWERKING: INFERENSIEEL<br />

9 Basiese konsepte van waarskynlikheid 98<br />

10 Die normaalverspreiding 102<br />

11 Steekproefdistribusies en hipotesetoetsing 115<br />

12 Hipotesetoetse vir gemiddeldes: t-toetse 128<br />

13 Hipotesetoetse vir gemiddeldes: eenrigting-variansieontleding 149<br />

14 Die chi-kwadraattoets 168<br />

15 OnderskeidingsvermoeÈ 174<br />

TOEPASSING<br />

16Data-analise: 'n fiktiewe organisasie 181<br />

VERWYSINGS 201<br />

BYLAE: Lys van formules 203<br />

IOP2601/1/2012±2018 iii


voorwoord<br />

Baie welkom by Bedryfsielkundige navorsing, wat 'n tweedevlak-module in<br />

Bedryf- en Organisasiesielkunde aan Unisa is. As dosente in hierdie<br />

kursus hoop ons dat jy die kursus interessant en leersaam sal vind.<br />

Die studiegids is so geskryf dat dit jou aktief by die deurwerk van die<br />

kursusmateriaal betrek. Ons het die materiaal informeel en gemaklik probeer<br />

aanbied dat dit hopelik vir jou lekker sal wees om daarmee te werk!<br />

Die studiemateriaal word in so 'n volgorde aangebied dat dit die proses van<br />

navorsing in die praktyk uiteindelik in 'n sinvolle geheel weerspieeÈ l. 'n<br />

Kursuskaart is saamgestel sodat jy 'n geheelbeeld van die kursus kan kry, en<br />

sodat jy op enige tydstip kan sien met watter deel van die kursus jy besig is en hoe<br />

dit by die res van die kursus inskakel.<br />

Verskillende dosente het die onderskeie studie-eenhede geskryf en jy sal moontlik<br />

verskille in die styl van verskillende studie-eenhede merk. Ons hoop dat dit die<br />

studiemateriaal verder vir jou lewendig en interessant sal maak en jou<br />

bemeestering van die kursusmateriaal sal bevorder.<br />

Doel van hierdie vakkursus _________________________________<br />

Laat ons jou inlig oor die doel van die kursus in navorsingsmetodiek in<br />

Bedryfsielkunde.<br />

Die voltooiing van hierdie kursus behoort jou in staat te stel om<br />

. 'n toereikende woordeskat van statistiek te verwerf om hierdie voorgraadse<br />

kursus met gemak te bespreek. Hierdie woordeskat sal bestaan uit begrippe wat<br />

gesimboliseer word deur woorde en die alfabetiese simbole vir hierdie woorde.<br />

Jy ken waarskynlik al sommige van die simbole vanuit jou vroeeÈ re kennis van<br />

wiskunde.<br />

. jou berekeningsvaardighede te verbeter. 'n Mens leer statistiek die beste deur dit<br />

te doen.<br />

. statistiese gegewens korrek te interpreteer. Statistiese bevindinge wat korrek<br />

geõÈ nterpreteer is, kan hoogs beduidend wees, maar wanvertolking van resultate<br />

is tydmors. Laasgenoemde is dikwels onderliggend aan die skeptiese<br />

iv


opmerkings wat 'n mens hoor, byvoorbeeld dat jy ``enigiets met statistiek kan<br />

bewys''.<br />

. die logika van statistiek te begryp. As jy 'n navorsingsprobleem eers korrek<br />

geformuleer het, is jou stryd halfpad gewonne. Indien 'n mens sou voortgaan<br />

om gegewens in te win sonder om die probleem eers deeglik te oorweeg, kan dit<br />

gebeur dat geen statistiese tegniek gebruik kan word om die inligting sinvol te<br />

verwerk nie. Selfs in die beplanningsfase moet 'n mens deeglik oorweging skenk<br />

aan die statistiese tegnieke wat tydens dataverwerking gebruik gaan word.<br />

. te weet watter statistiese tegnieke op watter data van toepassing is. Onthou, elke<br />

tegniek berus op sy eie stel aannames en reeÈ ls wat streng nagevolg moet word<br />

om geldige resultate te lewer.<br />

Statistiese formules _______________________________________<br />

Hier is goeie nuus:<br />

Jy hoef geen statistiese formule te memoriseer nie! Jy hoef slegs te weet wanneer om<br />

dit te gebruik en hoe om dit reg toe te pas.<br />

In die eksamen kry jy altyd 'n lys van al die formules waarvan jy geleer het soos<br />

wat dit in die bylae aan die einde van hierdie studiegids gegee word. Die volledige<br />

formule word gegee, ook die simbool links van die `` = ''. Al wat jy moet ken, is<br />

die simbole links van die `` = '' in al die formules.<br />

Ikone en wat hulle beteken _________________________________<br />

As jy vinnig deur die studiegids blaai, sal jy sien dat verskillende ikone gebruik<br />

word om bepaalde soorte teks te identifiseer. Hier volg 'n voorbeeld en kort<br />

verduideliking van wat elk van hierdie ikone beteken:<br />

IKOON beteken: AKTIWITEIT<br />

Hierdie ikoon beteken dat jy iets daadwerklik moet doen, byvoorbeeld 'n definisie<br />

herformuleer, vrae beantwoord of berekeninge doen.<br />

'n Aktiwiteit sluit ook die terugvoering in wat ons jou daarop gee en wat jou sal<br />

help om die werk te verstaan.<br />

Doen asseblief die aktiwiteite, ons het dit spesiaal vir jou geskep.<br />

Eerstens kan jy bepaal of jy die werk wat behandel is, ken en verstaan.<br />

Tweedens kan jy dit as 'n mikro-ervaring van 'n werkopdrag- of eksamenvraag<br />

beskou.<br />

IOP2601/1 v


IKOON beteken: WENK<br />

'n Wenk is altyd belangrike inligting wat jou met sekere feite en berekeninge sal<br />

help. Neem deeglik kennis daarvan.<br />

IKOON beteken: TIPIESE REKENAARDRUKSTUK<br />

Dit verwys na 'n afdeling in die voorgeskrewe boek deur Tredoux en Durrheim<br />

(2002) of ons eie voorbeeld van die tipiese rekenaaruitdruk van 'n statistiese<br />

pakket.<br />

Bestudeer dit saam met die addisionele aantekeninge wat op die uitdruk<br />

aangebring is. Met die addisionele aantekeninge wys ons jou waar die spesifieke<br />

statistiese tegniek se eintlike antwoord op die uitdruk gekry word, aangesien sulke<br />

rekenaardrukstukke gewoonlik baie meer inligting bevat as die enkele syfer(s)<br />

waarin jy belangstel.<br />

IKOON beteken: WAT BEHOORT EK NOU TE KAN DOEN?<br />

Aan die einde van elke studie-eenheid word 'n kontrolelys ingesluit. Evalueer<br />

jouself om seker te maak dat jy die doelwitte wat ons vir die studie-eenheid gestel<br />

het, wel bemeester het.<br />

Hoe die voorgeskrewe boek saam met die studiegids gebruik moet word<br />

Hierdie studiegids is presies wat die naam impliseer. Jy gebruik die studiegids as 'n<br />

basis om die voorgeskrewe boek mee te bestudeer. Ons lei jou dus, met verdere<br />

verduidelikings in die studiegids, deur die boek. Moenie die boek sonder die hulp<br />

van die studiegids bestudeer nie.<br />

Navorsingsmetodiek en rekenaars _____________________________<br />

Vandag is die gebruik van die rekenaar by statistiese dataverwerking onmisbaar. Hierdie onderwerp word<br />

onder twee opskrifte behandel, naamlik:<br />

. Tipiese rekenaardrukstukke<br />

. Die internet/Weà reldwye Web (WWW)<br />

Tipiese rekenaardrukstukke<br />

Ons het dit goedgedink om tipiese rekenaardrukstukke by die studiemateriaal in<br />

vi<br />

te sluit om jou 'n idee te gee van die rol wat pakkette vir statistiese data-ontleding<br />

op 'n persoonlike rekenaar speel.<br />

Wanneer nuwe inligting in die vorm van 'n datastel aan jou beskikbaar gestel<br />

word, moet jy weet watter statistiese berekeninge om te doen, dit wil seà watter


statistieke om te bereken en ook hoe om dit te doen, hoe om die inligting uit die<br />

datastel te onttrek om dit te verstaan. In die oefeninge en werkopdragte gee ons<br />

vir jou oefening in bogenoemde (wat en hoe) deur klein datastelle en eenvoudige<br />

syfers te gebruik. In die praktyk sal jy egter meestal met groot datastelle en meer<br />

komplekse syfers te doen kry. Dan is dit nie meer prakties om self die berekeninge<br />

met 'n sakrekenaar te probeer doen nie ± jy sal BESLIS 'n rekenaar nodig heà . Ons<br />

een doelwit met hierdie kursus is om vir jou te wys hoe om die uitvoer van 'n<br />

sagteware program te lees (selfs al het jy nie toegang tot 'n rekenaar nie).<br />

Die voorgeskrewe boek bevat materiaal wat jou wys hoe om SPSS vir bepaalde<br />

statistiese ontledings te gebruik, maar jy kan ook sagteware soos STATISTICA<br />

gebruik wat uitgebreide ondersteuningsmateriaal op die meegaande CD bevat.<br />

Die voorgeskrewe boek bied ook voorbeelde in Microsoft Excel. Onthou, die doel<br />

met die rekenaardrukstukke is om jou die geleentheid te gee om die uitvoer te lees<br />

en om die verskillende statistiese konsepte daarop te identifiseer en te interpreteer.<br />

Indien jy nie toegang tot 'n rekenaar het nie, sal jy voorbeelde van die belangrikste<br />

rekenaardrukstukke ± wat jy moet kan uitken ± in verskillende studie-eenhede in<br />

die studiegids vind.<br />

Blaai gerus deur die voorgeskrewe boek en soek na voorbeelde van die uitvoer van<br />

'n rekenaarprogram as jy wil weet hoe dit lyk. Voorbeelde hiervan verskyn op<br />

bladsy 175 tot 179 in Tredoux en Durrheim (2002). Jy sal miskien in hierdie<br />

stadium nog nie die uitvoer verstaan nie, aangesien ons nog nie die betrokke<br />

konsepte verduidelik het nie. Ons wil eintlik net heà dat jy moet sien hoe die uitvoer<br />

van 'n program voorgestel word.<br />

Die internet/WeÃreldwye Web (WWW)<br />

Lees die laaste vier reeÈ ls van die voorwoord in Tredoux en Durrheim (2002) se<br />

boek oor die gebruik van die internet.<br />

Indien jy toegang tot die internet het, kan jy dit gerus benut om jou studie van<br />

navorsingsmetodes te verryk. Besoek webtuistes wat statistiese konsepte en<br />

tegnieke op 'n interaktiewe wyse aanbied. Ons kan dit beslis aanbeveel!<br />

Indien jy op die internet kan rondsnuffel, kan jy ook die bykomende hoofstuk op<br />

die CD oor internethulpbronne en gebruike daarvan deurwerk.<br />

Voorspoed! _____________________________________________<br />

Sterkte met jou studie! Ons hoop dat jy hierdie kursus sal geniet en dit wat jy hier<br />

gaan leer in die toekoms in jou werkomgewing sal kan gebruik.<br />

IOP2601/1 vii


viii<br />

Kyk nou baie deeglik na ons kursuskaart op die volgende bladsy.


16 Data-analise:<br />

'n fiktiewe<br />

organisasie<br />

9 Basiese konsepte van<br />

waarskynlikheid<br />

10 Die normaalverspreiding<br />

11 Steekproefdistribusies en<br />

hipotesetoetsing<br />

12 Hipotesetoetse vir gemiddeldes: t-toetse<br />

13 Hipotesetoetse vir gemiddeldes:<br />

eenrigting-variansieontleding<br />

14 Die chi-kwadraattoets<br />

15 OnderskeidingsvermoeÈ<br />

1 Inleiding tot navorsing<br />

en statistiek<br />

2 Die taal van statistiek<br />

3 Basiese wiskundige berekenings<br />

wat in statistiek gebruik word<br />

4 Voorstelling van data<br />

5 Maatstawwe van sentrale neiging<br />

6 Maatstawwe van varieerbaarheid<br />

7 Korrelasie<br />

8 Regressie


1 Inleiding tot navorsing en statistiek<br />

2 Die taal van statistiek<br />

3 Basiese wiskundige berekenings<br />

wat in statistiek gebruik word


1<br />

studie-eenheid een<br />

Inleiding tot navorsing<br />

en statistiek<br />

Studente wonder dikwels waarom die opleiding van voornemende<br />

bedryfsielkundiges 'n kursus in navorsing insluit. Om hierdie vraag te<br />

beantwoord, moet ons eerstens weet wat navorsing behels. Hierdie studieeenheid<br />

stel jou bekend aan navorsing, hoe bedryfsielkundiges navorsing gebruik<br />

en die basiese navorsingsproses. Ons sal ook die spesifieke fokus van hierdie<br />

module ten opsigte van die breeÈ r navorsingsproses verduidelik. Hierdie studieeenheid<br />

sal afsluit met die bekendstelling van ons revolusioneà re navorsingsprojek<br />

wat ons dwarsdeur hierdie studiegids sal ondersoek.<br />

Wat is navorsing? ________________________________________<br />

In 'n onlangse navorsingsveldtog vir 'n internasionale fiksheidsentrum is die<br />

volgende inligting vrygestel:<br />

FIGUUR 1: Advertensieveldtog van 'n internasionale fiksheidsentrum<br />

(Verkry van http:www.virginactive.co.za op 2009/10/30)<br />

bladsy 2 . studie-eenheid 1 inleiding tot navorsing en statistiek


Is dit slegs inligting wat deel van 'n advertensieveldtog uitmaak of kan hierdie<br />

inligting regtig waar wees? Wat as die advertensie gelees het: ``Navorsing het<br />

getoon dat ...'', sou jy dan geglo het dat dit die waarheid is?<br />

Wat beteken die woord navorsing vir jou?<br />

. afdeling 1 agtergrond<br />

................................................................................................................................<br />

................................................................................................................................<br />

................................................................................................................................<br />

................................................................................................................................<br />

Die woord navorsing word dikwels in alledaagse taal en met verskeie betekenisse<br />

op verskillende tye gebruik. Gevolglik bestaan daar dikwels heelwat<br />

wanopvattings daaroor. 'n Voorbeeld hiervan is dat navorsing 'n aktiwiteit is<br />

wat ietwat eksklusief en verwyder van die alledaagse lewe is, of dat navorsers<br />

afsydige individue in wit jasse is wat hulle in laboratoriums met rotte afsonder<br />

(Leedy & Omrod, 2010)!<br />

Maar in werklikheid is navorsing slegs 'n proses waardeur ons vrae kan<br />

beantwoord. Dit is 'n sistematiese proses van die insameling, ontleding en<br />

interpretering van inligting (of data soos dit in navorsingsterme genoem word) om<br />

ons begrip te verbeter van 'n aspek waarin ons belangstel of besorg oor is (Leedy<br />

& Ormrod, 2010).<br />

'n Verdere definisie van navorsing is dat dit 'n sistematiese studie of ondersoek<br />

van verskynsels volgens wetenskaplike beginsels is. Wat beteken dit om 'n<br />

sistematiese studie volgens wetenskaplike beginsels te doen? Dit klink<br />

ingewikkeld. Wat dit in werklikheid beteken is dat jy inligting op so 'n wyse<br />

insamel dat jy bewyse sal heà om te toon dat jou bewerings die waarheid is. Met<br />

ander woorde, jy gebruik spesifieke strategieeÈ en metodes om inligting op so 'n<br />

wyse in te samel dat dit betroubaar en geldig sal wees. Hierdie proses sal jou<br />

daarom in staat stel om aan te toon of die inligting wat in die navorsingsveldtog<br />

wat hierbo aangedui is in werklikheid 'n akkurate weerspieeÈ ling is. Navorsing help<br />

ons daarom om inligting op so 'n wyse in te samel dat ons die waarheid of selfs<br />

nuwe kennis kan ontdek.<br />

Maar selfs al weet jy van hierdie inligting kan jy dalk steeds wonder waar<br />

navorsing in die veld van Bedryfsielkunde inpas.<br />

Navorsing in Bedryfsielkunde ________________________________<br />

Soos ons genoem het, behels navorsing die beantwoording van vrae of die oplos<br />

van probleme. Oorweeg die volgende vrae:<br />

. Hoe voel generasie Y oor unies in organisasies?<br />

. Wat is die geskikste tyd om haarsorgprodukte vir vroue op televisie te<br />

adverteer?<br />

bladsy 3


. Is dit billik om persoonlikheidseienskappe te gebruik om werksprestasie te<br />

voorspel?<br />

. Wat is die optimale aantal mense om in 'n virtuele weà reldspan te werk?<br />

. Wat doen universiteite om studente vir die beroepsweà reld voor te berei?<br />

. Watter etiek is betrokke in die gebruik van gerekenariseerde toetsing?<br />

Al hierdie vrae val in die raamwerk van Bedryfsielkunde. Figuur 2 illustreer hoe<br />

elk van hierdie vrae op 'n aantal gebiede van Bedryfsielkunde van toepassing is.<br />

Kan jy aan 'n paar vrae in jou werkomgewing dink of in sommige ander modules<br />

waarvan jy graag die antwoord sal wil weet?<br />

................................................................................................................................<br />

................................................................................................................................<br />

................................................................................................................................<br />

................................................................................................................................<br />

Die waarde van navorsing leà daarom eerstens in die feit dat kennis van navorsing<br />

help om vrae binne jou spesifieke studieveld of werkomgewing te beantwoord.<br />

Organisatoriese<br />

Sielkunde:<br />

Wat is die optimale<br />

aantal mense<br />

om in 'n virtuele<br />

weà reldspan<br />

te werk?<br />

Loopbaansielkunde:<br />

Wat doen<br />

universiteite om<br />

studente vir die<br />

beroepsweà reld<br />

voor te berei?<br />

Verbruikersielkunde:<br />

Wanneer is die geskikste<br />

tyd om haarsorgprodukte<br />

vir vroue<br />

op televisie te<br />

adverteer?<br />

Bedryfsielkunde<br />

Arbeidsverhoudinge:<br />

Hoe voel generasie<br />

Y oor unies<br />

in organisasies?<br />

FIGUUR 2: Navorsingsvrae in Bedryfsielkunde<br />

bladsy 4 . studie-eenheid 1 inleiding tot navorsing en statistiek<br />

Sielkundige<br />

assessering:<br />

Watter etiek is<br />

betrokke by die<br />

gebruik van<br />

gerekenariseerde<br />

toetsing<br />

Personeelsielkunde:<br />

Is dit billik om<br />

persoonlikheidseienskappe<br />

te gebruik<br />

om werkverrigting<br />

te voorspel?


. afdeling 1 agtergrond<br />

Kennis van navorsing is ook nuttig om die werk van ander wetenskaplik te<br />

interpreteer en te evalueer. Dink na oor die volgende scenario: Jou organisasie is<br />

op die punt om R3 miljoen vir die ingebruikneming van 'n nuwe prestasieevalueringstelsel<br />

te bestee. Die persone wat die stelsel ontwikkel maak 'n aantal<br />

aannames oor die nut en voordele van hul stelsel. Met jou kennis van navorsing<br />

sal jy in staat wees om te bepaal of hierdie aannames werklik geldig is voordat jou<br />

organisasie in hierdie stelsel investeer.<br />

Kennis van navorsing sal jou daarom toerus met vaardighede wat jou sal help om<br />

probleme te kan oplos en vrae te kan beantwoord op 'n wyse wat wetenskaplik en<br />

betekenisvol is en wat die wins van die organisasie sal verhoog. Jy sal jou kennis<br />

van navorsing in jou werkomgewing sowel as in jou alledaagse lewe kan toepas<br />

om vrae te vra of probleme in jou gemeenskap of gesin op te los. Is dit genoeg<br />

motivering vir jou om meer oor navorsing te wete te kom?<br />

Ons het gesien navorsing begin met 'n vraag wat beantwoord moet word of 'n<br />

probleem wat opgelos moet word. Dit sal die doelwit van die meeste<br />

navorsingsprojekte wees. Navorsing word dan die proses waardeur nuwe kennis<br />

ontdek word of geõÈ dentifiseerde probleme opgelos word. Kom ons kyk nou na die<br />

onderskeie stappe wat in die navorsingsproses betrokke is.<br />

Die navorsingsproses _____________________________________<br />

Alhoewel sekere variasies mag voorkom, volg die meeste navorsingsprojekte wat<br />

uitgevoer word 'n basiese proses. Figuur 3 toon die tipiese stappe wat navorsers<br />

volg om navorsing te doen. Die navorsingsproses is basies 'n vyfstap-prosedure.<br />

. Eerstens begin die navorsingsproses met die indentifisering van die probleem:<br />

Wat is die vraag wat beantwoord moet word of wat is die probleem wat opgelos<br />

moet word?<br />

. Tweedens, hoe ontwerp jy 'n studie om die vraag te beantwoord? (Wie gaan by<br />

die studie betrokke wees en wanneer en hoe gaan hulle betrokke wees?)<br />

. Derdens, hoe verkry jy die inligting wat jy nodig het en samel die nodige data in<br />

om die navorsingsvraag te beantwoord?<br />

. Vierdens, hoe ontleed jy die data? (Met ander woorde, hoe maak jy sin uit al die<br />

inligting wat ingesamel is?)<br />

. Laastens, hoe maak jy gevolgtrekkings uit die data wat ontleed is om die<br />

navorsingsvraag te beantwoord?<br />

Jy sal dwarsdeur hierdie module die geleentheid heà om te sien hoe hierdie<br />

navorsingsproses prakties toegepas word. Ons sal kyk na 'n aantal verskillende<br />

navorsingsvrae, kortliks bespreek hoe so 'n navorsingsvraag ondersoek kan word<br />

(ontwerp); die wyse noem waarop data ingesamel word, bespreek hoe die data<br />

ontleed word en laastens illustreer hoe om gevolgtrekkings te maak oor die<br />

navorsingsvraag op grond van die data-ontleding. Hierdie module fokus egter<br />

meer op die vierde stap van die navorsingsproses, naamlik data-ontleding. Dit is<br />

bladsy 5


Navorsingsvraag<br />

Gevolgtrekkings<br />

FIGUUR 3: Die Navorsingsproses<br />

Navorsingsontwerp<br />

Data analise<br />

Data insameling<br />

daarop gemik om inligting te verskaf oor sekere tegnieke wat jy moet leer wat<br />

gebruik kan word om sin uit die data te maak wat ingesamel is en jou te leer om<br />

betekenisvolle gevolgtrekkings hieruit te maak. Hierdie tegnieke word<br />

gesamentlik Statistiek genoem.<br />

Statistiek ______________________________________________<br />

Die woord statistiek ontlok dikwels 'n sterk emosionele reaksie van studente.<br />

Sommige studente is opgewonde om meer oor statistiek te leer, ander mag 'n<br />

bietjie versigtig wees, terwyl sekere studente selfs die onderwerp met vrees en 'n<br />

voorgevoel benader!<br />

In hierdie stadium is dit moontlik dat jy nie baie vertroud met die studieveld van<br />

statistiek is nie. Statistiek, soos enige ander spesialisveld, het sekere unieke<br />

terminologie en amper 'n taal van sy eie. Studie-eenheid 2 sal daarom jou eerstens<br />

vertroud maak met die basiese terme en belangrike konsepte wat in hierdie veld<br />

gebruik word.<br />

Navorsing het bewys (byvoorbeeld Brown & Brown, 1995; Onwuegbuzie, 2000;<br />

Schau, 2003) dat studente se houding teenoor statistiek dikwels deur verskeie<br />

faktore beõÈ nvloed word. Die eerste is die graad waartoe studente hulself as vaardig<br />

in wiskunde beskou. Interessant genoeg, is dit nie die aantal vorige<br />

wiskundekursusse wat studente voltooi het of hoe goed hulle in hierdie kursusse<br />

gedoen het nie, maar eerder 'n baie subjektiewe siening van hoe vaardig hulle<br />

hulleself in wiskunde ag wat hulle houding teenoor statistiek bepaal.<br />

Laat ons jou onmiddellik hieroor gerus stel: alhoewel jy sekere basiese algebraõÈ ese<br />

beginsels moet ken, is dit nie 'n kursus in wiskunde nie. Om berekenings te doen,<br />

is slegs 'n klein deel van die werklike inhoud van die onderwerp. Selfs vir studente<br />

wat nooit blootstelling aan wiskunde gehad het nie, hoef die slaag van hierdie<br />

module nie 'n onoorkomelike probleem te wees nie. Studie-eenheid 3 sal al die<br />

bladsy 6 . studie-eenheid 1 inleiding tot navorsing en statistiek


asiese algebraberekenings hersien wat in hierdie module gebruik word. Nadat jy<br />

deeglik deur hierdie studie-eenheid gewerk het, sal jy in staat wees om die res van<br />

hierdie module met vertroue te benader.<br />

Wat ook belangrik is om te weet, is dat statistiek die beste geleer word deur dit te<br />

doen. Jy sal daarom aktief moet deelneem deur die res van die studiegids om die<br />

tegnieke te bemeester wat jy sal leer. Daar is ook pas genoem dat jy die<br />

geleentheid sal heà om te sien hoe die navorsingsproses prakties in hierdie module<br />

toegepas word. Ons sal daarom 'n spesifieke navorsingsprojek as praktiese<br />

illustrasie dwarsdeur die res van die studiegids gebruik. Die besonderhede van<br />

hierdie navorsingprojek word volgende beskryf.<br />

Bekendstelling van ons navorsingsprojek ________________________<br />

Verbeel jou dat jy deel is van 'n eksklusiewe navorsingspan om deel te neem aan 'n<br />

revolusioneà re en opwindende navorsingsprojek. Hierdie navorsingsprojek beloof<br />

om nuuswaardig en die grootste te wees wat die vermaaklikheidsweà reld hierdie<br />

jaar gaan beleef! Jy het Big Brother gesien, jy het Idols gesien en jy het The<br />

Apprentice gesien. Maar jy het nog nooit 'n werklikheidsvertoning gesien wat al<br />

drie hiervan kombineer nie!! Jy word uitgenooi om deel van 'n navorsingspan te<br />

wees wat hierdie nuwe en opwindende werklikheidsvertoning wat hierdie jaar<br />

bekengestel word, te monitor, ondersoek en te evalueer. Kom ons vertel jou meer<br />

van Nuwe Sterre: Die volgende advertensie is in al die groot koerante geplaas:<br />

NUWE STERRE __________________________________________<br />

Is dit jou droom om 'n ster te word? Ons stel bekend die grootste geleentheid in<br />

die mees opwindende werklikheidsvertoning wat jy nog ooit gesien het! Nuwe<br />

Sterre is op soek na sterre in wording wat die eienskappe het wat nodig is om die<br />

hitte van die kollig te verduur en naam te maak in die vermaaklikheidsweà reld!<br />

Die reeÈ ls van ``Nuwe Sterre'' is soos volg:<br />

. afdeling 1 agtergrond<br />

. Voordat iemand aan die Nuwe Sterre-sangkompetisie kan deelneem, moet hulle<br />

'n moordende leerlingskapprogram van drie weke deurloop.<br />

. Die hele leerlingskapprogram van drie weke sal 24 uur per dag verfilm word ...<br />

en ... wat meer is!!!!! alles sal regstreeks op televisie gebeeldsend word asook op<br />

die internet vertoon word. Die Nuwe Sterre-webtuiste sal regstreekse film van<br />

die deelnemers uitsaai soos hulle deur die leerlingskapprogram gaan.<br />

. Die leerlingskapprogram sal vereis dat deelnemers in 'n luukse gastehuis saam<br />

met die ander deelnemers bly terwyl hulle vir die lewe van 'n glanspersoon<br />

voorberei.<br />

. Voorbereidingsaktiwiteite sluit in<br />

± 'n algehele verandering van voorkoms<br />

± sielkundige assesserings<br />

bladsy 7


± dramaklasse<br />

± stemopleidingsessies<br />

± bywoning van kursusse wat aangebied word oor hoe om op te tree tydens<br />

onderhoudvoering<br />

± opleiding oor hoe om aandag van aanhangers en die media te hanteer.<br />

. Tien deelnemers sal gekies word om aan die Nuwe Sterre-leerlingskapprogram<br />

deel te neem, maar slegs vyf van hulle sal gekies word om aan die finale Nuwe<br />

Sterre-sangkompetisie deel te neem.<br />

. Die wenner van Nuwe Sterre sal die volgende wen:<br />

± 'n Internasionale opnamekontrak<br />

± 'n Kontantprys ter waarde van R1 000 000.00<br />

± 'n Drie-maande kontrak as die hoofsanger van die vertoning ``Grease'' op<br />

Broadway in New York.<br />

. Gedurende die leerlingskapprogram van drie weke sal kykers vir hulle<br />

gunsteling ``ster-in-wording'' kan stem en hulle sal ook met hulle kan<br />

kommunikeer deur middel van die sosiale netwerkfasiliteit wat op die Nuwe<br />

Sterre-webtuiste beskikbaar is. Alle kommunikasie en deelname aan hierdie<br />

sosiale netwerkfasiliteit sal noukeurig deur administrateurs, Nuwe Sterrebeoordelaars<br />

en lede van die paneel van die etiese komitee gemonitor word.<br />

En kykers word selfs meer aangebied<br />

. hulle sal 'n paar van die beoordelaars ook kan uitstem!<br />

Hoe sal die stemmery werk? ________________________________<br />

. Kykers kan vir deelnemers stem en punte gee op grond van hulle<br />

kommunikasievaardighede en interaksie met ander deelnemers, deelname aan<br />

die proses, sterkwaliteit, uitvoeringtalent asook hulle kanse om die kompetisie<br />

te wen.<br />

. Die stemming en gee van punte sal twee maal per week op Maandae en Vrydae<br />

plaasvind. Deelnemers en beoordelaars wat uitgestem word, sal op Dinsdae en<br />

Saterdae in kennis gestel word. Om dubbelstemming uit te skakel, sal die finale<br />

stemming vir die Nuwe Sterre-sangkompetisie slegs gedoen word deur die<br />

gehoor wat by die regstreekse televisie-uitsending van die vertoning<br />

teenwoordig is.<br />

. Deelnemers is uitgenooi om aansoek te doen deur 'n persoonlike aanbieding<br />

van hul CV's deur middel van 'n video-opname in te dien. Die aanbieding moes<br />

verwysing insluit na hul ouderdom, geslag, ras, opleiding, beroep, huidige<br />

inkomste en uitgawes, loopbaanaspirasies, vorige optree- en sangondervinding<br />

asook 'n motivering waarom hulle glo hulle in staat is om die eerste Nuwe<br />

Sterre-ster te wees.<br />

bladsy 8 . studie-eenheid 1 inleiding tot navorsing en statistiek


Ontmoet die 10 Nuwe Sterre-kandidate wat gekies is om aan die 24/7 Nuwe Sterreleerlingskapprogram<br />

vir drie weke deel te neem:<br />

. Vuyo K<br />

± Swart vrou<br />

± 20 jaar oud<br />

± Enkellopend<br />

± Derdejaar Drama-en-Kunsstudent<br />

± Sien haarself as die ``volgende beste ding'' in die musiekbedryf<br />

± Baie ambisieus, spontaan, en glo sy is gereed vir glorie en rykdom<br />

. Lebo<br />

± Swart man<br />

± 20 jaar oud<br />

± Enkellopend, maar onbeskikbaar, soos hy daarvan hou om homself bekend<br />

te stel<br />

± IT-administrateur<br />

± Glo hy het talent en sien hierdie kompetisie as iets nuuts om op die proef te<br />

stel, aangesien hy dink dit sal hom uitdaag om afstand van sy<br />

bleeksielmentaliteit te doen<br />

. Sasha<br />

± Wit vrou<br />

± 19 jaar oud<br />

± Tweedejaar BCom-student in Bedryfsielkunde aan Unisa<br />

± Sy beskryf haarself as 'n ``klein bom'' as gevolg van haar fyn liggaamsbou<br />

en groot stem<br />

± Sy sien daarna uit om die ``helder stadsligte'' te ervaar wat met 'n loopbaan<br />

in vermaaklikheid geassossieer word.<br />

. Susan<br />

. afdeling 1 agtergrond<br />

± Swart vrou<br />

± Enkellopend<br />

± 27 jaar oud<br />

± Baie ambisieus en wil meer wees as bloot 'n kunstenaar (``ster'')<br />

± Sien haarself as 'n entrepeneur wat eendag haar eie groot opname-ateljee<br />

wil bestuur<br />

± Ietwat berekenend in haar interpersoonlike vaardighede ± is geneig om te<br />

werk aan verhoudings met diegene wat haar kan help of tot voordeel vir<br />

haar op die lange duur kan wees<br />

± Baie ongeduldig met persone wat enige persoonlike tekortkoming of<br />

weerloosheid het<br />

± Baie gefokus en veeleisend wanneer sy met ander werk ± kan moeilik in 'n<br />

groep wees<br />

bladsy 9


. David<br />

± Wit man<br />

± 25 jaar oud<br />

± Enkellopend<br />

± Jong IT-kundige wat 'n klein besigheid tydelik saam met vriende van die<br />

huis af bestuur terwyl hy droom om 'n kunstenaar te word<br />

± Leefstyl en pret is vir hom baie belangrik ± nie baie ambisieus nie ± dink die<br />

die lewe van 'n kunstenaar is een waar die geld net sal instroom!<br />

± Is op soek na die groot geleentheid wat sy sangloopbaan met mening sal<br />

inlui ± sy motivering waarom hy in die eerste plek aansoek gedoen het!!<br />

. Tshepo<br />

± Swart man<br />

± 26jaar oud<br />

± Enkellopend<br />

± Tegniese agtergrond ± klankingenieur<br />

± Wil 'n loopbaan in die opnamebedryf volg ± maar sien die wyse waarop hy<br />

die veld betree om eers naam as kunstenaar te maak<br />

± Hy het kontakte in die musiekbedryf en glo dat hulle name hom sal help om<br />

vinniger opgang in sy loopbaan te maak<br />

. Indresan<br />

± IndieÈ rman<br />

± 25 jaar oud<br />

± Verloof aan sy meisie van vyf jaar<br />

± Hy is sedert hy 'n klein seuntjie was deur Bollywood geõÈ nspireer.<br />

± Hy het 'n passie en toewyding om 'n Suid-Afrikaanse Bollywoodproduksiemaatskappy<br />

van sy eie die lig te laat sien.<br />

± Hy is bekend daarvoor dat hy alle perke oorskry en advies van ander<br />

ignoreer.<br />

± Hy kan die beste as dramaties en selfbevorderlik beskryf word.<br />

. Shelly<br />

± Kleurlingvrou<br />

± 28 jaar oud<br />

± Sy is vier jaar gelede as Mejuffrou Langebaan gekroon.<br />

± Sy het haar modelloopbaan onderbreek om haar graad in Kommunikasie<br />

en Bemarking aan die Universiteit van die Weskaap te voltooi.<br />

± Sy wil nou haar lewe in die openbare oog voortsit en glo sy het baie om te<br />

bied.<br />

± Haar voorkoms en houding sal opmaak vir enige gebreke in haar<br />

sangtalent.<br />

bladsy 10 . studie-eenheid 1 inleiding tot navorsing en statistiek


. Cameron<br />

± Kleurlingman<br />

± 23 jaar oud<br />

± Studeer Politieke en Sosiale Wetenskappe voltyds aan Wits<br />

± Hy wil graag eendag 'n ``ernstige'' loopbaan heà , maar sien geen kwaad<br />

daarin om pret te heà terwyl hy nog jonk is nie.<br />

± Hy heg groot waarde aan openbare erkenning van sy dade en prestasies.<br />

. Kerry<br />

± IndieÈ rvrou<br />

± 21 jaar oud<br />

± Op aanmoediging van haar pa is sy tans ingeskryf vir haar graad in<br />

Rekeningkunde aan die Universiteit van KwaZulu-Natal.<br />

± Sy is sedert kleuterskool lief vir dans, sing en drama en is tans een van die<br />

Sharks-meisies wat op die veld dans terwyl rugbywedstryde gespeel word.<br />

± Sy is 'n ekstrovert en floreer op sosiale interaksie.<br />

± Sy is op soek na 'n leefstyl van vermaak en opwinding.<br />

En die beoordelaars is:<br />

. StellaDebark<br />

± Wit vrou<br />

± 53 jaar oud<br />

± Kinderster wat nie so goed in haar volwasse lewe gevaar het nie<br />

± Nou sing sy in jazz-nagklubs en het nie enige albums in amper twee<br />

dekades vervaardig nie<br />

± Twee kinders wat ook in die musiekbedryf is<br />

± Dink die vertoning sal haar die kans gee om haar weer tot roem te bevorder<br />

± Alhoewel sy jong talent aanmoedig, kan sy baie onsensitief wees in haar<br />

kritiek as sy dink jy het nie die nodige talent nie<br />

. Ricco Milan<br />

± 37-jarige enkellopende man<br />

± Mode-ontwerper en platejoggie<br />

± Is lief vir musiek en passievol oor modes, glo albei bepaal sukses in die<br />

vermaaklikheidsbedryf<br />

± Sien hierdie as 'n geleentheid om homself te bevorder<br />

± Baie energiek, vriendelik en aanmoedigend, sien altyd die positiewe in<br />

mense<br />

. Zolisa Mafupha aka Zee M<br />

± 31-jarige suksesvolle swart musikant<br />

± Het verskeie bekroonde treffers<br />

± Enkellopend<br />

. afdeling 1 agtergrond<br />

bladsy 11


± Baie beskeie en gretig om jong en vars talent te ontdek<br />

± Opgewonde om as beoordelaar gekies te word aangesien sy dit sien as 'n<br />

geleentheid om jong talent te ontwikkel<br />

. Angie Motseneka<br />

± Swart vrou<br />

± 35 jaar oud<br />

± MBA-student wat tans 'n bestuursposisie in 'n groothandelsmaatskappy<br />

beklee.<br />

± Getroud ± twee tienerkinders<br />

± Ietwat hooggespanne ± kan emosioneel onder spanning reageer<br />

± Persoonlike ontwikkeling baie belangrik vir haar<br />

± Taamlik krities teenoor mense wat nie verantwoordelikheid vir die gevolge<br />

van hulle besluite wil neem nie ± sal dit ook teenoor die deelnemers<br />

openbaar<br />

. Brian Mahlangu<br />

± Praktiserende prokureur<br />

± 29 jaar oud<br />

± Enkellopend en toon ywerige belangstelling in enkellopende jong vroue ±<br />

kan moontlik bevooroordeeld teenoor hulle wees?<br />

± Het vir sewe jaar in die regsveld gewerk<br />

± Goeie interpersoonlike vaardighede<br />

± kon goed onder druk presteer<br />

En nou vir die navorsingsprojek:<br />

Aangesien dit die eerste keer is dat 'n werklikheidsvertoning van hierdie aard<br />

aangebied gaan word, is jy, as deel van 'n groep navorsers, uitgenooi om 'n aantal<br />

aspekte van die aansoekers, deelnemers asook kykers dwarsdeur die<br />

bekendstelling en die eerste sessie van hierdie werklikheidsvertoning te ondersoek.<br />

Sommige van die navorsingsvrae wat jy gevra word om te ondersoek en oor verslag te doen, is die<br />

volgende:<br />

. Hoeveel deelnemers uit die verskillende rassegroepe het vir die kompetisie<br />

ingeskryf?<br />

. Wat is die inkomsteverspreiding van al die aansoekers?<br />

. Wat is die biografiese eienskappe van die aansoekers, deelnemers,<br />

televisiekykers en internetdeelnemers onderskeidelik?<br />

. Wat is die verhouding tussen die puntetellings van die internet-interaksie op die<br />

sosiale netwerkwebtuiste en die stemming vir die 10 deelnemers?<br />

. Is daar 'n verband tussen die hoeveelheid tyd wat kykers bestee om die program<br />

te kyk en die frekwensie waarmee hulle vir deelnemers stem?<br />

. Kan die kykers se jare van onderrig die aantal ure voorspel wat hulle na die<br />

vertoning kyk of die webtuiste besoek?<br />

bladsy 12 . studie-eenheid 1 inleiding tot navorsing en statistiek


. Wat is die verhouding, persentasie en aantal kykers wat aan die sosiale<br />

netwerkwebtuiste deelneem?<br />

. Is daar 'n verskil in die vlakke van gelukkigheid van deelnemers voor en na die<br />

leerlingskapprogram?<br />

. Is daar 'n verskil tussen die manlike en vroulike deelnemers en hul vermoeÈ om<br />

aandag van die media te hanteer?<br />

. Gee manlike stemmers hoeÈ r punte vir oulike, jong, vroulike deelnemers as vir<br />

manlike deelemers?<br />

. Is daar 'n verskil in die emosionele intelligensie van aansoekers, deelnemers aan<br />

die leerlingskapprogram en deelnemers wat aan die finale Nuwe Sterresangkompetisie<br />

deelneem?<br />

. Is daar 'n verskil tussen kykers se puntetelling vir deelnemers op grond van<br />

hulle haarkleur (blond, rooi of bruin hare)?<br />

Kan jy dink aan ander vrae wat jy uit hierdie projek beantwoord wil heà ? Lys dit<br />

hier:<br />

................................................................................................................................<br />

................................................................................................................................<br />

................................................................................................................................<br />

................................................................................................................................<br />

Hierdie navorsingsprojek sal as grondslag gebruik word vir ons praktiese<br />

illustrasies in die res van hierdie studiegids.<br />

Ons nooi jou nou uit om ons op hierdie opwindende reis te vergesel om meer oor<br />

navorsing en spesifiek statistiek in die navorsingsproses te leer.<br />

Nadat jy hierdie studie-eenheid voltooi het, moet jy in staat wees om:<br />

. navorsing in jou eie woorde te omskryf<br />

. die basiese navorsingsproses te omskryf<br />

. 'n navorsingsprobleem te identifiseer<br />

. afdeling 1 agtergrond<br />

bladsy 13


2<br />

studie-eenheid twee<br />

Die taal van statistiek<br />

Noudat jy 'n goeie idee het van waarom 'n studie van<br />

navorsingsmetodiek vir jou belangrik is, en hoe bedryfsielkundige<br />

navorsing verloop, wil ons jou bekendstel aan die taal van statistiek.<br />

In hierdie studie-eenheid stel ons die volgende bekend:<br />

. kwantitatiewe metodes en waarom dit gebruik word<br />

. die klassifikasie van statistiese tegnieke<br />

. belangrike konsepte wat onderliggend is aan enige statistiese ontleding van data<br />

Kwantitatiewe metodes _____________________________________<br />

Soos jy tot dusver uit die bespreking kon aflei, sal jy met syfers in hierdie kursus<br />

werk. Wanneer 'n mens enige vorm van inligting of data neem, is dit moontlik om<br />

dit in die vorm van syfers te beskryf. 'n Eenvoudige voorbeeld hiervan kan wees:<br />

Indien ons al die aansoekers van Nuwe Sterre gevra het om ons te vertel hoeveel<br />

vertroue hulle het dat hulle as een van die 10 deelnemers gekies sal word, kon ons<br />

hulle gevra het om hulle gevoel op 'n skaal van 1 tot 10 te evalueer, waar 1 sal seÃ<br />

``Ek voel ek het geen kans nie,'' 5 sal seà ``Ek voel ek het 'n 50/50-kans'' en 10 sal seÃ<br />

``Ek voel ek sal definitief gekies word''.<br />

Wanneer 'n mens data in syfers omskakel, soos ons in bostaande voorbeeld<br />

gedoen het, kwantifiseer 'n mens die inligting. Kwantitatiewe metodes is daarop<br />

gemik om data in die vorm van syfers uit te druk. Wat is die waarde hiervan?<br />

Waarom is dit nuttig om data in syfers om te skakel? Eerstens, syfers is deel van<br />

ons alledaagse lewe.<br />

Dink net aan die tarief wat jy vir die gebruik van jou selfoon betaal en hoeveel<br />

geld jy nodig het om die maand uit te kom. Wanneer jy weer inkopies gaan doen,<br />

dink aan hoe gekwantifiseer die bedrywighede in 'n winkel is. Dink aan die bedrag<br />

wat jy vir 'n artikel betaal, die wins wat daarop gemaak word, belastings wat<br />

gehef word, die huur vir die perseel en salarisse, om maar enkele voorbeelde te<br />

noem. Kwantifisering en kwantitatiewe denke is dus ewe onvermydelik in die<br />

daaglikse lewe.<br />

Afgesien hiervan het kwantitatiewe metodes ook spesifieke voordele.<br />

bladsy 14 . studie-eenheid 2 die taal van statistiek


Kwantitatiewe metodes is besonder nuttig omdat dit<br />

. inligting doeltreffend oordra<br />

. voorsiening maak vir die hermodellering van lewenswerklike verskynsels<br />

. deel uitmaak van 'n goed ontwerpte en kragtige dissiplineà re taal<br />

Gee op grond van die inligting oor die voordele van kwantitatiewe metodes jou eie<br />

voorbeeld om elk van die drie voordele van kwantitatiewe metodes te verduidelik.<br />

1 ........................................................................................................................<br />

2 ........................................................................................................................<br />

3 ........................................................................................................................<br />

In hierdie studie-eenheid skop ons af met die eerste hoofstuk van Tredoux en<br />

Durrheim (2002). Vergelyk jou voorbeelde met die drie voorbeelde wat volledig<br />

van bladsy 3 tot 7 in die afdeling ``The advantages of quantitative methods'' in<br />

Tredoux en Durrheim (2002) beskryf word.<br />

1. Doeltreffendheid: Om syfers bekend te maak, byvoorbeeld die Suid-<br />

Afrikaanse nasionale sensusopname.<br />

2. Benadering/modellering: Om verskynsels in die weà reld te bestudeer,<br />

byvoorbeeld 'n ruimtelike model vir die verklaring van die beoordeling van<br />

mensegesigte vir eenvormigheid.<br />

3. 'n Kragtige taal: Byvoorbeeld, die weerkaart.<br />

Kwantifisering dien as steunpilaar vir twee algemene soorte funksies. Dit kan<br />

enersyds 'n infrastrukturele of administratiewe funksie verrig en andersyds steun<br />

dit argumentasie en redevoering. In die sosiale wetenskappe stel ons veral belang<br />

in die gebruik van die gegewens wat deur kwantitatiewe metodes beskikbaar gestel<br />

word om ons argumente te staaf. Ons is geneig om probabilistiese metodes toe te<br />

pas, eerder as die deterministiese model wat in sommige wetenskapsvorme gevolg<br />

word.<br />

Lees die bespreking van die funksies van kwantifisering van bladsy 3 tot 7 in<br />

Tredoux en Durrheim (2002). Gee jou eie voorbeeld van 'n bewering of stelling<br />

wat deterministies is en een wat probabilisties is.<br />

1 ........................................................................................................................<br />

2 ........................................................................................................................<br />

Vergelyk jou voorbeelde met die volgende:<br />

. afdeling 1 agtergrond<br />

bladsy 15


1. 'n Deterministiese bewering: besonder streng opvoedingspatrone in die<br />

kleinkinderjare gee aanleiding tot 'n outoriteà re persoonlikheid.<br />

Sorg dat jy die deterministiese bewering vir 'n noodwendigheids- of<br />

voldoendheidsvoorwaarde toets. Dit wil seà dat die teenwoordigheid van A<br />

noodwendig tot B lei.<br />

2. 'n Probabilistiese bewering, daarenteen, moet voorsiening maak vir die<br />

moontlikheid dat die teenwoordigheid van A nie noodwendig tot B gaan lei<br />

nie, en of dit tot B aanleiding gee of nie, kan op grond van kansverwagting<br />

verklaar word. Gevolglik beteken die bewering dat blootstelling aan die<br />

karsinogene in sigaretrook kanker veroorsaak nie dat daardie blootstelling<br />

beslis tot kanker aanleiding gaan gee nie, maar dat dit kanker sal veroorsaak<br />

in meer gevalle as wat ons met nieblootstelling te wagte kan wees.<br />

Klassifisering van statistiese tegnieke vir hierdie kursus _____________<br />

Statistiese metodes en tegnieke kan in die volgende breeÈ kategorieeÈ ingedeel word:<br />

Beskrywende statistiek: 'n Tegniek wat gebruik word om data te organiseer, op te<br />

som en te beskryf. Dit is die beskrywende navorsingsbenadering.<br />

InferensieÈ le statistiek: 'n Tegniek wat op steekproewe toegepas word om afleidings<br />

oor populasies te maak. Dit staan ook bekend as die eksperimentele<br />

navorsingsbenadering.<br />

Basiese begrippe _________________________________________<br />

Voordat jy in alle erns met jou studie van beskrywende en inferensieÈ le statistiek<br />

begin, moet jy enkele belangrike begrippe onderliggend aan statistiese dataanalise<br />

deeglik onder die knie kry. Dit sluit terme soos die volgende in:<br />

. veranderlikes en konstantes<br />

. metingskale<br />

. steekproewe, populasies, statistieke en parameters<br />

Veranderlikes ___________________________________________<br />

Hiermee neem jy jou eerste tree in die gebruik van 'n kwantitatiewe taal, naamlik<br />

om voorwerpe of entiteite in simbole en konsepte van daardie taal om te sit. Die<br />

eenvoudigste konsep is die van 'n veranderlike. Die aspekte wat ons bestudeer,<br />

word veranderlikes genoem. Wanneer ons byvoorbeeld lengte meet, praat ons van<br />

lengte as 'n veranderlike en die simbool daarvoor is X. Temperatuur en massa is<br />

ook voorbeelde van veranderlikes.<br />

Kom ons kyk na 'n voorbeeld van ons Nuwe Sterre-vertoning om te bepaal wat 'n<br />

bladsy 16 . studie-eenheid 2 die taal van statistiek


veranderlike is. Die vertoning is amptelik bekend gestel deur 'n wydverspreide<br />

mediaveldtog, waar die publiek uitgenooi is om in te skryf. Duisende inskrywings<br />

is ontvang. Is jy ook nuuskierig wie ingeskryf het? Sou jy graag self wou inskryf?<br />

Ons kan aanneem dat nie almal van die kalklig hou nie, of van 'n lewe in die<br />

vermaaklikheidsbedryf sal hou nie. Dit kan interessant wees om te weet wat die<br />

vernaamste persoonlikheidseienskappe is van die persone wat ingeskryf het. Die<br />

persoonlikheidseienskappe is dus 'n voorbeeld van 'n veranderlike wat 'n mens<br />

kan ondersoek.<br />

Taylor en Meyer (2009) het bevind dat sommige persoonlikheidseienskappe wat<br />

aansoekers van realiteitsvertonings openbaar, die volgende is:<br />

. Hulle is geneig om ``ekstroverties'' te wees en floreer op sosiale interaksie.<br />

. Hulle kan beskryf word as buigsaam en oop vir verandering, maar ook<br />

impulsief en dink nie oor die gevolge van hulle dade na nie.<br />

. Hulle het 'n sterk behoefte aan pret en opwinding.<br />

. Hulle kan dramaties, selfbevorderend en aandagsoekerig wees.<br />

. Hulle is dikwels op soek na 'n leefstyl wat om goeie kos, goeie drank en<br />

vermaak gesentreer is.<br />

Die studie van Taylor en Meyer (2009) is insiggewend en ons kan later weer na<br />

meer van hulle resultate kyk. Maar vir eers gaan ons terug na die bespreking van<br />

veranderlikes.<br />

Veranderlikes word gewoonlik deur die letters X en Y geõÈ dentifiseer. Soms gaan jy<br />

met twee of meer veranderlikes soos X en Y werk.<br />

1. Bestudeer die afdeling ``Variables and constants'' van bladsy 9 tot 13 van<br />

Tredoux en Durrheim (2002). Lees die omskrywings hieronder en pas telkens<br />

die korrekte begrip uit die gegewe lys by die omskrywing:<br />

Begrippe<br />

veranderlikes<br />

diskrete veranderlike<br />

kontinue veranderlike<br />

onafhanklike veranderlike<br />

afhanklike veranderlike<br />

Omskrywings<br />

. afdeling 1 agtergrond<br />

1.1 Die veranderlike wat deur die eksperimenteerder/navorser beheer word<br />

is die ..................<br />

1.2 Eienskappe van waarnemings wat verskillende waardes kan aanneem<br />

word .................. genoem.<br />

bladsy 17


1.3 'n Veranderlike wat enige waarde kan aanneem, is 'n ..................<br />

..................<br />

1.4 Die veranderlike wat gemeet word (die data of tellings) is die ..................<br />

..................<br />

1.5 'n Veranderlike wat 'n beperkte aantal waardes kan aanneem, is 'n<br />

...............<br />

1.6'n Hoeveelheid wat nie verander nie maar altyd dieselfde waarde behou,<br />

is 'n .......................<br />

2. Voltooi aktiwiteit 1.5 op bladsy 10 van Tredoux en Durrheim (2002).<br />

1. Wat belangrik is om te onthou, is dat veranderlikes verskillende waardes kan<br />

aanneem, afhangend van die eksperiment wat die navorser uitvoer.<br />

1.1 onafhanklike veranderlike<br />

1.2 veranderlikes<br />

1.3 kontinue veranderlike<br />

1.4 afhanklike veranderlike<br />

1.5 diskrete veranderlike<br />

1.6konstante<br />

2. Jy behoort (a), (c) en (d) nie moeilik te vind nie ± die antwoorde is onderskeidelik<br />

'n diskrete veranderlike, 'n konstante en 'n diskrete veranderlike. In<br />

die geval van (b) moet ons toegee dat 'n akkurate maatstaf sal toon dat die<br />

gewig van die maan voortdurend sal wissel. In die geval van (e) sal die getal<br />

regters 'n diskrete konstante vir 'n bepaalde tydperk wees (totdat 'n ander een<br />

aangestel word, bedank, sterf, ens)<br />

Metingskale ____________________________________________<br />

Die data wat jy as bedryfsielkundige in die organisasie sal insamel, hetsy prestasiebeoordelingsresultate,<br />

afwesigheidstellings of enige ander data, kan in een van vier<br />

soorte metingskale geklassifiseer word. Dit word spesifiek op bladsy 11 en 12 van<br />

Tredoux en Durrheim (2002) bespreek, en jy moet dit goed onder die knie kry.<br />

Ons onderskei tussen vier metingskale, naamlik die nominale, ordinale, intervalen<br />

ratio-skale.<br />

Eienskappe om tussen metingskale te onderskei ___________________<br />

Ons bespreek hieronder meer volledig die eienskappe op grond waarvan jy tussen<br />

metingskale kan onderskei. Saam met die afdeling op bladsy 11 tot 12 in Tredoux<br />

en Durrheim (2002) behoort dit vir jou 'n nuttige raamwerk te bied om tussen die<br />

vier metingskale te kan onderskei.<br />

bladsy 18 . studie-eenheid 2 die taal van statistiek


Grootte<br />

Grootte is die eienskap van ``meerheid''. 'n Skaal het 'n eienskap van grootte<br />

indien een attribuut meer is as, minder is as of gelyk is aan 'n ander attribuut<br />

(McCall, 1986).<br />

Lengte, wat 'n voorbeeld van die ratio-skaal is, het wel die eienskap van grootte.<br />

Ons kan seà dat een persoon langer of korter is as 'n ander persoon, maar ons kan<br />

nie seà dat 'n rugby- of sokkerspeler met 'n groter nommer op sy rug belangriker is<br />

of meer werk doen as 'n speler met 'n kleiner nommer nie. Die nommers op spelers<br />

se sportklere is 'n voorbeeld van die nominale skaal, wat die enigste skaal is wat<br />

nie die eienskap van grootte het nie.<br />

Gelyke intervalle 'n Skaal het die eienskap van gelyke intervalle indien die verskil tussen alle punte<br />

Absolute 0<br />

op die skaal eenvormig is.<br />

As ons die voorbeeld van lengte neem, beteken dit dat die verskil tussen 6en 8<br />

sentimeter op 'n liniaal dieselfde is as die verskil tussen 10 en 12 sentimeter. In<br />

albei gevalle is die verskil presies 2 sentimeter. 'n Sielkundige metingskaal wat 'n<br />

voorbeeld van die interval-skaal is, het ook gelyke intervalle. Kyk byvoorbeeld na<br />

die volgende skaal:<br />

Stem glad nie<br />

saam nie<br />

Stem nie<br />

saam nie<br />

Onseker Stem saam Stem volkome<br />

saam<br />

1 2 3 4 5<br />

Die intervalle tussen die verskillende tellings is in al die gevalle presies een.<br />

Nominale en ordinale skale het nie die eienskap van gelyke intervalle nie.<br />

Absolute 0 word verkry wanneer heeltemal niks bestaan van die eienskap wat<br />

gemeet word nie. As ons weereens die voorbeeld van lengte gebruik, beteken 0<br />

sentimeter dat daar geen afstand is nie. Lengte besit dus die eienskap van 'n<br />

absolute 0. So ook sou jy kon seà dat as jy windsnelheid meet en die lesing 0 is, daar<br />

geen wind van enige aard waai nie.<br />

Ten opsigte van vele menslike eienskappe is dit uiters moeilik, indien nie onmoontlik<br />

nie, om 'n absolute nulpunt te definieer. Indien ons byvoorbeeld<br />

rekenkundige vermoeÈ op 'n skaal van 0 tot 10 meet, is dit moeilik om te seà dat 0<br />

beteken die persoon het geen rekenkundige aanleg nie. Dit is moontlik dat daar 'n<br />

vlak van aanleg is wat die betrokke skaal nie meet nie of dat daar glad nie so iets<br />

soos 0-aanleg is nie (Kaplan, 1987). In die geval van temperatuur, wat 'n<br />

voorbeeld van die interval-skaal is, kan ons nie seà dat 0 o C beteken dat geen<br />

temperatuur teenwoordig is nie.<br />

Slegs die ratio-skaal besit hierdie eienskap.<br />

. afdeling 1 agtergrond<br />

bladsy 19


1. Bepaal op grond van bostaande inligting watter tipe skaal oor watter<br />

eienskap(pe) besit en voltooi dit in hierdie opsommingstabel, deur ``Ja'' of<br />

``Nee'' in die toepaslike ruimte te skryf.<br />

Metingskale en hulle eienskappe<br />

Eienskap<br />

Tipe skaal Grootte Gelyke interval Absolute 0<br />

Nominaal<br />

Ordinaal<br />

Interval<br />

Ratio<br />

2. Bestudeer die volgende twee probleemstellings.<br />

2.1 Jy wil bepaal of die jare onderrig van deelnemers aan Nuwe Sterre<br />

(byvoorbeeld matriek, voorgraadse studie, nagraadse studie) hul<br />

gewildheidsgraderings van kykers beõÈnvloed.<br />

2.2 Is daar 'n verhouding tussen die tyd wat kykers bestee om na Nuwe Sterre<br />

te kyk en hulle inkomste?<br />

Metingskaal/<br />

Onafhanklik<br />

Diskreet/<br />

Kontinu<br />

. Skryf die naam van die korrekte metingskaal wat van toepassing is op<br />

die veranderlikes wat uit die probleemstellings geõÈ dentifiseer en in die<br />

tabel weerspieeÈ l word in die regte kolom neer.<br />

. Onderskei of hierdie veranderlike die afhanklike of onafhanklike<br />

veranderlike in die probleemstelling verteenwoordig, en skrap die<br />

verkeerde alternatief.<br />

. Bepaal ook of die spesifieke veranderlike 'n kontinue of diskrete<br />

veranderlike is, en skrap weer eens die verkeerde alternatief.<br />

Jare onderrig Gewildheidsgradering<br />

Afhanklik/<br />

Onafhanklik<br />

Diskreet/<br />

Kontinu<br />

Afhanklik/<br />

Onafhanklik<br />

Diskreet/<br />

Kontinu<br />

Kyktyd Inkomste<br />

Afhanklik/<br />

Onafhanklik<br />

Diskreet/<br />

Kontinu<br />

3. Voltooi aktiwiteit 1.6op bladsy 13 van Tredoux en Durrheim.<br />

bladsy 20 . studie-eenheid 2 die taal van statistiek<br />

Afhanklik/<br />

Onafhanklik<br />

Diskreet/<br />

Kontinu


1. Metingskale en hulle eienskappe<br />

Eienskap<br />

Tipe skaal Grootte Gelyke interval Absolute 0<br />

Nominaal Nee Nee Nee<br />

Ordinaal Ja Nee Nee<br />

Interval Ja Ja Nee<br />

Ratio Ja Ja Ja<br />

2. Die volgende tabel verteenwoordig die korrekte antwoorde:<br />

Jare onderrig Gewildheidsgradering<br />

Kyktyd Inkomste<br />

Metingskaal Nominaal Interval Ratio Interval<br />

Afhanklik/<br />

Onafhanklik<br />

Diskreet/<br />

Kontinu<br />

3. Onafhanklike veranderlike<br />

(voorspeller)<br />

. afdeling 1 agtergrond<br />

Onafhanklik Afhanklik Onafhanklik Afhanklik<br />

Diskreet Kontinu Kontinu Kontinu<br />

Afhanklike veranderlike<br />

(kriterium)<br />

(a) Hoeveelheid rooiwyn ingeneem Aantal hartaanvalle<br />

(b) Diegene met of sonder troeteldiere Algemene geluk<br />

(c) Getroud/ongetroud Selfmoordsyfer<br />

Kan jy sien waarom dit nie nodig is om die rooiwyninname ooreenkomstig die<br />

per-populasie-indeks uit te druk nie?<br />

Let op dat dit moontlik is om 'n verskil tussen twee groepe (diegene wat<br />

troeteldiere het en diegene wat geen troeteldiere het nie) aan die hand van<br />

afhanklike en onafhanklike veranderlikes te konseptualiseer, en so ook die<br />

verband tussen twee kontinue veranderlikes.<br />

Populasies, steekproewe en verskillende soorte data ________________<br />

Wanneer ons met statistiek werk, is daar verskillende terme wat gebruik word.<br />

Ten opsigte van die groepe wie se inligting gebruik word, onderskei ons tussen 'n<br />

bladsy 21


populasie en 'n steekproef. Ons onderskei ook tussen numeriese waardes wat<br />

populasiedata opsom en numeriese waardes wat steekproefdata saamvat en wat<br />

onderskeidelik parameters en statistieke genoem word.<br />

Lees die afdeling ``Populations, samples, statistics and parameters'' van bladsy 13<br />

tot 15 in Tredoux en Durrheim (2002). Bestudeer die gedeeltes waarin begrippe<br />

verduidelik word en sorg dat jy elke term so goed verstaan dat jy dit in jou eie<br />

woorde kan verduidelik aan iemand wat dit nie ken nie. Hieronder volg 'n lys van<br />

belangrike terme. Gebruik die ruimte wat voorsien word om die betekenis van<br />

elke term te beskryf en gee 'n voorbeeld van elk, van die Nuwe Sterre-vertoning.<br />

Term Beskrywing Voorbeeld<br />

Populasie<br />

Steekproef<br />

Metingsdata<br />

Kategoriese Data<br />

Kyk of jou antwoorde in breeÈ trekke ooreenstem met die inligting wat in die<br />

onderstaande tabel gegee word. Jy moes minstens die skuinsgedrukte terme in jou<br />

beskrywing ingesluit het.<br />

Term Beskrywing Voorbeeld<br />

Populasie 'n volledige stel gebeure<br />

waarin jy geõÈ nteresseerd is<br />

Steekproef 'n stel waargenome tellings<br />

wat 'n deelversameling van<br />

die populasie is<br />

Parameters numeriese waardes wat<br />

populasiedata opsom<br />

Statistieke numeriese waardes wat<br />

steekproefdata opsom<br />

bladsy 22 . studie-eenheid 2 die taal van statistiek<br />

alle aansoekers vir Nuwe<br />

Sterre<br />

20 ewekansig geselekteerde<br />

aansoekers vir Nuwe Sterre<br />

die gemiddelde inkomste van<br />

alle aansoekers vir Nuwe<br />

Sterre<br />

die gemiddelde inkomste van<br />

20 ewekansig geselekteerde<br />

aansoekers vir Nuwe Sterre


. afdeling 1 agtergrond<br />

Voltooi aktiwiteit 1.7 op bladsy 14 in Tredoux en Durrheim (2002).<br />

Wat al hierdie vrae moeilik maak, is dat 'n mens seker moet wees wat die<br />

populasie van belang is. As ons daarom besluit dat die tersaaklike populasie vir al<br />

drie vrae die hele kohort leerders in Suid-Afrika is wat hul matrikulasie-eksamen<br />

in daardie bepaalde jaar afleà , kan net (a) 'n parameter wees. Maar as ons besluit<br />

dat ons vir (b) slegs die populasie leerders aan die HoeÈ rskool Platbakkies in<br />

aanmerking wil neem, sal die gemiddelde punt vir Geskiedenis aan daardie skool<br />

as 'n parameter dien. Dieselfde geld vir (c) ± 'n mens sou heel gepas kon verwys na<br />

``die populasie leerders aan die HoeÈ rskool Platbakkies op 'n bepaalde deel van 4de<br />

strand by Clifton op 1 Januarie 2001'', selfs al sou die meeste mense daardie<br />

versameling mense as 'n oninteressante populasie beskou!<br />

Ewekansige steekproefneming ________________________________<br />

Die afdeling ``Samples, populations, statistics and parameters'' in Tredoux en<br />

Durrheim (2002) bied 'n uiteensetting van ewekansige steekproefneming en<br />

statistiese inferensie. 'n Ewekansige steekproef beteken dat elke lid van die<br />

populasie 'n gelyke kans staan om vir 'n ondersoek, eksperiment of<br />

navorsingsprojek gekies te word. Dit is die enigste geldige/aanvaarbare manier<br />

om steekproefresultate ten opsigte van daardie populasie te veralgemeen. Die<br />

veralgemening van steekproefdata na populasies staan bekend as statistiese<br />

inferensie en is die sentrale doel van statistiese metodes.<br />

Jy behoort nou 'n idee te heà wat hierdie kursus in Bedryfsielkundige navorsing<br />

behels. Om seker te wees dat jy die belangrikste inligting in hierdie studie-eenheid<br />

uitgeken en begryp het, kan jy die lys in die volgende aktiwiteit nagaan.<br />

Gaan deur die volgende lys en merk elke item af indien jy seker is dat jy die terme/<br />

begrippe kan omskryf, tussen hulle kan onderskei en jou eie voorbeelde van elk<br />

kan gee:<br />

bladsy 23


Terme Omskryf Onderskei Voorbeeld<br />

beskrywende statistiek<br />

vs<br />

inferensieÈ le statistiek<br />

kontinue veranderlike<br />

vs<br />

diskrete veranderlike<br />

onafhanklike veranderlike<br />

vs<br />

afhanklike veranderlike<br />

populasie<br />

vs<br />

steekproef<br />

parameters<br />

vs<br />

statistieke<br />

Noudat jy studie-eenheid 3 bestudeer het, behoort jy<br />

. 'n veranderlike te kan omskryf<br />

. tussen beskrywende en inferensieÈ le statistiek te kan onderskei<br />

. te kan onderskei tussen die vier skale van meting en voorbeelde van elk te kan<br />

verskaf<br />

. diskrete en kontinue veranderlikes, asook onafhanklike en afhanklike<br />

veranderlikes te kan omskryf, onderskei en voorbeelde daarvan te kan verskaf<br />

Nou is jy reg om verskillende vaardighede en tegnieke te leer in die studie-eenhede<br />

wat volg.<br />

bladsy 24 . studie-eenheid 2 die taal van statistiek


3<br />

studie-eenheid drie<br />

. afdeling 1 agtergrond<br />

Basiese wiskundige<br />

berekenings wat in<br />

statistiek gebruik word<br />

Syfers: deel van ons lewe __________________________________<br />

Deesdae kan ons beswaarlik sonder syfers klaarkom ± dink net vir 'n<br />

oomblik hoeveel jy elke dag met syfers werk. Net die opstel van 'n<br />

tydtafel om te bepaal hoeveel ure jy aan elke vak gaan bestee wys al<br />

klaar jou afhanklikheid van syfers; en wie van ons probeer nie om ons begroting<br />

aan die einde van die maand te laat klop nie?<br />

Getalle en kwantifisering bied aan ons 'n baie spesiale taal wat ons in staat stel om<br />

ons in presiese terme uit te druk. Hierdie spesiale taal word wiskunde genoem. Net<br />

soos jy die basiese reeÈ ls van 'n taal moet ken om jou noukeurig in Afrikaans,<br />

Engels of Zoeloe uit te druk, moet jy ook die basiese wiskundige reeÈ ls ken om<br />

doeltreffend met syfers te kan kommunikeer.<br />

Soos jy teen hierdie tyd ook al opgemerk het, het hierdie kursus heelwat te doen<br />

met die gebruik van syfers. Dit is belangrik dat jy oor basiese rekenkundige kennis<br />

beskik ± matriekwiskunde is NIE nodig om hierdie kursus suksesvol te voltooi nie. Jy<br />

hoef dus nie 'n briljante wiskundige te wees nie, maar moet slegs sekere basiese<br />

rekenkundige beginsels bemeester om die statistiese berekenings in hierdie kursus<br />

te kan verstaan.<br />

Om gemaklik te wees met 'n module oor statistiek is dit nodig dat jy basiese<br />

wiskundige berekenings moet kan doen. Ongelukkig ervaar baie studente in<br />

Sielkunde (en Bedryfsielkunde) 'n mate van ongemak, angs en selfs vrees wanneer<br />

hulle met enige aspek van wiskunde ± byvoorbeeld formulas, berekenings,<br />

ontleding en, ja, natuurlik, statistiek ± te doen het!<br />

Sakrekenaars: noodsaaklik vir oorlewing ________________________<br />

Jy sal 'n sakrekenaar nodig heà om jou vanjaar met die statistiese ontleding te help.<br />

Indien jy nie 'n sakrekenaar het nie, sal jy een moet aankoop. Die klein, goedkoop<br />

bladsy 25


modelle is heeltemal voldoende. Om jou berekenings te vergemaklik, beveel ons<br />

egter aan dat die sakrekenaar ten minste die funksies van vierkantswortel ( p )en<br />

geheue (M+) moet heà .<br />

Die samestelling van hierdie studie-eenheid ______________________<br />

Hierdie studie-eenheid bied al die wiskundige inligting wat as agtergrond vir<br />

hierdie kursus dien. Dit behels basiese bewerkings met syfers, vergelykings,<br />

vervanging, sommasie asook die lees en verstaan van grafieke. Jy moet al die<br />

verskillende rekenkundige/wiskundige bewerkings kan doen (tutoriaal 23 en 24)<br />

en grafieke kan lees en verstaan (tutoriaal 25) wat by hierdie studie-eenheid<br />

ingesluit word om die statistieke in hierdie kursus te kan uitwerk.<br />

Die inligting in hierdie studie-eenheid vorm deel van jou voorkennis en jy is<br />

moontlik reeds vaardig in basiese syferwerk en rekenkundige bewerkings.<br />

Daarom is dit raadsaam om die selfevalueringstoetse vir tutoriaal 23 en 24 te<br />

doen. Die toets vir tutoriaal 23 is selftoets 23.1 op bladsy 445 en die toets vir<br />

tutoriaal 24 is selftoets 24.1 op bladsy 462 van Tredoux en Durrheim (2002).<br />

Gebruik hierdie selfevaluering om te bepaal of dit vir jou nodig is om tutoriaal 23<br />

en 24 te bestudeer. Sodra jy die inhoud van hierdie tutoriale onder die knie het,<br />

kan jy voortgaan met tutoriaal 25 oor hoe om grafieke te lees en te interpreteer.<br />

Ons vertrou dat jou belangstelling in die spesifieke vrae wat gevra is jou sal help<br />

om enige moontlike vrees vir wiskunde te bowe te kom. Die numeriese aspek word<br />

bloot 'n hulpmiddel om jou in staat te stel om interessante vrae te beantwoord. Op<br />

hierdie wyse sal jy hopelik jou vrees vir nommers, berekenings of formules<br />

vergeet. As jy nie 'n sterk wiskundige agtergrond het nie, is dit raadsaam om 'n<br />

paar keer deur Tutoriaal 23 en 24 van die voorgeskrewe boek te werk om die<br />

nodige vertroue en vaardighede te kry. Die gevoel van sukses wat jy sal ervaar<br />

wanneer jy die nodige berekenings kan doen, sal vergoed vir die moeite wat dit<br />

geverg het om daar te kom.<br />

Die volgende drie tutoriale behandel die wiskundige grondslag en grafieke wat<br />

deel uitmaak van hierdie studie-eenheid en wat jy op jou eie moet bestudeer:<br />

. Tutoriaal 23: ``Basic work with numbers''<br />

'n Rekenkundige oorsig word gebied wat jou leer hoe om eenvoudige<br />

algebraõÈ ese berekenings te doen.<br />

Studente wat nie van berekenings hou nie of wat vrees dat hulle nie berekenings<br />

kan doen nie, skrik wanneer hulle formules sien, want dit beteken dat<br />

berekenings gedoen moet word!! 'n Formule kan in basiese berekenings<br />

opgedeel word ± so as jy die opsommende oefeninge in Tutoriaal 23 van die<br />

voorgeskrewe boek gedoen het, behoort jy in staat te wees om enige<br />

bladsy 26 . studie-eenheid 3 basiese wiskundige berekenings wat in statistiek gebruik word


. afdeling 1 agtergrond<br />

berekenings te doen wat nodig mag wees om probleme op te los en antwoorde<br />

op vrae te kry.<br />

. Tutoriaal 24: ``Equations, substitution and summation''<br />

Ons behandel ook sommasie-notasie sodat jy die betekenis van die verskillende<br />

simbole sal verstaan en gevolglik rekenkundige berekenings sal kan uitvoer.<br />

. Tutoriaal 25: ``Reading and understanding graphs''<br />

Hierdie tutoriaal behandel grafieke wat dit moontlik maak om numeriese<br />

gegewens visueel voor te stel.<br />

Noudat jy studie-eenheid 3 bestudeer het, behoort jy die volgende te ken en te kan<br />

doen of gebruik:<br />

. die verskillende standaard rekenkundige simbole<br />

. die optel, aftrek, vermenigvuldig en deel van positiewe en negatiewe getalle<br />

. berekenings tussen hakies<br />

. eenvoudige algebraõÈ ese berekenings<br />

. die noteringstelsel om rekenkundige berekenings uit te voer<br />

. eenvoudige lyngrafieke en kategoriestippings te kan teken, interpreteer en<br />

verstaan<br />

bladsy 27


4 Voorstelling van data<br />

5 Maatstawwe van sentrale neiging<br />

6 Maatstawwe van varieerbaarheid<br />

7 Korrelasie<br />

8 Regressie


Inleiding tot beskrywende statistiek<br />

Nuwe Sterre ____________________________________________<br />

Die kompetisie tot dusver<br />

Hierdie nuwe werlikheidsvertoning het groot aanhang en opgewondenheid<br />

ontlok. Duisende aansoeke is van regoor Suid-Afrika ontvang. Om deur die<br />

aansoeke te werk om die 10 deelnemers vir die leerlingskapprogram te kies, was<br />

meer as 'n veeleisende oefening. Die navorsingspan was ook hard aan die werk en<br />

die inligting wat hulle ingesamel het, sal in die volgende vyf studie-eenhede<br />

gebruik word.<br />

Studie-eenheid 4 stel ondersoek in na die voorstelling van data ± hoe die massiewe<br />

hoeveelheid inligting opgesom en vereenvoudig en verslag oor gedoen kan word.<br />

Vrae soos: Hoeveel aansoeke is van elke provinsie ontvang? Wat is die biografiese<br />

eienskappe (ras, geslag, huwelikstatus) van die deelnemers en beoordelaars?<br />

Studie-eenheid 5 bespreek die maatstawwe van sentrale neiging ± deur metodes te<br />

ondersoek om die inligting te beskryf deur die middelpunt van die data aan te dui<br />

deur die gemiddelde, modus en mediaan te gebruik. Vrae soos: Wat is die<br />

gemiddelde telling van die beoordelaars vir die deelnemers se prestasie in die eerste<br />

week? Wat is die telling wat die meeste deur elke beoordelaar in die eerste week<br />

gegee is?<br />

Studie-eenheid 6 bespreek die maatstawwe van verieerbaarheid ± hoe die inligting<br />

beskryf kan word deur te kyk hoe die tellings verspreid is rondom die gemiddelde<br />

deur die omvang, variansie en die standaardafwyking te gebruik.<br />

Studie-eenheid 7 neem die beskrywing van die inligting verder deur na die<br />

verhouding tussen twee veranderlikes te kyk. Vrae kan bepaal of daar 'n<br />

verhouding bestaan tussen die tellings wat die deelnemers gedurende hulle<br />

voorbereidingsaktiwiteite ontvang het en hulle tellings vir hulle optrede vir<br />

daardie week.<br />

Studie-eenheid 8 maak aannames wat gegrond is op die verhouding tussen<br />

veranderlikes om voorspellings te maak. Byvoorbeeld, indien daar 'n sterk<br />

verhouding tussen voorbereiding en prestasie bestaan, kan regressie-ontleding<br />

gebruik word om 'n veranderlike te voorspel op grond van die berekende<br />

verhouding.<br />

So kom ons begin met hoe die navorsingspan die inligting kan opsom en voorstel.<br />

bladsy 30 . inleiding tot beskrywende statistiek


4<br />

studie-eenheid vier<br />

. afdeling 2 data-verwerking: beskrywend<br />

Aanbieding van data<br />

Dit is 'n bekende feit dat baie mense prente, simbole en grafiese<br />

voorstellings beter onthou as geskrewe woorde. Grafiese voorstellings<br />

is veral 'n manier om syfers sinvol te organiseer en voor te stel.<br />

Grafieke het ook 'n manier om inligting te vereenvoudig wat langer kan neem om<br />

oor te dra of te lees indien dit in woorde of net in syfers voorgestel is.<br />

Byvoorbeeld, vir die Nuwe Sterre-projek, indien jy verslag wil doen oor die<br />

aansoeke wat ontvang is, kan dit lank neem, terwyl dit maklik in tabelle en<br />

grafieke voorgestel kan word. Dit is waarom jy in hierdie studie-eenheid gaan leer<br />

om data deur middel van frekwensieverspreiding in tabelle aan te bied en ook om<br />

dit grafies deur middel van frekwensiestaafdiagramme en histogramme aan te<br />

bied. Sodra data grafies voorgestel is, is dit meer betekenisvol om dit in terme van<br />

skeefheid en kurtose te beskryf. Afgesien daarvan dat frekwensievoorstellings met<br />

kumulatiewe persentasiefrekwensies ons vertroud maak met die data, maak dit vir<br />

ons moontlik om persentiele en persentielrange uit te werk waarmee ons die<br />

posisie van sekere tellings ten opsigte van ander tellings in die distribusie kan<br />

bepaal.<br />

Dit is uit die staanspoor nodig dat ons 'n belangrike onderskeid tref tussen<br />

datasoorte wat op verskillende maniere aangebied/voorgestel moet word.<br />

Kategoriese of diskrete data (ongegroepeerde data) word in frekwensieverspreidingstabelle<br />

en staafdiagramme aangebied, terwyl kontinue data (gegroepeerde<br />

data) in frekwensieverspreidingstabelle en histogramme aangebied word.<br />

1. Lees die inleiding tot tutoriaal 2 op bladsy 18 en 19. Voltooi dan aktiwiteit 2.1<br />

op bladsy 19.<br />

2. Bestudeer die uitslae van die behandeling van tuberkulose (TB) wat in tabel<br />

2.1 op bladsy 20 van Tredoux en Durrheim (2002) gegee word. Watter<br />

afleidings (inferensies) kan jy oor die behandelingsuitslae maak deur bloot na<br />

die tabel te kyk?<br />

1. Ons het 'n lys met voorbeelde van diskrete en kontinue data saamgestel.<br />

Vergelyk jou voorbeelde daarmee.<br />

bladsy 31


Diskrete data:<br />

1. Flieke gekyk ± jy kon vyf of ses flieke gekyk het, maar nie 6,5 nie.<br />

2. KlieÈ nte gespreek in die afgelope maand ± jy kon 22 of 25 klieÈ nte bedien<br />

het, maar nie 23,25 nie.<br />

3. Sigarette gerook ± 'n mens rook gewoonlik net hele sigarette. As iemand<br />

jou vra hoeveel sigarette jy hierdie week gerook het, sal jou antwoord 13<br />

kan wees, maar nie 13,5 nie.<br />

4. Die nommers op die truie van vlugbalspelers kan 12 of 32 wees, maar nie<br />

12,56of 32,45 nie.<br />

5. Geslag ± 'n mens is o f manlik o f vroulik.<br />

6. 'n Dosis medikasie ± 'n mens kan 2,2 ml of 2,211 ml inspuit.<br />

7. Ure geslaap ± jy kan 9 ure, 9,5 ure of 9,75 ure lank slaap.<br />

8. KaffeõÈ eninname ± jy kan 7 mg, 7,1 mg of 7,25 mg kaffeõÈ en inneem.<br />

9. Salaris ± jy kan enige hoeveelheid rande en sente verdien.<br />

10. Televisie kyk ± jy kan vir enige getal ure en minute televisie kyk.<br />

2. Stem jy saam dat daar 'n magdom syfers in die tabel vervat is wat glad nie sin<br />

maak deur net daarna te kyk nie? Geen betekenisvolle patroon kan uit die stel<br />

data geõÈ dentifiseer word nie. Omdat jy gewoonlik met so 'n hele datastel in<br />

hierdie kursus gaan werk, is dit belangrik om as eerste stap onder<br />

beskrywende statistiek te leer om data grafies sinvol aan te bied sodat<br />

betekenisvolle afleidings daarvan gemaak kan word.<br />

Aanstip van data: ongegroepeerde data _________________________<br />

In die afdeling ``The frequency distribution'' op bladsy 19 van Tredoux en<br />

Durrheim (2002) het jy die begrip ``frekwensie'' die eerste keer teeÈ gekom. Die<br />

frekwensie van 'n telling verwys na die getal kere wat die gegewe telling in die<br />

datastel voorkom.<br />

'n Frekwensieverspreidingstabel en 'n frekwensiestaafdiagram word gebruik om<br />

ongegroepeerde data aan te bied.<br />

Vir die Nuwe Sterre-vertoning is 6645 aansoeke ontvang ± dit is baie papierwerk<br />

om deur te gaan en baie inligting om vas te leà en verslag oor te doen.<br />

Net 'n kort voorbeeld: kom ons neem die eerste 20 aansoeke en kyk wat die<br />

geslagsverspreiding is (V = vroulik en M = manlik):<br />

V V V V M V M M V M<br />

V M M V V V V V V V<br />

Jy sal die aantal kere tel wat V gelys is om die totale aantal vroue in die groep te<br />

bepaal en dieselfde met die mans doen.<br />

bladsy 32 . studie-eenheid 4 aanbieding van data


. afdeling 2 data-verwerking: beskrywend<br />

Geslag Telling Frekwensie<br />

V 11111111111111 14<br />

M 111111 6<br />

Jy kan hierdie voorstelling verder vat deur die persentasies in te sluit.<br />

Geslag Telling Frekwensie Persentasiefrekwensie<br />

V 11111111111111 14 70<br />

M 111111 630<br />

Totaal (N) 20 100<br />

Het jy dit reggekry om die persentasiefrekwensie te bereken? Die persentasie van<br />

elke kategorie word bereken deur die frekwensie vir die kategorie deur die totale<br />

aantal items/persone (N) te deel. Vir die vrouekategorie: 14 / 20 = 0,7 en om die<br />

persentasie te kry maal met 100 = 70%.<br />

Om te kontroleer of jy al die data-items in ag geneem het, kan jy die totaal van die<br />

frekwensiekolom bereken. Dit moet gelyk wees aan die totale aantal data-items.<br />

In die voorbeeld hierbo is daar 20 aansoeke. Die totaal van die frekwensies is ook<br />

gelyk aan 20.<br />

Soos genoem is, is 6645 aansoeke ontvang. Die aansoeke is gesorteer volgens die<br />

Suid-Afrikaanse provinsies van waar die aansoeke ontvang is. As ons dus verslag<br />

wil doen oor die aantal aansoeke wat van elke provinsie in Suid-Afrika ontvang is,<br />

kan ons die frekwensieverspreidingstabel gebruik soos hieronder aangedui.<br />

Voltooi asseblief die tabel deur die persentasies te bereken.<br />

bladsy 33


Frekwensieverspreiding vir Nuwe Sterre-aansoeke ± provinsies:<br />

Provinsie Frekwensie Persentasiefrekwensie<br />

Oos-Kaap 907<br />

Vrystaat 654<br />

Gauteng 1 506<br />

KwaZulu-Natal 1 215<br />

Limpopo 413<br />

Mpumalanga 632<br />

Noord-Kaap 321<br />

Noord-wes 211<br />

Wes-Kaap 786<br />

6 645 100<br />

Lyk jou berekenings soos die berekenings hieronder? Indien nie, gaan dit weer na.<br />

Ons doen berekenings tot twee desimale plekke.<br />

Frekwensieverspreiding vir Nuwe Sterre-aansoek ± provinsies:<br />

Provinsie Frekwensie Persentasiefrekwensie<br />

Oos-Kaap (EC) 907 13,65<br />

Vrystaat (FS) 654 9,84<br />

Gauteng (GP) 1 50622, 6<br />

KwaZulu-Natal (KZN) 1 215 18,28<br />

Limpopo (L) 413 6,22<br />

Mpumalanga (MP) 632 9,51<br />

Noord-Kaap (NC) 321 4,83<br />

Noord-wes (NW) 211 3,18<br />

Wes-Kaap (WC) 78611,83<br />

6 645 100<br />

Soos jy uit bogenoemde voorbeeld kan sien, word die inligting eenvoudig en in 'n<br />

maklik leesbare formaat vertoon.<br />

bladsy 34 . studie-eenheid 4 aanbieding van data


Noudat jy weet hoe om ongegroepeerde data met behulp van 'n frekwensieverspreidingstabel<br />

voor te stel, kan ons kyk hoe data grafies deur middel van die<br />

frekwensiestaafdiagram voorgestel word. Tredoux en Durrheim (2002) bied in<br />

figuur 2.1 op bladsy 21 'n voorbeeld van 'n frekwensiestaafdiagram. Dit is 'n<br />

grafiese voorstelling van die datastel wat in tabel 2.1 en 2.2 op bladsy 20 voorkom.<br />

Indien ons die vroeeÈ re voorbeeld van 20 aansoekers sou gebruik, sal die<br />

frekwensiestaafdiagram soos volg lyk:<br />

Frekwensie<br />

20<br />

15<br />

10<br />

5<br />

. afdeling 2 data-verwerking: beskrywend<br />

V M<br />

Geslag<br />

In 'n frekwensiestaafdiagram word elke kategorie aangedui met 'n staaf wat op<br />

die horisontale as (x-as) staan. Die stawe word deur leeÈ ruimtes of spasies van<br />

mekaar geskei wat die diskontinuõÈ teit tussen die kategorieeÈ beklemtoon.<br />

In die geval van hierdie kursus is enige grafiese voorstelling wat van jou gevra<br />

word tweedimensioneel. Waar daar met frekwensies gewerk word, word die<br />

frekwensie (f) altyd op die vertikale as en die telling (X) op die horisontale as<br />

aangeteken. Die asse moet ook altyd 'n naam kry, byvoorbeeld ``frekwensie'' en<br />

``geslag''.<br />

Onthou, indien die grafiek nie benoem word of byskrifte bevat nie, verskaf dit<br />

onvolledige inligting. Indien bogenoemde grafiek nie byskrifte bevat het nie, sou<br />

jy die stawe gesien het, maar jy sou nie geweet het waarvoor die 14 of die 6voor<br />

staan nie. Die tabelle en grafieke is 'n manier om inligting te vereenvoudig, mense<br />

moet na die tabel kan kyk en weet waarvoor die frekwensies is, dieselfde geld vir<br />

die grafieke. In bostaande grafiek is die Y-as duidelik frekwensie gemerk, X-as is<br />

duidelik geslag gemerk en jy weet die stawe is vir vroulik (V) en manklik (M).<br />

bladsy 35


1. Teken die frekwensiestaafdiagram op grond van die Nuwe Sterre-aansoeke ±<br />

Provinsies (kyk na die voltooide frekwensieverspreidingstabel hierbo).<br />

2. In die aanvangsfases was daar heelwat debat oor waar om hierdie vertoning<br />

te adverteer om aansoekers uit te nooi. Bestuur en die vervaardigers wou weet<br />

watter bemarkingskanaal die beste gewerk het. Die response was soos volg:<br />

Frekwensieverspreiding bemarking/advertering:<br />

Frekwensie<br />

1600<br />

1 400<br />

1 200<br />

1 000<br />

Bemarkingsinstrument Frekwensie<br />

Koerant (K) 399<br />

Televisie (TV) 2 193<br />

Radio (R) 1 728<br />

Pamflette (P) 1 395<br />

Vriende/familie (V/F) 598<br />

Ander (A) 199<br />

Geen respons (GR) 133<br />

1.<br />

2.1 Voltooi die frekwensieverspreidingstabel.<br />

2.2 Stel die toepaslike frekwensiestaafdiagram op.<br />

800<br />

600<br />

400<br />

200<br />

bladsy 36 . studie-eenheid 4 aanbieding van data<br />

6 645<br />

OK VS GP KZN L MP NK NW WK<br />

PROVINSIES


2.1<br />

Frekwensieverspreiding bemarking/advertering:<br />

Bemarkingsinstrument Frekwensie Persentasiefrekwensie<br />

Koerant (K) 399 6<br />

Televisie (TV) 2 193 33<br />

Radio 1 728 26<br />

Pamflette (P) 1 395 21<br />

Vriende/familie (V/F) 598 9<br />

Ander (A) 199 3<br />

Geen respons (GR) 133 2<br />

2.2<br />

Frekwensie<br />

2 200<br />

2 000<br />

1 800<br />

1600<br />

1 400<br />

1 200<br />

1 000<br />

800<br />

600<br />

400<br />

200<br />

. afdeling 2 data-verwerking: beskrywend<br />

6 645 100<br />

NK TV R P V/F A GR<br />

BEMARKINGSINSTRUMENT<br />

Aanstip van data: gegroepeerde data ___________________________<br />

Ons het tot nou toe met nominale of diskrete (ongegroepeerde) data en die<br />

voorstelling daarvan te doen gehad. Nou gaan ons die voorstelling van ordinale,<br />

intervals- en verhoudingsdata of kontinue veranderlikes (gegroepeerde data)<br />

bladsy 37


ehandel. Ons wil hier graag die eienskap vasleà dat geen gapings tussen die<br />

datatellings voorkom nie, omdat die data kontinu van aard is. Geen gapings kom<br />

dus tussen die reghoeke in die grafiek voor soos in staafdiagramme nie.<br />

In die praktyk gebeur dit dikwels dat jy met stelle data werk wat werklik 'n groot<br />

aantal items het. Dit raak dan moeilik om die frekwensie van elke gebeurtenis<br />

individueel aan te teken. Om hierdie rede maak ons gebruik van klasintervalle en<br />

teken ons die frekwensies aan vir die klasinterval en nie vir die individuele<br />

gebeurtenisse nie. Op hierdie wyse groepeer ons die data. Gegroepeerde data kan<br />

aangebied word in 'n tabel bekend as die gegroepeerde frekwensieverspreidingstabel<br />

wat grafies in die vorm van 'n histogram voorgestel kan word.<br />

Die moeilikste stap in die opstel van 'n gegroepeerde frekwensieverspreidingstabel<br />

is om te besluit hoeveel klasintervalle gebruik moet word. Raam 2.1 op bladsy 23<br />

van Tredoux en Durrheim (2002) bied riglyne aan waarmee die getal klasintervalle<br />

en die geskikte grootte daarvan bepaal kan word.<br />

Soos jy kan sien, is daar baie prosedures wat jy kan gebruik om die grootte van<br />

die interval te bereken, maar vir hierdie module sal ons altyd aandui hoe groot die<br />

interval moet wees.<br />

In die geval van gegroepeerde data, waar daar met klasintervalle gewerk word, is<br />

die volgende statistiek belangrik:<br />

. werklike ondergrens<br />

. werklike bogrens<br />

Alhoewel dit in die praktyk kan gebeur dat die grootte van klasintervalle verskil,<br />

is dit in jou geval belangrik om te onthou dat om data sinvol aan te bied, dit nodig<br />

is om gelyke klasintervalle te kies.<br />

Byvoorbeeld: 11±20<br />

21±30<br />

31±40<br />

Al hierdie klasintervalle het 'n gelyke interval van 10.<br />

Indien jy die werklike ondergrens en werklike bogrens vir hierdie voorbeeld moes<br />

bereken:<br />

Klasintervalle Werklike ondergrens Werklike bogrens<br />

11±20 10,5 20,5<br />

21±30 20,5 30,5<br />

31±40 30,5 40,5<br />

Hoe het ons hierdie waardes gekry?<br />

bladsy 38 . studie-eenheid 4 aanbieding van data


. afdeling 2 data-verwerking: beskrywend<br />

Bestudeer die afdeling ``Grouped frequency distributions'' op bladsy 22 tot 25 van<br />

Tredoux en Durrheim (2002) bokant tabel 2.3. Voltooi nou aktiwiteit 2.3 op<br />

bladsy 25.<br />

Werklike bo- en ondergrense leà halfpad tussen die sigbare limiete van aanliggende<br />

klasintervalle. Om die werklike bogrense (WBG) en werklike ondergrense (WOG)<br />

vir tabel 2.4 te bepaal, kan 'n mens die afstand tussen die sigbare bogrens van 'n<br />

interval en die sigbare ondergrens van die volgende klasinterval neem. Die afstand<br />

word dan in twee gedeel om die werklike bogrens vir die eerste interval te gee.<br />

Dieselfde syfer stel ook die werklike ondergrens van die daaropvolgende interval<br />

voor. Vir die eerste klasinterval in tabel 2.4 is 89,5 die werklike bogrens vir die<br />

interval 80±89. Die werklike ondergrens vir die interval is 79,5. Die werklike<br />

bogrens vir die interval 70±79 is 79,5 en die werklike ondergrens is 69,5. Vergelyk<br />

jou ander antwoorde deur dieselfde metode te gebruik as wat ons vir die eerste<br />

twee intervalle gebruik het.<br />

Ons moet nou nog 'n frekwensieverspreidingstabel opstel. In tabel 2.4 op bladsy<br />

26van Tredoux en Durrheim (2002) vind jy twee bekende terme, naamlik<br />

frekwensie en persentasiefrekwensie. Ons het hierdie terme gebruik toe ons<br />

ongegroepeerde data behandel het. Die nuwe begrippe in die ander twee kolomme<br />

is kumulatiewe frekwensie en kumulatiewe persentasiefrekwensie. Syfers in hierdie<br />

kolomme toon die frekwensie of die persentasie frekwensie van alle gevalle met<br />

tellings onder die bogrens van die klasinterval waarlangs hulle leà . Kumulatiewe<br />

frekwensies en persentasie frekwensies word vir elke klasinterval bereken deur die<br />

frekwensie of persentasiefrekwensie vir 'n bepaalde interval by die frekwensies of<br />

persentasiefrekwensies in alle laer intervalle op te tel.<br />

Bestudeer die afdeling ``Grouped frequency distributions'' op bladsy 25 (laaste<br />

paragraaf) en 26van Tredoux en Durrheim (2002). Stel dan 'n gegroepeerde<br />

frekwensieverspreidingstabel vir die volgende gegewens op:<br />

Die Nuwe Sterre-produksie het ook beoordelaarsposte vir die vertoning<br />

geadverteer. Uit die honderde aansoeke wat van potensieÈ le beoordelaars<br />

ontvang is, is 80 op die kortlys geplaas en moes assessering ondergaan. Hier is<br />

hulle resultate.<br />

33 48 45 70 55 57 88 54 44 29<br />

23 43 6 5 78 39 53 78 6 7 56 6 3<br />

25 32 78 65 41 33 66 56 88 68<br />

56 23 6 45 6 0 6 1 49 58 45 54<br />

76 34 54 34 80 65 50 69 34 50<br />

78 54 34 55 568645 70 45 50<br />

56 54 6 7 89 34 50 52 71 6 1 59<br />

45 55 89 7652 51 55 87 70 90<br />

bladsy 39


Bykomend tot die kolomme van die tabel op bladsy 26in Tredoux en Durrheim<br />

(2002) het ons die ``werklike grense''-kolom wat die RLL en RUL aandui.<br />

Frekwensieverspreiding: Assesseringstellings vir beoordelaars van aansoekers op die<br />

kortlys<br />

Klasinterval<br />

Werklike<br />

bogrens<br />

Frekwensie Kumulatiewe<br />

frekwensie<br />

Persentasiefrekwensie<br />

Kumulatiewe<br />

persentasiefrekwensie<br />

81±90 80,5±90,5 7 80 8,75 100<br />

71±80 70,5±80,5 8 73 10 91,25<br />

61±70 60,5±70,5 15 65 18,75 81,25<br />

51±60 50,5±60,5 23 50 28,75 62,5<br />

41±50 40,5±50,5 14 27 17,5 33,75<br />

31±40 30,5±40,5 9 13 11,25 16,25<br />

21±30 20,5±30,5 4 4 5 5<br />

80 100<br />

Histogramme word gebruik om gegroepeerde data (interval- of verhoudingsdata)<br />

grafies voor te stel. Hulle lyk soos staafdiagramme, maar verskil in die volgende<br />

opsig:<br />

. Die stawe verteenwoordig frekwensies van gevalle in klasintervalle (en nie die<br />

frekwensie van afsonderlike data-itemwaardes soos in staafdiagramme nie) wat<br />

van links na regs en in volgorde van toenemende grootte gerangskik word.<br />

. Geen oop ruimtes word tussen stawe toegelaat nie, omdat geen gapings tussen<br />

klasse voorkom soos in staafdiagramme nie.<br />

. Die stawe in die grafiese voorstelling word aangedui deur die middelpunt van<br />

elke klasinterval te gebruik. Jy sal die vergelyking vir die middelpunt van die<br />

klasinterval op bladsy 27 van Tredoux en Durrheim (2002) vind (kyk<br />

vergelyking 2.1).<br />

1. Bestudeer die afdeling ``The histogram'' op bladsy 27 tot 28 van Tredoux en<br />

Durrheim (2002). Voltooi nou aktiwiteit 2.6op bladsy 28.<br />

Die volgende aktiwiteite het betrekking op alles wat jy tot dusver oor<br />

gegroepeerde data geleer het.<br />

2. Voltooi die onderstaande sinne:<br />

2.1 Die werklike ondergrens is die ................... waarde wat in die spesifieke<br />

klasinterval kan klassifiseer.<br />

bladsy 40 . studie-eenheid 4 aanbieding van data


2.2 Die werklike bogrens is die .................... waarde wat in die spesifieke<br />

klasinterval kan klassifiseer.<br />

2.3 Die middelpunt is die .................... van die onder- en bogrens.<br />

2.4 Wanneer gegroepeerde data grafies in die vorm van histogramme<br />

voorgestel word, word die reghoek aan weerskante van die ....................<br />

op die .................... -as van die grafiek getrek.<br />

3. Bepaal die werklike ondergrens, werklike bogrens en middelpunt van die<br />

volgende stel klasintervalle.<br />

Klasinterval Werklike<br />

ondergrens<br />

1±4<br />

Werklike<br />

bogrens<br />

Middelpunt<br />

5±8 6,5<br />

9±12<br />

13±16<br />

17±20<br />

Middelpunt = gemiddelde van die boonste en onderste limiet van die<br />

klasinterval<br />

= (8 + 5)/2<br />

=6,5<br />

4. Stel 'n grafiese aanbieding op van die assesseringstellings vir beoordelaars op<br />

die kortlys.<br />

5. Voltooi oefening 3 (a) en (b) op bladsy 39 van Tredoux en Durrheim (2002).<br />

1. Ons het die middelpunt van die interval 80±89 uitgewerk en jy kan dit as 'n<br />

voorbeeld gebruik. Vergelyk jou berekening met ons s'n en bereken die ander<br />

middelpunte op dieselfde manier.<br />

Middelpunt van klasinterval = WOG +<br />

…WBG WOG†<br />

…2†<br />

Middelpunt van klasinterval 80±89 = 79,5 + ((89,5±79,5)/2)<br />

= 79,5 + 5<br />

= 84,5<br />

2. Die middelpunt vir klasinterval 80±89 is 84,5.<br />

2.1 Laagste (kleinste)<br />

2.2 Hoogste (grootste)<br />

2.3 Gemiddeld<br />

. afdeling 2 data-verwerking: beskrywend<br />

bladsy 41


2.4 middelpunt<br />

horisontale<br />

3. Jy sal sien dat die volgende klasintervalle almal dieselfde grootte van 4 het.<br />

Klasinterval Werklike<br />

ondergrens<br />

4.<br />

Frekwensie<br />

25<br />

20<br />

15<br />

10<br />

5<br />

Werklike<br />

bogrens<br />

Middelpunt<br />

1±4 0,5 4,5 2,5<br />

5±8 4,5 8,5 6,5<br />

9±12 8,5 12,5 10,5<br />

13±1612,5 16,5 14,5<br />

17±20 16,5 20,5 18,5<br />

25,5 35,5 45,5 55,5 65,5 75,5 85,5<br />

ASSESSERINGSTELLINGS<br />

5(a) Omvang = 46+ 1 = 47 en groeperings van 5 gee dus 10 klasintervalle.<br />

Dit is die standaard, en hoewel die besluit betreklik arbitreà r is, sal 'n<br />

klasinterval van 5 gebruik word.<br />

WOG 7 97,495<br />

WBG 7 102,495<br />

Middelpunt 7 (102,495 7 97,495)/2 = 100<br />

bladsy 42 . studie-eenheid 4 aanbieding van data


Tabel: Frekwensieverspreidingstabel van IK-tellings<br />

Klasinterval Frekwensie Kumulatiewe<br />

frekwensie<br />

5(b) Histogram<br />

Frekwensie<br />

14 .<br />

12 .<br />

10 .<br />

8 .<br />

6 .<br />

4 .<br />

2 .<br />

0 . .<br />

85,0<br />

.<br />

90,0<br />

. afdeling 2 data-verwerking: beskrywend<br />

.<br />

95,0<br />

.<br />

100,0<br />

.<br />

105,0 110,0<br />

IK-telling<br />

Persentasiefrekwensie<br />

.<br />

.<br />

115,0<br />

.<br />

120,0<br />

Kumulatiewe<br />

persentasiefrekwensie<br />

82,5±87,49 5 5 8 8<br />

87,5±92,49 8 13 13 21<br />

92,5±97,49 13 2622 43<br />

97,5±102,49 11 37 18 61<br />

102,5±107,49 9 4615 76<br />

107,5±112,49 5 51 8 84<br />

112,5±117,49 2 53 3 87<br />

117,5±122,49 4 57 7 94<br />

122,5±127,49 2 59 3 97<br />

127,5±132,49 1 60 2 100<br />

.<br />

125,0<br />

.<br />

130,0<br />

bladsy 43


In die geval waar 'n telling presies op die werklike bogrens van 'n klasinterval en<br />

op die daaropvolgende klasinterval se werklike ondergrens val, byvoorbeerd 14,5,<br />

kan dit in enige van die twee klasintervalle gegroepeer word. Dit bly egter<br />

belangrik om konsekwent met al hierdie grensgevalle te wees.<br />

Beskrywing van distribusies _________________________________<br />

Jy kan nou ongegroepeerde en gegroepeerde data grafies voorstel. Die<br />

frekwensiestaafdiagram en die histogram wat jy getrek het, kan dan beskryf<br />

word, sodat dit sinvol geõÈ nterpreteer kan word ten opsigte van twee<br />

hoofeienskappe, naamlik skeefheid en kurtose.<br />

. Skeefheid<br />

Bestudeer die afdeling ``Describing frequency distributions'' op bladsy 28 tot 31<br />

van Tredoux en Durrheim (2002).<br />

. Kurtose<br />

Ons verwys na die spitsheid van verspreiding as die kurtose van daardie<br />

verspreiding. Bestudeer die definisie van kurtose wat hieronder gegee word en<br />

sorg dat jy grafies tussen die verskillende soorte kurtose kan onderskei.<br />

Vervolgens haal ons die definisie en beskrywing van die soorte kurtose uit<br />

Howell (1995, pp. 40±42) aan.<br />

Kurtosis has a specific mathemathical definition, but basically it refers to the<br />

relative concentration of scores in the center, the upper and lower ends<br />

(tails), and the shoulders (between the center and the tails) of a distribution.<br />

A normal distribution ... is called mesokurtic. Its tails are neither too thin nor<br />

too thick, and there are neither too many nor too few scores concentrated in<br />

the center. If you start with a normal distribution and move scores from both<br />

the center and the tails into the shoulders, the curve becomes flatter and is<br />

called platykurtic. If, on the other hand, you moved scores from the<br />

shoulders into both the center and the tails, the curve becomes more peaked<br />

with thicker tails. Such a curve is called leptokurtic, ... Notice in this<br />

distribution that there are too many scores in the center and too many scores<br />

in the tails.<br />

Figuur 2.7 op bladsy 30 van Tredoux en Durrheim (2002) bied 'n voorbeeld van 'n<br />

spits (leptokurtiese) en 'n plat (platikurtiese) verspreiding.<br />

1. Identifiseer die twee hoofeienskappe en hulle verskillende soorte,<br />

waarvolgens distribusies beskryf kan word.<br />

2. Maak 'n vryhandskets van elke soort distribusie.<br />

bladsy 44 . studie-eenheid 4 aanbieding van data


1. Skeefheid<br />

. simmetriese distribusie<br />

. bimodale distribusie (tweetoppig)<br />

. unimodale distribusie (eentoppig)<br />

. negatief skewe distribusie (skeef na links, dws die lang stert wys na die<br />

negatiewe/klein getalle toe). 'n Voorbeeld hiervan verskyn regs in figuur<br />

2.6op bladsy 30 van Tredoux en Durrheim.<br />

. positief skewe distribusie (skeef na regs, dws die lang stert wys na die<br />

positiewe/groot getalle toe). 'n Voorbeeld hiervan verskyn links in figuur<br />

2.6op bladsy 30 van Tredoux en Durrheim.<br />

Kurtose<br />

. afdeling 2 data-verwerking: beskrywend<br />

. platikurtiese distribusie (``plat'', dws baie hoeÈ en lae waardes)<br />

. leptokurtiese distribusie (``spits'', dws min hoeÈ en lae waardes)<br />

. mesokurtiese distribusie (``normaal'')<br />

2. Normaal/Mesokurties Skeefheid Negatief skeef Kurtose Leptokurties<br />

Bimodaal Positief skeef Platikurties<br />

Persentielrange en persentiele _______________________________<br />

Om die data nog beter te verstaan, kan ons datafrekwensie-aanbiedings met<br />

kumulatiewe persentasiefrekwensies aanwend om persentiele en persentielrange<br />

uit te werk. Frekwensies maak dit vir ons moontlik om bepaalde waardes in<br />

verhouding tot ander waardes in 'n distribusie te vind, om te bepaal watter<br />

proporsie tellings hoeÈ r of laer as 'n spesifieke waarde leà en om te bepaal watter<br />

proporsie tellings tussen twee waardes leà .<br />

Dit is belangrik om te onderskei tussen die telling wat 'n individu in 'n toets<br />

bladsy 45


ehaal het en die persentielrang wat hierdie telling verteenwoordig, en die<br />

persentiel wat die punt op die skaal is wat met 'n gegewe persentielrang<br />

ooreenstem.<br />

Jy moet die volgende kan bereken en interpreteer:<br />

. persentielrang (vergelyking 2.2 op bladsy 32 van Tredoux en Durrheim (2002))<br />

. persentiele (vergelyking 2.3 op bladsy 33 van Tredoux en Durrheim (2002))<br />

. persentasies of frekwensies van tellings wat onder of bo 'n gegewe telling of<br />

tussen twee tellings leà (formules op bladsy 35 van Tredoux en Durrheim (2002))<br />

Persentiele deel 'n distribusie in 100 klein intervalle in, vanaf die 1ste tot die 100ste<br />

persentiel. Distribusies kan ook in halwes, kwarte en tiendes ingedeel word. Die<br />

50ste persentiel word ook die mediaan genoem, terwyl die 25ste en 75ste persentiel<br />

as die 1ste en 3de kwartiel bekend staan. Die 1ste, 2de, 3de ... desiel is die 10de,<br />

20ste en 30ste persentiel.<br />

Bestudeer die afdeling ``Percentile ranks and percentiles'' op bladsy 31 tot 38 van<br />

Tredoux en Durrheim (2002). Voltooi dan die volgende aktiwiteite.<br />

1. Doen oefening 3(c), (d) en (e) op bladsy 39 van Tredoux en Durrheim (2002).<br />

Jy hoef nie die frekwensietabel vir hierdie datastel op te stel nie, aangesien jy<br />

die een kan gebruik wat jy reeds in oefening 3(a) en (b) gedoen het in die<br />

aktiwiteite aan die begin van hierdie studie-eenheid.<br />

2. Gebruik die tellings van die assessering van beoordelaars op die kortlys en<br />

doen die volgende oefeninge.<br />

2.1 Watter telling word op die 35ste persentiel gevind?<br />

2.2 Bepaal die persentielrang van 70.<br />

Tabel: ESP-tellings (n=30)<br />

7 9 16 6 7 8<br />

4 7 5 11 5 9<br />

4 4 7 5 17 5<br />

8 6 5 4 4 6<br />

610 1 12 4 10<br />

bladsy 46 . studie-eenheid 4 aanbieding van data


1. 3(c) persentielrang = % onder +<br />

2.1<br />

persentielrang = 43 +<br />

=52<br />

100 97;495<br />

5<br />

telling WOG<br />

klasintervalwydte (interval %)<br />

(18)<br />

Ongeveer 52% van die tellings leà by of onder 'n telling van 100. Hierdie<br />

steekproef het 'n gemiddelde telling wat effens laer is as die vir die res<br />

van die populasie.<br />

3(d) telling van p = WOG +<br />

telling van p = 102,495 +<br />

= 107<br />

(e) persentielrang = % onder +<br />

PR % onder<br />

interval % (intervalwydte)<br />

75 61<br />

15 (5)<br />

telling WOG<br />

klasintervalwydte (interval %)<br />

Ons weet dat 75% van die distribusie by of onder 107 leà (kyk (d)). Ons<br />

moet bereken watter persentasie onder 'n telling van 92 val. As ons dit<br />

bepaal het, kan ons bereken watter persentasie tussen die twee tellings leà .<br />

persentielrang = 8 +<br />

= 19,7<br />

92 87;495<br />

5<br />

(13)<br />

Ongeveer 20% van die distribusie leà dus by of onder 92 en ongeveer 75%<br />

leà by of onder 107.<br />

Dus val 75% 7 20% = 55% van die tellings tussen 'n telling van 92<br />

en 107.<br />

telling van p = WOG +<br />

PR % onder<br />

interval % (intervalwydte)<br />

WOG = 50,5 (die werklike ondergrens van die klasinterval<br />

wat die 50ste persentielrangtelling bevat)<br />

PR = 35 (die persentielrang waarin ons belang stel)<br />

% onder = 33,75 (die kumulatiewe % frekwensie van die klasinterval<br />

onder die een waarin ons belang stel)<br />

interval % = 28,75 (die % frekwensie van die klasinterval waarin<br />

ons belang stel)<br />

telling van p = 50,5 +<br />

= 50,93<br />

. afdeling 2 data-verwerking: beskrywend<br />

35 33;75<br />

28;75<br />

(10)<br />

bladsy 47


2.2<br />

telling WOG<br />

klasintervalwydte (interval %)<br />

persentielrang =<br />

Waar:<br />

% onder +<br />

% onder = Kumulatiewe persentasiefrekwensie van die<br />

klasinterval onder die interval waarin die telling<br />

van belang val<br />

telling = die telling ten opsigte waarvan ons die<br />

persentielrang wil bepaal<br />

WOG<br />

klasinterval-<br />

= werklike ondergrens van die interval waarin die<br />

telling van belang val<br />

wydte = die wydte van die klasinterval<br />

interval % = die persentasie van die distribusie wat in die interval<br />

van belang val<br />

% onder = 62,5<br />

telling = 70<br />

WOG<br />

klasinterval-<br />

= 60,5<br />

wydte = 10<br />

interval % =<br />

persentielrang =<br />

=<br />

18,75<br />

62,5 +<br />

70<br />

80,31<br />

60; 5<br />

10<br />

(18,75)<br />

Ons wil jou graag 'n voorbeeld gee van hoe data op 'n rekenaardrukstuk<br />

aangebied word. Ons het SPSS op die datastel hieronder toegepas om 'n<br />

staafdiagram te verkry. As jy toegang tot 'n rekenaar het, sal jy hierdie gegewens<br />

op die CD vind wat die handboek vergesel. Soek onder die laaste opskrif ``A1<br />

Introduction to SPSS'' en kies dan ``Additional exercises''.<br />

Hier volg die frekwensiedata wat die ouderdomme van die verskillende<br />

deelnemers aan die opname toon.<br />

Ouderdom Frekwensie Persentasiefrekwensie<br />

10±18 jaar 17 21,3<br />

18±24 jaar 3 3,8<br />

24±30 jaar 23 28,8<br />

30±40 jaar 20 2,5<br />

40+ jaar 17 21,3<br />

bladsy 48 . studie-eenheid 4 aanbieding van data


Staafdiagram van frekwensiedata<br />

Telling<br />

30 .<br />

20 .<br />

10 .<br />

0 .<br />

10±18 jaar 24±30 jaar 2,5 40+ jaar<br />

18±24 jaar 30±40 jaar<br />

Ouderdomkategorie<br />

Noudat jy studie-eenheid 4 bestudeer het, behoort jy in staat te wees om die<br />

volgende te kan doen:<br />

. 'n Stel data in tabelvorm te kan aanbied, spesifiek as 'n gegroepeerde of<br />

ongegroepeerde frekwensieverspreidingstabel of as 'n kumulatiewe<br />

frekwensieverspreidingstabel<br />

. die volgende tipes grafieke te kan teken:<br />

± frekwensiestaafdiagramme<br />

± histogramme<br />

. distribusies op grond van die volgende twee eienskappe te kan onderskei en<br />

teken:<br />

± skeefheid<br />

± kurtose<br />

. die volgende te kan bereken en verstaan:<br />

± persentielrange<br />

± persentiele<br />

. afdeling 2 data-verwerking: beskrywend<br />

. verskillende tipes grafiese voorstellings en eienskappe daarvan op<br />

rekenaardrukstukke te kan identifiseer.<br />

bladsy 49


5<br />

studie-eenheid vyf<br />

Maatstawwe van<br />

sentrale neiging<br />

Wanneer navorsing gedoen word, word dikwels met groot stelle data<br />

gewerk. 'n Datastel is 'n versameling van al die datapunte wat in 'n<br />

bepaalde ondersoek ingesamel is en wat gewoonlik in tabelvorm<br />

aangebied word. Hierdie datastelle maak waarskynlik op die oog af geen sin nie.<br />

In studie-eenheid 4 het jy geleer dat ons 'n datastel kan saamvat of vereenvoudig<br />

deur dit visueel voor te stel. Die onderstaande stel data is gegrond op 'n gedeelte<br />

van die inligting wat in die eerste week uit die Nuwe-Sterre-aktiwiteite ingesamel<br />

is. Kyk 'n bietjie hoe die deelnemers die eerste week gevaar het. Miskien het jy toe<br />

jy hulle profiel gelees het reeds van een of twee van hulle gehou of nie gehou nie.<br />

Die kompetisie het begin!<br />

Tellings van die voorbereidingsaktiwiteite is volgens 'n 10-puntskaal gedoen, met<br />

1 wat die laagste is en 10 die hoogste. Soos wat in elke kolom aangedui is, is die<br />

telling ontvang vir die verskillende aktiwiteite in die week en die laaste kolom is 'n<br />

totale telling wanneer jy al vyf aktiwiteite bymekaar tel.<br />

Week 1: Puntetellings vir voorbereidingsaktiwiteite<br />

Deelnemers Dramaklasse Stemopleiding<br />

Vernuwing<br />

van beeld<br />

Onderhoudsvaardigheidsopleiding<br />

Opleiding in<br />

die hantering<br />

van aanhangers<br />

en media<br />

Totale<br />

puntetelling<br />

vir<br />

Week 1<br />

1. Vuyo K 8 7 7 8 8 38<br />

2. Lebo 5 65 4 4 24<br />

3. Sasha 8 7 8 4 5 32<br />

4. Susan 67 65 7 31<br />

5. David 65 5 6 4 26<br />

6. Tshepo 7 6 5 6 4 28<br />

7. Indresan 8 65 6 6 31<br />

8. Shelley 8 7 8 68 37<br />

9. Camero 7 8 67 6 34<br />

10. Kerry 9 68 7 5 35<br />

bladsy 50 . studie-eenheid 5 maatstawwe van sentrale neiging


. afdeling 2 data-verwerking: beskrywend<br />

Hierdie studie-eenheid sal 'n alternatiewe metode verduidelik waarin 'n datastel<br />

beskryf kan word, naamlik deur 'n meting van sentrale neiging te gebruik.<br />

Ons ondersoek drie maatstawwe van sentrale neiging: die gemiddelde, modus en<br />

mediaan. Hierdie maatstawwe dui almal die ``middel'' van 'n datastel aan. Die<br />

diagram hieronder bied 'n grafiese voorstelling van die drie maatstawwe. Ons<br />

verwag dat jy die toepaslike blokkies sal invul namate jy deur die studie-eenheid<br />

vorder.<br />

SENTRALE NEIGING<br />

1 2 3<br />

Bestudeer die inleiding tot hierdie tutoriaal op bladsy 40 tot 41 van Tredoux en<br />

Durrheim (2002) wat 'n kort uiteensetting van elke maatstaf van sentrale neiging<br />

bied.<br />

Elke maatstaf word meer volledig in die onderstaande paragrawe bespreek.<br />

Wat is die gemiddelde (X)? ________________________________<br />

Dink terug aan jou skooldae en jou rapport aan die einde van die jaar. Vir elke<br />

vak het jy 'n punt gekry en ook 'n gemiddelde punt vir die jaar wat jou o f laat<br />

slaag o f laat druip het. Gewoonlik is die gemiddelde persentasie van die klas ook<br />

in jou rapport aangedui en was jou ouers gelukkig met jou prestasie of moes jy<br />

verduidelik het waarom jy soveel swakker as die klasgemiddeld presteer het.<br />

Hierdie klasgemiddeld is een van die maatstawwe van sentrale neiging. Ons gaan<br />

eerstens na 'n formeler omskrywing van die gemiddeld kyk en daarna hoe 'n mens<br />

dit uitwerk.<br />

Bestudeer bladsy 41 tot 43 van Tredoux en Durrheim (2002). Let op hoe die<br />

skrywers die begrip omskryf en die formule gebruik.<br />

Hulle verwys op bladsy 43 na een van die beperkings van die gemiddeld, naamlik<br />

dat dit nie rekening hou met uitskietertellings nie. Jy kan hul bespreking op bladsy<br />

bladsy 51


43 tot 44 lees van die geknipte/gesnoeide gemiddelde wat vir die uitwerking van<br />

enige uitskietertellings in die gemiddelde waarde van 'n datastel vergoed. Hoewel<br />

jy bewus moet wees van die geknipte gemiddelde, hoef jy dit nie vir die eksamen te<br />

ken nie.<br />

1. Formuleer jou eie beskrywing van 'n gemiddelde:<br />

_________________________________________________________________<br />

_________________________________________________________________<br />

2. Kyk of jy die gemiddeld vir die volgende datastelle reg kan bereken:<br />

(Let wel: As jy vertroud is met die berekening van die gemiddeld is dit nie<br />

nodig om al ses oefeninge te doen nie. Doen slegs twee en gaan aan met die<br />

volgende vraag.)<br />

2.1 Die telling vir die dramaklasaktiwiteite van al 10 deelnemers<br />

2.2 Die telling vir die stemopleidingsaktiwiteit van al 10 deelnemers<br />

2.3 Susan se telling vir al vyf aktiwiteite<br />

2.4 Die telling vir die onderhoudsvaardigheidsopleidingaktiwiteit vir al 10<br />

deelnemers<br />

2.5 Die puntetellings vir die opleidingsaktiwiteite vir die hantering van<br />

aanhangers en die media vir al 10 deelnemers<br />

2.6Shelley se puntetellings vir al vyf aktiwiteite<br />

3. Wat is die gemiddelde puntetelling vir die voorbereidingsaktiwiteite vir Week<br />

1 van al 10 deelnemers?<br />

1. Die gemiddelde is die som van al die tellings gedeel deur die aantal tellings.<br />

2.1 Dramaklasse: 8+5+8+6+6+7+8+8+7+9 / 10 = 72 / 10 = 7,2<br />

2.2 6,5<br />

2.3 6,2<br />

2.4 5,9<br />

2.5 5,7<br />

2.67,4<br />

3 31,6<br />

Uit dit wat jy hierbo baasgeraak het, behoort die gemiddelde vir jou duidelik te wees en behoort jy<br />

. dit te kan omskryf; en<br />

. dit te kan bereken<br />

bladsy 52 . studie-eenheid 5 maatstawwe van sentrale neiging


Die volgende twee maatstawwe sal dalk vir jou vreemder wees, maar met 'n bietjie<br />

gesonde verstand en nadenke oor die algemene spreektaal en hoe die woorde<br />

gebruik word, sal die begrippe vir jou makliker wees.<br />

Wat is die mediaan? ______________________________________<br />

Die tweede maatstaf van sentrale neiging is die vreemdste, maar as jy mooi<br />

daaroor nadink, is dit dalk voor die hand liggend.<br />

Van watter woord dink jy is mediaan afgelei? Watter betekenisse kan aan die<br />

woord ``medium'' geheg word? (Dink aan die drie keuses wat jy het as jy biefstuk<br />

in 'n restaurant bestel ± goed gaar, medium of half gaar. Hoe sou biefstuk wees<br />

wat medium gaar is?)<br />

Bestudeer bladsy 45 tot 46van Tredoux en Durrheim (2002) en sorg dat jy die<br />

definisie van die term ken en weet hoe om die mediaan te bereken.<br />

Onthou om altyd die volgende drie stappe met die berekening van die mediaan toe<br />

te pas:<br />

1. Bereken altyd eers die mediaanposisie deur middel van die formule.<br />

2. Orden die data ± van die kleinste na die grootste getalle o f van die grootste na<br />

die kleinste getalle.<br />

3. Tel die posisies tot by die mediaanposisie wat jy in stap 1 bereken het en<br />

bepaal die mediaan.<br />

1. Gee jou eie definisie van die term ``mediaan'':<br />

_________________________________________________________________<br />

_________________________________________________________________<br />

2. Bereken die mediaan vir die volgende datastelle:<br />

. afdeling 2 data-verwerking: beskrywend<br />

(Let wel: As jy vertroud is met die berekening van die meidaan is dit nie nodig<br />

om al ses oefeninge te doen nie. Doen slegs twee en gaan aan met die<br />

volgende vraag.)<br />

2.1 Die telling vir die dramaklasaktiwiteite van al 10 deelnemers<br />

2.2 Die telling vir die stemopleidingsaktiwiteit van al 10 deelnemers<br />

2.3 Susan se telling vir al vyf aktiwiteite<br />

2.4 Die telling vir die onderhoudsvaardigheidsopleidingaktiwiteit vir al 10<br />

deelnemers<br />

bladsy 53


2.5 Die puntetellings vir die opleidingsaktiwiteite vir die hantering van<br />

aanhangers en die media vir al 10 deelnemers<br />

2.6Shelley se puntetellings vir al vyf aktiwiteite<br />

3. Wat is die mediaan vir die voorbereidingsaktiwiteite vir Week 1 van al 10<br />

deelnemers?<br />

1. Die mediaan is daardie telling wat presies in die middel van 'n verspreiding<br />

val as al die tellings in numeriese volgorde gerangskik is. Hierdie telling hoef<br />

nie noodwendig in die oorspronklike datastel teenwoordig te wees nie.<br />

2.1 Dramaklasse:<br />

Stap 1: Mediaanposisie = N ‡ 1<br />

2<br />

= 11/2 = 5,5de posisie<br />

Stap 2: 5; 6; 6; 7; 7; 8; 8; 8; 8; 9<br />

Stap 3: 7+8 / 2 = 7,5 (As die mediaanposisie tussen twee tellings leÃ, tel<br />

hierdie tellings by mekaar en deel deur 2. Dit gee vir jou die mediaan.)<br />

2.2 6,5<br />

2.3 6<br />

2.4 6<br />

2.5 5,5<br />

2.68<br />

3 31,5<br />

Jy wonder seker waarom jy nou moet leer om nog 'n maatstaf van sentrale neiging<br />

te bereken as jy reeds weet hoe om die gemiddelde te bepaal. Die mediaan verskil<br />

ietwat van die gemiddelde en kan soms in die plek van die gemiddelde gebruik<br />

word.<br />

Hier volg bykomende inligting oor die verskil tussen die mediaan en die gemiddelde:<br />

. Die wesenlike verskil tussen die gemiddelde en die mediaan is dat die<br />

gemiddelde die waarde van elke telling in die distribusie weerspieeÈ l, terwyl die<br />

mediaan grootliks gegrond is op die posisie van die middelpunt van die<br />

distribusie, sonder om die spesifieke waarde van baie van die tellings in ag te<br />

neem.<br />

. Kyk goed na die volgende tabel:<br />

Tellings Gemiddelde Mediaan<br />

12345 3 3<br />

123450 12 3<br />

1234100 22 3<br />

bladsy 54 . studie-eenheid 5 maatstawwe van sentrale neiging


. afdeling 2 data-verwerking: beskrywend<br />

. Slegs die laaste getal in elke stel tellings verskil. Die gemiddelde weerspieeÈ l<br />

hierdie verskille, maar die mediaan nie. Die spesifieke waarde van die ekstreme<br />

tellings beõÈ nvloed nie die mediaan nie, maar wel die gemiddelde.<br />

Kortom, as jou datastel 'n paar ekstreme uitskieter-datapunte bevat, kan jy die<br />

mediaan in plaas van die gemiddelde bereken sodat jou maatstaf van sentrale<br />

neiging nie deur die uitskietertellings geraak word nie.<br />

Jy het nou die tweede vorm van sentrale neiging bestudeer en behoort<br />

. die mediaan te kan omskryf; en<br />

. die mediaanposisie te kan bepaal om die mediaan te kan bereken.<br />

Wat is die modus? _______________________________________<br />

Die modus is die telling met die hoogste frekwensie in 'n distribusie (dit wil seà , die<br />

telling wat die meeste voorkom).<br />

Bestudeer bladsy 46tot 47 van Tredoux en Durrheim (2002). Sorg dat jy die<br />

definisie van die term ken en weet hoe om die modus te bereken.<br />

1. Formuleer jou eie omskrywing van die term ``modus''.<br />

_________________________________________________________________<br />

_________________________________________________________________<br />

2. Kyk of jy die modus vir die volgende datastelle reg kan bereken:<br />

(Let wel: As jy vertroud is met die berekening van die modus is dit nie nodig<br />

om al ses oefeninge te doen nie. Doen slegs twee en gaan aan met die<br />

volgende vraag.)<br />

2.1 Die telling vir die dramaklasaktiwiteite van al 10 deelnemers<br />

2.2 Die telling vir die stemopleidingsaktiwiteit van al 10 deelnemers<br />

2.3 Susan se telling vir al vyf aktiwiteite<br />

2.4 Die telling vir die onderhoudsvaardigheidsopleidingaktiwiteit vir al 10<br />

deelnemers<br />

2.5 Die puntetellings vir die opleidingsaktiwiteite vir die hantering van<br />

aanhangers en die media vir al 10 deelnemers<br />

2.6Shelley se puntetellings vir al vyf aktiwiteite<br />

3. Wat is die modus vir die voorbereidingsaktiwiteite vir Week 1 van al 10<br />

deelnemers?<br />

1. Die modus is die telling wat die meeste voorkom, dit wil seà , die hoogste<br />

frekwensie het.<br />

2.1 Dramaklasse: 5; 6; 6; 7; 7; 8; 8; 8; 8; 9, dus die modus is = 8.<br />

bladsy 55


3 31<br />

2.2 6en 7 (bimodaal)<br />

2.3 6en 7 (bimodaal)<br />

2.4 6<br />

2.5 4<br />

2.68<br />

Die aktiwiteite hierbo het jou sekerlik in staat gestel om:<br />

. die modus te kan omskryf; en<br />

. dit te kan bereken<br />

Wat beteken sentrale neiging? _______________________________<br />

Voltooi die diagram aan die begin van die studie-eenheid deur die drie<br />

maatstawwe van sentrale neiging in die toepaslike blokkies in te vul.<br />

Noudat jy die diagram aan die begin van die studie-eenheid voltooi het, het jy al<br />

drie die maatstawwe van sentrale neiging baasgeraak. Maar het jy al gedink wat<br />

sentrale neiging behels? Hoekom stel ons as bedryfsielkundiges (en ander mense)<br />

belang in maatstawwe van sentrale neiging? Wat is die nut, voordele en nadele<br />

daarvan?<br />

Sit terug en dink 'n bietjie oor die konsep sentrale neiging. Probeer nou jou eie<br />

omskrywing van sentrale neiging formuleer op grond van die kennis wat jy in die<br />

voorgaande baasgeraak het.<br />

Die figuur hieronder toon die relatiewe posisies van die modus, mediaan en<br />

gemiddelde vir verskillende distribusies.<br />

bladsy 56 . studie-eenheid 5 maatstawwe van sentrale neiging


Gemiddelde, mediaan en modus vir verskillende distribusies<br />

Gemiddelde<br />

Mediaan<br />

Modus<br />

Modus Gemiddelde<br />

Mediaan<br />

Bron: McCall (1986)<br />

. afdeling 2 data-verwerking: beskrywend<br />

Modus Gemiddelde Modus<br />

Mediaan<br />

Gemiddelde Modus<br />

Mediaan<br />

Tredoux en Durrheim (2002) toon op bladsy 49 hoe die mediaan, modus en<br />

gemiddelde met behulp van Microsoft Excel uitgewerk kan word. Hoewel jy<br />

hierdie berekeninge nie vir die eksamen in Microsoft Excel moet kan doen nie,<br />

moet jy tog kennis neem van hoe die antwoorde in hierdie rekenaarprogram<br />

voorgestel word.<br />

Nadat jy hierdie studie-eenheid sorgvuldig bestudeer het, behoort jy<br />

. te verstaan wat sentrale neiging beteken en te weet dat die gemiddelde, mediaan<br />

en modus die algemeenste maatstawwe van sentrale neiging is<br />

. die gemiddelde, mediaan en modus van 'n datastel te kan beskryf en bereken;<br />

en<br />

. enkele voor- en nadele van die maatstawwe van sentrale neiging te kan<br />

identifiseer<br />

bladsy 57


6<br />

studie-eenheid ses<br />

D<br />

C<br />

B<br />

A<br />

3 "<br />

Maatstawwe van<br />

varieerbaarheid<br />

In die voorgaande studie-eenheid het jy geleer van die verskillende<br />

maatstawwe van sentrale neiging: die modus, mediaan en gemiddelde.<br />

Hierdie maatstawwe van sentrale neiging dui aan waar die middelpunt van<br />

'n groep tellings leà . Die berekening van die maatstawwe van varieerbaarheid bied<br />

nog 'n tegniek wat gebruik kan word om 'n groep tellings te beskryf. Hierdie<br />

metode behels meer as bloot die bepaling van die middelpunt van 'n groep tellings.<br />

Ons gee nou 'n voorbeeld om die verwantskap tussen maatstawwe van<br />

varieerbaarheid en maatstawwe van sentrale neiging te verduidelik.<br />

Gestel dat jy betrokke was by 'n ondersoek wat in jou organisasie gedoen is. Julle het<br />

die spanningsdruk by werknemers in vier verskillende departemente gemeet,<br />

naamlik in die departement finansies, mensehulpbronne, bemarking en klieÈ ntediens.<br />

Kyk nou na die vier stelle data van die tellings vir die stresvlakke van die<br />

personeel in die vier departemente. Al die departemente toon dieselfde<br />

gemiddelde, naamlik 5.<br />

A: Departement Finansies: 4 5 6<br />

B: Departement Mensehulpbronne: 3 5 7<br />

C: Departement KlieÈ ntediens: 2 5 8<br />

D: Departement Bemarking: 1 5 9<br />

Ons kan dit grafies voorstel:<br />

0 1 2 3 4 5 6 7 8 9 10<br />

bladsy 58 . studie-eenheid 6 maatstawwe van varieerbaarheid


. afdeling 2 data-verwerking: beskrywend<br />

Jy sal merk dat al die werknemers oor die algemeen dieselfde mate van<br />

spanningsdruk ervaar het (jy het 'n gemiddelde van 5 uit 10 vir al vier<br />

departemente verkry). Maar as jy die res van die inligting bestudeer wat in die<br />

datastelle voorkom, sal jy merk dat elk van die datastelle verskil ten opsigte van<br />

hoe die werknemers se tellings rondom die gemiddelde van 5 versprei is.<br />

Trek nou die pyltjies op die ander datastelle in die figuur in, van die gemiddelde tot<br />

by die onderskeie datapunte, soos ons vir die Departement Finansies gedoen het.<br />

Jy kan nou self sien dat die pyltjies van Departement A na Departement D al hoe<br />

langer word. Dit beteken dat in die Departement Finansies ongeveer al die<br />

werknemers 'n gemiddelde vlak van stres ervaar, maar dat in die Departement<br />

Bemarking sommige persone uiters lae stresvlakke ervaar, sommiges 'n<br />

gemiddelde vlak van stres en ander uiters hoeÈ stresvlakke.<br />

Dit is wat met varieerbaarheid bedoel word. Dit is 'n aanduiding van die mate<br />

waarin individuele waarnemings of tellings rondom hul sentrale waardes<br />

konsentreer of daarvan afwyk, met ander woorde hoeveel hulle rondom die<br />

sentrale waardes varieer (wissel). In ons voorbeeld hierbo word die<br />

varieerbaarheid al hoe groter namate ons van die Departement Finansies na die<br />

Departement Bemarking beweeg.<br />

Bestudeer die inleiding tot tutoriaal 4 op bladsy 52 tot 54 van Tredoux en<br />

Durrheim (2002) waarin die begrip varieerbaarheid aan die hand van twee<br />

voorbeelde verduidelik word. Verduidelik nou self die doel van die maatstawwe<br />

van varieerbaarheid.<br />

Die maatstawwe van varieerbaarheid word gebruik om aan te dui hoe wyd<br />

verspreid tellings in 'n datastel is. Dit toon met ander woorde die verspreiding van<br />

die tellings om die sentrale punt. In ons voorbeeld van die stresvlakke in<br />

verskillende departemente kon ons die verspreiding waarneem van die tellings vir<br />

die spanningsdruk wat die werknemers in elke departement ervaar het.<br />

Dit is noemenswaardig (soos Tredoux en Durrheim (2002) ook meld) dat<br />

varieerbaarheid die grondslag vorm van heelparty ander statistiese konsepte en<br />

prosedures, veral waar dit gaan om die begryping van inferensieÈ le statistiek<br />

(indien nodig, verwys na studie-eenheid 2 vir 'n omskrywing van inferensieÈ le<br />

statistiek).<br />

Nuwe Sterre Week 1:<br />

Die kompetisie is aan die gang!!! Aan die einde van week een is die deelnemers<br />

gevra om 'n uitvoering van 'n liedjie van enige topkunstenaar in Suid-Afrika te<br />

bladsy 59


gee en die beoordelaars het hulle evalueer. Die uitvoerings is geeÈ valueer deur 'n<br />

10-puntskaal te gebruik, met 1 wat die laagste en 10 die hoogste is. Soos in elke<br />

kolom aangedui, is die punte van elk van die beoordelaars bymekaar getel en die<br />

laaste kolom is 'n totale puntetelling wat verkry is deur al die beoordelaars se<br />

punte vir elke deelnemer bymekaar te tel.<br />

Week 1: Uitvoeringstellings<br />

Deelnemers Stella<br />

Debark<br />

Beoordelaar<br />

1<br />

Ricco<br />

Milan<br />

Beoordelaar<br />

2<br />

Zee M<br />

Beoordelaar<br />

3<br />

Angie<br />

Motseneka<br />

Beoordelaar<br />

4<br />

Brian<br />

Mahlangu<br />

Beoordelaar<br />

5<br />

Totale<br />

puntetellings<br />

vir<br />

Week 1<br />

1. Vuyo K 7 668 8 35<br />

2. Lebo 8 67 65 32<br />

3. Sasha 4 7 65 4 26<br />

4. Susan 5 7 8 68 34<br />

5. David 8 8 7 65 34<br />

6. Tshepo 667 65 30<br />

7. Indresan 4 7 65 628<br />

8. Shelley 7 67 7 633<br />

9. Cameron 7 8 8 9 5 37<br />

10. Kerry 6 9 8 7 8 36<br />

Die verskillende maatstawwe van varieerbaarheid __________________<br />

Omvang<br />

Noudat ons na die begrip varieerbaarheid gekyk het, kan ons gaan kyk na die<br />

verskillende wyses waarop dit gemeet kan word, dit wil seà , die verskillende<br />

maatstawwe van varieerbaarheid. In jou geval is drie maatstawwe belangrik om te<br />

ken, naamlik:<br />

. omvang<br />

. variansie<br />

. standaardafwyking<br />

Volgens Tredoux en Durrheim (2002) is omvang die eenvoudigste maatstaf van<br />

varieerbaarheid. Dit is die verskil tussen die hoogste en die laagste tellings in 'n<br />

datastel. Die formule daarvoor is dus soos volg:<br />

omvang = hoogste telling 7 laagste telling<br />

1. Bereken die omvangstellings vir die volgende aspekte in die datastel van<br />

uitvoeringstellings wat hierbo verskaf is.<br />

bladsy 60 . studie-eenheid 6 maatstawwe van varieerbaarheid


Variansie<br />

(Let wel: as jy vertroud is met die berekening van die omvang is dit nie nodig<br />

om al ses oefeninge te doen nie, doen slegs twee en gaan aan met die volgende<br />

vraag.)<br />

1.1 Beoordelaar 2: Ricco Milan se puntetellings vir al 10 deelnemers<br />

1.2 Sasha se puntetellings van al vyf beoordelaars<br />

1.3 Kerry se puntetellings van al vyf beoordelaars<br />

1.4 Beoordelaar 5: Brian Mahlangu se puntetellings vir al 10 deelnemers<br />

1.5 Vuyo K se puntetellings van al vyf beoordelaars<br />

1.6Tshepo se puntetellings van al vyf beoordelaars<br />

2. Wat is die omvang van die puntetellings vir die prestasies van al die<br />

deelnemers vir Week 1?<br />

3 11<br />

. afdeling 2 data-verwerking: beskrywend<br />

1.1 Beoordelaar 2: Ricco Milan: Omvang = hoogste puntetelling ± laagste<br />

puntetelling = 9 ± 6= 3.<br />

1.2 3<br />

1.3 3<br />

1.4 4<br />

1.5 2<br />

1.62<br />

LET WEL: Tredoux en Durrheim (2002) verduidelik begrippe soos die<br />

roupuntomvang (crude range), uitgebreide omvang (extended<br />

range) en interkwartielomvang (interquartile range). Die<br />

inligting wat ons hierbo bied, is egter al wat jy oor die<br />

omvang hoef te ken.<br />

Hierdie tweede maatstaf van varieerbaarheid is sekerlik die een wat jy keer op keer<br />

sal eien soos wat jy met die kursus vorder. Variansie is 'n integrale deel van die<br />

meeste formules by inferensieÈ le statistiek. Dit is raadsaam om variansie deeglik te<br />

bestudeer om te verstaan wat dit beteken, dit te kan bereken en te interpreteer.<br />

Bestudeer die afdeling oor die gemiddelde afwyking en die variansie op bladsy 56<br />

tot 60 van Tredoux en Durrheim (2002).<br />

Let daarop dat jy nie die gemiddelde afwyking hoef te kan beskryf of bereken nie,<br />

maar dat jy wel hierdie werk moet bestudeer omdat dit jou gaan help om die<br />

bladsy 61


egrip variansie te verstaan. Let ook daarop dat die berekeningsoefeninge vir die<br />

variansie gedoen sal word wanneer jy die nodige afdelings vir standaardafwyking<br />

bestudeer het.<br />

Wanneer jy die variansie interpreteer moet jy die volgende in gedagte hou:<br />

. Hoe kleiner die variansie is, hoe nader val die individuele tellings aan die<br />

gemiddelde.<br />

. Hoe groter die variansie is, hoe verder is die individuele tellings om die<br />

gemiddelde versprei.<br />

Die standaardafwyking<br />

Die standaardafwyking is die vierkantswortel van die variansie en word deur s<br />

genoteer. Bestudeer die afdeling in Tredoux en Durrheim (2002) oor die<br />

standaardafwyking, maar slaan die bespreking van die variansiekoeÈ ffisieÈ nt<br />

gerus oor.<br />

Die standaardafwyking is die maatstaf van varieerbaarheid wat die meeste in die<br />

praktyk gebruik word.<br />

Jy sal merk dat Tredoux en Durrheim (2002) eers verduidelik hoe om die variansie<br />

en standaardafwyking vir 'n populasie te bereken. In hierdie kursus verwag ons<br />

dat jy die omvang, variansie en standaardafwyking vir slegs 'n steekproef moet<br />

kan bepaal. Dit is wel nuttig om eers te verstaan hoe om hierdie berekenings vir 'n<br />

populasie te kan doen. Kyk goed na die berekening van die variansie en<br />

standaardafwyking in die uitgewerkte voorbeeld wat Tredoux en Durrheim (2002)<br />

op bladsy 66 gee.<br />

Bestudeer nou die afdeling oor die beraming van populasieparameters uit<br />

steekproefdata op bladsy 61 tot 62 van Tredoux en Durrheim (2002).<br />

Kies die regte antwoord uit die gegewe moontlikhede in die volgende items:<br />

1. Die simbool vir die steekproefvariansie is:<br />

(1) X<br />

2 (2)<br />

(3) s 2<br />

2. Ons gebruik (N 7 1) in die variansieformule omdat<br />

(1) dit ons 'n beter skatting van die populasievariansie gee<br />

(2) dit makliker is om met (N 7 1) te deel; en<br />

(3) dit die verskil tussen distribusies makliker uitwys<br />

bladsy 62 . studie-eenheid 6 maatstawwe van varieerbaarheid


. afdeling 2 data-verwerking: beskrywend<br />

3. Bereken die variansie en standaardafwyking van die volgende puntetellings<br />

wat in die uitvoeringstellingsdatastel voorkom.<br />

(Let wel: indien jy vertroud is met die berekening van die variansie en<br />

standaardafwyking is dit nie nodig om al ses oefeninge te doen nie, doen slegs<br />

twee en gaan aan met die volgende vraag.)<br />

3.1 Beoordelaar 2: Ricco Milan se puntetellings vir 10 deelnemers<br />

3.2 Sasha se puntetellings van al vyf beoordelaars<br />

3.3 Kerry se puntetellings van al vyf beoordelaars<br />

3.4 Beoordelaar 5: Brian Mahlangu se puntetellings vir al 10 deelnemers<br />

3.5 Vuyo K se puntetellings van al vyf beoordelaars<br />

3.6Tshepo se puntetellings van al vyf beoordelaars<br />

4. Wat is die variansie en standaardafwyking van die puntetellings vir die<br />

prestasies van al die deelnemers vir Week 1?<br />

Jy wil nou vasstel hoe hierdie tellings versprei is ten aansien van die sentrale<br />

waardes en hoe dit ten opsigte van hierdie sentrale waardes varieer. Om dit te<br />

doen, moet jy die volgende bereken: gemiddelde, modus, mediaan, omvang,<br />

variansie en standaardafwyking.<br />

5. Hieronder word 'n aantal statistiese tegnieke en notasies gegee. Vul dit in die<br />

onderstaande sinoptiese kaart in die regte spasie in.<br />

Omvang X<br />

s Variansie<br />

Modus Gemiddelde<br />

Standaardafwyking Mediaan<br />

s 2<br />

Tegnieke om data en steekproewe met een veranderlike te interpreteer<br />

Maatstawwe van sentrale neiging Maatstawwe van varieerbaarheid<br />

bladsy 63


1. Alternatief (3) is die regte antwoord. Alternatief (2) verteenwoordig die<br />

populasievariansie, terwyl alternatief (1) die gemiddelde vir 'n datastel X is.<br />

2. Dit is belangrik om te onthou dat die variansieformule altyd (N ±1) is, omdat<br />

dit ons 'n beter skatting van die populasievariansie gee.<br />

3. Soos voorheen genoem is, is dit raadsaam om altyd eers die volgende tabel te<br />

voltooi voor enige berekenings gedoen word.<br />

Deelnemers Ricco Milan<br />

Beoordelaar 2<br />

X<br />

X 2<br />

1. Vuyo K 4 16<br />

2. Lebo 7 49<br />

3. Sasha 9 81<br />

4. Susan 10 100<br />

5. David 3 9<br />

6. Tshepo 12 144<br />

7. Indresan 7 49<br />

8. Shelley 636<br />

9. Cameron 11 121<br />

10. Kerry 5 25<br />

N=10 X =70 X 2 = 500<br />

3.1 Variansie:<br />

s2 X = X2 … X† 2<br />

N<br />

N 1<br />

…70† 2<br />

10<br />

= 500<br />

10 1<br />

= 500 ± 490 / 9<br />

= 1,11<br />

Standaardafwyking:<br />

sX = s2 q<br />

X<br />

p<br />

= 1; 11 = 1,05<br />

3.2 1,7 1,3<br />

3.3 8,7 2,95<br />

3.4 2,2 1,48<br />

3.5 1,0 1,0<br />

3.60,5 0,71<br />

bladsy 64 . studie-eenheid 6 maatstawwe van varieerbaarheid


4 12,5 3,54<br />

5. Die volgende is 'n eenvoudige samevatting van die statistiese tegnieke en die<br />

notasies wat daarvoor gebruik word, wat jy in studie-eenheid 5 (tutoriaal 3 in<br />

Tredoux en Durrheim (2002)) en studie-eenheid 6(tutoriaal 4 in Tredoux en<br />

Durrheim (2002)) geleer het.<br />

Tegnieke om data en steekproewe met een veranderlike te interpreteer<br />

Maatstawwe van sentrale neiging Maatstawwe van varieerbaarheid<br />

Modus Mediaan Gemiddelde Omvang Variansie Standaardafwyking<br />

X s 2 s<br />

Alle variansies en standaardafwykings is positiewe getalle. Indien jy 'n negatiewe<br />

antwoord kry en/of die vierkantswortel van 'n negatiewe getal probeer bereken,<br />

het jy beslis 'n fout begaan. Gaan jou berekenings na!<br />

Ons het in die inleiding tot hierdie studiegids gemeld dat verskeie<br />

rekenaarprogramme beskikbaar is om die statistieke te bereken wat in hierdie<br />

kursus verduidelik word. Tredoux en Durrheim (2002) stel enkele programme<br />

bekend, waaronder Microsoft Excel. Aan die einde van die betrokke tutoriaal (bl<br />

66±67) verduidelik die skrywers ook hoe om die variansie en standaardafwyking<br />

in Microsoft Excel te bereken. Bestudeer hierdie gedeelte van die handboek sodat<br />

jy 'n ander manier ken om statistieke te bereken as jy 'n datastel sou teeÈ kom wat te<br />

groot is om die vereiste statistieke met die hand uit te werk.<br />

Tredoux en Durrheim (2002) verwys na die gebruik van die formules wat reeds in<br />

die program ingevoer is waarmee die berekenings gedoen kan word. Om hierdie<br />

ingeboude formules in te skryf, kan jy die stappe hieronder volg:<br />

Plaas die merker (cursor) in die sel waarin jy die formule wil inskryf (gewoonlik<br />

aan die einde van jou datastel).<br />

Klik op Insert aan die bokant van die skerm.<br />

Kies Function op die kieslys.<br />

. afdeling 2 data-verwerking: beskrywend<br />

bladsy 65


Klik op die woord Statistical in die linkerkantste venster.<br />

Rol af met die merker en lig die standaardafwyking of variansie vir die steekproef<br />

uit deur daarop te klik.<br />

Klik op OK.<br />

Tik die nommer in van die eerste en laaste sel wat jy by jou berekenings wil insluit<br />

en skei die twee nommers met 'n dubbelpunt. As dit reeds korrek ingevul is, klik<br />

op OK.<br />

Die antwoord behoort outomaties in die sel te verskyn waarin jy jou merker aan<br />

die begin geplaas het.<br />

Onthou dat jy Microsoft Excel nie vir die eksamen hoef te kan gebruik nie. Ons<br />

wil jou net hieroor inlig sodat jy ander hulpbronne vir statistiese berekenings ken<br />

en kan benut.<br />

In hierdie studie-eenheid het ons enkele maatstawwe van die verspreiding van<br />

tellings rondom die gemiddelde ondersoek. Die belangrikste maatstawwe is die<br />

variansie en die standaardafwyking wat 'n vername rol gaan speel in jou studie<br />

van die statistiek in hierdie module.<br />

Noudat jy studie-eenheid 6bestudeer het, behoort jy<br />

. te weet wat varieerbaarheid is en dat die drie tipes maatstawwe wat die meeste<br />

gebruik word omvang, variansie en standaardafwyking is; en<br />

. omvang, variansie en standaardafwyking te kan definieer, bereken en<br />

interpreteer.<br />

bladsy 66 . studie-eenheid 6 maatstawwe van varieerbaarheid


7<br />

studie-eenheid sewe<br />

Korrelasie<br />

In studie-eenhede 5 en 6het jy kennis gemaak met datastelle waarin daar net<br />

een veranderlike voorkom. Jy het geleer hoe om hierdie veranderlike te<br />

beskryf met statistieke soos die volgende:<br />

. die gemiddelde (X), en<br />

. die standaardafwyking (s).<br />

. afdeling 2 data-verwerking: beskrywend<br />

In hierdie studie-eenheid kry jy te doen met datastelle met twee veranderlikes.<br />

Jy het sekerlik al met data te doen gekry met twee veranderlikes, X en Y,<br />

byvoorbeeld<br />

X ± prestasie op 'n IOP2601 werkopdrag<br />

Y ± prestasie op 'n IOP2062 werkopdrag<br />

of<br />

X ± aantal foute gemaak deur fabriekswerkers op 'n monteerband<br />

Y ± tyd wat die fabriekswerkers neem om 'n spesifieke taak op die monteerband te<br />

doen.<br />

Indien 'n mens hierdie veranderlikes in aanmerking wil bring, sal jy vrae soos die<br />

volgende kan stel: As studente goed vaar in 'n werkopdrag vir IOP2601, sal hulle<br />

dan ewe goed vaar in 'n opdrag vir IOP2062? Maak fabriekswerkers meer foute<br />

met 'n monteertaak as hulle vinniger werk?<br />

Hierdie vrae dui daarop dat 'n mens die twee veranderlikes gelyktydig wil beskou<br />

en ook die uitwerking wat hulle op mekaar uitoefen, wil ondersoek. Hoe sal die<br />

een veranderlike onder die invloed van die ander fluktueer? Ons wil dus die<br />

verwantskap of korrelasie tussen hierdie twee veranderlikes bepaal.<br />

Wat beteken korrelasie? ____________________________________<br />

Formeel gesproke beantwoord 'n statistiek soos korrelasie bogenoemde vrae, met<br />

ander woorde dit bied die antwoord op die vraag: wat is die verband tussen X en<br />

Y? In hierdie studie-eenheid gaan jy leer hoe om die verwantskap tussen twee<br />

veranderlikes te bepaal met 'n statistiek bekend as korrelasie wat deur die simbool<br />

r voorgestel word.<br />

bladsy 67


Strooiingsdiagramme ______________________________________<br />

Jy wonder seker nou: ons het pas na korrelasie verwys en nou spring ons na 'n<br />

nuwe begrip: strooiingsdiagram. Hoekom? Die antwoord is eenvoudig ± 'n<br />

strooiingsdiagram is eintlik net 'n grafiese voorstelling van korrelasie.<br />

Soos jy weet, is die publiek ook by die Nuwe Sterre-vertoning betrokke ± kykers<br />

kan vir hulle gunsteling ``ster-in-wording'' stem en hulle kan ook deur middel van<br />

'n sosiale netwerkfasiliteit op die Nuwe Sterre-webtuiste met hulle kommunikeer.<br />

In Week 1 het die kykers reeds gesels en vir hulle gunstelinge gestem. Hierdie<br />

aktiwiteite is gekwantifiseer deur die skaal van 1 tot 10 te gebruik, waar 1 die<br />

laagste is en 10 die hoogste telling.<br />

. 1±10: die deelnemers<br />

. X: puntetelling op grond van internet-interaksie<br />

. Y: Tellings op grond van stemming<br />

Telling op grond van stemming<br />

Deelnemers Puntetelling op grond van<br />

internet-interaksie<br />

Puntetelling op grond van internet-interaksie<br />

Tellings op grond van<br />

stemming<br />

1 2 2<br />

2 3 5<br />

3 2 4<br />

4 5 6<br />

5 5 3<br />

6 3 3<br />

7 7 5<br />

8 4 4<br />

9 6 5<br />

10 8 7<br />

Bestudeer die onderstaande strooiingsdiagram van hierdie data wat deur die<br />

rekenaar gegenereer is:<br />

bladsy 68 . studie-eenheid 7 korrelasie


Kon jy agterkom hoe die strooiingsdiagram geteken word?<br />

As jy na die tabel hierbo kyk, sal jy sien dat die datapunte vir deelnemers 1 en 2<br />

soos volg is<br />

Puntetelling op grond van<br />

stemming<br />

Deelnemer X Y<br />

y<br />

8<br />

7<br />

6<br />

5<br />

4<br />

3<br />

2<br />

1<br />

1 2 2<br />

2 3 5<br />

. afdeling 2 data-verwerking: beskrywend<br />

Op die onderstaande diagram is hierdie twee datapunte reeds met swart kolle<br />

aangedui.<br />

x<br />

1 2 3 4 5 6 7 8<br />

Puntetelling op grond van internet-interaksie<br />

Sien jy dat Deelnemer 1 se datapunt reg bokant 2 op die x-as en regs van 2 op die<br />

y-as is? Dit is hoe so 'n datapunt geplot word.<br />

Skryf die regte syfer op die volgende twee stippellyne in:<br />

Deelnemer 2 se datapunt is bokant ... op die x-as, en regs van ... op die y-as. (Die<br />

twee syfers is 3 en 5.) Maak seker of Deelnemer 2 se datapunt korrek op die<br />

grafiek aangedui is. Jy behoort nou te verstaan hoe 'n strooiingsdiagram geteken<br />

word.<br />

Gebruik nou die tabel met al 10 werknemers se data en teken die datapunte vir<br />

Deelnemers 3 tot 10 op die grafiek, al het jy die korrek voltooide<br />

rekenaargegenereerde strooiingsdiagram reeds gesien. Jou leerdoelwit is om dit<br />

self te kan teken.<br />

Wanneer jy klaar is, moet jou strooiingsdiagram lyk soos die reeds voltooide<br />

rekenaargegenereerde een. Vergelyk dit daarmee.<br />

bladsy 69


Die korrelasiekoeÈffisieÈnt ____________________________________<br />

Noudat jy strooiingsdiagramme kan plot, kom ons keer terug na korrelasie, of om<br />

meer spesifiek te wees, die korrelasiekoeÈ ffisieÈ nt.<br />

Berekening van die korrelasiekoeÈfisieÈnt _________________________<br />

Blaai agtertoe in jou studiegids waar 'n lys van formules voorsien word. Soek die<br />

formule langs die simbool r. Ons gaan hierdie formule gebruik om die<br />

korrelasiekoeÈ ffisieÈ nt te bereken. Hierdie formule staan bekend as Pearson se<br />

produkmoment-korrelasiekoeÈ ffisieÈ nt en word algemeen gebruik om korrelasie te<br />

bereken.<br />

Onthou jy nog die verskillende berekeninge van die sommasienotasie wat jy in<br />

studie-eenheid 3 en tutoriaal 24 geleer het? Indien nie, blaai gou terug en verfris<br />

jou geheue. Jy sal altyd weet wat N is, dus as jy die waardes X, Y , X 2 , Y 2 ,<br />

XY , X Y , bereken het, hoef jy dit net te vervang in die formule en die<br />

oorblywende berekeninge te doen.<br />

Werk deur die praktiese voorbeeld hieronder wat jou sal wys hoe om te werk te<br />

gaan as ons jou 'n opdrag soos die volgende gee:<br />

Bereken die verband tussen die puntetellings op grond van die internet-interaksie<br />

(X) op die sosiale netwerkwebtuiste en die stemming (Y) vir die 10 deelnemers.<br />

(Hierdie is dieselfde as die data wat jy gebruik het om die strooiingsdiagram<br />

vroeeÈ r te plot.)<br />

bladsy 70 . studie-eenheid 7 korrelasie<br />

Deelnemer X Y<br />

1 2 2<br />

2 3 5<br />

3 2 4<br />

4 5 6<br />

5 5 3<br />

6 3 3<br />

7 7 5<br />

8 4 4<br />

9 6 5<br />

10 8 7


X Y X 2<br />

2 2 4 4 4<br />

3 5 9 25 15<br />

2 4 4 16 8<br />

5 625 3630<br />

5 3 25 9 15<br />

3 3 9 9 9<br />

7 5 49 25 35<br />

4 4 161616<br />

65 3625 30<br />

8 7 6 4 49 56<br />

SX =45 SY =44 SX 2 = 241 SY 2 = 214 SXY = 218<br />

Nadat jy nou die tabel hierbo voltooi het, is dit net nodig om die notasies met die<br />

syfers te vervang.<br />

r =<br />

N XY X Y<br />

‰N X2 … X† 2 Š‰N Y 2 … Y † 2 p<br />

Š<br />

10 218 …45†…44†<br />

=<br />

‰10 241 …45† 2 Š‰10 214 …44† 2 p<br />

Š<br />

=<br />

=<br />

p 2180 1980<br />

‰2 410 2 025Š‰2 140 1936Š<br />

200 p<br />

‰385Š‰204Š<br />

= 200 p<br />

8 540<br />

= 200<br />

280;24988<br />

= 0; 71365<br />

= 0,71<br />

'n KorrelasiekoeÈ ffisieÈ nt kan net 'n waarde van ±1 tot 1 aanneem.<br />

Dus, as jou antwoord ooit kleiner as () 1 is, kontroleer jou<br />

berekeninge! Jy het beslis iewers 'n berekeningsfout gemaak!<br />

Probeer nou om die volgende oefening self te doen:<br />

. afdeling 2 data-verwerking: beskrywend<br />

1. Is daar 'n verband tussen die puntetellings wat deelnemers behaal het vir die<br />

voorbereidingsaktiwiteite en hul uitvoerings teenoor die beoordelaars aan die<br />

einde van die eerste week?<br />

Y 2<br />

XY<br />

bladsy 71


Deelnemers Voorbereidingsaktiwiteite<br />

X<br />

Uitvoerings-puntetellings<br />

Y<br />

1 38 35<br />

2 24 32<br />

3 32 26<br />

4 31 34<br />

5 26 34<br />

628 30<br />

7 31 28<br />

8 37 33<br />

9 34 37<br />

10 35 36<br />

N=10 SX = 316 SY = 325<br />

Om bogenoemde navorsingvraag te beantwoord, bereken die produkmomentkorrelasie-koeÈ<br />

ffisient vir bogenoemde data.<br />

2. Wat is die verhouding tussen die puntetellings vir die deelnemers se onderhoudsvaardigheidskursus<br />

en die aanhangers- en mediahanterings-kursus<br />

onderskeidelik?<br />

bladsy 72 . studie-eenheid 7 korrelasie<br />

Deelnemers Onderhoudsvaardigheidskursus<br />

Aanhangers- en mediahanteringskursus<br />

1 8 8<br />

2 4 4<br />

3 4 5<br />

4 5 7<br />

5 6 4<br />

6 6 4<br />

7 6 6<br />

8 6 8<br />

9 7 6<br />

10 7 5<br />

N=10 SX =59 SY =57


Bereken die produkmomentkorrelasie-koeÈ ffisieÈ nt vir hierdie data.<br />

Onthou dat jy moet begin met die voltooiing van die tabel deur al die<br />

``sommasienotasies'' te doen. Dit maak dinge makliker vir jou vir al die<br />

berekenings wat jy later moet doen, jy sal slegs die waardes in hierdie<br />

sommasienotasietabel in die verskillende formules vervang. So maak seker jy<br />

werk baie akkuraat en dat al jou berekenings reg is. Voordat jy paniekerig word<br />

en dink jou antwoord is verkeerd, gaan jou berekenings na.<br />

1 0,31<br />

2 0,42<br />

So wat beteken hierdie antwoorde vir ons oor die verband tussen hierdie<br />

veranderlikes? Om verslag te gee dat daar 'n verhouding van 0,31 tussen<br />

voorbereidingsaktiwiteite en uitvoeringstellings is, beteken nie veel nie. Daarom<br />

moet ons die korrelasiekoeÈ ffisieÈ nt interpreteer.<br />

Interpretasie van die korrelasiekoeÈffisieÈnt ________________________<br />

Ons gaan vier wyses van interpretering van 'n korrelasiekoeÈ ffisieÈ nt met jou behandel:<br />

. Aard<br />

. Sterkte<br />

. Afleidings<br />

. Gemeenskaplike variansie<br />

Aard<br />

Wat die aard van 'n korrelasiekoeÈ ffisieÈ nt betref, kan 'n korrelasie o f negatief o f<br />

positief wees:<br />

. positief (0,00 tot 1,00)<br />

of<br />

. negatief (±1,00 tot 0,00)<br />

. afdeling 2 data-verwerking: beskrywend<br />

Bepaal die aard van die korrelasie deur na die antwoord te kyk. As die antwoord<br />

wat jy verkry het positief is, is die verband ook positief en omgekeerd. Maar wat<br />

beteken 'n positiewe of negatiewe verwantskap?<br />

Volgens Tredoux en Durrheim (2002, p. 184 beteken 'n r van ±1 'n perfekte<br />

negatiewe korrelasie ('n perfekte inverse relasie waarin die waarde van Y afneem<br />

namate die waarde van X toeneem), terwyl 'n r van +1 'n perfekte positiewe<br />

korrelasie beteken (waar die waarde van X en Y saam toeneem en afneem).<br />

Jy kan ook die aard van 'n korrelasie bepaal deur na die strooiingsdiagram van<br />

die twee veranderlikes te kyk. As die datastel strek vanaf die linkerkantste hoek<br />

bladsy 73


onder na die regterkantste hoek bo, is die verband positief (namate X toeneem,<br />

neem die waardes van Y ook toe). Strek die datastel egter van die linkerkantste<br />

hoek bo na die regterkantste hoek onder, is die verwantskap negatief (namate X<br />

toeneem, neem die waardes van Y af). Hierdie verhoudings word grafies<br />

voorgestel in figuur 10.4 en 10.5 op bladsy 172 van Tredoux en Durrheim (2002).<br />

Voorbeelde van 'n positiewe korrelasie<br />

. Algemeen. Hoe meer snye brood 'n persoon daagliks vir middagete nuttig, hoe<br />

groter sal die persoon se gewig wees. Dit is 'n positiewe korrelasie omdat 'n<br />

toename in een veranderlike (die aantal snye brood) met 'n toename in die<br />

ander veranderlike korreleer (gewig).<br />

. In die werksituasie. Hoe meer jare opleiding 'n persoon ontvang het, hoe hoeÈ ris<br />

die persoon se salaris.<br />

Voorbeelde van 'n negatiewe korrelasie<br />

. Algemeen. Hoe swaarder die vrag wat 'n voertuig dra, hoe minder kilometers<br />

sal dit op 'n tenk brandstof kan afleà . Dit is 'n negatiewe korrelasie omdat 'n<br />

toename in een veranderlike (gewig van die vragmotor) met 'n afname in die<br />

ander veranderlike (getal kilometers per tenk) korreleer.<br />

. In die werksituasie. Hoe meer werksdae fabriekswerkers afwesig is, hoe laer is<br />

die fabriek se uitset.<br />

Sterkte<br />

Beskou die strooiingsdiagram wat jy vroeeÈ r in hierdie studie-eenheid voltooi het.<br />

Dui hierdie strooiingsdiagram 'n positiewe of 'n negatiewe verwantskap aan?<br />

Dit is effens moeiliker om die sterkte van 'n verband te interpreteer.<br />

Die korrelasiekoeÈ ffisieÈ nt is 'n punt op 'n skaal vanaf ±1 tot 1. As die waarde van r<br />

gelyk is aan 0, is daar geen korrelasie en dus geen verband tussen X en Y nie. Hoe<br />

nader daardie waarde aan enige van hierdie twee syfers leà , hoe sterker is die<br />

verband tussen die veranderlikes.<br />

Hieronder is 'n skaal om 'n korrelasiekoeÈ ffisieÈ nt te interpreteer. Kom ons noem<br />

dit ons korrelasie-interpretasieskaal. Jy moet dit kan gebruik om<br />

korrelasiekoeÈ ffisieÈ nte mee te interpreteer.<br />

. swak (0,00 tot 0,39)<br />

of<br />

. matig (0,40 tot 0,79)<br />

of<br />

. sterk (0,80 tot 1,00)<br />

bladsy 74 . studie-eenheid 8 korrelasie


Afleiding<br />

Figuur 10.7 op bladsy 172 van Tredoux en Durrheim (2002) bied 'n illustrasie van<br />

'n swak korrelasie.<br />

Interpreteer die volgende korrelasiekoeÈ ffisieÈ nte:<br />

1. ± 0,95<br />

2. 0,35<br />

3. 0,82<br />

4. ± 0,70<br />

5. 2,48<br />

6. 0,0<br />

Gemeenskaplike variansie<br />

. afdeling 2 data-verwerking: beskrywend<br />

1. Sterk negatiewe korrelasie<br />

2. Swak positiewe korrelasie<br />

3. Sterk positiewe korrelasie<br />

4. Matige negatiewe korrelasie<br />

5. 'n Onmoontlike korrelasie Ð hierdie waarde dui op 'n foutiewe berekening of<br />

'n drukfout! (Lees weer die vorige wenk.)<br />

6. Geen korrelasie<br />

Samevattend: Jy het nou van twee fasette van korrelasie geleer, naamlik die sterkte<br />

en aard daarvan.<br />

. Die aard van die korrelasie (dit wil seà positief of negatief) word deur die rigting<br />

van die lyn daarvan bepaal.<br />

. Die sterkte van die korrelasie word deur die konsentrasie van punte bepaal: hoe<br />

nader hulle aan 'n reguit lyn leà hoe sterker is die korrelasie.<br />

Jy moet ook die korrelasiekoeÈ ffisieÈ nt kan gebruik om afleidings te maak ten<br />

opsigte van die twee veranderlikes waartussen die korrelasie bereken is.<br />

As die korrelasie byvoorbeeld 0,68 is tussen die mate van werksbevrediging en<br />

kwaliteit van werklewe, wat 'n matige positiewe korrelasie (volgens die korrelasieinterpretasieskaal)<br />

is, sal die afleiding wees dat mense wat 'n hoeÈ mate van<br />

werksbevrediging ervaar, ook 'n hoeÈ kwaliteit werklewe ervaar.<br />

Ons wil jou nou reeds voorstel aan die r 2 interpretasie van korrelasie (jy sal weer<br />

hiervan leer in studie-eenheid 9). Dit is die proporsie variansie in X-tellings wat<br />

toe te skryf is aan variansie in Y-tellings, dit wil seà gedeelde/gemeenskaplike<br />

variansie tussen X en Y. Dus<br />

bladsy 75


2 : proporsie gemeenskaplike variansie, wat bereken word deur die<br />

korrelasiekoeÈ ffisieÈ nt (r) te kwadreer<br />

r 2 6 100: persentasie gemeenskaplike variansie<br />

LET WEL: Slegs r 2 kan na 'n persentasie omgeskakel word, nie r nie.<br />

'n Korrelasie (r) kan nie regstreeks as 'n persentasie uitgedruk word nie. Dit is<br />

heeltemal verkeerd om te seà dat 'n korrelasie van byvoorbeeld 0,75 op 'n<br />

korrelasie van 75% tussen X en Y dui.<br />

Bestudeer die afdeling ``Correlation coefficients cannot be directly compared'' op<br />

bladsy 191 tot 192 van Tredoux en Durrheim (2002).<br />

Die volgende figuur bied 'n grafiese voorstelling van enkele waardes van r, r 2 en<br />

r 2 6 100:<br />

Korrelasie as gemeenskaplike variansie<br />

X Y r = 0,00 X Y r = 0,60<br />

r 2<br />

= 0,00 r 2<br />

= 0,36<br />

r 2 6 100 = 0% r 2 6 100 = 36%<br />

X Y r = 0,20 X Y r = 0,80<br />

r 2<br />

= 0,04 r 2<br />

= 0,64<br />

r 2 6 100 = 4% r 2 6 100 = 64%<br />

X Y r = 0,40 XY r = 1,00<br />

r 2<br />

= 0,16 r 2<br />

= 1,00<br />

r 2 6 100 = 16% r 2 6 100 = 100%<br />

Die voorafgaande bespreking van die aard, sterkte, afleiding en gemeenskaplike<br />

variansie van korrelasie verduidelik hoe om 'n korrelasiekoeÈ ffisieÈ nt te<br />

interpreteer. Dit is belangrik om te sorg dat jou interpretasie van 'n korrelasiekoeÈ<br />

ffisieÈ nt sinvol is. Daar is bepaalde wyses waarop die korrelasie-koeÈ ffisieÈ nt NIE<br />

beskou of geõÈ nterpreteer moet word nie. Ons het reeds genoem dat 'n korrelasiekoeÈ<br />

ffisieÈ nt nie direk as 'n persentasiewaarde uitgedruk moet word nie. Die<br />

volgende moet ook in ag geneem word:<br />

. Korrelasies verwys na die lineeà re verwantskap tussen twee veranderlikes.<br />

'n Lineeà re verwantskap beteken dat die verband tussen die twee veranderlikes as<br />

bladsy 76 . studie-eenheid 7 korrelasie


'n reguit lyn op 'n strooiingsdiagram getoon kan word. As die datapunte van twee<br />

veranderlikes in 'n ander patroon behalwe 'n reguit lyn op 'n strooiingsdiagram<br />

val, noem ons dit 'n kromlynige verwantskap. Dit word in figuur 10.8 op bladsy<br />

172 van Tredoux en Durrheim (2002) uitgebeeld. Lees ook die gedeelte op bladsy<br />

191 van Tredoux en Durrheim (2002) wat hierdie verskynsel verder belig.<br />

. Die gemiddelde van korrelasiekoeÈ ffisieÈ nte moet nie bereken word nie.<br />

Lees die afdeling op bladsy 191 van Tredoux en Durrheim (2002) wat hierdie saak<br />

uiteensit.<br />

. Korrelasie en oorsaaklikheid<br />

Korrelasie impliseer nie 'n oorsaak-gevolg-verhouding tussen veranderlikes nie.<br />

Neem kennis hiervan en onthou dit wanneer jy 'n korrelasiekoeÈ ffisieÈ nt<br />

interpreteer. Vermy dus woorde soos ``veroorsaak'', ``beõÈ nvloed'' en ``gee<br />

aanleiding tot''.<br />

Indien r = 0,85 vir tellings in 'n werkopdrag en 'n eksamen, beteken dit slegs dat<br />

'n hoeÈ telling in die een gepaardgaan met 'n hoeÈ telling in die ander (of 'n lae<br />

telling in een met 'n lae telling in die ander). Dit beteken nie dat goeie prestasie in<br />

die eksamen veroorsaak is deur goeie prestasie in die werkopdrag nie. (Prakties<br />

beteken dit: moenie dink jy hoef nie te leer vir die eksamen indien jy 'n goeie<br />

telling in 'n werkopdrag behaal het nie!) Lees die afdeling op bladsy 190 van<br />

Tredoux en Durrheim (2002) waar die kwessie van oorsaak en gevolg bespreek<br />

word.<br />

Vul die ontbrekende woorde in:<br />

'n Positiewe korrelasie tussen motivering en produktiwiteit beteken dat werkers<br />

met hoeÈ tellings in 'n meting van motivering .................... tellings in 'n<br />

produktiwiteitmaatstaf het, of dat .................... tellings in een gepaardgaan met<br />

lae tellings in die ander. Dit beteken nie dat hoeÈ produktiwiteit deur gemotiveerde<br />

werkers .................... word nie.<br />

hoeÈ lae veroorsaak<br />

. afdeling 2 data-verwerking: beskrywend<br />

Interkorrelasiematrikse<br />

Moenie skrik vir hierdie begrip nie! In werkopdragte en in die eksamen vra ons<br />

gewoonlik vir jou om die korrelasiekoeÈ ffisieÈ nt tussen net twee veranderlikes te<br />

bereken. In navorsingsprojekte het 'n mens egter meesal baie veranderlikes in 'n<br />

datastel en wil 'n navorser die korrelasies van almal met mekaar bepaal (twee op<br />

'n keer). In hierdie geval gee statistiese ontledingspakkette gewoonlik die<br />

antwoorde in matriksvorm.<br />

bladsy 77


Kyk na die interkorrelasiematriks hieronder en skryf die korrelasies tussen die<br />

gevraagde veranderlikes neer:<br />

Variable Overall Teach Exam Knowledge Grade Enroll<br />

Overall 1,0000 0,8039 0,59560,6818 0,3008 70,2396<br />

Teach 0,8039 1,0000 0,7197 0,5263 0,4691 70,4511<br />

Exam 0,59560,7197 1,0000 0,4515 0,6100 70,5581<br />

Knowledge 0,6818 0,5263 0,4515 1,0000 0,2242 70,1279<br />

Grade 0,3008 0,4691 0,6100 0,2242 1,0000 70,3371<br />

Enroll 70,2396 70,4511 70,5581 70,1279 70,3371 1,0000<br />

(Uit Howell, D.C. 2004. Fundamental statistics for the Behavioral Sciences. 5th edition. London:<br />

Thomson Learning.)<br />

1. Overall en Knowledge: r = .....<br />

2. Exam en Teach: r = .....<br />

3. Exam en Grade: r = .....<br />

4. Knowledge en Knowledge: r = .....<br />

5. Teach en Enroll: r = .....<br />

6. Grade en Exam: r = .....<br />

1. r = 0,68<br />

2. r = 0,72<br />

3. r = 0,61<br />

4. r = 1,00 (Onthou? Die korrelasie van 'n veranderlike met homself is altyd<br />

1,00, met ander woorde 'n perfekte positiewe korrelasie.)<br />

5. r = 0,45<br />

6. r = 0,61 (Vanselfsprekend moet hierdie antwoord dieselfde wees as by vraag<br />

3 omdat dit nie saak maak in watter volgorde die veranderlikes<br />

genoem word nie.)<br />

Faktore wat korrelasies kan beõÈnvloed<br />

Heelparty faktore kan 'n invloed op korrelasie uitoefen, onder meer die volgende:<br />

. Uitskieters in 'n datastel<br />

. Homogeniteit van die populasie<br />

. Beperkings in die omvang van veranderlikes<br />

Bestudeer hierdie faktore op bladsy 185 en 192 tot 195 van Tredoux en Durrheim<br />

(2002). Sorg dat jy hierdie faktore goed genoeg begryp sodat jy dit kortliks kan<br />

omskryf.<br />

bladsy 78 . studie-eenheid 7 korrelasie


'n Ander tipe korrelasie<br />

Dit is nodig dat jy weet dat korrelasies ook bereken kan word vir intervaldata wat<br />

getransformeer is na 'n stel syfers in rangorde of data wat slegs in rangorde<br />

beskikbaar is. (Onthou jy nog die ordinale metingskaal van studie-eenheid 2?)<br />

Spearman se koeÈ ffisieÈ nt kan in sulke gevalle gebruik word. Neem slegs kennis van<br />

wat Tredoux en Durrheim (2002) op bladsy 186tot 187 hieroor seà ± jy hoef nie<br />

hierdie berekenings te kan doen nie.<br />

Lees raam 11.1 en 11.2 op bladsy 188 tot 189 van Tredoux en Durrheim (2002).<br />

Sorg dat jy die korrelasiekoeÈ ffisieÈ nt (r) op die drukstukke kan identifiseer. Onthou<br />

ook dat slegs korrelasies met 'n beduidendheidswaarde (p-waarde) van minder as<br />

0,05 of 0,01 is statisties beduidend. 'n Mens moet daarom altyd kyk na die pwaarde<br />

(beduidendheidswaarde) op die drukstukke ook.<br />

Dis tyd vir 'n bietjie hersiening! Bestudeer die opsomming op bladsy 198 van<br />

Tredoux en Durrheim (2002) waarin die belangrikste sake rakende korrelasie<br />

saamgevat word.<br />

1. Interpreteer die korrelasiekoeffisieÈ nt vir:<br />

1.1 0,71 (internet-interaksie en stemming)<br />

1.2 0,31 (voorbereidingsaktiwiteite en uitvoeringstellings)<br />

1.3 0,42 (onderhoudsvaardigheidskursus en aanhangers- en<br />

mediahanteringskursus)<br />

2. Wat is jou afleiding met betrekking tot die verband tussen die veranderlikes?<br />

2.1 Internet-interaksie en stemming<br />

2.2 Voorbereidingsaktiwiteite en uitvoeringstelling<br />

2.3 Onderhoudsvaardigheidskurus en aanhangers- en mediahanteringskursus<br />

3 Oefening 2 op bladsy 199 in Tredoux en Durrheim (2002)<br />

1.1 Sterk positiewe korrelasie<br />

1.2 Swak positiewe korrelasie<br />

1.3 Matige positiewe korrelasie<br />

. afdeling 2 data-verwerking: beskrywend<br />

2.1 Hoe meer die internet-interaksie met die deelnemers, hoe groter is die kans<br />

dat die deelnemers meer stemme kry.<br />

2.2 Hoe hoeÈ r deelnemers se tellings gedurende hulle voorbereidingsaktiwiteite,<br />

hoe groter is die kans dat hulle hoeÈ r punte vir hul uitvoering kry, maar tot 'n<br />

geringe mate.<br />

bladsy 79


2.3 Soos die telling vir die onderhoudsvaardigheidskursus toeneem, so sal die<br />

puntetellings vir aanhangers- en mediahanteringskursus matig toeneem.<br />

3. Onthou dat die korrelasiekoeÈ ffisieÈ nt nie direk as 'n persentasiewaarde<br />

bereken kan word nie. Slegs r 2 (gemeenskaplike variansie van twee<br />

veranderlikes) kan as 'n persentasiewaarde geõÈ nterpreteer word. Dit<br />

behoort jou in staat te stel om die oefening te voltooi. Met ander woorde,<br />

as jy die persentasiewaarde in die regterkantste kolom deur 100 deel, gee dit<br />

jou die antwoord vir r 2 . Trek dan eenvoudig die vierkantswortel van r 2 om die<br />

antwoord vir r in die linkerkantste kolom te verkry. Om die regterkantste<br />

kolom te voltooi, neem jy die waarde van r wat in die linkerkantste kolom<br />

gegee is, kwadreer dit om die waarde van r 2 te verkry en vermenigvuldig<br />

hierdie antwoord dan met 100 om die persentasiewaarde te bereken. As jy dit<br />

gedoen het, behoort jou voltooide tabel so te lyk:<br />

KorrelasiekoeÈ ffisieÈ nt Gemeenskaplike variansie<br />

van twee veranderlikes<br />

1,0 100%<br />

0,85 72%<br />

0,82 68%<br />

0,79 62%<br />

0,63 40%<br />

0,50 25%<br />

0,45 20%<br />

0,3613%<br />

0,22 5%<br />

0,19 3,6%<br />

0 0%<br />

Noudat jy hierdie studie-eenheid bestudeer het, behoort jy in staat te wees om die<br />

volgende te kan doen:<br />

. die begrip korrelasie te kan omskryf<br />

. 'n strooiingsdiagram te kan teken en interpreteer op grond van die verband<br />

tussen die veranderlikes<br />

. Pearson se produkmoment-korrelasiekoeÈ ffisieÈ nt te kan bereken<br />

. 'n korrelasiekoeÈ ffisieÈ nt te kan interpreteer in terme van:<br />

± sterkte (met die korrelasie-interpretasieskaal)<br />

± aard (met die korrelasie-interpretasieskaal)<br />

± afleidings wat gemaak kan word<br />

± proporsie en persentasie gemeenskaplike variansie<br />

bladsy 80 . studie-eenheid 7 korrelasie


. afdeling 2 data-verwerking: beskrywend<br />

. die korrelasie tussen twee spesifieke veranderlikes in 'n korrelasiematriks te kan<br />

aflees<br />

. die faktore wat korrelasie kan beõÈ nvloed, te verstaan<br />

. een ander tipe korrelasie, naamlik Spearman se koeÈ ffisieÈ nt kortliks te kan<br />

omskryf<br />

. die korrelasiekoeÈ ffisieÈ nt op 'n rekenaardrukstuk te kan identifiseer en<br />

interpreteer<br />

bladsy 81


8<br />

studie-eenheid agt<br />

Regressie<br />

Kom ons kyk eers na die term regressie. In alledaagse taal het die woord<br />

die ongunstige betekenis van afname of agteruitgang. Ons sou<br />

byvoorbeeld na regressie in 'n persoon se fisieke toestand kon<br />

verwys wanneer iemand se gesondheid verswak. In die statistiek het hierdie<br />

term egter 'n heel ander betekenis.<br />

Wat is regressie? ________________________________________<br />

Regressie word in die statistiek gebruik om voorspellings te maak op grond van<br />

inligting wat reeds verkry is. Die onderliggende aanname is dat 'n verwantskap<br />

tussen veranderlikes bestaan. Empiries bevestigde verwantskappe word nagegaan<br />

om voorspellings oor soortgelyke data te maak.<br />

Die blote feit dat ons woorde verband en verwantskap gebruik om te verduidelik<br />

wat die term regressie beteken, behoort 'n aanduiding te wees dat regressie ten<br />

nouste met korrelasie saamhang en selfs daarop berus.<br />

Voorspelling is nog 'n sleutelterm wat uit hierdie verduideliking van regressie na<br />

vore kom. Ons maak van regressieanalise gebruik om 'n veranderlike op grond<br />

van die berekende verwantskap met 'n ander veranderlike te voorspel.<br />

Verskeie dinge in die alledaagse lewe toon 'n bepaalde verwantskap met mekaar<br />

en inligting oor sulke veranderlikes kan gebruik word om voorspellings deur<br />

middel van regressie te maak.<br />

Bestudeer bladsy 160 tot 162 van Tredoux en Durrheim (2002) waar die skrywers<br />

'n kort oorsig van korrelasie bied en na die verband daarvan met regressieanalise<br />

verwys.<br />

Vir ons berekenings van regressie gebruik ons dieselfde datastel van tellings op 'n<br />

internet-interaksiewebtuiste en stemming wat in die vorige studie-eenheid oor<br />

korrelasie gebruik is.<br />

bladsy 82 . studie-eenheid 8 regressie


Deelnemers X Y X 2<br />

8<br />

7<br />

6<br />

5<br />

4<br />

3<br />

Stemming Vir jou gerief herhaal ons die tabel hieronder.<br />

2<br />

1<br />

1 2 2 4 4 4<br />

2 3 5 9 25 15<br />

3 2 4 4 16 8<br />

4 5 625 3630<br />

5 5 3 25 9 15<br />

6 3 3 9 9 9<br />

7 7 5 49 25 35<br />

8 4 4 161616<br />

9 65 3625 30<br />

10 8 7 64 49 56<br />

N=10 SX=45 SY=44 SX 2 =241 SY 2 =214 SXY=218<br />

Die gemiddelde van die X-waardes: X = 4,5<br />

Die gemiddeld van die Y -waardes: Y = 4,4<br />

. afdeling 2 data-verwerking: beskrywend<br />

In studie-eenheid 7 het jy die X- enY-waardes op 'n strooiingsdiagram geteken.<br />

Hierdie strooiingsdiagram is rekenaarmatig gegenereer en word hieronder gegee.<br />

1 2 3 4 5 6 7 8 9<br />

Internet-interaksie tellings<br />

Die regressielyn _________________________________________<br />

Gebruik 'n liniaal en trek 'n ligte stippellyn met potlood deur die punte op die<br />

strooiingsdiagram. Doen dit op so 'n manier dat die lyn die beste aanduiding van<br />

die verspreiding van die punte gee. Lees nou die gedeelte ``The best fitting line'' op<br />

bladsy 162 tot 163 van Tredoux en Durrheim (2002).<br />

Y 2<br />

XY<br />

bladsy 83


Op die heel eenvoudigste vlak word die verwantskap tussen twee stelle data as 'n<br />

reguit lyn uitgebeeld. Hierdie reguit lyn is bloot 'n benadering van die waardes wat<br />

dit voorstel en kan nooit presies deur al die waardes loop nie, behalwe wanneer<br />

die korrelasie perfek is. Die regressielyn maak dit dus vir ons moontlik om<br />

voorspellings te maak.<br />

In die aktiwiteit hierbo het jy geskat waar die bes passende lyn op die<br />

strooiingsdiagram sou leà . Die posisie van hierdie lyn kan egter wetenskaplik<br />

bereken word om te verseker dat ons voorspellings so akkuraat moontlik is. Ons<br />

bereken die posisie van die regressielyn deur van die regressievergelyking gebruik<br />

te maak.<br />

Die regressievergelyking ___________________________________<br />

Die regressielyn wat ons gaan bereken is 'n reguit lyn en daarom is die formule vir<br />

die regressielyn oftewel die regressievergelyking in die algemene formaat van 'n<br />

reguit lyn, naamlik<br />

YÃ = bX + a<br />

met YÃ = die voorspelde Y-waarde (waarde op die Y-as)<br />

b = die helling van die lyn<br />

a = die Y-afsnit (die plek waar die lyn die Y-as sny)<br />

en X = die voorspellerveranderlike (waarde op die X-as)<br />

Lees die bespreking van die regressiekoeÈ ffisieÈ nt op bladsy 163 tot 164 van<br />

Tredoux en Durrheim (2002). Let daarop dat hierdie skrywers se formule vir die<br />

regressielyn effens anders lyk in die sin dat a eerste in hulle formule staan. Dit is<br />

net 'n kwessie van voorkeur. Jy kan die formule wat in hierdie gids aangebied<br />

word as die korrekte een beskou vir gebruik in werkopdragte en die eksamen.<br />

Berekening van die waardes in die regressievergelyking _____________<br />

As jy weer kyk na die regressievergelyking wat hierbo gegee is, sal jy sien dat daar<br />

links in die vergelyking een veranderlike is (YÃ) en regs in die vergelyking drie<br />

veranderlikes (b, a en X). Daar is formules waarmee die waardes van b en a<br />

bereken word deur van die oorspronklike datastel se waardes gebruik te maak<br />

(sien die tabel van waardes vroeeÈ r in hierdie studie-eenheid).<br />

Indien 'n spesifieke waarde vir X gegee word en die b- ena-waardes is reeds<br />

bereken, dan kan die ooreenstemmende YÃ-waarde bereken word.<br />

Die formule vir die b-waarde, wat die helling van die regressielyn gee, word eerste<br />

bladsy 84 . studie-eenheid 8 regressie


gegee. Indien die berekende b-waarde positief is, dui dit op 'n regressielyn met 'n<br />

positiewe helling. So 'n lyn sal van links onder na regs bo loop. Indien die<br />

berekende b-waarde negatief is, dui dit op 'n regressielyn met 'n negatiewe helling.<br />

So 'n lyn met 'n negatiewe helling sal van links bo na regs onder loop. Die formule<br />

om die b-waarde te bereken is soos volg:<br />

b =<br />

N XY … X†… Y †<br />

N X 2 … X† 2<br />

VroeeÈ r in hierdie studie-eenheid is 'n tabel met waardes gegee. Hierdie X- enYwaardes<br />

gaan nou gebruik word om die waardes in die regressievergelyking te<br />

bereken. Jy het al die nodige inligting in die tabel om die onderskeie waardes te<br />

kan bereken. Gebruik nou die tabel-waardes en bereken die b-waarde met die<br />

formule wat hierbo gegee is.<br />

Die korrekte berekening van die b-waarde behoort so te lyk:<br />

b =<br />

= 10…218† …45†…44†<br />

= 2 180 1 980<br />

= 200<br />

385<br />

N XY … X†… Y †<br />

N X 2 … X† 2<br />

10…241† …45† 2<br />

2 410 2 025<br />

= 0,51948<br />

= 0,52<br />

In die regressievergelyking YÃ =bX+ahet ons nou reeds die b-waarde bereken<br />

en ons weet dat dit die helling van die lyn verteenwoordig. Die a-waarde in die<br />

regressievergelyking gee die Y-afsnit, met ander woorde die plek waar die reguit<br />

lyn die Y-as sny. Op die Y-as is alle X-waardes gelyk aan 0. Die a-waarde (Yafsnit),<br />

is dus die Y-waarde wanneer die X-waarde gelyk is aan 0. Die formule vir<br />

die a-waarde is soos volg:<br />

a = Y bX.<br />

. afdeling 2 data-verwerking: beskrywend<br />

Y is die gemiddeld van die Y-waardes en X is die gemiddeld van die X-waardes<br />

wat direk onder die tabel van data vroeeÈ r in hierdie studie-eenheid gegee is.<br />

bladsy 85


Gebruik nou die b-waarde wat jy reeds bereken het, asook die gemiddeldes van die<br />

X- enY-waardes en bereken dan die a-waarde<br />

a = Y bX<br />

=( )7 ( ) ( )<br />

= 7<br />

=<br />

Jy het nou die b-waarde sowel as die a-waarde bereken. Skryf die twee waardes<br />

hier onder:<br />

b =<br />

a =<br />

a = Y bX<br />

= 4,4 7 (0,52) (4,5)<br />

= 4,4 72,34<br />

= 2,06<br />

b = 0,52<br />

a = 2,06<br />

Die regressievergelyking vir hierdie stel data is dus:<br />

YÃ = bX + a<br />

= 0,52X + 2,06<br />

Berekening van waardes deur die regressievergelyking te gebruik ______<br />

Wanneer ons die b-waarde en die a-waarde van die regressievergelyking vir 'n<br />

spesifieke stel data bereken het, kan die regressievergelyking gebruik word om<br />

voorspellings ten opsigte van nuwe data te maak. Deur die regressievergelyking<br />

het ons die verwantskap tussen die X-waardes en Y-waardes van die datastel wat<br />

voorgestel word deur 'n reguitlynformule. Ons kan nou vir enige nuwe X-waarde<br />

die ooreenstemmende Y-waarde bereken met die regressievergelyking omdat ons<br />

op grond van die aanvanklike data die aanname maak dat alle X-waardes en Ywaardes<br />

volgens dieselfde patroon (formule) bymekaar pas.<br />

Bestudeer die voorbeeld wat Tredoux en Durrheim (2002) onder die opskrif<br />

``Making predictions'' op bladsy 167 bied.<br />

Gebruik nou die regressievergelyking wat jy hierbo bereken het om vir elk van die<br />

volgende X-waardes (internet-interaksietelling) die ooreenstemmende Y-waarde<br />

(stemmingtellings) te bereken.<br />

bladsy 86 . studie-eenheid 8 regressie


Bereken die stemmingtelling van 'n persoon wat 'n telling van 1 op die internetinteraksie<br />

behaal het:<br />

Vir X =1: YÃ =bX+a<br />

=( )(1)+( )<br />

= _____<br />

Bereken nou ook die stemmingtelling van 'n persoon wat 'n telling van 10 op die<br />

internet-interaksie behaal het:<br />

Vir X = 10: YÃ =bX+a<br />

= ( ) (10) + ( )<br />

. afdeling 2 data-verwerking: beskrywend<br />

= _____<br />

Vir die X-waarde van 1 is die ooreenstemmende Y-waarde gelyk aan 2,58. Dit<br />

beteken dat die getallepaar (1; 2,58) op die regressielyn sal val.<br />

Vir 'n X-waarde van 10 is die ooreenstemmende berekende Y-waarde gelyk aan<br />

7,26. Dit beteken dat die geordende getallepaar (10; 7,26) ook op die regressielyn<br />

sal val.<br />

Onthou dat sodra die b-waarde en die a-waarde bereken is, dan verwys die<br />

regressievergelyking na een spesifieke reguit lyn. Enige punt (getallepaar) wat dan<br />

met daardie vergelyking bereken word, sal dan op die lyn leà .<br />

Dit is redelik maklik om vir 'n gegewe X-waarde die ooreenstemmende Y-waarde<br />

te bereken deur die regressievergelyking te gebruik en die bekende waardes te<br />

vervang. Gebruik die regressievergelyking om die ooreenstemmende Y-waarde te<br />

bereken indien die X-waarde bekend is. Die getallepaar (X;Y) wat so verkry word<br />

(met YÃ =bX+a), sal altyd op die spesifieke regressielyn val.<br />

Vir interessantheid: Die kooÈ rdinaat (X; Y ) sal altyd op die regressielyn val. Deur<br />

die gemiddeldes van die twee stelle waardes te bereken, kan jy reeds een<br />

kooÈ rdinaat kry wat op die regressielyn sal val.<br />

Twee maniere om die grafiek van die regressielyn te skets ___________<br />

'n Reguit lyn word uniek gekenmerk deur die plek waar dit deur die Y-as gaan en<br />

die helling van die lyn. 'n Spesifieke reguit lyn kan op meer as een manier geteken<br />

word. Ons gaan vir jou twee verskillende maniere wys om dieselfde reguit lyn te<br />

teken.<br />

bladsy 87


Metode 1:<br />

. In die eerste metode maak ons gebruik van die feit dat enige twee punte wat op<br />

'n reguit lyn leà met mekaar verbind kan word om die lyn te teken:<br />

. Gebruik dieselfde X-waardes (X =1enX = 10) wat in die vorige aktiwiteit<br />

gebruik is om ooreenstemmende Y-waardes te bereken. Die twee getallepare (1;<br />

2,58) en (10; 7,26) sal albei op die regressielyn leà met die regressievergelyking:<br />

YÃ = 0,52X + 2,06.<br />

± Gebruik 'n gekleurde pen en plot die twee punte op die strooiingsdiagram<br />

wat vroeeÈ r in hierdie studie-eenheid gebruik is. Verbind die twee punte om<br />

'n reguit lyn te vorm.<br />

Metode 2:<br />

. Vir die tweede metode maak ons gebruik van die Y-afsnitpunt (a) van die<br />

regressievergelyking YÃ = bX + a en enige ander getallepaar wat op die<br />

regressielyn sal leà om die regressielyn te teken. Die regressielyn wat ons mee<br />

werk is steeds:<br />

YÃ = 0,52X + 2,06.<br />

. Die Y-afsnit is dus gelyk aan 2,06, wat beteken dat die lyn by die Y-waarde<br />

gelyk aan 2,06deur die Y-as sal gaan. (Jy sal hierdie Y-waarde kry wanneer jy<br />

X = 0 stel in die regressievergelyking. Op die Y-as is X = 0.)<br />

± Gebruik nou 'n ander kleur pen as by die eerste metode hierbo en merk die<br />

waarde 2,06op die Y-as. Merk ook die getallepaar wat gevorm word deur<br />

die twee gemiddelde waardes (X; Y ) naamlik (4,5; 4,4). (Jy sou hier ook<br />

enige ander getallepaar kon gebruik wat op hierdie lyn val, dit wil seà wat<br />

met behulp van dieselfde formule bereken is.) Trek 'n lyn deur die twee<br />

punte.<br />

. Wanneer jy volgens metode 1 die lyn trek deur die twee punte met 'n liniaal te<br />

verbind, gee dit vir jou die regressielyn wat die grafiese voorstelling is van die<br />

formule wat bereken is.<br />

. As jy volgens metode 2 die Y-afsnit en byvoorbeeld die kooÈ rdinaat (X; Y ) met<br />

mekaar verbind, sal jy sien dat jy steeds besig is om dieselfde lyn te teken. Die<br />

nuwe lyn behoort presies bo-op die vorige lyn te leà (mits jy natuurlik netjies en<br />

noukeurig werk).<br />

Jou grafiek behoort so te lyk:<br />

bladsy 88 . studie-eenheid 8 regressie


Stemming<br />

. afdeling 2 data-verwerking: beskrywend<br />

Internet-interaksie<br />

Onthou ook om altyd die volgende inligting op jou grafiek aan te dui:<br />

± die name van die veranderlikes op die X-as en Y-as van die grafiek,<br />

byvoorbeeld X-as: internet-interaksiestelling, en Y-as: stemming.<br />

± die regressielynvergelyking, byvoorbeeld YÃ = 0,52X + 2,06<br />

± die afsnit, byvoorbeeld a = 2,06<br />

± alle berekende getallepare (X; Y), byvoorbeeld (1; 2,58) en (10; 7,26)<br />

en/of<br />

die gemiddelde waardes (X; Y ) bv. (4,5; 4,4).<br />

Die akkuraatheid van voorspelling _____________________________<br />

Lees die gedeelte oor die standaard-skattingsfout op bladsy 168 tot 170 van<br />

Tredoux en Durrheim (2002). Jy hoef geen berekenings in hierdie afdeling te kan<br />

doen nie, maar jy moet die begrip akkuraatheid van voorspelling of standaardskattingsfout<br />

kan omskryf.<br />

bladsy 89


Regressie en oorsaaklikheid _________________________________<br />

Bestudeer die gedeelte ``A common difficulty with predictions based on regression<br />

models'' op bladsy 171 van Tredoux en Durrheim (2002) waar die skrywers<br />

verduidelik dat afleidings met betrekking tot oorsaaklikheid met groot<br />

omsigtigheid uit regressieanalises gemaak behoort te word.<br />

Ons gaan voort met dieselfde datastel waarmee julle in studie-eenheid 7 gewerk<br />

het. Die volledige berekeningstabelle word verskaf:<br />

1. Jy wil die deelnemers se uitvoeringstellings voorspel.<br />

1.1 Bereken die helling.<br />

1.2 Bereken die ``afsnit''.<br />

1.3 Bereken die uitvoeringstelling vir deelnemers met voorbereidingstellings<br />

van 25 en 30.<br />

1.4 Gee 'n grafiese verteenwoordiging van die regressielyn deur die ``afsnit''<br />

[soos in (1.2) bereken] en die geskatte waardes [soos in (1.3) bereken] op<br />

hierdie regressielyn.<br />

Deelnemers<br />

Voorbereidingsaktiwiteite<br />

X<br />

Uitvoeringtellings<br />

Y X 2<br />

1 38 35 1444 1225 1330<br />

2 24 32 5761024 768<br />

3 32 261024 676 832<br />

4 31 34 961 1156 1054<br />

5 2634 6761156884<br />

628 30 784 900 840<br />

7 31 28 961 784 868<br />

8 37 33 1369 1089 1221<br />

9 34 37 11561369 1258<br />

10 35 361225 12961260<br />

N=10 SX = 316 SY = 325 SX 2<br />

= 10176<br />

X Y = (316) (325) = 102700<br />

X 2 = (316) 2<br />

X 2 = (325) 2<br />

= 99856<br />

= 105625<br />

Gemiddeld van X = 316/10 = 31,6<br />

Gemiddeld van Y = 325/10 = 32,5<br />

bladsy 90 . studie-eenheid 8 regressie<br />

Y 2<br />

SY 2<br />

= 10675<br />

XY<br />

SXY<br />

= 10315


2. Jy wil die deelnemers se hantering van die aanhanger- en mediatellings<br />

voorspel.<br />

2.1 Bereken die helling.<br />

2.2 Bereken die ``afsnit''.<br />

2.3 Bereken die deelnemers se hantering van die aanhanger- en<br />

mediatellings met onderhoudsvaardigheidskursustellings van 3 en 9<br />

onderskeidelik.<br />

2.4 Gee 'n grafiese verteenwoordiging van die regressielyn deur die ``afsnit''<br />

[soos in (2.2) bereken] en die geskatte waardes [soos in (2.3) bereken] op<br />

hierdie regressielyn.<br />

Deelnemers Onderhoudsvaardigheidskursus<br />

X<br />

Aanhangers en<br />

mediatellings<br />

Y X 2<br />

1 8 8 6 4 6 4 6 4<br />

2 4 4 161616<br />

3 4 5 1625 20<br />

4 5 7 25 49 35<br />

5 64 361624<br />

664 361624<br />

7 66363636<br />

8 6 8 36 6 4 48<br />

9 7 649 3642<br />

10 7 5 49 25 35<br />

N=10 SX =59 SY =57 SX 2<br />

X Y = (59) (57) = 3363<br />

X 2 = (59) 2<br />

X 2 = (57) 2<br />

= 3481<br />

Gemiddeld van X = 59/10<br />

= 3249<br />

= 5,9<br />

Gemiddeld van Y = 57/10 = 5,7<br />

= 363<br />

Y 2<br />

SY 2<br />

= 347<br />

XY<br />

SXY<br />

= 344<br />

Indien jou berekenings korrek is, behoort jy die volgende antwoorde te heà :<br />

1.1 0,24<br />

1.2 24,92<br />

1.3 [25 ; 30,9] & [30 ; 32]<br />

. afdeling 2 data-verwerking: beskrywend<br />

bladsy 91


1.4<br />

Uitvoeringtellings<br />

40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

10<br />

9<br />

8<br />

7<br />

6<br />

5<br />

4<br />

3<br />

2<br />

1<br />

0<br />

a = 24,9<br />

2.1 0,52<br />

2.2 2,63<br />

2.3 [3 ; 4,19] & [9 ; 7,31]<br />

2.4<br />

Tellings vir aanhangers en mediahanteringskursus<br />

YÃ = 0,24 (X) + 24,9<br />

[30; 32]<br />

5 10 15 20 25 30 35 40<br />

Voorbereidingsaktiwiteite<br />

a = 24,9<br />

bladsy 92 . studie-eenheid 8 regressie<br />

YÃ = 0,52 (X) + 2,63<br />

[3; 4, 19]<br />

[9; 7, 31]<br />

1 2 3 4 5 6 7 8 9 10<br />

Onderhoudsvaardigheidskursus


Bestudeer raam 10.1 en 10.2 op bladsy 175 tot 178 van Tredoux en Durrheim<br />

(2002). Let op waar die helling (b-waarde) en die afsnit (a-waarde) op die uitvoer<br />

aangedui word. Neem kennis dat jy deur regressieanalise ook die korrelasie (r)<br />

verkry.<br />

Noudat jy studie-eenheid 8 bestudeer het, behoort jy<br />

. afdeling 2 data-verwerking: beskrywend<br />

. te kan verduidelik wat regressie is en hoe dit gebruik word<br />

. die algemene regressievergelyking te kan identifiseer en gebruik<br />

. die formule vir die b-waarde te ken en die b-waarde te kan bereken<br />

. die formule vir die a-waarde te ken en die a-waarde te kan bereken<br />

. gegewe X-waardes te kan gebruik om deur vervanging in die vergelyking die<br />

ooreenstemmende YÃ-waardes te bereken<br />

. die regressielyn grafies te kan voorstel<br />

. te kan verduidelik hoe die akkuraatheid van voorspelling en korrelasie met<br />

mekaar verband hou.<br />

bladsy 93


9 Basiese konsepte van<br />

waarskynlikheid<br />

10 Die normaalverspreiding<br />

11 Steekproefdistribusies en<br />

hipotesetoetsing<br />

12 Hipotesetoetse vir gemiddeldes: t-toetse<br />

13 Hipotesetoetse vir gemiddeldes: eenrigting-variansieontleding<br />

14 Die chi-kwadraattoets<br />

15 OnderskeidingsvermoeÈ<br />

l


Inleiding<br />

Nuwe Sterre ____________________________________________<br />

Die sukses van die vertoning tot dusver<br />

bladsy 96<br />

Die Nuwe Sterre-vertoning het selfs groter belangstelling in die media ontlok as<br />

wat aanvanklik verwag is. Die aantal kykers het alle vooruitskattings oortref en<br />

selfs die sosiale netwerktuiste het meer as 10 000 besoekers per dag sedert die<br />

bekendstelling van die vertoning gehad! Vuyo K is na die eerste twee weke van die<br />

vertoning as die mededingendste deelnemer deur haar mededeelnemers aangewys.<br />

Alhoewel sy regtig goed in die voorbereidingsaktiwiteite gevaar het en relatief hoeÈ<br />

punte van die beoordeelaars ontvang het, is sy nie so gewild onder die kykers nie.<br />

En die kykers se stem tel inderdaad! Die grootste teleurstelling van die vertoning<br />

tot dusver is dat Sasha onttrek het. Sy was een van die gewildste deelnemers op die<br />

sosiale netwerktuiste, maar het na die eerste week besluit dat haar studies by<br />

Unisa voorkeur bo haar aspirasies vir 'n sangloopbaan moet geniet. Angie<br />

Motseneka is die eerste beoordeelaar wat uitgestem is. Die stemmery was eenparig<br />

van kykers sowel as deelnemers!<br />

Een van die redes waarom die vertoning so 'n groot opgewondenheid in die media<br />

ontlok het, is die feit dat verskeie rolspelers van die gemeenskap hul mening<br />

uitgespreek het. Wat toon hierdie vertoning oor die toestand van die breeÈ r<br />

samelewing? Wat wys die deelnemers oor die aspirasies van ons jeug in Suid-<br />

Afrika. InferensieÈ le statistiek kan ons help om sommige van hierdie vrae te<br />

beantwoord. InferensieÈ le statistiek maak van steekproewe gebruik om afleidings<br />

oor populasies te maak. Die volgende paar studie-eenhede sal 'n aantal temas van<br />

inferensieÈ le statistiek dek.<br />

Studie-eenheid 9 verskaf 'n basiese inleiding tot die konsep van waarskynlikheid.<br />

Dit is 'n beginsel wat inferensieÈ le statistiek onderleà en sal ook die grondslag van 'n<br />

aantal ander statistiese tegnieke vorm.<br />

Studie-eenheid 10 bespreek die standaard-normaalverspreiding. Hierdie<br />

verspreiding is 'n metode om te bepaal waar 'n individu se telling val in<br />

verhouding tot 'n groep ander individue se tellings. Dit kan die navorsingspan van<br />

Nuwe Sterre help om vrae soos die volgende te beantwoord: Wat is die aantal<br />

aansoekers wat hoeÈ r as die gemiddelde ``ekstrovert'' telling vir die groter<br />

populasie in Suid-Afrika behaal het?<br />

Studie-eenheid 11 verskaf 'n inleiding tot hipotesetoetsing. Die navorsingspan van


. afdeling 3 data-verwerking: inferensieel<br />

Nuwe Sterre het moontlik 'n aantal verwagtings (hipoteses) oor die interaksies en<br />

uitkomste van die vertoning. Dit moet egter wetenskaplik bewys word. Dit is die<br />

proses van hipotesetoetsing.<br />

Studie-eenheid 12 handel oor hipotesetoetsing waar twee groepe betrokke is.<br />

Byvoorbeeld, daar kan 'n vergelyking wees tussen mans en vroue of ouer en<br />

jonger kykers of applikante vir die Nuwe Sterre-vertoning.<br />

Studie-eenheid 13 ondersoek hipotesetoetsing waar meer as twee groepe betrokke<br />

is. 'n Mens kan byvoorbeeld belangstel om te weet wat die verskil tussen die<br />

deelnemers se houdings voor, tydens en na die vertoning is.<br />

Studie-eenheid 14 bespreek hipotesetoetsing wat op kategoriese data van<br />

toepassing gemaak word (kyk na studie-eenheid 2 vir 'n beskrywing van<br />

kategoriese data). 'n Mens kan byvoorbeeld die deelnemers in lae, medium en<br />

hoeÈ presteerders indeel en ondersoek instel of daar 'n verskil is met betrekking tot<br />

hierdie drie groepe ten opsigte van hul buigsaamheid.<br />

Studie-eenheid 15 bespreek die konsep van onderskeidingsvermoeÈ . Dit is 'n<br />

instrument wat gebruik kan word om die graad van akkuraatheid van ons<br />

navorsingsbevindings te bepaal. Aangesien die Nuwe Sterre-vertoning ietwat<br />

kontroversieel kan wees en baie aandag van die media ontlok het, wil 'n mens<br />

seker wees oor die gevoltrekkings wat deur die navorsers gemaak word.<br />

bladsy 97


9<br />

studie-eenheid nege<br />

Basiese konsepte van<br />

waarskynlikheid<br />

Waarskynlikheid het baie te make met kans ten opsigte van die een of<br />

ander teoretiese stel waardes. As ons byvoorbeeld dink aan die<br />

opskiet van 'n muntstuk om uitslag te gee oor die een of ander besluit<br />

soos byvoorbeeld watter span eerste gaan kolf in krieket, het ons met kans te<br />

make. Teoreties is daar twee moontlike uitkomste, kruis of munt. Elke uitkoms is<br />

ewe moontlik en elkeen het op sy eie 'n kans of 'n waarskynlikheid van 1 uit 2 ( 1 /2;<br />

0,5 of 50%) om te realiseer.<br />

Benewens die daaglikse gebruike vir die konsep van waarskynlikheid, word dit<br />

ook algemeen in statistiese berekenings toegepas. Jy sal in studie-eenheid 10 van<br />

die normaalverspreiding leer. Lees nou die laaste paragraaf op bladsy 84 en die<br />

eerste paragraaf op bladsy 85 van Tredoux en Durrheim (2002) waar die verband<br />

tussen waarskynlikheid en die normaalverspreiding verduidelik word. Jy gaan in<br />

studie-eenheid 15 met die konsep onderskeidingsvermoeÈ kennis maak.<br />

OnderskeidingsvermoeÈ word daar omskryf as die waarskynlikheid om reg te<br />

besluit om 'n onwaar nulhipotese te verwerp. Die definisie bevat 'n aantal<br />

begrippe wat in hierdie stadium vir jou vreemd mag voorkom, soos ``verwerp'' en<br />

``onwaar nulhipotese''. Jy hoef jou nie nou daaraan te steur nie. Maar jy moet wel<br />

daarop let dat die woord waarskynlikheid in die definisie van<br />

onderskeidingsvermoeÈ voorkom.<br />

Hierdie is slegs 'n paar terreine in die statistiek waarin waarskynlikheid 'n uiters<br />

belangrike rol speel. Om 'n groot verskeidenheid ander statistiese berekenings te<br />

verstaan, moet jy dus eers die konsep waarskynlikheid onder die knie kry.<br />

Daar bestaan geen eenvoudige definisie van die begrip waarskynlikheid nie. Dit<br />

word soms uitgedruk op grond van die getal gunstige gevalle in teenstelling met<br />

die totale aantal ewe moontlike gevalle. In die voorbeeld van 'n muntstuk is die<br />

waarskynlikheid van 'n bepaalde uitkoms een uit twee, terwyl dit in die geval van<br />

'n dobbelsteen een uit ses (0,17 of 17%) is. Tredoux en Durrheim (2002) gee 'n<br />

definisie van waarskynlikheid op bladsy 74 van hul boek en beskryf dit as die<br />

aantal ``suksesse'' gedeel deur die totale aantal gebeurtenisse.<br />

bladsy 98 . studie-eenheid 9 basiese konsepte van waarskynlikheid


Bestudeer Tredoux en Durrheim (2002) vanaf bladsy 70 tot aan die bokant van<br />

bladsy 74. Hierdie gedeelte bied 'n basiese inleiding tot waarskynlikheid en sluit<br />

enkele toepassings ten opsigte van frekwensie en kansspeletjies in.<br />

Omdat ons aanneem dat jy die begrip waarskynlikheid nou verstaan, wil ons<br />

voortgaan met eenvoudige berekenings van waarskynlikheid.<br />

Bestudeer die afdeling ``The multiplication and addition rules of probability'' op<br />

bladsy 74 tot 76van Tredoux en Durrheim (2002).<br />

Jou vermoeÈ om waarskynlikheid korrek te bereken, sal regstreeks afhang van jou<br />

begrip van enkele terme en reeÈ ls wat toegepas moet word wanneer hierdie<br />

berekenings gedoen word en wat in hierdie gedeelte van Tredoux en Durrheim<br />

(2002) behandel word.<br />

1. Verduidelik die volgende terme en gee 'n voorbeeld van elk:<br />

. onafhanklike gebeurtenis<br />

. onderling uitsluitend<br />

. omvattendheid<br />

2. Wanneer gebruik ons die volgende reeÈ ls?<br />

. OptellingsreeÈ l(Probability law of disjunctions)<br />

. VermenigvuldigingsreeÈ l(Probability law of conjunctions)<br />

1. . Onafhanklike gebeurtenis: Gebeurtenis waar die voorkoms<br />

geen effek het op die waarskynlikheid<br />

van die voorkoms van 'n<br />

ander gebeurtenis nie.<br />

. Onderling uitsluitend: Wanneer die voorkoms van een<br />

gebeurtenis die voorkoms van 'n<br />

ander gebeurtenis uitsluit.<br />

. Omvattendheid: 'n Stel gebeure wat alle moontlike<br />

uitkomste voorstel.<br />

2. . Die optellingsreeÈ l (Law of disjunctions):<br />

. Die vermenigvuldigingsreeÈ l(Law of<br />

conjunctions):<br />

. afdeling 3 data-verwerking: inferensieel<br />

Wanneer gebeurtenisse onderling<br />

uitsluitend is.<br />

Wanneer gebeurtenisse onafhanklik<br />

is.<br />

bladsy 99


Diskrete en kontinue veranderlikes ____________________________<br />

Ons het in studie-eenheid 2 reeds onderskei tussen diskrete en kontinue<br />

veranderlikes. Jy sal sien dat die aard van die veranderlikes ook by<br />

waarskynlikheidsteorie 'n rol speel. 'n Kontinue veranderlike, byvoorbeeld<br />

lengte, kan tussenwaardes aanneem, terwyl 'n diskrete veranderlike,<br />

byvoorbeeld aantal kinders per gesin, net spesifieke waardes kan aanneem. By<br />

die verdelingskromme van 'n kontinue veranderlike is daar dus 'n interval van<br />

waardes ter sprake. Daar word verwys na die kans dat 'n spesifieke veranderlike<br />

binne 'n bepaalde interval val, eerder as die kans dat dit 'n bepaalde waarde sal<br />

aanneem.<br />

Bestudeer die afdeling oor binomiaalverspreiding op bladsy 79 tot 82 van Tredoux<br />

en Durrheim (2002). Die binomiaalverspreiding verteenwoordig die verspreiding<br />

vir diskrete veranderlikes. Lees ook die gedeelte op bladsy 83 tot 85 wat handel<br />

oor die normaalverspreiding, oftewel die distribusie vir kontinue veranderlikes.<br />

Beantwoord die volgende vraag ter opsomming van hierdie studie-eenheid:<br />

1. Die sosiale netwerkfasiliteit op die Nuwe Sterre-webtuiste het 'n kompetisie<br />

uitgevaardig. Hulle het kykers uitgenooi om te raai watter deelnemer studeer<br />

tans Bedryfsielkunde. Gelukkig het jy en jou vriendin dit opgetel in 'n<br />

onderhoud wat die media vantevore met sommige van die deelnemers gevoer<br />

het en weet dat dit Sasha is. Jy is daarom taamlik seker van jou antwoord.<br />

Die wenner van die kompetisie kan DVD's en CD's ter waarde van R5 000<br />

wen en die tweede prys is CD's ter waarde van R1 000. Jou vriendin het 35<br />

inskrywings ingestuur en jy 30. Jy het pas gelees dat 200 inskrywings geslaagd<br />

was.<br />

1.1 Wat is die waarskynlikheid dat jou vriendin die eerste prys sal wen?<br />

1.2 Indien jy nie die eerste prys wen nie, wat is die waarskynlikheid dat jy<br />

die tweede prys sal wen? (Die inskrywing van die eerstepryswenner word<br />

nie in die houer teruggeplaas nie.)<br />

1.3 Wat is die waarskynlikheid dat julle twee die eerste en tweede prys sal<br />

wen?<br />

1.1 p (vriendin) =<br />

35<br />

200<br />

= 0,175<br />

= 0,18<br />

1.2 p (self) =<br />

30<br />

199<br />

= 0,15<br />

bladsy 100 . studie-eenheid 9 basiese konsepte van waarskynlikheid


1.3 Stap 1: Waarskynlikheid dat jy die eerste prys wen en jou vriendin die tweede<br />

prys.<br />

p (vriendin) 6 p (self) = 35 30<br />

200<br />

6<br />

199<br />

= (0,18)(0,15)<br />

= 0,027<br />

= 0,03<br />

Stap 2: Waarskynlikheid dat jou vriendin die eerste prys wen en jy die tweede<br />

prys.<br />

p (vriendin) 6 p (self) = 30 35<br />

200<br />

6<br />

199<br />

= (0,15)(0,18)<br />

= 0,027<br />

= 0,03<br />

Stap 3: Die antwoord is dus 0,03 + 0,03 = 0,06<br />

. afdeling 3 data-verwerking: inferensieel<br />

Noudat jy studie-eenheid 9 bestudeer het, behoort jy<br />

. die basiese terminologie en reeÈ ls van waarskynlikheid te kan omskryf<br />

. tussen diskrete en kontinue veranderlikes te kan onderskei<br />

. waarskynlikhede te kan bereken soos in die oefeninge wat in hierdie studieeenheid<br />

aangebied is.<br />

bladsy 101


10<br />

studie-eenheid tien<br />

Die normaal-<br />

verspreiding<br />

Ons kan 'n groot verskeidenheid veranderlikes in ons daaglikse lewe<br />

ondersoek. Mense se lengte is een voorbeeld hiervan. Gestel ons neem<br />

lengte as 'n veranderlike. Besonder min mense is buitengewoon kort en<br />

net so min is buitengewoon lank. Die meeste mense het 'n gemiddelde lengte. Ons<br />

kan dieselfde van ander menslike eienskappe seà . As ons die verspreiding van<br />

lengte (waar slegs 'n paar mense besonder kort, die meeste mense middelmatig<br />

lank en net enkele mense besonder lank is) grafies moet uitbeeld, sal die distribusie<br />

soos in die grafiek hieronder lyk.<br />

Hierdie verspreiding word die normaalverspreiding genoem. Dink aan die<br />

klokvormige normaalverspreiding as 'n kontinue frekwensieverspreiding. Indien<br />

data volgens hierdie normaalvorm versprei is, beteken dit dat min persone oor<br />

baie min van 'n bepaalde eienskap beskik en dat ewe min persone besonder baie<br />

van daardie eienskap het. Die meeste persone het 'n gemiddelde hoeveelheid van<br />

die eienskap. Die normaalverspreiding vorm die grondslag vir die gebruik van<br />

baie van die statistiese tegnieke waarvan jy in hierdie kursus gaan leer.<br />

Die normaalverspreiding het die volgende eienskappe, waarvan sommige reeds in studie-eenheid 4<br />

bespreek is:<br />

. Klokvormig. 'n Normale verspreiding het 'n duidelik herkenbare klokvorm met<br />

een definitiewe piek, en is dus unimodaal.<br />

. Simmetries. Die figuur vorm 'n presiese spieeÈ lbeeld om die middellyn. Omdat<br />

die normaalverspreiding simmetries is, word net die positiewe helfte se waardes<br />

in die tabel vir z-waardes gegee. Die ander helfte se waardes is presies dieselfde,<br />

net die tekens verskil.<br />

. Die oppervlak of proporsie onder die normaalverspreiding is gelyk aan 1,00 in<br />

bladsy 102 . studie-eenheid 10 die normaalverspreiding


. afdeling 3 data-verwerking: inferensieel<br />

desimale terme of gelyk aan 100% as 'n persentasie. Aangesien die figuur<br />

simmetries is, beteken dit dat die oppervlak van die linkerkantste helfte 50% (of<br />

0,5) beslaan en die regterkantste helfte die ander 50% (of 0,5).<br />

Baie sielkundige toetse maak ook die aanname dat die eienskap(pe) wat gemeet<br />

word normaal versprei is. Die meeste sielkundige toetse van intelligensie en aanleg<br />

is gegrond op die aanname van normale verspreiding van daardie eienskappe.<br />

Daarom word normtabelle vir toetse opgestel sodat toetsprestasie van individue in<br />

vergelyking met die van 'n normgroep geõÈ nterpreteer kan word. Die aanname is<br />

dat die eienskap binne die normgroep normaal versprei is.<br />

Hieruit kan jy aflei dat ons die normaalverspreiding gebruik om 'n relatiewe<br />

posisie in 'n distribusie te bepaal of om byvoorbeeld vas te stel waar 'n individu<br />

ten opsigte van ander op 'n normaalverspreiding leà .<br />

Jy sal merk dat hierdie studie-eenheid hoofsaaklik uit aktiwiteite bestaan. Deur<br />

hierdie aktiwiteite te doen, sal jy besef hoe waardevol die normaalverspreiding vir<br />

praktiese gebruik is.<br />

Die standaard-normaalverspreiding ____________________________<br />

Om 'n individu se posisie in verhouding tot ander in 'n normaalverspreiding te<br />

bepaal, moet ons weet wat die gemiddeld en variansie van die verspreiding is. Soos<br />

jy jou kan voorstel, sal die gemiddeld en variansie vir lengte as 'n veranderlike<br />

verskil van die gemiddeld en variansie van gewig as 'n veranderlike op 'n<br />

normaalverspreiding. Dit is daarom onmoontlik om te weet wat die waardes van<br />

die normaalverspreiding van elke veranderlike is wat ons wil ondersoek. So in<br />

plaas daarvan om die normaalverspreidingstellings te heà vir elke veranderlike wat<br />

ons ondersoek, het statistici een standaard-normaalverspreiding ontwikkel. Die<br />

waardes op die standaard-normaalverspreiding word as z-tellings vertoon. Die<br />

statistici het ook 'n manier geõÈ dentifiseer om 'n telling van enige veranderlike tot<br />

'n z-telling om te skakel sodat ons die standaard-normaalverspreiding kan gebruik<br />

om die verspreiding van 'n telling in verhouding tot ander tellings waarin ons<br />

belangstel, te bepaal.<br />

Bestudeer die inleiding tot tutoriaal 6op bladsy 90 tot 91 van Tredoux en<br />

Durrheim (2002) om 'n oorsig te verkry van wat jy tot dusver oor die<br />

normaalverspreiding geleer het. Lees dan die afdeling oor die standaardnormaalverspreiding<br />

op bladsy 91 tot 93 (voordat jy tabelle vir z-tellings gebruik).<br />

Tredoux en Durrheim (2002) verduidelik dat, wanneer ons met verskillende<br />

datastelle werk wat almal normaal versprei is, ons eenvormigheid kan verkry deur<br />

al die datastelle na 'n standaardvorm om te skakel.<br />

bladsy 103


Hierdie standaard-normaalverspreiding beskik oor dieselfde eienskappe as die<br />

normaalverspreiding asook die volgende:<br />

. 'n Standaard-normaalverspreiding toon 'n gemiddelde van 0 en 'n<br />

standaardafwyking van 1.<br />

. Die standaard-normaalverspreiding word beskryf op grond van eenhede van<br />

standaardafwyking bekend as z-tellings.<br />

. Hierdie z-tellings wissel van drie standaardafwykings onder die gemiddelde tot<br />

drie standaardafwykings bokant die gemiddelde.<br />

Maak 'n gewoonte daarvan wanneer jy met z-tellings werk om altyd 'n sketsie van<br />

die normaalverspreiding te maak. Dui die middellyn daarop aan met z = 0. Alle<br />

negatiewe z-tellings sal in die linkerkantste helfte leà en alle positiewe z-tellings sal<br />

in die regterkantste helfte leà . Jou skets moet ooreenstem met die grafiek wat aan<br />

die begin van die studiegids gegee word.<br />

Om die standaard-normaalverspreiding te kan gebruik, word die z-tellings in<br />

tabelvorm gegee.<br />

Bestudeer nou die afdeling oor die gebruik van z-tellings op bladsy 93 tot 97 van<br />

Tredoux en Durrheim. (Laat Boks 6.1 op bladsy 97 tot 98 uit.) Figuur 3 op bladsy<br />

93 is net 'n klein deel van tabel A1.1 in bylae 1. Neem kennis dat, aangesien 'n<br />

normaalverspreiding simmetries is, slegs die waardes vir die positiewe helfte in die<br />

tabel vir z-waardes gegee word. Die waardes vir die ander helfte is presies<br />

dieselfde, behalwe dat die tekens verskil. So indien jy 'n negatiewe z-telling het,<br />

gebruik net die ooreenstemmende positiewe z-telling in die tabel om die toepaslike<br />

verhouding af te lees.<br />

Nadat jy hierdie afdeling in Tredoux en Durrheim (2002) bestudeer het, behoort<br />

jy vertroud te wees met tabel A1.1 en behoort jy proporsies vir verskeie z-tellings<br />

te kan bepaal.<br />

Soos reeds in hierdie studie-eenheid gemeld, vestig ons ons aandag op die<br />

verspreiding van verskillende veranderlikes in ons daaglikse lewe en nie<br />

noodwendig op die verspreiding van z-tellings nie.<br />

Bestudeer die afdeling op bladsy 98 tot 99 van Tredoux en Durrheim (2002) wat<br />

verduidelik hoe die statistiese weà reld (die standaard-normaalverspreiding)<br />

toegepas kan word om die regte weà reld (veranderlikes wat in ons daaglikse<br />

bestaan voorkom) te interpreteer en afleidings daaroor te maak.<br />

bladsy 104 . studie-eenheid 10 die normaalverspreiding


Soos voorheen genoem en uit hierdie bespreking in Tredoux en Durrheim (2002)<br />

afgelei kan word, is die standaard-normaalverspreiding besonder nuttig,<br />

aangesien enige stel tellings wat normaal versprei is na standaardtellings<br />

omgeskakel kan word sodat direkte vergelyking van data uit verskillende<br />

datastelle moontlik is. Die formule vir hierdie omskakeling is soos volg:<br />

z = X<br />

. afdeling 3 data-verwerking: inferensieel<br />

Sodra tellings na standaardtellings (z-tellings) omgeskakel is, kan ons die<br />

standaardtabel gebruik. Hierdie omskakeling verander nie die verspreiding van<br />

die tellings nie, maar bloot die wyse waarop dit voorgestel word. Vergelyk<br />

byvoorbeeld ``A'' met ``a''. Albei karakters stel die eerste letter van die alfabet<br />

voor ± dieselfde inligting word net in verskillende vorms voorgestel.<br />

Bestudeer die afdeling oor die omskakeling van x-tellings na z-tellings op bladsy<br />

100 tot 102 van Tredoux en Durrheim (2002).<br />

Jy ken nou die definisie en eienskappe van 'n normaalverspreiding. Jy het ook al<br />

die definisie en eienskappe van die standaard-normaalverspreiding geleer. Boonop<br />

weet jy ook hoe om tellings wat as normaalveranderlikes (x-tellings) voorkom, om<br />

te sit in tellings wat in die standaard-normaalverspreiding pas (z-tellings).<br />

Dink na oor die volgende scenario. Een van die eienskappe wat as deel van die<br />

psigometriese assessering van die deelnemers van die Nuwe Sterre-vertoning<br />

gemeet is, is ``ReeÈ lnavolging''. Dit is die mate waartoe 'n persoon geneig sal wees<br />

om die verwagte reeÈ ls en regulasies van die samelewing te volg. Die navorsers wat<br />

aangestel is om verskeie aspekte van die Nuwe Sterre-vertoning te ondersoek, wil<br />

weet of die deelnemers aan die vertoning geneig is om 'n laer puntetelling te behaal<br />

as die gemiddeld wat oor die algemeen van individue in die gemeenskap verwag<br />

kan word. Hulle besluit om die puntetellings van die deelnemers te vergelyk met<br />

die data van die normgroep wat hulle tot hulle beskikking het. Die data van die<br />

normgroep is normaal verspreid en bestaan uit 'n groep individue tussen 18 en 36<br />

jaar oud (N=1 250) met 'n gemiddelde (m)-telling van 7 en 'n standaardafwyking<br />

(s) van 2 op die meting van ``ReeÈ lnavolging''. Die deelnemers het 'n gemiddelde<br />

telling van minder as 5 vir ``ReeÈ lnavolging'' behaal, terwyl dit bekend is dat uiters<br />

konsensieuse individue ongeveer 10 op hierdie meting behaal.<br />

Hulle het jou gevra om die volgende vrae te beantwoord:<br />

(a) Bereken die ooreenstemmende z-telling vir 'n persoon met 'n telling van 5 vir<br />

``ReeÈ lnavolging''.<br />

(b) Bereken die ooreenstemmende z-telling vir 'n persoon met 'n telling van 10 vir<br />

``ReeÈ lnavolging''.<br />

(c) Bepaal die proporsie van gevalle met 'n telling van minder as 5 vir<br />

``ReeÈ lnavolging''.<br />

bladsy 105


(d) Bepaal die persentasie van gevalle met 'n telling van minder as 5 vir<br />

``ReeÈ lnavolging''.<br />

(e) Bepaal die aantal gevalle met 'n telling tussen 5 en 10 vir ``ReeÈ lnavolging''.<br />

Voordat jy hierdie vrae probeer antwoord, raai ons jou aan om die volgende<br />

aktiwiteite te voltooi. Hierdie aktiwiteite sal jou in staat stel om die vrae sinvol<br />

aan te pak.<br />

Langs elke z-telling wat in die tabel gegee word, word drie verskillende waardes gegee:<br />

. Mean to z<br />

. Larger portion<br />

. Smaller portion<br />

Onthou dat die totale proporsie of oppervlak onder die normaalverspreiding<br />

gelyk is aan 1,0. Die oppervlak van die linkerkantste helfte onder die kromme (dit<br />

wil seà by die negatiewe z-tellings) is gelyk aan 0,5 en net so is die oppervlak van die<br />

regterkantste helfte onder die kromme (by die positiewe z-tellings) ook gelyk aan<br />

0,5.<br />

Instruksies Kommentaar<br />

Maak 'n diagrammatiese voorstelling<br />

van 'n tipiese gestandaardiseerde normaalverspreiding<br />

en dui die proporsie<br />

onder die kromme as 0,5 by elkeen van<br />

die twee helftes aan.<br />

So 'n voorstelling behels 'n skets van 'n<br />

normaalkromme met 'n vertikale lyn<br />

deur die middel en z = 0 daar aangedui.<br />

Hierdie skets word slegs gebruik<br />

om die oppervlak onder die kromme<br />

van die twee helftes voor te stel.<br />

Wanneer daar gevra word na die proporsie groter as 'n bepaalde telling, verwys<br />

dit na die proporsie regs van die bepaalde telling se posisie. Proporsie kleiner as<br />

verwys weer na die proporsie links van die bepaalde punt. Om te weet waar die<br />

bepaalde punt op die kromme sal leà , moet die z-telling eers bereken word. Daar is<br />

vyf moontlikhede met die aandui van oppervlaktes:<br />

. Positiewe z-telling: groter as (regs van) = ``smaller portion'' in tabel<br />

. Positiewe z-telling: kleiner as (links van) = ``larger portion'' in tabel<br />

. Negatiewe z-telling: groter as (regs van) = ``larger portion'' in tabel<br />

. Negatiewe z-telling: kleiner as (links van) = ``smaller portion'' in tabel<br />

. Twee z-tellings: tussen die twee tellings = ``mean to z''-waardes in tabel<br />

bladsy 106 . studie-eenheid 10 die normaalverspreiding


Instruksies Kommentaar<br />

Maak vyf sketse van die normaalverspreiding<br />

om die vyf moontlikhede<br />

wat hierbo genoem is grafies (diagrammaties)<br />

voor te stel.<br />

Dui op die eerste twee figure z =<br />

+1,5 met 'n vertikale lyn in die<br />

regterkantste helfte aan.<br />

Dui op die derde en vierde figuur 'n ztelling<br />

van z = 72 aan met 'n<br />

vertikale lyn in die linkerkantste helfte.<br />

Op die vyfde figuur moet jy twee ztellings<br />

aandui, z = +1,5 in die<br />

regterkantste helfte en z = 72,0 in<br />

die linkerkantste helfte.<br />

Onthou dat 'n positiewe z-telling altyd<br />

regs van die middellyn (z = 0) sal<br />

wees en 'n negatiewe z-telling altyd<br />

links van die middellyn (z = 0).<br />

Onthou verder dat groter as (4) ``regs<br />

van'' beteken en kleiner as (5) ``links<br />

van''.<br />

Ons gaan jou nou wys hoe om die verskillende moontlikhede voor te stel.<br />

POSITIEWE z-TELLING ± AFLEES VAN PROPORSIES<br />

Instruksies Kommentaar<br />

Gebruik eers die eerste twee figure<br />

(waar die positiewe z-telling van 1,5<br />

aangedui is).<br />

Skryf groter as (4) onder die eerste<br />

figuur en kleiner as (5) onder die<br />

tweede figuur. Kleur nou die gepaste<br />

area in op die twee figure.<br />

Soek nou die gepaste waarde in tabel<br />

A1.1 om die spesifieke area by elke<br />

diagram as 'n proporsie aan te dui.<br />

. afdeling 3 data-verwerking: inferensieel<br />

Waar daar groter as (4) staan, moet<br />

jy die area regs van die gemerkte ztelling<br />

inkleur. Waar daar kleiner as<br />

(5) staan, moet jy die area links van<br />

die gemerkte z-telling inkleur.<br />

By die eerste figuur (positiewe z-telling<br />

en groter as (4)) sou jy die kleiner<br />

proporsie ingekleur het. By die tweede<br />

figuur (positiewe z-telling en kleiner as<br />

(5)) sou jy die groter proporsie<br />

ingekleur het.<br />

Die kleiner proporsie by 'n z-telling<br />

van 1,5 is gelyk aan 0,0668 (sien tabel<br />

A1.1) en die groter proporsie by<br />

z = 1,5 is gelyk aan 0,9332.<br />

In die volgende gedeelte gaan jy nou figure 3 en 4 gebruik om die proporsies in te<br />

kleur waar daar met 'n negatiewe z-telling gewerk word.<br />

bladsy 107


NEGATIEWE z-TELLING ± AFLEES VAN PROPORSIES<br />

Instruksies Kommentaar<br />

Gebruik nou figuur 3 en 4 (waar die<br />

negatiewe z-telling van z = 72<br />

aangedui is). Skryf groter as (4)<br />

onder die eerste figuur en kleiner as<br />

(5) onder die tweede figuur. Kleur<br />

nou die gepaste area in op die twee<br />

figure.<br />

Soek nou die gepaste waarde in tabel<br />

A1.1 om die spesifieke area by elke<br />

diagram as 'n proporsie aan te dui.<br />

Waar daar groter as (4) staan, moet<br />

jy die area regs van die gemerkte ztelling<br />

inkleur. Waar daar kleiner as<br />

(5) staan, moet jy die area links van<br />

die gemerkte z-telling inkleur.<br />

By die derde figuur (negatiewe z-telling<br />

en groter as (4)) sou jy die groter<br />

proporsie ingekleur het. By die vierde<br />

figuur (negatiewe z-telling en kleiner as<br />

(5)) sou jy die kleiner proporsie<br />

ingekleur het.<br />

Die kleiner proporsie by 'n z-telling<br />

van 2,0 is gelyk aan 0,0228 (sien tabel<br />

A1.1) en die groter proporsie by<br />

z = 2,0 is gelyk aan 0,9772.<br />

In die volgende gedeelte gaan ons nou kyk wat gebeur as jy wil kyk na die area<br />

(proporsie) tussen twee verskillende z-tellings. Hier werk ons met die area kleiner<br />

as (links van) die een waarde, maar terselfdertyd ook die area groter as (regs van)<br />

die tweede waarde. Weer eens sal dit vir jou baie duideliker word as jy 'n grafiese<br />

voorstelling daarvan maak. In hierdie gedeelte sal jy gebruik maak van die ``mean<br />

to z''-kolom in tabel A1.1 (alhoewel jy die antwoord ook met ander waardes sou<br />

kon bereken).<br />

bladsy 108 . studie-eenheid 10 die normaalverspreiding


TWEE z-TELLINGS ± PROPORSIE TUSSEN TWEE TELLINGS<br />

Instruksies Kommentaar<br />

Gebruik nou die vyfde skets van die<br />

normaalverspreiding wat jy geteken<br />

het. Dui daarop z = +1,5 (regs van<br />

z = 0) SOWEL AS z =7 2,0 (links<br />

van z = 0) op hierdie figuur aan.<br />

Skryf 72,0 5 z 5 1,5 onder hierdie<br />

figuur. Kleur nou die gepaste area in<br />

op die figuur in.<br />

Soek nou die gepaste waarde in tabel<br />

A1.1 om die spesifieke area wat jy<br />

ingekleur het as 'n proporsie aan te<br />

dui.<br />

. afdeling 3 data-verwerking: inferensieel<br />

Jy moes die area TUSSEN die twee zwaardes<br />

ingekleur het (kleiner as<br />

z = +1,5 en terselfdertyd groter as<br />

z = 72,0).<br />

Hier is dit makliker om van die ``mean<br />

to z''-waardes van tabel A1.1 gebruik<br />

te maak. Die area tussen die twee zwaardes<br />

word deur twee helftes verteenwoordig.<br />

Die linkerkantste deel is<br />

die waarde van z = 72,0 tot by die<br />

middellyn (z = 0), terwyl die<br />

regterkantste deel die proporsie tussen<br />

z = 1,5 en die middellyn (z =0)<br />

is.<br />

Die ``mean to z''-proporsie by 'n ztelling<br />

van 2,0 is gelyk aan 0,4772 (sien<br />

tabel A1.1) en die ``mean to z''-telling<br />

by z = 1,5 is gelyk aan 0,4332. Hierdie<br />

twee tellings moet bymekaargetel word<br />

om die proporsie tussen die twee<br />

tellings te kry. (Die antwoord is<br />

0,9104.)<br />

Enige proporsie kan ook as 'n persentasie uitgedruk word deur dit met 100 te<br />

vermenigvuldig. Byvoorbeeld: 0,9772 kan geskryf word as 97,72%, terwyl 0,0228<br />

as 2,28% geskryf kan word.<br />

Wanneer ons die proporsie bereken het, kan ons ook uitwerk watter aantal<br />

persone daardie proporsie verteenwoordig. Die aantal persone word verkry deur<br />

die proporsie (of persentasie) met die totale aantal gevalle te vermenigvuldig.<br />

bladsy 109


AANTAL GEVALLE VERTEENWOORDIG DEUR `N PROPORSIE (OF<br />

PERSENTASIE)<br />

Instruksies Kommentaar<br />

Bereken die aantal gevalle van 'n<br />

totaal van 80 gevalle wat deur die<br />

proporsie 0,7653 (of 76,53%)<br />

voorgestel word.<br />

Jy moet die totale aantal gevalle (80)<br />

met die proporsie (of persentasie)<br />

vermenigvuldig. Dit gee 'n antwoord<br />

van 61,24, wat afgerond word tot 61.<br />

. Onthou dat waar daar met persone<br />

gewerk word, die antwoord altyd tot<br />

die naaste syfer afgerond word.<br />

Jy moet die volgende stappe volg elke keer wat jy met z-tellings werk:<br />

. Maak 'n skets van die normaalverspreiding met z = 0 in die middel.<br />

. Bereken die z-telling (gebruik die formule).<br />

. Teken die berekende z-telling op jou skets. Onthou, positiewe z-tellings kom<br />

regs van z = 0 en negatiewe z-tellings kom links van z = 0.<br />

. Bepaal of jy die gedeelte links van () die bepaalde<br />

z-waarde moet inkleur en kleur dit in.<br />

. Lees die korrekte proporsie (larger portion, smaller portion of mean to z) in die<br />

tabel af by die bepaalde z-waarde en teken dit so op jou skets aan.<br />

. Skryf die nodige berekening neer en gee jou finale antwoord in die korrekte<br />

formaat.<br />

Probeer nou om die vrae wat ons vroeeÈ r gestel het te beantwoord.<br />

Jou antwoorde behoort so te lyk:<br />

(a) (X =5)<br />

z = X<br />

= 5 7<br />

2<br />

= 2<br />

2<br />

= 71<br />

bladsy 110 . studie-eenheid 10 die normaalverspreidingg


(b) (X = 10)<br />

z = X<br />

= 10 7<br />

= 3<br />

2<br />

2<br />

= 1,5<br />

(c) Proporsie = 0,15866<br />

. afdeling 3 data-verwerking: inferensieel<br />

. Kyk na die skets by Vraag (a).<br />

. Jy het reeds z = ±1 bereken by Vraag (a).<br />

. Blaai na tabel A1.1 in Tredoux en Durrheim.<br />

. Soek waar z = 1 in die tabel.<br />

. Die grysgekleurde area is waaroor hierdie vraag handel en jy kan<br />

sekerlik sien dat dit die smaller portion onder hierdie normaaldistribusie<br />

is.<br />

. Kyk langs z = 1 onder smaller portion in Tabel A1.1 en jy sal die<br />

waarde 0,15866 sien.<br />

(d) Proporsie = 0,15866 (jou antwoord op Vraag (c))<br />

Dus is die persentasie = 15,87%<br />

(e) Onthou dat die totale oppervlakte onder die standaard-normaalverspreiding<br />

= 1.<br />

Dus is die grysgekleurde proporsie = 0,927.<br />

1 7 (0,06681 + 0,15866) = 1 ± 0,22547 = 0,77453<br />

Jy sal dieselfde antwoord kry indien jy die twee mean to z proporsies (0,43319<br />

en 0,44134) in die figuur bymekaar tel.<br />

N = 1 250 (Dit word by die begin in die vraag gegee)<br />

Die aantal gevalle = 0,77453 6 1 250<br />

= 968,16<br />

;968 persone<br />

Ons kan uit hierdie berekenings sien dat die deelnemers van die Nuwe Sterrevertoning<br />

binne die laagste 15% van individue in die samelewing tussen die<br />

ouderdom 18 tot 36jaar val met betrekking tot die mate waartoe hulle normale<br />

bladsy 111


eeÈ ls en regulasies nakom. Dit kom daarom voor dat hulle meer geneig is om<br />

risiko's te neem en die status quo uit te daag as die gemiddelde individu in hierdie<br />

ouderdomsgroep in die gemeenskap.<br />

Ons kan nie net x-tellings in z-tellings omskakel nie, maar ook z-tellings in xtellings<br />

omsit.<br />

Bestudeer die toepaslike afdeling op bladsy 102 tot 103 van Tredoux en Durrheim<br />

(2002) en doen dan die volgende oefening.<br />

Gestel ons moet die grense bepaal waarbinne 80% van persone se tellings sal val<br />

as ons weet dat die gemiddelde van die tellings gelyk is aan 45,7 en die<br />

standaardafwyking gelyk is aan 11,42.<br />

GRENSE VAN SEKERHEID<br />

Instruksies Kommentaar<br />

Teken weer 'n normaalverspreiding<br />

met z = 0 in die middel.<br />

Merk nou twee grense aan weerskante<br />

van z = 0 en kleur die gedeelte tussen<br />

hierdie twee grense in.<br />

Merk die ingekleurde deel as gelyk aan<br />

80% (0,80) met 40% links van z =0<br />

en 40% regs van z =0.<br />

Vind nou die ooreenstemmende ztelling<br />

wat die areas sal gee soos wat<br />

op jou skets aangedui is.<br />

Indien jy nie die presiese waarde in die<br />

tabel (A1.1) kry nie, gebruik die<br />

waarde wat numeries die naaste is<br />

aan die waarde wat jy gesoek het.<br />

Die twee z-waardes wat die naaste aan<br />

0,4000 (40%) kom, is<br />

z = 1,29 (mean to z = 0,4015) en<br />

z = 1,28 (mean to z = 0,3997).<br />

Aangesien 0,3997 nader aan 0,40 is,<br />

neem ons z = 1,28 as die korrekte<br />

antwoord.<br />

bladsy 112 . studie-eenheid 10 die normaalverspreiding<br />

Die 80% is presies simmetries rondom<br />

z = 0 versprei, sodat 40% links van<br />

z = 0 en 40% regs van z = 0 leà .<br />

Die oorblywende 20% van die area<br />

(proporsie) onder die kromme sal in<br />

die twee stertgedeeltes vorm. Die<br />

oorblywende 20% word dus in twee<br />

gedeel met 10% in die linkerkantste<br />

stertgedeelte en 10% in die regterkantste<br />

stertgedeelte.<br />

Soek die z-waarde wat 'n ``mean to z''telling<br />

van 0,4000 (40%) gee sodat die<br />

area tussen die negatiewe z-telling met<br />

hierdie waarde en die positiewe xtelling<br />

met hierdie waarde 'n totale<br />

area van 80% sal beslaan. (Onthou dat<br />

die normaalverspreiding heeltemal<br />

simmetries is.)<br />

Jy kon ook vir die z-waarde met 'n<br />

``smaller portion'' van 0,1000 gesoek<br />

het, en sou op die manier by presies<br />

presies dieselfde z-waardes uitgekom<br />

het.


. afdeling 3 data-verwerking: inferensieel<br />

Om nou bogenoemde z-telling korrek te interpreteer, moet jy weer kyk na die<br />

skets wat jy gemaak het. Ons het nou bereken dat 80% van alle tellings tussen z =<br />

±1,28 en z = +1,28 sal leà . Dit beteken prakties dat 80% van alle waardes tussen<br />

die volgende twee berekende waardes sal leà :<br />

. die gemiddelde minus 1,28 maal die standaardafwyking (gee die onderste grens)<br />

. die gemiddelde plus 1,28 maal die standaardafwyking (gee die boonste grens)<br />

Onthou dat ons vir jou geseà het dat die gemiddelde gelyk is aan 45,7 en die<br />

standaardafwyking is gelyk aan 11,42. Vir hierdie spesifieke geval sal 80% van alle<br />

tellings leà tussen:<br />

. Ondergrens: 45,7 7 1,28(11,42) = 45,7 7 14,62 = 31,08; en<br />

. Bogrens: 45,7 + 1,28(11,42) = 45,7 + 14,62 = 60,32.<br />

Tagtig persent (80%) van die persone se waardes sal dus tussen 31,08 en 60,32 leà .<br />

Daar is twee vaste grense wat baie algemeen gebruik word en wat belangrik is om<br />

te onthou: 95% en 99%. Die z-waardes vir 95% is +1,96en vir 99% is dit<br />

+2,58.<br />

Hier is 'n grafiek wat die areas onder die normaaldistribusiekurwe aantoon.<br />

bladsy 113


Bestudeer die uitgewerkte voorbeeld op bladsy 104 van Tredoux en Durrheim<br />

(2002).<br />

Bestudeer raam 6.2 op bladsy 104 tot 105 van Tredoux en Durrheim sodat jy weet<br />

hoe om 'n sigblad te gebruik om z-berekenings te doen.<br />

Noudat jy studie-eenheid 10 bestudeer het, behoort jy<br />

. die normaalverspreiding te kan beskryf<br />

. die standaard-normaalverspreiding te kan beskryf en 'n grafiese voorstelling<br />

daarvan te kan maak<br />

. lineeà re transformasies te kan doen soos die berekening van z-waardes en ook<br />

die aflees van tabelwaardes<br />

. grense te kan bepaal vir die mate van sekerheid van waarnemings<br />

bladsy 114 . studie-eenheid 10 die normaalverspreiding


11<br />

studie-eenheid elf<br />

. afdeling 3 data-verwerking: inferensieel<br />

Steekproefdistribusies<br />

en hipotesetoetsing<br />

Moenie skrik vir hierdie lang en skynbaar ingewikkelde titel nie. Kom<br />

ons kyk na al die terme in hierdie studie-eenheid se opskrif.<br />

Steekproef _____________________________________________<br />

As ons as navorsers belang sou stel om die gemiddelde lengte van al die mans in<br />

Suid-Afrika te bepaal, sou dit onmoontlik wees. Stem jy saam dat dit heeltemal te<br />

veel geld, mense en tyd sou neem om dit te doen? Jy sal al die mans tot in al die<br />

uithoeke van Suid-Afrika moet gaan soek en al sou dit moontlik wees om almal<br />

op te spoor, is die fisiese meet van al die mans onrealisties. Hierdie is maar een<br />

voorbeeld waar dit prakties onmoontlik is om van die hele populasie gebruik te<br />

maak. Soos jy in studie-eenheid 2 gesien het,'n populasie is 'n hele versameling<br />

voorwerpe of entiteite ± in ons voorbeeld hierbo, is dit al die mans in Suid-Afrika.<br />

Aangesien dit nie altyd moontlik is om die hele versameling of alle mans te betrek<br />

nie, gebruik ons eerder 'n deelversameling van die populasie. Ons noem hierdie<br />

deelversameling van die populasie 'n steekproef.<br />

Ons wil egter meestal bepaalde afleidings oor 'n hele populasie maak. As ons dink<br />

aan die voorbeeld waarin ons die gemiddelde ouderdom bereken van alle Nuwe<br />

Sterre-kykers, is dit tog duidelik dat dit heelwat makliker sou wees om met 'n<br />

kleiner groep ('n steekproef) te werk. Ons kan dan die aanname maak dat wat vir<br />

die steekproef geld, ook op die populasie van toepassing is. Die gemiddelde<br />

ouderdom van die kykers in die steekproef sou dan as die gemiddelde ouderdom<br />

van alle Nuwe Sterre-kykers beskou kon word. Ons kan dus veralgemenings van<br />

die steekproef na die populasie vorm. In so 'n geval sou ons spesifieke<br />

navorsingstegnieke op 'n steekproef toepas om afleidings (gevolgtrekkings) oor<br />

die populasie te maak. Dit is wat met inferensieÈ le statistiek bedoel word. Ons<br />

gebruik inferensieÈ le statistiek dus om van 'n steekproef na 'n populasie te<br />

veralgemeen.<br />

Hoe regverdigbaar is die gebruik van steekproewe in plaas van populasies? _____<br />

Jy het nou seker vir jouself die vraag afgevra: hoe seker kan ons wees dat alles wat<br />

waar is van die steekproef, ook waar sal wees van die populasie? Anders gestel, as<br />

bladsy 115


die resultate uit ons navorsing toon dat die gemiddelde ouderdom van kykers in<br />

die steekproef 26jaar oud is, hoe seker kan ons wees dat die gemiddelde<br />

ouderdom van al Nuwe Sterre-kykers in die populasie ook 26jaar oud sal wees?<br />

Hierdie is 'n vraag waarmee navorsers te doen gekry het, maar dit doeltreffend<br />

opgelos het ± deur 'n populasie te definieer wat nie te groot is nie en die<br />

gemiddelde van die totale populasie ten opsigte van 'n eienskap, byvoorbeeld<br />

lengte te verkry. Verskillende ewekansige steekproewe uit dieselfde populasie word<br />

daarna geneem en die gemiddeld van elke steekproef ten opsigte van die eienskap<br />

word gemeet. Die eksperiment word op verskeie populasies uitgevoer en<br />

verskillende eienskappe word ook telkens gemeet. Die gemiddelde van al die<br />

steekproewe se gemiddeldes toon dat dit nooit veel verskil van die populasie se<br />

gemiddelde nie. Daarom is dit regverdigbaar om van 'n steekproef na 'n populasie<br />

te veralgemeen.<br />

Steekproefneming ________________________________________<br />

Steekproefneming is die proses waardeur 'n deelversameling van die hele<br />

populasie geõÈ dentifiseer en groepeer word. Ewekansige steekproefneming<br />

beteken dat die steekproef op so 'n wyse geõÈ dentifiseer en ingesamel word dat<br />

elke lid van die populasie 'n gelyke kans het om deel van die steekproef te wees.<br />

Dit is die beste manier om te verseker dat jou steekproef so kenmerkend moontlik<br />

van die populasie is. Met ander woorde, die steekproef verteenwoordig die<br />

populasie.<br />

Distribusies ____________________________________________<br />

'n Distribusie (verspreiding/verdeling) is 'n grafiese voorstelling van die totale<br />

datastel. Jy het in studie-eenheid 10 reeds van die standaard-normaalverspreiding<br />

geleer.<br />

Hou die betekenis van hierdie konsepte in gedagte terwyl ons nou verduidelik wat<br />

steekproefdistribusies is.<br />

Steekproefdistribusies ___________________________________________<br />

Bestudeer bladsy 108 tot 113 van Tredoux en Durrheim (2002) waar die begrippe<br />

populasies, ewekansige steekproewe en inferensie/afleiding hersien word om die<br />

begrip steekproefdistribusie te verduidelik. 'n Definisie vir die begrip<br />

steekproefdistribusie verskyn in die middel van bladsy 112.<br />

Die vryhandskets hieronder bied 'n voorstelling van die begrip<br />

steekproefdistribusie.<br />

bladsy 116 . studie-eenheid 11 steekproefdistribusies en hipotesetoetsing


Populasiedistribusie met<br />

gemiddelde m, variansie s 2<br />

en standaardafwyking s<br />

Frekwensiedistribusie van alle<br />

moontlike steekproewe van<br />

grootte N vanuit die populasie,<br />

elk met gemiddelde X,<br />

variansie s 2 en standaardafwyking<br />

s<br />

Steekproefdistribusie van die<br />

gemiddelde met gemiddelde x,<br />

variansie s2 x (bekend as die variansiefout<br />

van die gemiddelde) en standaardafwyking<br />

sx (bekend as<br />

die standaardfout van die gemiddelde)<br />

. afdeling 3 data-verwerking: inferensieel<br />

Die steekproefdistribusie van 'n statistiek<br />

X1<br />

Soos reeds geseà , is dit bykans onmoontlik om die gemiddelde van die populasie te<br />

bereken en daarom bereken ons eerder die steekproefgemiddelde, wat as X<br />

genoteer word. Ons neem aan dat alles wat waar is van X, ook waar sal wees van<br />

die populasiegemiddelde, wat as m genoteer word. Omdat ons uiteindelik<br />

belangstel wat in die hele populasie aangaan eerder as in die steekproef,<br />

gebruik ons die m-notasie in berekeninge, en nie X nie.<br />

Noudat jy die term steekproefdistribusies verstaan, gaan ons voort met 'n<br />

bespreking van die tweede begrip in die titel van hierdie studie-eenheid, naamlik<br />

hipotesetoetsing.<br />

Wanneer ons inferensieÈ le statistiek bereken, gebruik ons steekproewe om<br />

m<br />

X3<br />

m X<br />

X2<br />

bladsy 117


afleidings oor populasies te maak. Net so gebruik ons steekproefdistribusies om<br />

afleidings oor populasiedistribusies te maak. Anders gestel, ons gebruik 'n<br />

steekproefdistribusie om 'n hipotese oor 'n populasiegemiddelde te toets.<br />

Wat is 'n hipotese? _______________________________________<br />

Die meeste wetenskaplike navorsingsondersoeke is pogings om 'n hipotese te toets<br />

wat deur die navorser geformuleer is. 'n Hipotese is in werklikheid 'n idee ± 'n<br />

verwagting dat daar 'n verband tussen twee of meer veranderlikes bestaan. Die<br />

navorser maak gewoonlik 'n spesifieke voorspelling aangaande die uitkoms van<br />

sy/haar eksperiment. Indien hierdie voorspelling deur die resultaat van die<br />

ondersoek bevestig word, onderskryf dit die hipotese.<br />

Tredoux en Durrheim (2002, p. 128) beskryf 'n hipotese as 'n tentatiewe<br />

konstatering/stelling van 'n verhouding tussen twee veranderlikes. Die skrywers<br />

verwys ook na Neuman se definisie wat beweer dat hipoteses bloot ingeligte<br />

raaiskote oor die werking van die sosiale weà reld is.<br />

Sover het ons nog net teoreties gepraat. Kom ons verwys terug na die voorbeeld<br />

aan die begin van hierdie studie-eenheid waar ons belang gestel het in die<br />

ouderdom van al die Nuwe Sterre-kykers. Gestel ons as bedryfsielkundiges wil<br />

egter nie net weet wat die gemiddelde ouderdom van die kykers is nie. Ons stel<br />

ook belang om te weet of die kykers 'n verskillende gemiddelde ouderdom van<br />

besoekers aan die webtuiste het. Die vraag wat ons ons afvra is of die twee groepe<br />

verskil, met ander woorde of die gemiddelde ouderdom van 'n kykersteekproef<br />

wat verkry is beduidend sal verskil van die gemiddelde ouderdom vir 'n steekproef<br />

van besoekers aan die webtuiste. So ons stel 'n navorsingsprobleem, wat ons<br />

verder as 'n stelling kan definieer wat as 'n navorsingshipotese bekend staan.<br />

Hierdie stelling of navorsingshipotese kan die volgende wees: ``Daar is 'n verskil<br />

tussen die ouderdom van kykers en besoekers aan die webtuiste vir die Nuwe<br />

Sterre-vertoning.''<br />

Waar pas hipoteses in by die navorsingsproses? __________________<br />

Ons as bedryfsielkundiges kan egter nie sommer net op gesigswaarde seà dat die<br />

besoekers aan die webtuiste jonger is as die TV-kykers nie en daarom moet ons<br />

wetenskaplik te werk gaan. Dit gebeur deur middel van hipotesetoetsing en die<br />

formulering van 'n navorsingshipotese soos ons hierbo gedoen het. Daarna word<br />

daar deur 'n proses gewerk om die navorsingsvraag statisties (wetenskaplik) te<br />

beantwoord.<br />

Die proses wat gevolg moet word staan bekend as hipotesetoetsing. Tredoux en<br />

Durrheim (2002, p. 128) beskryf dit as 'n logiese en empiriese prosedure waardeur<br />

hipoteses formeel opgestel en dan aan empiriese toetsing onderwerp word. Die<br />

proses van hipotesetoetsing behels 'n aantal stappe.<br />

bladsy 118 . studie-eenheid 11 steekproefdistribusies en hipotesetoetsing


. afdeling 3 data-verwerking: inferensieel<br />

Die nege stappe in statistiese hipotesetoetsing ____________________<br />

Ons gaan vervolgens die nege stappe in die proses van hipotesetoetsing bespreek en sistematies daardeur<br />

werk. Die stappe is die volgende:<br />

1. formuleer die nulhipotese<br />

2. formuleer die alternatiewe hipotese<br />

3. bepaal of dit 'n een- of tweekantige toets is<br />

4. bepaal die beduidendheidsvlak<br />

5. bereken die toetsstatistiek<br />

6. bepaal die grade van vryheid<br />

7. bepaal die kritieke waarde<br />

8. verwerp of nie-verwerp die nulhipotese<br />

9. interpreteer die bevindinge<br />

Jy sal merk dat Tredoux en Durrheim (2002) soms 'n ander getal stappe in 'n<br />

ander volgorde gebruik. Jy moet egter altyd die bostaande nege stappe volg in die<br />

volgorde waarin dit in hierdie module aangebied word. Sodoende sal jy makliker<br />

met die stappe van hipotesetoetsing vertroud raak en dit beter onthou.<br />

Soos geseà , gaan ons in hierdie gedeelte deur die nege afsonderlike en baie<br />

belangrike stappe werk om wetenskaplik uitspraak te kan gee oor ons<br />

navorsingshipotese. Jy gaan met baie nuwe terme te doen kry, maar as jy dit<br />

baasraak, gaan dit vir jou tot voordeel wees, aangesien ons in studie-eenhede 12,<br />

13 en 14 telkens daarmee gaan werk.<br />

Daar is 'n vaste prosedure wat gevolg word by hipotesetoetsing en as jy vertroud<br />

is met die verskillende begrippe en die stappe, sal dit maklik wees om dit elke keer<br />

toe te pas en in hipotesetoetsing te gebruik. As jy die stappe goed verstaan en<br />

toepas, ken jy die basiese proses wat in alle navorsing gevolg word, en kan jy dit<br />

suksesvol in jou werksituasie gebruik om bedryfsielkundige ondersoeke te doen en<br />

sodoende werksprobleme op te los. Kom ons werk nou sistematies deur die nege<br />

stappe.<br />

Stap 1: Formuleer die nulhipotese<br />

Die nulhipotese is 'n ontkennende stelling wat ons maak oor die moontlike verskil<br />

tussen wat ons as bedryfsielkundiges wil toets. Ons seà dat daar nie 'n verskil is<br />

tussen wat ons ook al ondersoek nie, of dat albei die veranderlikes byvoorbeeld<br />

ewe groot, lank of swaar is.<br />

Voordat jy jou eie nulhipotese kan formuleer, moet jy eers 'n bietjie voorbereiding<br />

doen. Hersien Tredoux en Durrheim (2002) se uiteensetting van hipotesetoetsing<br />

en die nulhipotese op bladsy 128. Kyk ook na die voorbeelde van nulhipoteses<br />

boaan bladsy 129. Lees ook weer die navorsingsvraag en hipotese wat ons oor die<br />

bladsy 119


ouderdom van kykers en besoekers aan die webtuiste van Nuwe Sterre gestel het<br />

en probeer om 'n nulhipotese hiervoor te formuleer:<br />

_____________________________________________________________________<br />

_____________________________________________________________________<br />

_____________________________________________________________________<br />

_____________________________________________________________________<br />

'n Tipiese nulhipotese op bogenoemde vraag sou soos volg lui:<br />

. Daar is nie 'n verskil tussen die ouderdom van kykers en besoekers aan die<br />

webtuiste nie.<br />

Ons kan dit ook ietwat anders formuleer, byvoorbeeld:<br />

. TV-kykers en besoekers aan die webtuiste is ewe oud.<br />

Albei stellings seà dieselfde, of hoe? Het jy dit ook so geskryf deur die een of die<br />

ander stelwyse te gebruik?<br />

Ons kan 'n nulhipotese ook simbolies formuleer deur die simbool H0 vir die<br />

nulhipotese en m vir die gemiddelde van die steekproefdistribusie te gebruik.<br />

H0: mTV = mwebsite of alternatiewelik mTV 7 mwebsite =0<br />

Ons gee vir jou nog 'n volledige voorbeeld om deur te werk:<br />

'n Tipiese navorsingshipotese lui soos volg:<br />

'n Bedryfsielkundige wil bepaal of daar 'n beduidende verskil tussen die tellings vir<br />

emosionele intelligensie van aansoekers vir Nuwe Sterre en die deelnemers wat<br />

gekies is om aan Nuwe Sterre deel te neem.<br />

Hieruit kan die nulhipotese soos volg geformuleer word:<br />

. In woorde: Daar is geen verskil tussen die emosionele intelligensie van<br />

aansoekers en deelnemers nie<br />

of:<br />

. Die tellings vir emosionele intelligensie van aansoekers en<br />

deelnemers is ewe goed<br />

. In simbole: H0: mA = mD; of<br />

mA 7 mD= 0<br />

Is dit vir jou duidelik hoe om dit te doen?<br />

Stap 2: Formuleer die alternatiewe hipotese<br />

In hierdie gedeelte word die formulering van die alternatiewe hipotese bespreek.<br />

Die alternatiewe hipotese is soortgelyk aan die navorsingshipotese en<br />

teenoorgesteld aan die nulhipotese. (Onthou jy nog hoe om die nulhipotese in<br />

bladsy 120 . studie-eenheid 11 steekproefdistribusies en hipotesetoetsing


woorde en in simbole te formuleer?) Die alternatiewe hipotese is nie ontkennend<br />

soos die nulhipotese nie, maar bevestigend soos die navorsingshipotese,<br />

byvoorbeeld, daar is 'n verskil tussen wat jy ook al meet.<br />

Die alternatiewe hipotese is soortgelyk aan die navorsingshipotese en<br />

teenoorgesteld aan die nulhipotese. (Onthou jy nog hoe om die nulhipotese in<br />

woorde en in simbole te formuleer?) Die alternatiewe hipotese is nie ontkennend<br />

soos die nulhipotese nie, maar bevestigend soos die navorsingshipotese,<br />

byvoorbeeld, daar is 'n verskil tussen wat jy ook al meet.<br />

. nie-rigtinggewend ± die twee veranderlikes is nie gelyk nie (=) ± daar is 'n<br />

verskil in die ouderdom tussen TV-kykers en besoekers aan die webtuiste<br />

. rigtinggewend ± die een veranderlike is kleiner as die ander een (5) ± TVkykers<br />

is jonger as besoekers aan die webtuiste<br />

. rigtinggewend ± die een veranderlike is groter as die ander een (4) ± TV-kykers<br />

is ouer as besoekers aan die webtuiste<br />

Die formulering van die alternatiewe hipotese ten opsigte van rigting word in die<br />

oorspronklike probleemstelling geõÈ mpliseer, byvoorbeeld die navorser verwag dat<br />

TV-kykers ouer as besoekers aan die webtuiste is.<br />

Om saam te vat wat jy sopas oor die formulering van 'n alternatiewe hipotese<br />

geleer het, moet jy nou bladsy 129 tot 130 van Tredoux en Durrheim (2002)<br />

bestudeer.<br />

Ons gee 'n voorbeeld hoe om die alternatiewe hipotese te formuleer en gebruik<br />

dieselfde navorsingshipotese as vantevore.<br />

Die navorsingshipotese is:<br />

'n Navorser wil bepaal of daar 'n beduidende verskil tussen die emosionele<br />

intelligensie van aansoekers en deelnemers aan Nuwe Sterre is.<br />

Die alternatiewe hipotese kan soos volg geformuleer word:<br />

. In woorde: Daar is 'n verskil tussen die tellings vir emosionele intelligensie<br />

van aansoekers en deelnemers aan die Nuwe Sterre-kompetisie<br />

of<br />

Die emosionele intelligensietellings van aansoekers en deelnemrs<br />

is nie ewe goed nie<br />

. In simbole: H1: mA = mD; of<br />

H1: mAM 7 mD = 0<br />

Is dit vir jou duidelik hoe dit gedoen word?<br />

. afdeling 3 data-verwerking: inferensieel<br />

Stap 3: Bepaal of dit 'n een- of tweekantige toets is<br />

In stap 3 bepaal ons of ons met 'n eenkantige of 'n tweekantige toets te doen het.<br />

Dit hang gewoonlik af of ons vermoed dat die een veranderlike wat ons wil<br />

bladsy 121


ondersoek, groter of kleiner as die ander veranderlike is, byvoorbeeld dat mans<br />

langer is as dames. In so 'n geval het ons 'n eenkantige toets (rigtinggewend).<br />

Indien ons egter onseker is of dit langer of korter gaan wees, werk ons met 'n<br />

tweekantige toets (nie-rigtinggewend).<br />

Doen die volgende oefeninge:<br />

1. 'n Eenkantige toets is nie rigtinggewend nie.<br />

2. 'n Tweekantige toets is altyd nie-rigtinggewend.<br />

1. onwaar<br />

2. waar<br />

a = 0,05<br />

!<br />

a/2 = 0,025<br />

!<br />

!<br />

Waar Onwaar<br />

Hieronder volg skematiese voorstellings van een- en tweekantige toetse. Onthou<br />

dat die alfa-vlakke verwys na die proporsie of die oppervlak van die<br />

verwerpingsgebied.<br />

Eenkantige toets (rigtinggewende toets)<br />

Dit is 'n toets wat ekstreme uitkomstes in slegs een end van die verspreiding<br />

verwerp.<br />

Tweekantige toets (nie-rigtinggewende toets)<br />

a/2 = 0,025<br />

a = 0,05<br />

Dit is 'n toets wat ekstreme uitkomstes in beide kante van die verspreiding<br />

verwerp.<br />

bladsy 122 . studie-eenheid 11 steekproefdistribusies en hipotesetoetsing<br />

!


Maak seker jy weet wanneer 'n toets eenkantig of gerig is, en wanneer 'n toets<br />

tweekantig of niegerig is. Beantwoord dan die volgende vraag:<br />

Identifiseer die volgende alternatiewe hipoteses as een- of tweekantig:<br />

1. H1: m1 4 m2<br />

2. H1: mA = mB<br />

3. H1: mA 5 mB<br />

4. H1: m1 7 m2 =0<br />

5. H1: m1 7 m2 4 0<br />

6. H1: mA 7 mB =0<br />

1. eenkantig<br />

2. tweekantig<br />

3. eenkantig<br />

4. tweekantig<br />

5. eenkantig<br />

6. tweekantig<br />

Die praktiese oefening wat jy in bogaande aktiwiteit gehad het, behoort jou in<br />

staat te stel om te weet wat 'n een- en 'n tweekantige toets is en wanneer om elkeen<br />

te gebruik.<br />

Stap 4: Bepaal die beduidendheidsvlak<br />

. afdeling 3 data-verwerking: inferensieel<br />

In hierdie gedeelte verwys ons kortliks na die bepaling van die vlak van<br />

beduidendheid. Dit hou verband met stap 3 en die besluit om of 'n eenkantige of<br />

tweekantige toets te gebruik.<br />

Bestudeer bladsy 132 tot 134 van Tredoux en Durrheim (2002). Hier verduidelik<br />

die skrywers wat die vlak van beduidendheid is asook die soorte foute wat<br />

daarmee gepaardgaan.<br />

Samevattend kan geseà word dat ons gewoonlik met 'n 5%- en/of 1%-vlak van<br />

beduidendheid werk. Daar word nie van jou as student verwag om hierdie besluit te<br />

neem nie en ons sal altyd vir jou aandui watter vlak om te gebruik, naamlik 0,05 of<br />

0,01.<br />

'n Tipe I-fout beteken dat 'n nulhipotese verwerp word wanneer dit waar is. 'n<br />

Tipe II-fout beteken dat 'n nulhipotese nie verwerp word wanneer dit onwaar is<br />

nie.<br />

bladsy 123


Die onderskeidingsvermoeÈ van 'n toets verwys na die waarskynlikheid van 'n<br />

juiste verwerping van 'n onwaar nulhipotese ± jy gaan in studie-eenheid 15 meer<br />

hieroor leer.<br />

Stap 5: Bereken die toetsstatistiek<br />

Samevattend:<br />

Ons het tot dusver nog net steekproefstatistiek bereken ± statistiek wat uit 'n<br />

steekproef bereken is en hoofsaaklik gebruik is om die steekproef vir die<br />

gemiddelde (X) te beskryf. 'n Toetsstatistiek is die uitslag van 'n statistiese toets.<br />

Ons verwys na toetsstatistiek wanneer ons een of ander statistiese tegniek gebruik<br />

om data met mekaar te vergelyk. In hierdie kursus (IOP2601) gebruik ons net<br />

enkele statistieke (die t-toets, F-toets of chi-kwadraattoets), hoofsaaklik wanneer<br />

ons wil bepaal of daar beduidende verskille tussen steekproefgemiddeldes is.<br />

Toetsstatistieke waarin die gemiddelde 'n rol speel, kan in twee kategorieeÈ<br />

ingedeel word: die wat op slegs twee steekproewe (t-toets) betrekking het en die<br />

wat vir meer as twee steekproewe (F-toets) geld. In die geval van slegs twee<br />

steekproewe kan die steekproewe verwant of nieverwant (onafhanklik) wees.<br />

Laastens gaan jy kennis maak met die toetsing van frekwensies in een of meer<br />

groepe (chi-kwadraattoets).<br />

Jy sal merk dat die z-toets verduidelik word in die tutoriaal in Tredoux en<br />

Durrheim (2002) waarna ons jou verwys. Hierdie toetsstatistiek is een wat jy nie<br />

vir hierdie module hoef te ken nie. Die spesifieke tutoriaal in die handboek is tog<br />

nuttig wat betref die uiteensetting van die konsepte wat ons in hierdie studieeenheid<br />

gebruik, hoewel 'n ander statistiese toets gebruik word. Jy kan dit dus<br />

deurwerk as 'n voorbeeld.<br />

. Twee steekproewe<br />

± t-toets vir verwante steekproewe<br />

± t-toets vir nie-verwante steekproewe<br />

. Drie (of meer) steekproewe<br />

± F-toets (eenrigting-variansieontleding)<br />

. Een of meer veranderlikes met frekwensies<br />

± chi-kwadraattoets<br />

Jy hoef jou nie nou oor die spesifieke toetsstatistieke te kwel nie. In die studieeenhede<br />

wat volg, sal jy leer hoe om dit te bereken. Wat jy nou wel moet weet, is<br />

dat toetsstatistieke (soos t, F en chi-kwadraat) na die antwoorde verwys wat jy<br />

verkry wanneer jy 'n hipotese empiries (statisties) toets en jou berekening van die<br />

toetsstatistieke ooreenkom met die nege stappe van hipotesetoetsing.<br />

bladsy 124 . studie-eenheid 11 steekproefdistribusies en hipotesetoetsing


Stap 6: Bepaal die grade van vryheid<br />

Dit is ook nodig om die grade van vryheid te bepaal sodat jy jou berekenings<br />

sinvol kan interpreteer. Dit is nie vir jou nodig om die teorie aangaande die grade<br />

van vryheid te ken nie, maar jy moet dit korrek kan bereken volgens die formule<br />

wat elke soort toetsstatistiek vergesel. Ons gaan dit in die volgende studie-eenhede<br />

verduidelik en ook die toepaslike formules in elke studie-eenheid bespreek.<br />

Stap 7: Bepaal die kritieke waarde<br />

. afdeling 3 data-verwerking: inferensieel<br />

Die bepaling van die kritieke waarde is ook van belang in die interpretering van<br />

jou antwoord en gaan nou saam met die grade van vryheid wat jy in die vorige<br />

stap gedoen het. Jy het op bladsy 133 van Tredoux en Durrheim geleer wat die<br />

verwerpingsgebied behels. Die kritieke waarde begrens die verwerpingsgebied en<br />

is met ander woorde daardie waarde wat die beginpunt van die verwerpingsgebied<br />

aandui. 'n Kritieke waarde toon aan dat alle tellings bo of onder daardie punt in<br />

die 5%- of 1%-vlak van beduidendheid val.<br />

Jy kan nie die kritieke waarde bepaal sonder dat jy die volgende in berekening bring nie:<br />

. of dit 'n een- of tweekantige toets is<br />

. wat die beduidendheidsvlak is<br />

. wat die grade van vryheid is<br />

Jy hoef nie hierdie kritieke waardes te bereken nie, maar jy moet dit van die<br />

relevante tabelle kan aflees wat agter in Tredoux en Durrheim (2002) ingesluit<br />

word. Die tabel met die kritieke waardes vir die t-toets verskyn op bladsy 487, die<br />

kritieke waardes vir die F-toets op bladsy 489 tot 490 en die kritieke waardes vir<br />

die chi-kwadraattoets op bladsy 492.<br />

Moenie bekommerd wees as jy hierdie tabelle nie nou verstaan nie; jy gaan in die<br />

studie-eenhede wat volg, leer hoe om elkeen te gebruik.<br />

Stap 8: Verwerp die nulhipotese of moenie die nulhipotese verwerp nie<br />

In hierdie afdeling gaan jy leer hoe om te besluit wanneer jy die nulhipotese (soos<br />

jy hierbo geformuleer het) moet verwerp sodat jy 'n besluit oor jou<br />

probleemstelling kan maak. Gelukkig hoef jy nie lukraak daaroor te besluit nie,<br />

maar jy moet wel 'n eenvoudige besluitnemingsreeÈ l onthou:<br />

. Indien toetsstatistiek 4 kritieke waarde is, word H0 verwerp.<br />

. Indien toetsstatistiek 5 kritieke waarde is, word H0 nie verwerp nie.<br />

Met ander woorde, indien die berekende waarde van jou toetsstatistiek (die<br />

antwoord op die berekening van t, F en chi-kwadraat) binne die<br />

verwerpingsgebied val, moet die nulhipotese verwerp word.<br />

bladsy 125


Onthou dat ons altyd met absolute waardes werk. Dit wil seà dat jy die negatiewe<br />

teken in jou besluit ignoreer en selfs 'n negatiewe waarde as positief lees.<br />

'n Ander manier om te besluit of die nulhipotese verwerp of nie verwerp moet<br />

word nie, is om die normaalkromme grafies voor te stel. Jy sal hierdie metode<br />

moontlik makliker vind om te interpreteer. 'n Voorbeeld van so 'n grafiese<br />

voorstelling verskyn op bladsy 135 van Tredoux en Durrheim (2002).<br />

Stap 9: Interpreteer die bevinding<br />

Die laaste stap is die interpretasie van die verwerping of die nie-verwerping van<br />

die nulhipotese ten opsigte van die oorspronklike probleemstelling. Dit behels 'n<br />

formulering van die uitkoms van die probleemstelling in woorde om aan te dui of<br />

daar wel 'n verskil is of nie tussen die twee gemiddeldes wat jy empiries getoets<br />

het, byvoorbeeld, daar is 'n verskil in lengte tussen mans en vrouens in Suid-<br />

Afrika.<br />

Noudat ons deur die hele proses van wetenskaplike hipotesetoetsing gewerk het,<br />

en finaal ons statistiese bevindinge geõÈ nterpreteer het, het ons dit herlei na ons<br />

oorspronklike probleemstelling en die navorsingshipotese wat daaruit<br />

voortgevloei het. In die proses behoort ons die oorspronklike navorsingsvraag<br />

opgelos het.<br />

Tredoux en Durrheim (2002) bied op bladsy 136tot 137 'n uitgewerkte voorbeeld<br />

van die proses van wetenskaplike hipotesetoetsing. Bestudeer dit en let op die<br />

verskillende stappe wat gevolg word. Soos reeds genoem werk Tredoux en<br />

Durrheim (2002) nie op presies dieselfde wyse as in die nege stappe hierbo<br />

uiteengesit nie, maar jy moet vasstel in watter mate hulle die stappe wel insluit.<br />

Sorg dat jy elke stap asook die logika onderliggend daaraan verstaan.<br />

Sonder om nou na die studiegids te verwys, skryf die nege stappe in die proses van<br />

hipotesetoetsing neer. (WENK: doen dit op 'n stukkie netjiese karton en plak dit<br />

bo jou lessenaar op sodat jy voortdurend daarna kan verwys.)<br />

Nou behoort jy 'n deeglike prentjie te heà van die proses van hipotesetoetsing wat<br />

gevolg word in navorsing, beginnende by 'n probleemstelling of<br />

navorsingshipotese en al die verskillende stappe waardeur gewerk moet word<br />

om finaal te kan seà of daar 'n beduidende verskil bestaan tussen die gemiddelde<br />

tellings wat tussen twee of drie groepe verkry is. In die volgende studie-eenhede<br />

gaan jy dit prakties toepas en deur die hele proses werk.<br />

bladsy 126 . studie-eenheid 11 steekproefdistribusies en hipotesetoetsing


Skematiese voorstelling van studie-eenhede 12, 13 en 14 ____________<br />

In studie-eenheid 11 is reeds melding gemaak van sommige tipes toetsstatistieke<br />

vir hipotesetoetsing.<br />

Hier is 'n grafiese voorstelling van die verskillende tipes statistiese toetse vir<br />

metingsdata (studie-eenhede 12 en 13) sowel as vir kategoriese data (studieeenheid<br />

14).<br />

Dit dien vir jou as 'n soort geheuekaart (mind map) vir die verskillende soorte<br />

toetse in inferensieÈ le statistiek.<br />

Twee<br />

groepe/<br />

steekproewe<br />

"<br />

Metingsdata<br />

(Kwantitatief)<br />

"<br />

Drie of<br />

meer<br />

groepe/<br />

steekproewe<br />

"<br />

Een<br />

klassifikasie<br />

veranderlike:<br />

`Goodness-offit'<br />

test<br />

Kategoriese data<br />

(Frekwensie)<br />

"<br />

Chi-kwadraat<br />

Twee klassifikasie<br />

veranderlikes:<br />

Tweerigtingtabel<br />

Studie-eenheid 14<br />

Verwante Onafhanklike<br />

groepe groepe<br />

t-toets t-toets Onafhanklike Verwante<br />

Studie- Studie- groepe groepe<br />

eenheid 12 eenheid 12 F-Toets F-Toets<br />

ANOVA Herhaalde-metings<br />

ANOVA<br />

Een Twee of meer<br />

onafhanklikke onafhanklike<br />

veranderlike veranderlikes<br />

Eenrigting Faktoriale<br />

ANOVA ANOVA<br />

. afdeling 3 data-verwerking: inferensieel<br />

Studie- Nie deel van hiereenheid<br />

13 die kursus nie<br />

Nie deel van<br />

hierdie kursus nie<br />

bladsy 127


12<br />

studie-eenheid twaalf<br />

Hipotesetoetse vir<br />

gemiddeldes: t-toetse<br />

Ons het reeds hipotesetoetsing in studie-eenheid 11 bespreek en in hierdie<br />

studie-eenheid gaan ons 'n hipotese empiries toets sodat ons<br />

wetenskaplik kan seà of daar 'n beduidende verskil tussen die<br />

gemiddeldes van twee stelle tellings bestaan. Dit is iets waarmee ons dikwels in<br />

die werksituasie gekonfronteer word ± om die verskil tussen twee stelle data te<br />

bepaal. Onthou jy nog die voorbeeld van studie-eenheid 11 oor die emosionele<br />

intelligensie van aansoekers en deelnmers aan Nuwe Sterre.<br />

Verskillende tipes toetsstatistiek kan met behulp van hipoteses getoets word,<br />

afhangend van die tipe data waarmee ons werk. In hierdie studie-eenheid<br />

behandel ons die verskillende t-toetse: die t-toets vir onafhanklike groepe en die ttoets<br />

vir twee verwante groepe. Hierdie toetse word in tutoriaal 9 in Tredoux en<br />

Durrheim (2002) bespreek.<br />

Bestudeer die konsepte en enkele aannames waaraan die data moet voldoen op<br />

wat op bladsy 142 tot 147 van Tredoux en Durrheim (2002) bespreek word. Jy<br />

behoort dan ook die beginsels van hipotesetoetsing te verstaan.<br />

Hipotesetoetse vir gemiddeldes: twee onafhanklike steekproewe ________<br />

Ons bespreek nou hipotesetoetsing vir twee onafhanklike steekproewe en gaan<br />

dieselfde stappe volg as wat ons in studie-eenheid 11 voorgehou het. Ons gaan ook<br />

aandag gee aan die aanpassings wat nodig is wanneer verskille in homogeniteit<br />

van variansie voorkom en wanneer die grootte van steekproewe verskil.<br />

Wat is die doel met hipotesetoetsing vir twee onafhanklike steekproewe? _<br />

Die doel van hipotesetoetsing vir twee onafhanklike gemiddeldes is om jou te help<br />

besluit of die waargenome verskil tussen twee steekproefgemiddeldes toevallig<br />

ontstaan het en of dit 'n ware verskil tussen populasies verteenwoordig. In die taal<br />

van hipotesetoetsing is die doel van die t-toets om ons te help besluit of die<br />

nulhipotese van geen verskil tussen die gemiddeldes van die twee populasies,<br />

verwerp moet word of nie verwerp moet word nie.<br />

bladsy 128 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse


Wat beteken twee onafhanklike steekproewe? _____________________<br />

Ons praat van twee onafhanklike steekproewe as daar geen verband tussen die<br />

groepe bestaan nie, of as daar geen verband tussen individuele pare deelnemers<br />

oor die twee steekproewe is nie, dit wil seà , as die deelnemers in slegs een van die<br />

twee groepe van 'n eksperiment dien.<br />

Volg die redenasie oor steekproefdistribusies van die verskille tussen gemiddeldes.<br />

(Weet jy nog wat 'n steekproefdistribusie is? Indien nie, lees eers weer die relevante<br />

gedeeltes in studie-eenheid 11 ± jy sal uit die inleiding agterkom dat ons hier met<br />

die steekproefdistribusie van die verskil tussen gemiddeldes te make het.)<br />

1. Voltooi ook die onderstaande:<br />

Die steekproefdistribusie van die verskil tussen gemiddeldes is:<br />

_________________________________________________________________<br />

_________________________________________________________________<br />

_________________________________________________________________<br />

_________________________________________________________________<br />

2. Omdat ons steekproeftrekking onafhanklik vir elke<br />

populasie is, sal die steekproefgemiddeldes ook<br />

onafhanklik wees.<br />

3. Die gemiddelde van die steekproefdistribusie sal<br />

m1 7 m2 wees.<br />

4. Manlike en vroulike aansoekers vir NUWE<br />

STERRE sal twee onafhanklike groepe<br />

onderskeidelik verteenwoordig.<br />

. afdeling 3 data-verwerking: inferensieel<br />

Waar Onwaar<br />

1. Die verspreiding van die verskille tussen gemiddeldes van herhaalde<br />

steekproefneming uit dieselfde populasie(s).<br />

2. Waar<br />

3. Waar<br />

4. Waar<br />

Hoe bereken ons die t-toets vir onafhanklike steekproewe? ___________<br />

Noudat jy weet wat onafhanklike groepe is en waarom ons 'n t-toets vir<br />

onafhanklike steekproewe gebruik, is die volgende stap om empiries te bepaal of<br />

daar 'n beduidende verskil tussen die gemiddeldes van die twee onafhanklike<br />

steekproewe is. Dit behels 'n redelik eenvoudige berekening as jy die formule gebruik<br />

bladsy 129


wat Tredoux en Durrheim (2002) as vergelyking 9.4 op bladsy 150 voorsien. Jy kan<br />

dalk eerder net die formule gebruik wat in die lys van formules agterin hierdie gids<br />

voorsien word. Jy hoef nie die agtergrond te ken nie, maar moet die formule leer.<br />

Bestudeer die voorbeeld wat volg en sorg dat jy weet hoe die toetsstatistiek (in<br />

hierdie geval die t-toets vir onafhanklike groepe) bereken word. Die t-toets word<br />

uitgevoer volgens die nege stappe wat in studie-eenheid 11 uiteengesit is. Het jy<br />

onthou om die stappe op 'n stukkie karton neer te skryf en bo jou lessenaar te<br />

plak? Indien nie, kan jy dit nou doen voordat jy met die voorbeeld aangaan. Jy<br />

moet goed vertroud wees met die logiese opeenvolging van die stappe en jy moet<br />

hierdie stappe in die eksamen kan volg sodat jy die relevante toetsstatistiek kan<br />

gebruik om die probleemstelling statisties op te los. Hierdie nege stappe kan op<br />

dieselfde wyse vir ander toetsstatistiek (soos die t-toets vir verwante groepe en die<br />

F-toets) gebruik word ± dit is nog 'n goeie rede waarom jy die verskillende stappe<br />

nou onder die knie moet kry.<br />

'n Navorser wil graag bepaal of daar 'n beduidende verskil is tussen die algehele<br />

vermaaklikheidstellings wat manlike en vroulike kykers aan Nuwe Sterre toegeken<br />

het. Sy verkry die tellings van 20 ewekansig geselekteerde kykers en besluit om<br />

beduidendheid op die 5%- en die 1%-vlak te toets.<br />

Data<br />

Manlike kykers Vroulike kykers<br />

X X 2<br />

Y Y 2<br />

4 16 2 4<br />

3 9 1 1<br />

2 4 5 25<br />

5 25 3 9<br />

1 1 3 9<br />

6 36 4 16<br />

2 4 4 16<br />

1 1 1 1<br />

7 49 5 25<br />

6 36 5 25<br />

X = 37 Y = 33<br />

X 2 = 181 Y 2 = 131<br />

X 3,7 3,3<br />

s 2 4,88 2,47<br />

N 10 10<br />

bladsy 130 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse


Stap 1: Formuleer die nulhipotese<br />

In woorde<br />

Daar is geen verskil tussen die vermaaklikheidstellings van manlike en vroulike<br />

kykers van Nuwe Sterre nie.<br />

of<br />

Mans en vroue vind Nuwe Sterre ewe vermaaklik.<br />

In simbole<br />

H0 : mm 7 mv =0<br />

of<br />

H0 : mm = mv Stap 2: Formuleer die alternatiewe hipotese<br />

In woorde<br />

Daar is 'n verskil tussen manlike en vroulike kykers se vermaaklikheidstellings vir<br />

Nuwe Sterre.<br />

of<br />

Mans en vroue vind nie Nuwe Sterre ewe vermaaklik nie.<br />

In simbole<br />

H1 : mm 7 mv = 0<br />

of<br />

H1 : mm = mv<br />

Stap 3: Bepaal of die toets een- of tweekantig is<br />

In hierdie voorbeeld (soos die waarmee jy te doen sal kry) word die besluit op 'n<br />

eenkantige of 'n tweekantige toets aan jou oorgelaat. Jy moet dus die<br />

probleemstelling bestudeer en kyk of dit rigtinggewend of nie-rigtinggewend is.<br />

In geval van die voorbeeld wat ons deurwerk, word daar slegs ondersoek of daar<br />

'n verskil is tussen die gemiddeldes van die twee groepe en nie of die een groep<br />

beter of swakker as die ander groep presteer nie. Gevolglik werk ons dus met 'n<br />

nierigtinggewende hipotese en sal ons die tweekantige toets gebruik.<br />

Stap 4: Bepaal die vlak van beduidendheid<br />

. afdeling 3 data-verwerking: inferensieel<br />

Gelukkig hoef jy nie hieroor 'n besluit te neem nie, aangesien ons altyd sal<br />

spesifiseer by watter vlak van beduidendheid jy die hipotese moet toets. In hierdie<br />

geval spesifiseer ons twee vlakke, naamlik 0,05 en 0,01.<br />

bladsy 131


Stap 5: Bereken die toetsstatistiek<br />

As gevolg van ons probleemstelling (let op die feit dat die twee groepe onafhanklik<br />

is) maak ons gebruik van die t-toets vir nie-verwante groepe en word die volgende<br />

formule gebruik:<br />

X2<br />

t ˆ X1<br />

S2 1<br />

N1 ‡ S2 q<br />

2<br />

N2<br />

3; 7 3; 3<br />

ˆ q<br />

4;88<br />

10<br />

‡ 2;46<br />

10<br />

0; 4<br />

ˆ p<br />

0; 488 ‡ 0; 246<br />

0; 4<br />

ˆ p<br />

0; 734<br />

0; 4<br />

ˆ<br />

0; 857<br />

ˆ 0; 47<br />

Stap 6: Bepaal die grade van vryheid<br />

df = N1 + N2 7 2<br />

=10+107 2<br />

=18<br />

Stap 7: Bepaal die kritieke waarde<br />

Gebruik tabel A1.2 op bladsy 487 van Tredoux en Durrheim (2002) om die<br />

kritieke waardes af te lees.<br />

t0,05 (18) = 2,101<br />

t0,01 (18) = 2,878<br />

Stap 8: Besluit of die nulhipotese verwerp moet word of nie verwerp moet word nie<br />

Uit die berekenings wat ons gedoen het asook die tabelle het ons bepaal dat:<br />

. die waarde van die toetsstatistiek 0,47 is; en<br />

. die kritieke waarde op die 0,05-vlak 2,101 en op die 0,01-vlak 2,878 is.<br />

Gebruik die volgende besluitnemingsreeÈ ls:<br />

. verwerp H0 as die toetsstatistiek > die kritieke waarde is<br />

. moenie H0 verwerp as die toetsstatistiek 5 die kritieke waarde is nie<br />

Vir a = 0,05 Vir a = 0,01<br />

0,47 5 2,101 0,47 5 2,878<br />

; H0 word nie verwerp nie ;H0 word nie verwerp nie<br />

(Onthou: Dit is onwetenskaplik en verkeerd om te seà dat ons die nulhipotese<br />

aanvaar.)<br />

bladsy 132 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse


. afdeling 3 data-verwerking: inferensieel<br />

Stap 9: Interpreteer die bevindings<br />

Die navorser kan met 99% sekerheid tot die gevolgtrekking kom dat daar geen<br />

verskil is tussen manlike en vroulike kykers ten opsigte van hul vermaaklikheidstellings<br />

wat hul toeken aan die Nuwe Sterre-program nie.<br />

Hierdie is die eenvoudigste vorm van die t-toets vir onafhanklike groepe.<br />

Waarom voeg ons variansies saam? ___________________________<br />

Wanneer ons met steekproewe te doen kry wat nie ewe groot is nie, is dit nodig om<br />

die variansies van die twee steekproewe saam te voeg (pool). Tredoux en<br />

Durrheim (2002) verduidelik hierdie hierdie proses op bladsy 150. Sorg dat jy die<br />

formule vir saamgevoegde variansies kan gebruik deur vergelyking 9.5 en 9.6in<br />

Tredoux en Durrheim (2002) sorgvuldig te bestudeer.<br />

Om deeglik vertroud te raak met die gebruik van die t-toets en die verskillende<br />

fasette daaraan verbonde, sal dit tot jou voordeel wees om 'n oefening op jou eie<br />

te doen. Doen oefening 1 op bladsy 158 van Tredoux en Durrheim (2002). Volg<br />

die stappe vir hipotesetoetsing wat jy teen hierdie tyd al goed ken.<br />

. Volg veral al die stappe in die proses soos die formulering van die nul- en<br />

alternatiewe hipoteses en die besluit op 'n een-/tweekantige toets.<br />

. Werk dan met jou sakrekenaar deur die stappe in die berekening van die<br />

toetsstatistiek en bepaal ook die grade van vryheid.<br />

. Soek die kritieke waardes in die tabel op en pas die beslissingsreeÈ ls toe.<br />

. Skryf ook jou interpretasie oor die verwerping/nie-verwerping van die<br />

nulhipoteses neer.<br />

Jy het nou al weer 'n paar nuwe vaardighede geleer en in hierdie stadium behoort jy die volgende te kan<br />

doen:<br />

. te weet wanneer om 'n onafhanklike t-toets te gebruik<br />

. 'n hipotese te toets deur die t-toets vir onafhanklike groepe te gebruik en 'n<br />

toetsstatistiek te bereken. Jy moet dit ook kan doen in gevalle wanneer die<br />

steekproefgrootte nie dieselfde is nie, en wanneer die variansie van die een<br />

steekproef vier keer groter as die van die ander is<br />

. 'n finale gevolgtrekking ten opsigte van jou navorsingshipoteses te kan maak<br />

Lees die voorbeeld hieronder en sorg dat jy die t-waarde op die drukstuk kan<br />

identifiseer en interpreteer.<br />

bladsy 133


Oefening 2<br />

Datastel 8<br />

Vir die t-toets vir onafhanklike steekproewe moet die tellings vir albei groepe<br />

in 'n enkele veranderlike ingeskryf word. Dan moet 'n skynveranderlike<br />

ingeskryf word om elke groep mee te identifiseer. Ek het die afhanklike<br />

veranderlike ``laugh'' genoem en die onafhanklike veranderlike ``parent''.<br />

Die nommer 1 is aan twee-ouergesinne toegeken en die nommer 2 aan<br />

eenouergesinne.<br />

t-Toets vir onafhanklike groepe<br />

Roep die kieslys ``Analyse'' op. Kies die opsie ``Compare means'' en dan<br />

weer die opsie ``Independent Samples T-Test''. Kies in die dialoogblokkie die<br />

toetsveranderlike (DV) en die groeperingsveranderlike (IV). Definieer die<br />

groepveranderlike deur die laagste en hoogste waarde vir die skynveranderlike<br />

aan te dui ± in ons geval is die laagste waarde 1 (2-ouergesinne) en 2 (1ouergesinne).<br />

Die rekenaaruitvoer verskyn hieronder:<br />

Soos jy teen hierdie tyd weet, speel gelyke variansies 'n rol in 'n t-toets. In bostaande drukstuk, is die<br />

eerste toets (Levene se toets) om vir die aanname van gelyke variansies te toets. Indien dit betekenisvol<br />

(minder as 0,05 of 0,01) is, lees ons die tweede ry data. Indien dit nie die geval is nie, lees ons die eerste<br />

ry. In die kolom met die opskrif sig (tweekantig) kyk ons weer of die waarde minder as 0,05 of 0,01 is.<br />

Indien dit minder as 0,05 is, is die t-toets betekenisvol, wat 'n statisties beduidende verskil aandui.<br />

bladsy 134 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse


Nieparametriese ekwivalent van die t-toets vir onafhanklike steekproewe<br />

Die vreemde term ``nieparametries'' in hierdie opskrif het jou sekerlik opgeval. Jy<br />

sal leer wat 'n nieparametriese toets is en hoe dit van 'n parametriese statistiese<br />

toets verskil wanneer jy die inleiding tot tutoriaal 20 in Tredoux en Durrheim<br />

(2002) bestudeer.<br />

In hierdie afdeling ondersoek ons teoreties die nieparametriese ekwivalent van die<br />

t-toets vir twee onafhanklike steekproewe, naamlik die Mann-Whitney-toets. As<br />

bedryfsielkundige moet jy weet wat om te doen as jou data nie normaal versprei is<br />

nie. Dit word in hierdie gedeelte verduidelik.<br />

In hierdie gedeelte is daar nie veel om baas te raak nie. Bestudeer die eerste<br />

paragraaf op bladsy 391 van Tredoux en Durrheim (2002).<br />

Noudat jy hierdie gedeelte deurgewerk het, behoort jy die nieparametriese<br />

ekwivalent van die t-toets vir twee onafhanklike steekproewe te kan noem. Jy hoef<br />

dit nie te kan beskryf of die formule daarvoor te ken nie.<br />

Hiermee volstaan ons met ons bespreking van t-toetse vir twee onafhanklike<br />

steekproewe. Ons gaan ons nou by hipotesetoetse vir twee verwante steekproewe<br />

bepaal.<br />

Wat is verwante steekproewe? _______________________________<br />

Wat beteken verwante steekproewe? Is dit dieselfde as onafhanklike steekproewe?<br />

Wanneer verwys ons na verwante steekproewe en wanneer na onafhanklike<br />

steekproewe? Hierdie onderskeid sal vir jou duidelik wees wanneer jy hierdie<br />

studie-eenheid voltooi het. Daarna gaan ons na die ander tipes toetsstatistiek kyk.<br />

1. Onthou jy nog wanneer ons steekproewe as onafhanklik klassifiseer? Die<br />

presiese teenoorgestelde geld nou vir verwante steekproewe.<br />

Stel eers 'n lys op van die eienskappe van onafhanklike steekproewe. Voltooi dan<br />

die tabel vir verwante steekproewe. (Lees die inleiding op bladsy 155 van Tredoux<br />

en Durrheim (2002) om jou met hierdie aktiwiteit te help.)<br />

1.<br />

. afdeling 3 data-verwerking: inferensieel<br />

Onafhanklike steekproewe Verwante steekproewe<br />

bladsy 135


. Sorg dat jy verstaan wat die begrip verwante steekproewe beteken.<br />

. Gebruik die kennis wat jy opgedoen het om die volgende oefeninge te<br />

doen:<br />

2 Ons werk hier met twee stelle data van dieselfde<br />

deelnemers (dws persone wat deel vorm van die<br />

steekproef).<br />

3 Ons verwag dat die twee stelle syfers (veranderlikes)<br />

gaan korreleer.<br />

4 Ons neem korrelasie in ag by die berekening van die<br />

t-statistiek.<br />

5 Die enigste manier waarop ons verwante<br />

steekproewe kry, is wanneer een subjek twee<br />

tellings bydra.<br />

Waar Onwaar<br />

1. Onafhanklike steekproewe is steekproewe wat ingesluit word by slegs een van<br />

die twee steekproewe in 'n eksperiment en verwante steekproewe is<br />

steekproewe wat afhanklik is.<br />

2 Waar<br />

3. Waar<br />

4. Onwaar<br />

5. Onwaar<br />

Kom ons verduidelik meer volledig wat met verwante steekproewe bedoel word,<br />

aangesien jy sal moet weet wanneer 'n probleemstelling of 'n navorsingshipotese<br />

met verwante of onafhanklike steekproewe te doen het.<br />

Daar word geseà dat twee groepe mense of deelnemers volgens 'n veranderlike<br />

afgepaar word indien daar vir elke lid wat aan een groep toegewys word, 'n ander<br />

lid aan die ander groep toegewys word wat ten opsigte van daardie veranderlike<br />

met die persoon in die eerste groep ooreenstem. Subjekpare word sodoende<br />

geselekteer sodat die lede van elke paar so eenders moontlik ten opsigte van die<br />

relevante veranderlike of veranderlikes is. Veranderlikes soos intelligensie,<br />

ouderdom, lengte, oogkleur, geslag, ensovoorts, kan gebruik word om persone<br />

of deelnemers af te paar. In Engels gebruik ons die woord ``matched''.<br />

Om saam te vat: die enigste manier waarop verwante steekproeftellings verkry word is:<br />

. deur dit af te paar (``match''); en<br />

. deurdat een subjek twee tellings bydra.<br />

bladsy 136 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse


Hoe bereken ons die toetsstatistiek vir verwante steekproewe? _________<br />

Noudat jy weet wat 'n verwante groep is, is die volgende stap om empiries te<br />

bepaal of daar 'n beduidende verskil tussen die gemiddeldes van die twee verwante<br />

steekproewe is. Dit behels 'n redelike eenvoudige berekening met behulp van 'n<br />

spesifieke formule. Voordat jy egter die formule kan gebruik en toepas, moet jy<br />

eers met die berekening van verskiltellings vertroud wees. Dit vereis dat jy moet<br />

weet hoe om die gemiddelde (D) en die standaardafwyking van die verskiltellings<br />

(sD) te bereken.<br />

Hierdie is nie nuwe formules nie, maar is dieselfde formules wat jy gebruik het vir<br />

die berekening van die gemiddelde in studie-eenheid 5 en vir die<br />

standaardafwyking in studie-eenheid 6.<br />

'n Praktiese voorbeeld bied altyd 'n nuttige leerervaring. Dit sal daarom sinvol<br />

wees om eers die gedeelte ``Creating the variable D'' op bladsy 152 van Tredoux<br />

en Durrheim te lees vir 'n voorbeeld van hoe om die t-toets te bereken. As jy<br />

onseker is oor hoe om al die verskillende stappe van die formule te bereken,<br />

hersien die formule vir X en s in studie-eenheid 5 en 6onderskeidelik. Tredoux en<br />

Durrheim (2002) gee die berekende waarde van D in tabel 9.2 op bladsy 153.<br />

Voltooi die volgende:<br />

. afdeling 3 data-verwerking: inferensieel<br />

1. 'n Verskiltelling is<br />

_________________________________________________________________<br />

_________________________________________________________________<br />

_________________________________________________________________<br />

_________________________________________________________________<br />

2. Kontroleer die berekening van die verskiltelling in die voorbeeld. Is dit vir jou<br />

duidelik wanneer die tellings 'n positiewe of negatiewe waarde kry?<br />

_________________________________________________________________<br />

_________________________________________________________________<br />

_________________________________________________________________<br />

_________________________________________________________________<br />

3. Kontroleer die berekening van die t-toets in die voorbeeld. Kry jy dieselfde<br />

antwoord?<br />

_________________________________________________________________<br />

_________________________________________________________________<br />

_________________________________________________________________<br />

_________________________________________________________________<br />

4. Skryf die formule vir die grade van vryheid hier neer.<br />

_________________________________________________________________<br />

bladsy 137


_________________________________________________________________<br />

_________________________________________________________________<br />

_________________________________________________________________<br />

Die antwoorde verskyn op bladsy 153 van Tredoux en Durrheim (2002). Noudat<br />

jy die volledige voorbeeld met al die stappe noukeurig deurgelees het, is dit amper<br />

tyd om jou begrip daarvan te toets.<br />

Voordat jy 'n oefening op jou eie doen, moet jy eers die volledige voorbeeld<br />

hieronder deurwerk sodat jy kan sien hoe ons verwag dat jy die verskillende<br />

stappe moet uitvoer.<br />

Hier volg 'n volledig uitgewerkte voorbeeld van hoe om die t-toets vir verwante<br />

groepe te doen. Werk deur die voorbeeld en kontroleer al die berekenings. Sorg<br />

dat jy al die stappe in die proses verstaan.<br />

Voorbeeld van 'n t-toets vir verwante groepe<br />

Die navorsingspan wil graag bepaal of daar 'n verskil is tussen die<br />

gelukkigheidsvlakke van deelnemers voor en na die leerlingskapprogram. Hulle<br />

besluit om die hipotese op beide die 0,05- en 0,01-vlak van beduidendheid te toets.<br />

Die span gaan soos volg te werk:<br />

Data<br />

Voor Na<br />

4 5<br />

3 8<br />

7 6<br />

6 6<br />

5 6<br />

4 4<br />

5 7<br />

4 7<br />

3 6<br />

2 4<br />

bladsy 138 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse


Stap 1: Formuleer die nulhipotese<br />

In woorde<br />

Daar is geen verskil tussen die gelukkigheidsvlakke van deelnemers voor en na die<br />

leerlingskapprogram nie<br />

of<br />

Deelnemers is ewe gelukkig voor en na die leerlingskapprogram<br />

In simbole<br />

H0 : mV 7 mN =0<br />

of<br />

H 0 : m V = m N<br />

Stap 2: Formuleer die alternatiewe hipotese<br />

In woorde<br />

Daar is 'n verskil tussen die gelukkigheidsvlakke van deelnemers voor en na die<br />

leerlingskapprogram.<br />

of<br />

Deelnemers is nie ewe gelukkig voor en na die program nie<br />

In simbole<br />

H1 : mV 7 mN = 0<br />

of<br />

H1 : mV = mN<br />

Stap 3: Bepaal of die toets een- of tweekantig is<br />

Ons werk met 'n nie-rigtinggewende hipotese en sal die tweekantige toets gebruik.<br />

Stap 4: Bepaal die vlak van beduidendheid<br />

Ons het twee vlakke gespesifiseer, naamlik 0,05 en 0,01.<br />

Stap 5: Bereken die toetsstatistiek<br />

Ons gebruik die t-toets vir verwante groepe en die volgende formule:<br />

D 0<br />

t ˆ<br />

SD p<br />

N<br />

. afdeling 3 data-verwerking: inferensieel<br />

Om die formule te kan gebruik, is dit eers nodig om die verskiltellings te bereken. Dit<br />

word gedoen deur die tabel te voltooi en daarna sekere berekenings te doen om die<br />

gemiddelde en die standaardafwyking te verkry. Ons doen dit soos volg:<br />

bladsy 139


Voor Na D D 2<br />

D = D<br />

N<br />

4 5 ±1 1<br />

3 8 ±5 25<br />

7 6 1 1<br />

6 6 0 0<br />

5 6±1 1<br />

4 4 0 0<br />

5 7 ±2 4<br />

4 7 ±3 9<br />

3 6±3 9<br />

2 4 ±2 4<br />

SD = 716 SD 2 = 54<br />

= 16<br />

10<br />

= 71,6<br />

Om die formule vir die t-toetsberekening te kan gebruik, is dit nodig om eers die<br />

variansie van die data te bereken. As jy terugblaai na studie-eenheid 6, sal jy sien<br />

dat jy dit reeds gedoen het en die volgende formule vir die X-waardes gebruik het:<br />

s 2<br />

X ˆ X2 … X2 †<br />

N<br />

N 1<br />

In geval van die t-toets vir verwante groepe, het ons twee stelle tellings. Die logiese<br />

manier is om die verskil tussen die twee stelle tellings te bereken en dan die<br />

variansie van die verskiltellings te verkry.<br />

Die data in die D-kolom (D vir ``Difference scores'') is 'n stel X-veranderlikes, dus<br />

vervang jy net die X in die formule hierbo deur 'n D soos volg:<br />

s 2<br />

D = D2 … D2 †<br />

N<br />

= 54<br />

= 54 25;6<br />

= 28;4<br />

9<br />

N 1<br />

… 16† 2<br />

10<br />

9<br />

9<br />

= 3,16<br />

bladsy 140 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse


sD = s2 p<br />

D<br />

p<br />

= 3; 16<br />

= 1,78<br />

Die standaardafwyking is dus 1,78.<br />

t =<br />

= 1;6 0<br />

D 0<br />

S<br />

pD<br />

N<br />

= 1;6<br />

1;78<br />

3;16<br />

= 1;6<br />

0;56<br />

1;78<br />

p<br />

10<br />

= 2; 86<br />

Stap 6: Bepaal die grade van vryheid<br />

Gebruik die volgende formule:<br />

df = N ± 1<br />

=10±1<br />

=9<br />

Stap 7: Bepaal die kritieke waarde<br />

Gebruik tabel A1.2 op bladsy 487 van Tredoux en Durrheim (2002) om die<br />

kritieke waardes af te lees.<br />

t0,05 (9) = + 2,262<br />

t0,01 (9) = + 3,250<br />

Stap 8: Besluit of die nulhipotese verwerp/nie verwerp moet word nie<br />

t = 72,86; ;|t| = 2,86(Onthou ons werk met absolute waardes en<br />

ignoreer dus die minusteken.)<br />

Vir a = 0,05<br />

2,86 4 2,262<br />

; Ons verwerp dus die nulhipotese.<br />

Vir a = 0,01<br />

2,86 5 3,250<br />

; Ons kan dus nie die nulhipotese verwerp nie.<br />

. afdeling 3 data-verwerking: inferensieel<br />

bladsy 141


Stap 9: Interpreteer die bevindings<br />

Die span kan met 95% sekerheid seà dat daar 'n verskil is in die<br />

gelukkigheidsvlakke van deelnemers voor en na die leerlingskappprogram, maar<br />

kan dit nie met 99% sekerheid seà nie.<br />

Is dit vir jou duidelik hoe ons in die verskillende stappe te werk gegaan het? Indien<br />

nie, moet jy die voorbeeld hersien. Indien jy tevrede voel dat jy 'n goeie idee het<br />

wat al die stappe behels, kan jy die volgende aktiwiteit hieronder doen.<br />

Doen self die uitgewerkte voorbeeld 3 op bladsy 154 van Tredoux en Durrheim<br />

(2002) sonder om na die verskillende stappe en oplossings te kyk. Vergelyk jou<br />

antwoord met die skrywers s'n om te kyk of dit ooreenstem.<br />

'n Volgende stap in die proses van hipotesetoetsing is die bepaling van die getal<br />

grade van vryheid en die aflees van die kritieke waarde daarvan in tabel A1.2. As<br />

jy dit eers reggekry het, is dit baie maklik.<br />

Gaan die besluitnemingsreeÈ ls soos verduidelik in stap 8 in hierdie studie-eenheid<br />

na en volg die redenasie oor die verwerping of nieverwerping van die nulhipotese.<br />

As jy daarmee klaar is, doen dan die volgende oefeninge:<br />

1. Toets jou vaardigheid om die volgende kritieke waardes in die toepaslike<br />

tabel op te soek:<br />

1.1 eenkantige toets, 29df, 1%-betekenispeil<br />

1.2 eenkantige toets, 16df, 5%-betekenispeil<br />

1.3 tweekantige toets, 8df, 2%-betekenispeil<br />

1.4 tweekantige toets, 29df, 2%-betekenispeil<br />

1.5 tweekantige toets, 23df, 10%-betekenispeil<br />

2. Sou jy H0 in die volgende omstandighede verwerp? Waarom?<br />

2.1 t-toetsstatistiek = 2,302 en kritieke waarde = 2,508<br />

2.2 t-toetsstatistiek = 2,682 en kritieke waarde = 3,792<br />

2.3 t-toetsstatistiek = 3,248 en kritieke waarde = 2,704<br />

1.1 2,462<br />

1.2 1,746<br />

1.3 2,896<br />

1.4 2,462<br />

1.5 1,714<br />

bladsy 142 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse


2.1 nee<br />

2.2 nee<br />

2.3 ja<br />

In hierdie stadium het jy nou deeglik deur volledige voorbeelde van hipotesetoetsing met twee verwante<br />

steekproewe gewerk en behoort jy:<br />

. te kan verduidelik wat met 'n verwante steekproef bedoel word<br />

. te weet wanneer om 'n t-toets vir verwante groepe te gebruik<br />

. 'n hipotese te toets deur die t-toets vir verwante groepe te gebruik en 'n<br />

toetsstatistiek te bereken<br />

. 'n finale gevolgtrekking ten opsigte van jou navorsingshipotese te kan maak<br />

Datastel 7<br />

Bestudeer die voorbeeld wat volg en sorg dat jy die t-waarde op die drukstuk kan<br />

identifiseer en interpreteer.<br />

Sleutel die data in soos hierlangs aangedui.<br />

t-Toets vir verwante steekproewe<br />

Maak die kieslys ``Analyse'' oop. Kies die opsie ``Compare means'' en<br />

dan die opsie ``Paired samples T-test''. Die dialoogblokkie word<br />

hieronder gegee. Jy moet albei stelle waarnemings selekteer en dit in die<br />

venster vir ``Paired variables'' inskryf. Klik ``OK'' om die prosedure te<br />

laat loop.<br />

. afdeling 3 data-verwerking: inferensieel<br />

bladsy 143


Nieparametriese ekwivalent van die t-toets vir verwante steekproewe<br />

Oefening 3<br />

In hierdie gedeelte gaan ons die nieparametriese ekwivalent van die t-toets vir<br />

twee verwante groepe, naamlik Wilcoxson se tekenrangtoets vir afgepaarde pare<br />

teoreties bestudeer. As bedryfsielkundige moet jy weet wat om te doen as jou data<br />

nie normaal versprei is nie. Dit word in hierdie gedeelte verduidelik.<br />

Aangesien jy nie die nieparametriese ekwivalente in besonderhede hoef te ken nie,<br />

sal dit voldoende wees om die laaste paragraaf op bladsy 389 van Tredoux en<br />

Durrheim (2002) te bestudeer.<br />

Doen oefening 3 en 4 op bladsy 158 en 159 van Tredoux en Durrheim (2002) vir<br />

bykomende oefening.<br />

In hierdie ondersoek behels die ontwerp dat ons twee metings van elke subjek<br />

neem; met ander woorde herhaalde metings. Ons kan egter nie twee metings van<br />

elke persoon kry nie, omdat party nie tydens die tweede meting beskikbaar is nie.<br />

Ons gaan hierdie situasie te bowe kom deur middel van gevalskrapping ± ons<br />

ignoreer eenvoudig die data van 'n persoon van wie ons nie twee metings het nie.<br />

Ons aanvanklike (volledige) tabel met data lyk so:<br />

Subject 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15<br />

Time 1 13 12 1614 13 15 17 13 14 1613 1613 19 12<br />

Time 2 9 10 NA NA 10 NA 11 10 NA 17 9 8 NA 16NA<br />

As ons daardie subjekte van wie ons nie twee metings het nie, uitlaat (subjekte 3,<br />

4, 6, 9, 13 en 15), lyk ons tabel nou so:<br />

Subject 1 2 5 7 8 10 11 12 14<br />

Time 1 13 12 13 17 13 1613 1619<br />

Time 2 9 10 10 11 10 17 9 8 16<br />

Ons gaan met hierdie data werk en nie met die data in die oorspronklike tabel nie.<br />

Aangesien hierdie ontwerp herhaalde metings behels, moet ons eerstens<br />

veranderlike D skep. Doen dit deur keer 1 van keer 2 vir elke subjek af te trek<br />

(dws D = Time 2 ± Time 1). Die data vir D lyk nou so:<br />

bladsy 144 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse


Subject 1 2 5 7 8 10 11 12 14<br />

Time 1 13 12 13 17 13 1613 1619<br />

Time 2 9 10 10 11 10 17 9 8 16<br />

D ±4 ±2 ±3 ±6 ±3 1 ±4 ±8 ±3<br />

Ons sal voortaan nie meer die data van Time 1 of Time 2 gebruik nie, maar slegs<br />

die data van D.<br />

Ons begin deur die gemiddelde, die standaardafwyking en n vir D uit te werk.<br />

D ˆ 3; 5556 sD ˆ 2; 5055 ND ˆ 9<br />

Ons skatting van die standaardfout word deur middel van die volgende formule<br />

bepaal:<br />

sD<br />

p<br />

N<br />

As ons ons waardes in die vergelyking gebruik, kry ons:<br />

2; p5055<br />

9<br />

= 2; 5055<br />

3<br />

= 0; 8351<br />

Nou kan ons t bereken. Die formule is:<br />

t ˆ D<br />

… sD p †<br />

N<br />

En ons het reeds al daardie waardes, daarom bereken ons<br />

t ˆ<br />

3; 556<br />

0; 8351<br />

t ˆ 4; 257<br />

Nou moet ons bepaal of die verskil statisties beduidend is. Hiervoor benodig ons<br />

die grade van vryheid.<br />

En dit is<br />

df = N7 1<br />

df =97 1<br />

df =8<br />

Nou moet ons bepaal of dit 'n eenkantige of tweekantige toets is. Volgens die<br />

navorsingshipotese wil ons slegs bepaal of die substantia nigra kleiner geword het ±<br />

dit is dus 'n eenkantige toets. Ons alternatiewe hipotese is gevolglik:<br />

H1 : time2 < time1<br />

. afdeling 3 data-verwerking: inferensieel<br />

Ons gaan die ``standaard''-alfawaarde van 0,05 gebruik.<br />

bladsy 145


Oefening 4<br />

Nou gebruik ons hierdie inligting om 'n kritieke t-waarde in ons t-tabel op te soek.<br />

Die kritieke waarde vir df = 8, eenkantig, alfa = 0,05 is 1,860. Ons t-waarde is<br />

4,257 (ons ignoreer die minusteken vir hierdie vergelyking).<br />

Ons waarde is groter as die kritieke waarde, daarom verwerp ons die nulhipotese<br />

en aanvaar die alternatiewe hipotese. Dit blyk dat die gemiddelde deursnee van<br />

die substantia nigra in psigotiese pasieÈ nte na 'n tydperk kleiner word.<br />

Hier gebruik ons twee metings van dieselfde korfbalspan, hoewel die ontwerp nie<br />

herhaalde metings behels nie. Die rede is dat die omstandighede nie elke keer<br />

dieselfde was nie ± ons ondersoek die uitwerking van die afrigter en nie die span<br />

nie, met die gevolg dat die twee stelle data eintlik onafhanklik is.<br />

Hoewel data ontbreek (minder spelle is met die eerste afrigter gespeel as met die<br />

tweede), hoef ons ons nie daaraan te steur nie (ons hoef ons slegs daaroor te<br />

bekommer as ons besig is met 'n ontwerp vir herhaalde metings).<br />

Eerstens moet ons 'n nulhipotese formuleer. Vir 'n t-toets vir onafhanklike<br />

steekproewe is dit:<br />

H0 : coach2 ˆ coach1<br />

Die eerste stap is om die gemiddelde, n en die variansie vir elke groep te bepaal.<br />

Die variansies is:<br />

Xcoach1 ˆ 86; 25 S 2<br />

coach1 24; 214 N coach1 ˆ 8<br />

Xcoach2 ˆ 79; 9167 S 2<br />

coach2 732; 62 N coach2 ˆ 12<br />

Aangesien die steekproewe verskil is dit nodig om die variansies saam te voeg<br />

(pool).<br />

s2 p = …n1 1†s2 1 ‡…n2 1†S2 n1 ‡ n2 2<br />

2<br />

= …8 1†24; 214 ‡…12 1†732; 62<br />

8 ‡ 12 2<br />

= 169; 498 ‡ 8058; 82<br />

18<br />

= 457,13<br />

Nou kan ons hierdie waarde in ons formule vir die t-toets vir onafhanklike<br />

steekproewe gebruik. Die formule is:<br />

t = X1 X2<br />

s<br />

s 2 p<br />

N1<br />

‡ s2 p<br />

N2<br />

bladsy 146 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse


Ons het reeds al hierdie waardes, daarom skryf ons hulle in en bereken:<br />

t =<br />

t =<br />

86; 25 79; 91<br />

9; 758<br />

6; 34<br />

9; 758<br />

t = 0; 65<br />

Noudat ons oor 'n t-waarde beskik, moet ons bepaal of dit statisties beduidend is.<br />

Hiervoor benodig ons grade van vryheid.<br />

df = N1 +N2 ±2<br />

= 8 + 12 ± 2<br />

= 18<br />

Ons gaan dus 18 grade van vryheid gebruik.<br />

Is dit nou 'n eenkantige of 'n tweekantige toets? Volgens die navorsingshipotese<br />

wil ons bepaal of die span anders presteer het met die nuwe afrigter ± ons stel met<br />

ander woorde belang in o f positiewe o f negatiewe kans. Dit is dus 'n tweekantige<br />

toets. Hieruit lei ons ons alternatiewe hipotese af, naamlik:<br />

H1 :Xcoach1 6ˆ Xcoach2<br />

. afdeling 3 data-verwerking: inferensieel<br />

Ons gaan die ``standaard''-alfawaarde van 0,05 gebruik.<br />

Ons gebruik hierdie inligting nou om 'n kritieke t-waarde in ons tabel op te soek.<br />

Die kritieke waarde vir df = 18, tweekantig, alfa = 0,05 is 2,1009. Ons twaarde<br />

is 0,65.<br />

Ons waarde is minder as die kritieke waarde, daarom kan ons die nulhipotese nie<br />

verwerp nie. Die gemiddelde telling met elke afrigter was dieselfde. Dit blyk<br />

daarom dat die span dieselfde prestasie lewer onder die nuwe afrigter as onder die<br />

vorige een.<br />

Oorweeg die volgende navorsingsvraag van die Nuwe Sterre-program:<br />

``Is manlike stemmers geneig om hoeÈ r punte vir vroulike deelnemers as vir<br />

manlike deelnemers te gee?'' Dui aan watter ontledingstegniek die toepaslike<br />

een sal wees om hierdie navorsingsvraag te beantwoord en verduidelik/<br />

motiveer jou antwoord.<br />

In hierdie geval is die geslag van die stemmers bloot 'n seleksieveranderlike (wat<br />

beteken die tellings van vroulike stemmers sal nie in hierdie navorsingvraag<br />

oorweeg word nie). Vir die manlike stemmers sou 'n mens die tellings oorweeg wat<br />

hulle vir die deelnemers gegee het. Die tellings van die twee geslagsgroepe van die<br />

deelnemers sal oorweeg word om te evalueer of data 'n statisties beduidende<br />

bladsy 147


verskil in die gemiddelde tellings van die twee groepe is. Dit impliseer 'n t-toets<br />

(waarin twee groepe vergelyk word) en dit sal die t-toets vir onafhanklike groepe<br />

wees (aangesien die manlike en vroulike deelnemers nieverwant/onafhanklike<br />

groepe is).<br />

bladsy 148 . studie-eenheid 12 hipotesetoetse vir gemiddeldes: t-toetse


13<br />

studie-eenheid dertien<br />

"<br />

"<br />

Hipotesetoetse vir<br />

gemiddeldes:<br />

eenrigting-<br />

variansieontleding<br />

Jy het reeds kennis gemaak met die t-toets in studie-eenheid 12. Nou gaan jy<br />

een spesifieke soort F-toets bestudeer, naamlik eenrigtingvariansieontleding,<br />

algemeen bekend as<br />

ANOVA<br />

"<br />

Analysis of Variance<br />

Vir die doel van hierdie eenheid kombineer ons twee tutoriale uit die<br />

voorgeskrewe boek, naamlik tutoriaal 14 en 15.<br />

Wat is variansieontleding (ANOVA)? ___________________________<br />

Toe jy die opskrif van hierdie studie-eenheid gelees het, het jy waarskynlik 'n<br />

gedeelte daarvan herken: variansie (van studie-eenheid 6, waar jy geleer het hoe<br />

om dit te bereken). Nou wonder jy sekerlik: wat is variansieontleding?<br />

1. Om hierdie vraag te beantwoord, moet jy die inleiding op bladsy 252 tot 254<br />

van Tredoux en Durrheim (2002) bestudeer. Verwys ook na die skematiese<br />

voorstelling op die laaste bladsy van studie-eenheid 11 om vas te stel waar en<br />

wanneer die ANOVA gebruik kan word.<br />

Voltooi die volgende sin:<br />

ANOVA is<br />

. afdeling 3 data-verwerking: inferensieel<br />

___________________________________________________________________<br />

___________________________________________________________________<br />

bladsy 149


2. Lees bladsy 255 tot 262 van Tredoux en Durrheim (2002) om te verstaan<br />

waarom die ANOVA in plaas van t-toetse gebruik word. Skryf dan kort<br />

aantekeninge oor die rede(s) vir die gebruik van ANOVA.<br />

_________________________________________________________________<br />

_________________________________________________________________<br />

_________________________________________________________________<br />

_________________________________________________________________<br />

3. Onthou jy die drie aannames waarvan jy in die voorafgaande studie-eenheid<br />

geleer het? ANOVA berus op dieselfde beginsels wat op bladsy 281 tot 283<br />

van Tredoux en Durrheim (2002) behandel word.<br />

Noem drie aannames waarop ANOVA berus:<br />

3.1. _____________________________________________________________<br />

3.2. _____________________________________________________________<br />

3.3. _____________________________________________________________<br />

Hierdie aktiwiteit is nogal lank, maar dit sal jou help om te verstaan wat hierdie toetsstatistiek behels.<br />

1. Die antwoord is op bladsy 260 van Tredoux en Durrheim (2002).<br />

2. Die antwoord word saamgevat in die laaste paragraaf op bladsy 256van<br />

Tredoux en Durrheim (2002), net bo die opskrif ``The logic of ANOVA''.<br />

3. As jy hierdie drie aannames ken, sal jy die rasionaal vir ANOVA verstaan.<br />

Die drie aannames is:<br />

1. Die tellings is normaal versprei rondom die populasiegemiddelde.<br />

2. Homogeniteit van variansie, met ander woorde die variansies van die<br />

tellings van die populasies is dieselfde.<br />

3. Die waarnemings is onafhanklik van mekaar.<br />

Die afhanklike veranderlike by ANOVA is altyd een of ander meting Ð op 'n<br />

intervalskaal (onthou jy nog hierdie begrip van studie-eenheid 2?) vir parametriese<br />

toetse en op 'n ordinale skaal (kyk ook studie-eenheid 2) vir nieparametriese<br />

toetse. Eenrigting-ANOVA is 'n parametriese toets (met ander woorde dit is op 'n<br />

normaalverspreiding gegrond). Ons sal aan die einde van hierdie studie-eenheid<br />

vir jou 'n nieparametriese (distribusievrye) ekwivalent noem. Die navorser het nie<br />

beheer oor die afhanklike veranderlike nie. Dit is die uitkoms van die<br />

manipulering van die onafhanklike veranderlike.<br />

Die onafhanklike veranderlike is die een wat deur die navorser manipuleer word.<br />

Hy of sy besluit op die aantal vlakke daarvan en sien toe dat die deelnemers in<br />

elke groep net aan een van die vlakke onderwerp word.<br />

bladsy 150 . studie-eenheid 13 hipotesetoetse vir gemiddeldes: eenrigtingvariansieontleding


Die vlakke van die onafhanklike veranderlike kan in twee tipes verdeel word:<br />

1. Kwantitatief (intervalmeting)<br />

byvoorbeeld: Aantal ure studie per week (6, 8, 10, 12 ure)<br />

2. Kwalitatief (nominale meting)<br />

byvoorbeeld: Metode van onderrig (lesing, selfstudie, video,<br />

rekenaargesteund)<br />

Verwys na studie-eenheid 2 as jy nie meer seker is wat afhanklike en onafhanklike<br />

veranderlike beteken nie.<br />

Skep 'n aantal verskillende eksperimente, elk met sy eie onafhanklike en<br />

afhanklike veranderlike. Onthou dat die onafhanklike veranderlike uit drie of<br />

meer groepe of vlakke moet bestaan om vir 'n ANOVA-ontwerp te kwalifiseer. 'n<br />

Veranderlike soos geslag as die enigste onafhanklike veranderlike is dus foutief.<br />

Hier is slegs enkele voorbeelde. Jy kan die meeste van die onafhanklike<br />

veranderlikes (aan die linkerkant) met die meeste van die afhanklike<br />

veranderlikes (aan die regterkant) met mekaar kombineer, solank dit 'n sinvolle<br />

studie behels.<br />

Het jy ook aan hierdie of soortgelyke voorbeelde gedink? Jy het dalk unieke<br />

voorbeelde van jou eie. Vergelyk dit net met ons voorbeeld om te bepaal of jou<br />

redenering korrek was.<br />

Onafhanklike veranderlike Afhanklike veranderlike<br />

Departemente<br />

. Personeel<br />

. Produksie<br />

. Bemarking<br />

Dienstydperk<br />

. Kort: 0 tot 2 jaar<br />

. Medium: 3 tot 9 jaar<br />

. Lank: 10 jaar en langer<br />

Bestuursvlakke<br />

. President<br />

. Vise-president<br />

. Hoof- uitvoerende amptenaar<br />

. Algemene bestuurder<br />

. afdeling 3 data-verwerking: inferensieel<br />

Motivering van personeel<br />

(gemeet met 'n vraelys)<br />

Getal ongelukke op<br />

'n produksielyn<br />

Kwaliteit van werklewe<br />

meting<br />

bladsy 151


Onafhanklike veranderlike Afhanklike veranderlike<br />

Verskillende skofte<br />

. Oggend<br />

. Middag<br />

. Aand<br />

. Nag<br />

Opleidingstegnieke<br />

. Lesing<br />

. Video<br />

. Selfstudie<br />

. Rekenaargesteun<br />

. Werkwinkel<br />

Produktiwiteit<br />

(gemeet aan die aantal<br />

eenhede vervaardig)<br />

Getal foute tydens uitvoering<br />

van 'n praktiese taak<br />

Onafhanklike veranderlike Afhanklike veranderlike<br />

Onderrig<br />

Aantal ure per week waarin aktief<br />

na Nuwe Sterre gekyk is<br />

. Laerskoolleerder<br />

. HoeÈ rskoolleerder<br />

. Student op tersieà re vlak<br />

. Jong volwassene<br />

. Ouer volwassene<br />

Die logika van variansieontleding _____________________________<br />

Tredoux en Durrheim (2002) verduidelik die beginsels van ANOVA noukeurig op<br />

bladsy 256tot 262. Jy hoef geen berekenings hier te kan doen nie ± ons sal die<br />

berekenings wat jy wel moet kan doen binnekort behandel.<br />

Om die logika van ANOVA vir jou nog duideliker te maak, kom ons kyk hoe<br />

ander outeurs (Fox, Levin & Harkins, 1993; Porter & Hamm, 1986) dit<br />

verduidelik.<br />

Die totale varieerbaarheid in 'n stel tellings bestaan uit twee komponente:<br />

. Varieerbaarheid binne groepe. Dit meet die normale varieerbaarheid of<br />

ewekansige foute in die data.<br />

Dit is die fouteffek, dit wil seà , varieerbaarheid wat die gevolg is van ewekansige<br />

steekproeftrekking en kansgebeurtenisse.<br />

. Varieerbaarheid tussen groepe. Dit meet die verskil tussen groepgemiddeldes.<br />

Dit is die behandelingseffek, dit wil seà , meting van die effek van die<br />

eksperimentele behandeling van proefpersone.<br />

bladsy 152 . studie-eenheid 13 hipotesetoetse vir gemiddeldes: eenrigtingvariansieontleding


Die F-verhouding is die verhouding van die varieerbaarheid tussen groepe teenoor<br />

die varieerbaarheid binne groepe en kan so in 'n vergelyking weergegee word:<br />

F =<br />

varieerbaarheid tussen groepe<br />

varieerbaarheid binne groepe<br />

= behandelingseffek<br />

fouteffek<br />

Wanneer die behandelingseffek die fouteffek met 'n sekere kritieke waarde<br />

oorskry, is die F-toets betekenisvol en lei ons af dat daar 'n betekenisvolle verskil<br />

tussen groepgemiddeldes is en verwerp ons die nulhipotese.<br />

Praktiese voorbeeld<br />

Hier is 'n voorbeeld van 'n eksperiment (Fox, Levin & Harkins, 1993, pp 218±219)<br />

wat hierdie onderwerp grafies baie goed vir jou sal illustreer. Moenie skrik vir die<br />

vier groepe nie ± jy sal gou sien dit maak geensins die verduideliking meer<br />

kompleks as met drie groepe nie (onthou, ANOVA word gebruik wanneer jy drie<br />

of meer groepe het).<br />

Mense wat baie angstig is wanneer hulle 'n openbare toespraak maak, is ewekansig aan een van vier<br />

behandelingsgroepe toegewys vir 'n terapeutiese prosedure:<br />

1. sistematiese desensiteringsprosedure<br />

2. insigterapie<br />

3. plasebo-behandelingkontrole ± proefpersone praat oor hulle probleem<br />

4. geen behandelingkontrole ± geen intervensie vind plaas nie<br />

Na blootstelling aan 'n behandeling moet die deelnemers 'n openbare toespraak<br />

hou terwyl die mate van angs wat hulle toon, gemeet word.<br />

Die resultate van die eksperiment is soos volg:<br />

. Varieerbaarheid binne groepe<br />

Laag<br />

Sistematiese<br />

desensiteringprosedure<br />

| |<br />

X1jiKX1<br />

Insigterapie Plasebobehandelingkontrole<br />

| |<br />

. afdeling 3 data-verwerking: inferensieel<br />

| |<br />

X2jiKX2 X3jiKX3<br />

Mate van angs<br />

Geen<br />

behandelingkontrole<br />

| |<br />

X4jiKX4<br />

Let op die varieerbaarheid binne enige groepgemiddelde (X1, X2, X3, X4) en enige<br />

individuele telling (X1, X2, X3, X4) binne daardie groep.<br />

Hoog<br />

bladsy 153


. Varieerbaarheid tussen groepe<br />

Laag<br />

Sistematiese<br />

desensiteringprosedure<br />

Insigterapie Plasebobehandelingkontrole<br />

Mate van angs<br />

Geen<br />

behandelingkontrole<br />

|<br />

|<br />

|<br />

|<br />

X1<br />

3 " X2<br />

3 " X3<br />

3 " X4<br />

Let daarop dat die mate van angs as 'n funksie van die behandeling (terapeutiese<br />

tegniek) tussen groepe wissel (X1; X2; X3; X4) van lae angs in groep 1 tot hoeÈ angs<br />

in groep 4.<br />

Veronderstel jy as bedryfsielkundige in Organisasie XYZ wil die kwaliteit van<br />

werklewe van werknemers in die drie departemente, Personeel, Produksie en<br />

Bemarking ondersoek.<br />

Ontwerp jou eie eksperiment en stel die varieerbaarheid binne en tussen die groepe<br />

grafies voor.<br />

Uiteraard is geen terugvoering moontlik nie. Vergelyk jou sketse met die hierbo ±<br />

vervang die vier tipes terapeutiese tegnieke met die drie departemente in jou eie<br />

eksperiment.<br />

Berekenings vir ANOVA ____________________________________<br />

Nou is dit weer tyd om jou sakrekenaar in die hande te kry! Die berekeninge wat<br />

jy nou gaan leer is die enigste wat jy hoef te kan doen wanneer 'n datastel aan jou<br />

verskaf word.<br />

Bestudeer bladsy 262 tot 266 van Tredoux en Durrheim (2002) en sorg dat jy al die<br />

berekenings verstaan ± probeer ook om die voorbeeld op bladsy 267 op jou eie uit<br />

te werk voordat jy na die oplossing kyk.<br />

1. Onthou om altyd ANOVA-resultate in 'n opsommingstabel te rapporteer<br />

(voorbeeld hieronder) nadat jy die berekeninge gedoen het, selfs al vra ons dit<br />

nie direk so in 'n werkopdrag of die eksamen nie.<br />

2. Hou in gedagte dat SS, MS en F nooit 'n negatiewe waarde kan heà nie ± al<br />

die SS-enMS-waardes is kwadrate. Indien jy dus negatiewe waardes vir enige<br />

van hierdie statistieke tydens jou berekeninge kry, het jy beslis iewers 'n<br />

berekeningsfout gemaak! Soek die fout (in die eksamen ook)!<br />

bladsy 154 . studie-eenheid 13 hipotesetoetse vir gemiddeldes: eenrigtingvariansieontleding<br />

Hoog


3. As 'n vinnige manier om jou interim-berekeninge te kontroleer, doen die vyf<br />

berekeninge hieronder wanneer jy jou opsommingstabel voltooi het.<br />

Voorbeeld van 'n opsommingstabel<br />

Bron df SS MS F<br />

Groep 2 44,78 22,39 8,08<br />

Fout 15 41,50 2,77<br />

Totaal 17 86,28<br />

1. dfgroup + dferror = dftotal : 2 + 15 = 17<br />

2. SSgroup + SSerror = SStotal : 44,78 + 41,50 = 86,28<br />

3. SSgroup 7 dfgroup = MSgroup : 44,78/2 = 22,39<br />

4. SSerror 7 df error =MSerror : 41,50/15 = 2,77<br />

5. MSgroup 7 MSerror = F : 22,39/2,77 = 8,08<br />

Hierdie feite sal jou ook in staat stel om 'n gedeeltelike voltooide<br />

opsommingstabel te voltooi.<br />

1. Doen hierdie oefening wat ons gevind het in Fox, Levin en Harkins (1993,<br />

pp. 259±260).<br />

In a study of worker satisfaction, shift workers whose work hours had been<br />

on a phase-advance schedule (progressively earlier starting times e.g.<br />

midnight, 16:00, and 08:00) were changed to a phase-delay schedule<br />

(progres-sively later starting times). One-half of these subjects remained on<br />

a weekly rotation, while the others moved to a three-week period between<br />

changes. A control group of nonrotating workers was included for<br />

comparison. Test the null hypothesis that shifts in shifts had no effect on<br />

satisfaction.<br />

Set a = 0,01 and test the null hypothesis:<br />

H0 : one = three = control<br />

SATISFACTION LEVEL<br />

Phase-delay<br />

one-week<br />

Phase-delay<br />

three-weeks<br />

Control<br />

group<br />

13 18 7<br />

11 169<br />

14 19 11<br />

10 21 9<br />

12 13 18<br />

8 18 12<br />

(21-point scale; the higher the score, the greater the satisfaction)<br />

. afdeling 3 data-verwerking: inferensieel<br />

bladsy 155


2. Vul die waardes vir N en k in die tabel hieronder in. Soek die kritieke Fwaardes<br />

op (tabelle A1.4 en A1.5 in Tredoux en Durrheim (2002)) en<br />

antwoord ``Ja'' of ``Nee'' op die vraag ``Verwerp H0'' op grond van die<br />

berekende F-waarde in die eerste kolom.<br />

F N k dfgroup dferror Alpha Kritieke<br />

F<br />

5,45 2 18 0,05<br />

5,45 2 18 0,01<br />

4,95 3 12 0,01<br />

8,064 15 0,05<br />

6,22 5 24 0,05<br />

3. Voltooi die opsommingstabel hieronder<br />

Bron df SS MS F<br />

Groep 225<br />

Fout 18 5<br />

Totaal 23<br />

1. XA = ``Phase delay one-week''<br />

XB = ``Phase delay three-weeks''<br />

XC = ``Control group''<br />

Verwerp<br />

H0?<br />

XA XB XC Total<br />

X 11,33 17,50 11,00 13,28<br />

s 2,162,74 3,85 4,17<br />

XA XB XC X 2 A X 2 B X 2 C<br />

13 18 7 169 324 49<br />

11 169 121 25681<br />

14 19 11 196361 121<br />

10 21 9 100 441 81<br />

12 13 18 144 169 324<br />

8 18 12 64 324 144<br />

68 105 66 794 1 875 800<br />

SX = 68 + 105 + 66 = 239<br />

SX 2 = 794 + 1 875 + 800 = 3 469<br />

_________________________________________________________________<br />

bladsy 156 . studie-eenheid 13 hipotesetoetse vir gemiddeldes: eenrigting-variansieontleding


Nulhipotese H 0 : A ˆ B ˆ C<br />

Een moontlike alternatiewe hipotese H1 : mA = mB = mC<br />

Ander moontlike alternatiewe hipoteses H1 : mA 4 mB 4 mC<br />

SS total = X 2 … X† 2<br />

= 3469<br />

N<br />

…239† 2<br />

18<br />

= 3469 57 121<br />

18<br />

= 3469 3173; 39<br />

= 295; 61<br />

SS group = n …Xj<br />

X::) 2<br />

H1 : mA 5 mB 5 mC<br />

ens.<br />

= 6[(11,33 7 13,28) 2 + (17,5 7 13,28) 2 + (11,0 7 13,28) 2 ]<br />

= 6 [(71,95) 2 + (4,22) 2 +(72,28) 2 ]<br />

= 6[3,80 + 17,81 + 5,20] = 6(26,81)<br />

= 160,86<br />

SSerror = SStotal 7 SSgroup<br />

= 295,61 7 160,86<br />

= 134,75<br />

dftotal = N 7 1 dfgroup = k 7 1 dferror = k(n 7 1)<br />

= 18 7 1 = 3 7 1 = 3(6 7 1)<br />

= 17 = 2 = 15<br />

MSgroup= SSgroup/dfgroup<br />

= 160,86/2<br />

= 80,43<br />

MSerror = SSerror/dferror<br />

= 134,75/15<br />

= 8,98<br />

F = MSgroup<br />

MSerror<br />

= 80; 43<br />

8; 98<br />

= 8,96<br />

. afdeling 3 data-verwerking: inferensieel<br />

bladsy 157


2.<br />

3.<br />

Bron df SS MS F<br />

Groep 2 160,86 80,43 8,96<br />

Fout 15 134,75 8,98<br />

Totaal 17 295,61<br />

F 0, 01 (2,15) = 6,36 Vanaf tabel A1.5<br />

F calc = 8,96<br />

8,96 4 6,36<br />

; Verwerp H0<br />

Interpretasie<br />

Daar is 'n betekenisvolle verskil in werkers se tevredenheid tussen die drie<br />

groepe skofwerkers. Dit kan met 99% sekerheid beweer word.<br />

F N k dfgroup dferror Alpha Kritieke<br />

F<br />

Verwerp<br />

H0?<br />

5,45 21 3 2 18 0,05 3,55 Ja<br />

5,45 21 3 2 18 0,01 6,01 Nee<br />

4,95 164 3 12 0,01 5,95 Nee<br />

8,0620 5 4 15 0,05 3,06 Ja<br />

6,22 30 6 5 24 0,05 2,62 Ja<br />

Bron df SS MS F<br />

Groep 5 225 45 9<br />

Fout 18 90 5<br />

Totaal 23 315<br />

'n Beter begrip van ANOVA _________________________________<br />

Voordat jy jou studie van Tredoux en Durrheim (2002) hervat, wil ons graag 'n<br />

nuttige, konkrete voorstelling van ANOVA deur David Johnson (1989), 'n<br />

sielkundige wat onderrig in statistiek gee, aan jou voorhou. Sy tegniek lei studente<br />

tot 'n intuõÈ tiewe begrip van die beginsels van tussengroepevariansie (MSgroep) en<br />

binnegroepvariansie (MSfout) en die onderlinge verhouding daartussen. As jy dit<br />

noukeurig bestudeer, kan jy dit nuttig vind.<br />

bladsy 158 . studie-eenheid 13 hipotesetoetse vir gemiddeldes: eenrigting-variansieontleding


Die eksperiment<br />

Die data word verkry uit 'n hipotetiese eksperiment. Drie onafhanklike groepe<br />

bestaande uit vyf deelnemers elk word aan een van drie vlakke van 'n<br />

onafhanklike veranderlike blootgestel. Die spektrum van moontlike response op<br />

die afhanklike veranderlike is tussen 0 en 4.<br />

Die resultate<br />

Vyf moontlike uitkomste van die eksperiment word hieronder uiteengesit. Die<br />

datastel en opsommingstabel word saam met 'n verduideliking aangebied.<br />

Uitslag 1 ___________________________________________________________<br />

Data<br />

Groep 1 Groep 2 Groep 3<br />

1 1 1<br />

1 1 1<br />

1 1 1<br />

1 1 1<br />

1 1 1<br />

Opsommingstabel<br />

Bron df SS MS F<br />

Groep 2 0 0 ±<br />

Fout 12 0 0<br />

Totaal 14 0<br />

Jy besef sekerlik dat hierdie uitkoms hoogs onwaarskynlik is. Let op dat daar geen<br />

veranderlikheid in die data tussen en binne groepe is nie en dat dit aanleiding gee<br />

tot gemiddelde kwadrate van 0 in die opsommingstabel.<br />

Uitslag 2 ___________________________________________________________<br />

Data<br />

. afdeling 3 data-verwerking: inferensieel<br />

Groep 1 Groep 2 Groep 3<br />

1 1 3<br />

1 1 3<br />

1 1 3<br />

1 1 3<br />

bladsy 159


Opsommingstabel<br />

Bron df SS MS F<br />

Groep 2 13,33 6,67 ±<br />

Fout 12 0 0<br />

Totaal 14 13,33<br />

Tussengroepvariansie word ingevoer deur al vyf waardes in groep 3 na 3 te<br />

verhoog.<br />

Dit dui op die moontlike uitwerking van die onafhanklike veranderlike wat<br />

gemanipuleer word. Groep 3 is klaarblyklik anders die ander twee groepe<br />

(MSgroep = 6,67); daar is egter geen binnegroepvariansie nie (MSfout = 0).<br />

Uitslag 3 ___________________________________________________________<br />

Data<br />

Groep 1 Groep 2 Groep 3<br />

0 1 3<br />

1 1 3<br />

1 1 3<br />

1 1 3<br />

2 1 3<br />

Opsommingstabel<br />

Bron df SS MS F<br />

Groep 2 13,33 6,67 39,24<br />

Fout 12 2 0,17<br />

Totaal 14 15,33<br />

'n Derde datastel voer binnegroepvariansie by groep 1 in. Hierdie datastel bevat<br />

dieselfde mate van tussengroepvariansie as die vorige een, dit wil seà die<br />

gemiddeldes bly onveranderd. Let op hoe die invoer van nie-eenderse tellings in<br />

groep 1 die waarde van die gemiddelde kwadraat vir binnegroepvariansie verhoog<br />

(MSfout = 0,17). Let ook op die waarde van die F-statistiek (F = 39,24).<br />

bladsy 160 . studie-eenheid 13 hipotesetoetse vir gemiddeldes: eenrigting-variansieontleding


Uitslag 4 ___________________________________________________________<br />

Data<br />

Groep 1 Groep 2 Groep 3<br />

0 0 3<br />

1 1 3<br />

1 1 3<br />

1 1 3<br />

2 2 3<br />

Opsommingstabel<br />

Bron df SS MS F<br />

Groep 2 13,33 6,67 20,21<br />

Fout 12 4 0,33<br />

Totaal 14 17,33<br />

Hierdie datastel verskil van die vorige een in slegs een aspek: bykomende<br />

binnegroepvariansie is bygevoeg deur die waardes in groep 2 te verander om aan te<br />

pas by die in groep 1. Vergeleke met die vorige datastel bly die tussengroepgemiddelde<br />

kwadraat onveranderd, maar die binnegroepgemiddelde kwadraat is<br />

groter (MSfout = 0,33). As gevolg daarvan is die waarde van F kleiner (F =<br />

20,21).<br />

Uitslag 5 ___________________________________________________________<br />

Data<br />

. afdeling 3 data-verwerking: inferensieel<br />

Groep 1 Groep 2 Groep 3<br />

0 0 2<br />

1 1 3<br />

1 1 3<br />

1 1 3<br />

2 2 4<br />

bladsy 161


Opsommingstabel<br />

Bron df SS MS F<br />

Groep 2 13,33 6,67 13,34<br />

Fout 12 60,5<br />

Totaal 14 19,33<br />

Bykomende binnegroepvariansie word ingevoer deur twee waardes in groep 3 te<br />

verander. Let op die onveranderde tussengroepgemiddelde kwadraat en die<br />

verhoogde binnegroepgemiddelde kwadraat (MSfout = 0,5) in vergelyking met die<br />

voorafgaande datastel. As gevolg hiervan is die F-statistiek kleiner as voorheen<br />

(F = 13,34).<br />

Daar het jy dit! Ons is seker jy sal die begrippe betreffende ANOVA asook die<br />

wyse waarop die dinamiese verwantskap van tussengroep- en binnegroepvariansie<br />

die F-statistiek bepaal, nou baie beter verstaan.<br />

Die vervaardigers van Nuwe Sterre is geõÈ nteresseerd in die kykersgedrag van hulle<br />

gehoor. Hulle vra die navorsingspan om vas te stel of daar 'n verskil is tussen die<br />

aantal ure wat die volgende drie groepe na Nuwe Sterre kyk:<br />

. Studente op tersieà re vlak<br />

. Jong volwassenes (30)<br />

Die navorsingspan selekteer 27 kykers op ewekansige wyse, 9 uit elk van die drie<br />

bogenoemde groepe. Hulle neem die aantal ure waar wat hulle oor 'n tydperk van<br />

twee weke na Nuwe Sterre kyk.<br />

Die aantal ure is dus die afhanklike veranderlike.<br />

Die navorsingspan het jou die data hieronder gegee en jou gevra om te bepaal wie<br />

die meeste na Nuwe Sterre gekyk het.<br />

Studente Jong volwassenes Ouer volwassenes<br />

12 14 17<br />

10 10 16<br />

13 10 12<br />

12 8 10<br />

9 10 18<br />

10 10 10<br />

15 12 15<br />

8 8 11<br />

17 11 10<br />

bladsy 162 . studie-eenheid 13 hipotesetoetse vir gemiddeldes: eenrigting-variansieontleding


Die navorsingspan het alreeds die gemiddeldes en standaardafwykings, wat<br />

hieronder verskaf word uit nuuskierigheid bereken:<br />

Studente Jong<br />

volwassenes<br />

Ouer<br />

volwassenes<br />

Totaal<br />

X 11,78 10,33 13,22 11,78<br />

s 2,91 1,87 3,27 2,90<br />

Hulle het opgemerk dat ouer volwassenes waarskynlik die meeste gekyk het,<br />

omdat daardie groep se gemiddelde die hoogste is. Jy het hulle vertel dat geen<br />

gevolgtrekking slegs op grond van die gemiddeldes gemaak kan word nie en dat jy<br />

jou gevolgtrekking aan hulle sal meedeel nadat jy die volgende nulhipotese getoets<br />

het:<br />

mS = mJV = mOV<br />

Jy het besluit om a = 0,05 te gebruik.<br />

1. Doen die toepaslike statistiese toets, naamlik die F-toets en gee jou antwoord<br />

in 'n opsommingstabel.<br />

2. Maak jou gevolgtrekking.<br />

1.<br />

2.1 Wat is die kritieke waarde?<br />

2.2 Verwerp jy H0?<br />

2.3 Wat is jou antwoord aan die navorsingspan? (Onthou dat hulle nie<br />

noodwendig weet wat bedoel word met verwerping of nieverwerping van<br />

die nulhipotese nie.)<br />

XS = Studente<br />

XS = 11,78<br />

XJV = Jong<br />

volwassenes<br />

XJV = 10,33<br />

. afdeling 3 data-verwerking: inferensieel<br />

XOV = Ouer<br />

volwassenes<br />

XOV = 13,22<br />

XS XJV XOV X2 S X2 JV X2 OV<br />

12 14 17 144 196289<br />

10 10 16100 100 256<br />

13 10 12 169 100 144<br />

12 8 10 144 64 100<br />

9 10 18 81 100 324<br />

10 10 10 100 100 100<br />

15 12 15 225 144 225<br />

8 8 11 64 64 121<br />

17 11 10 289 121 100<br />

10693 119 1 316989 1 659<br />

SX = 106+ 93 + 119 = 318<br />

SX 2 = 1 316 + 989 + 1 659 = 3 964<br />

Totaal<br />

X::: = 11,78<br />

bladsy 163


SS total = X 2 … X† 2<br />

= 3964<br />

N df total = N 7 1<br />

…318† 2<br />

27<br />

= 3964 101 124<br />

27<br />

= 3964 3745; 33<br />

= 218; 67<br />

= 27 7 1<br />

= 26<br />

SSgroup = n …Xj X::† 2<br />

dfgroup = k 7 1<br />

= 9[(11,78 7 11,78) 2 + (10,33 7 11,78) 2 + = 3 7 1<br />

(13,22 7 11,78) 2 ]<br />

= 9[(0)<br />

= 2<br />

2 +(71,45) 2 + (1,44) 2 ]<br />

= 9[0 + 2,10 + 2,07] = 9(4,17)<br />

= 37,53<br />

SSerror = SStotal 7 SSgroup dferror = k(n 7 1)<br />

= 218,67 7 37,53 = 3(9 7 1)<br />

= 181,14 = 24<br />

MSgroup = SSgroup / dfgroup<br />

= 37,53/2<br />

= 18,77<br />

MSerror = SSerror / dferror<br />

= 181,14/24<br />

= 7,55<br />

F = MSgroup<br />

MSerror<br />

= 18; 77<br />

7; 55<br />

= 2,49<br />

Bron df SS MS F<br />

Groep 2 37,53 18,77 2,49<br />

Fout 24 181,14 7,55<br />

Totaal 26218,67<br />

2. Jou gevolgtrekking<br />

2.1 F0,05 (2, 24) = 3,40<br />

2.2 Nee<br />

(Omdat 2,49 5 3,40)<br />

bladsy 164 . studie-eenheid 13 hipotesetoetse vir gemiddeldes: eenrigting-variansieontleding


. afdeling 3 data-verwerking: inferensieel<br />

2.3 Daar is geen betekenisvolle verskil tussen die kykersure van die drie<br />

groepe nie. Ek kan dit met 95% sekerheid seà .<br />

Geeneen van die groepe het dus meer na Nuwe Sterre gekyk nie. Dit blyk of die<br />

program gewild is onder 'n wyer gehoor en nie net 'n sekere ouderdomsgroep nie.<br />

'n Nieparametriese ekwivalent van ANOVA _______________________<br />

Die Kruskal-Wallis eenrigting-ANOVA is die nieparametriese of distribusievrye<br />

ekwivalent van die standaardeenrigting-ANOVA of F-toets. Hierdie tegniek<br />

veronderstel dat die afhanklike veranderlike 'n onderliggende kontinue distribusie<br />

van minstens ordinale meting toon. Bestudeer die eerste paragraaf en die eerste sin<br />

van die tweede paragraaf op bladsy 392 tot 393 van Tredoux en Durrheim (2002).<br />

Voltooi die tabel deur die nieparametriese toetse in te vul:<br />

Parametries Nieparametriese ekwivalent<br />

1. t-toets vir twee onafhanklike<br />

steekproewe<br />

2. t-toets vir twee verwante steekproewe<br />

3. F-toets (ANOVA)<br />

Ons gebruik die data van 'n oefening in 'n ander bron (Lehman, 1991, p. 376,<br />

oefening 3) om 'n tipiese rekenaaruitvoer met behulp van SPSS for Windows aan<br />

jou te illustreer.<br />

Die data is die tyd (in minute) wat studente geneem het om vier verskillende<br />

lengtes toetse bestaande uit 10, 15, 20 en 25 vier-alternatiefmeerkeuse-items, te<br />

voltooi. Die navorsingsvraag hier is: Is daar 'n betekenisvolle verskil in die tyd wat<br />

die studente neem om toetse wat uit verskillende aantal meerkeuse-items bestaan,<br />

te voltooi? Die data word in die tabel hieronder verskaf.<br />

bladsy 165


Aantal toetsitems<br />

10 15 20 25<br />

13 17 18 16<br />

10 5 17 21<br />

13 13 10 28<br />

5 14 23 32<br />

611 24 24<br />

612 17 12<br />

2 3 10 9<br />

12 1627 18<br />

17 18 21 18<br />

12 8 24 9<br />

12 14 23 5<br />

2 7 8 15<br />

17 13 14 10<br />

3 16 1 7<br />

7 14 8 30<br />

1 18 10 5<br />

Werk deur die drukstuk en let veral op hoe die resultate weergegee word.<br />

Lees ook die voorbeeld wat Tredoux en Durrheim (2002) op bladsy 276tot 280<br />

onder die opskrif ``Using SPSS to do one-way ANOVA'' bespreek.<br />

bladsy 166 . studie-eenheid 13 hipotesetoetse vir gemiddeldes: eenrigting-variansieontleding


Onthou om die betekenisvolheid van die f-toets (dat daar 'n verskil is) te<br />

interpreteer op grond van die waarde in die ``sigof F'' kolom. Indien die waarde in<br />

hierdie kolom


14<br />

studie-eenheid veertien<br />

Die chi-kwadraattoets<br />

Inhierdie studie-eenheid gaan ons die eerste keer werk met kwalitatiewe<br />

(kategoriese) data. Sover het ons nog net te doen gehad met kwantitatiewe<br />

data. Wanneer jy as bedryfsielkundige in die werksituasie met frekwensies te<br />

doen kry, moet jy tog op een of ander manier kan vasstel of daar beduidende<br />

verskille tussen die frekwensies is. Die toetsstatistiek wat ons hiervoor gebruik<br />

word, is die chi-kwadraat w 2 - toets. Ons gaan in hierdie studie-eenheid met twee<br />

tipes w 2 - toetse werk en leer hoe om die resultate te interpreteer.<br />

As 'n mens dink aan die Nuwe Sterre-projek kan 'n aantal biografiese<br />

veranderlikes deel wees van die vrae wat gevra word. Biografiese veranderlikes<br />

is dikwels kategoriese veranderlikes. Dit sal beteken dat die chi-kwadraattoets is<br />

die toepaslike metode van data-ontleding om die verhouding tussen hierdie<br />

veranderlikes te ondersoek.<br />

Waarom gebruik ons die chi-kwadraattoets? ______________________<br />

Die chi-kwadraattoets help ons om frekwensie of kategoriese data sinvol te<br />

ontleed. Onthou jy nog die verskil tussen kategoriese en metingsdata?<br />

As jy nog die verskil tussen die twee ken, voltooi die tabel hieronder deur die<br />

eienskappe van elke tipe in te vul. Indien jy dit nie onthou nie, raadpleeg eers<br />

studie-eenheid 2 waar die betekenis van kategoriese en metingsdata en die verskil<br />

daartussen behandel word. Voltooi dan die tabel.<br />

Metingsdata Kategoriese data<br />

bladsy 168 . studie-eenheid 14 die chi-kwadraattoets


. afdeling 3 data-verwerking: inferensieel<br />

Dit kom daarop neer dat kategoriese data die getal observasies (tellings) in elke<br />

kategorie verteenwoordig, terwyl metingsdata verkry word deur objekte te meet.<br />

Watter tipes chi-kwadraattoetse kry ons? ________________________<br />

Soos reeds gemeld, kan ons slegs met twee kategoriese veranderlikes werk: 'n eenklassifikasieveranderlike<br />

en 'n twee-klassifikasieveranderlike.<br />

Bestudeer die afdeling ``Classifications'' op bladsy 365 van Tredoux en Durrheim<br />

(2002) sodat jy kan verstaan hoe 'n populasie op verskillende wyses geklassifiseer<br />

kan word.<br />

. Som dan vir jou die verskil tussen 'n een- en 'n twee-klassifikasieveranderlike in<br />

die tabel hieronder op:<br />

Een-klassifikasieveranderlike Twee-klassifikasieveranderlike<br />

Noudat jy weet wat die verskil tussen die twee is, gaan ons vir jou in die volgende<br />

afdeling verduidelik hoe om dit te bereken.<br />

Wanneer word die twee-klassifikasieveranderlikes: chi-kwadraatgebeurlikheidstabel<br />

gebruik? _________________________________<br />

Dikwels kan die data waarmee ons werk, nie geklassifiseer word as net een<br />

veranderlike nie. Soms werk ons met data wat in twee kategorieeÈ val, en waar die<br />

veranderlike (data) ook as twee veranderlikes geklassifiseer word. In sodanige<br />

gevalle word na 'n gebeurlikheidstabel (contingency table) verwys.<br />

Bestudeer die gedeelte ``Contingency tables'' op bladsy 365 tot 366 van Tredoux<br />

en Durrheim (2002) om hierdie konsep beter te begryp.<br />

bladsy 169


. Gebruik jou sakrekenaar om die berekenings in tabel 19.1 op bladsy 366 van<br />

Tredoux en Durrheim (2002) na te gaan.<br />

. Formuleer jou eie beskrywing van 'n gebeurlikheidstabel:<br />

__________________________________________________________________<br />

__________________________________________________________________<br />

__________________________________________________________________<br />

Het jy in jou beskrywing die volgende ingesluit? Ons werk met 'n klassifikasie<br />

waarin die waarneming gelyktydig geklassifiseer is ten opsigte van twee<br />

veranderlikes.<br />

Wanneer word die een-klassifikasieveranderlike gebruik? Die chi-kwadraatpasgehaltetoets<br />

__________________________________________<br />

Waar ons met net een veranderlike werk, gebruik ons die pasgehaltetoets<br />

(goodness of fit test). Dit is die spesifieke naam vir die tipe chi-kwadraattoets. Die<br />

veronderstelling hier is dat ons slegs een stel waargenome data vergelyk met 'n<br />

teoretiese voorspelling van frekwensies, dit wil seà ons werk met waargenome (O)<br />

en verwagte (E) tellings.<br />

Ons maak nou kennis met bepaalde formules en simbole. Om jou te help om<br />

daarmee vertroud te raak moet jy die afdeling ``w 2 significance test'' op bladsy 366<br />

tot 371 van Tredoux en Durrheim (2002) bestudeer. Hierdie gedeelte is lank en al<br />

die berekenings, formules en simbole is bes moontlik verwarrend. Kom ons<br />

verdeel die afdeling sodat jy die belangrikste elemente makliker snap.<br />

. Vergewis jou van die simbole in die formules en hoe om dit te bereken.<br />

. Kontroleer die berekenings met jou sakrekenaar.<br />

. Sorg ook dat jy die waarde in tabel A1.7 op bladsy 492 van Tredoux en<br />

Durrheim (2002) korrek kan aflees.<br />

Benewens die toetsstatistiek wat verskil, behoort die proses vir jou bekend te wees,<br />

aangesien dit dieselfde prosedure is wat met alle hipotesetoetsing gevolg word (bv<br />

met die berekening van die t- en die F-toets).<br />

Probeer nou om die volgende aktiwiteite te doen om jou vaardigheid in die<br />

toepassing van die chi-kwadraattoets te bepaal. Onthou om al die stappe te volg<br />

wat jy in studie-eenheid 11 geleer het. Begin dus met die formulering van die<br />

nulhipotese en volg die stappe totdat jy jou bevindings interpreteer.<br />

bladsy 170 . studie-eenheid 14 die chi-kwadraattoets


1. Die programbestuurders van Nuwe Sterre wou vasstel of daar 'n verskil was<br />

tussen mans en vroue se mening ten opsigte daarvan of stemmers toegelaat<br />

moet word om vir die beoordelaars ook te stem. Jy is genader om die<br />

navorsing te onderneem. Die volgende vraag is aan 'n groep van 60 stemmers<br />

(30 mans en 30 vroue) gestel:<br />

Dink jy dat stemmers toegelaat moet word om vir beoordelaars ook te stem?<br />

Die deelnemers is gevra om slegs een van drie response te kies: ja, nee of onseker.<br />

Van die 30 mans het 9 ja geantwoord, 12 het nee geseà en 9 was onseker. Van die<br />

vroue het 15 ja geseà , 2 het nee geseà en 13 was onseker.<br />

Verskil mans en vroue beduidend oor hulle opinie rakende stemmery vir die beoordelaars?<br />

1.1 Stel 'n gebeurlikheidstabel op om die gegewe inligting voor te stel.<br />

1.2 Doen die nodige berekenings om te bepaal of daar 'n beduidende verskil is<br />

tussen die twee geslagte ten opsigte van hulle opinie rakende stemmery vir<br />

die beoordelaars.<br />

1.3 Werk op 'n beduidenheidsvlak van 0,05. Wat is jou afleiding? (Verwys na die<br />

navorsingsprobleem.)<br />

1.1<br />

Ja Nee Onseker Totaal<br />

Mans 9 (12) 12 (7) 9 (11) 30<br />

Vroue 15 (12) 2 (7) 13 (11) 30<br />

Totaal 24 14 22 60<br />

Die syfers tussen hakies is die verwagte frekwensies, bereken volgens die<br />

formule:<br />

Eij = Ri Cj<br />

N<br />

Vir ons vraag:<br />

E11 =<br />

E12 =<br />

E13 =<br />

E21 =<br />

E22 =<br />

E23 =<br />

30 24<br />

60<br />

30 14<br />

60<br />

30 22<br />

60<br />

30 24<br />

60<br />

30 14<br />

60<br />

30 22<br />

60<br />

= 12<br />

= 7<br />

= 11<br />

= 12<br />

= 7<br />

= 11<br />

. afdeling 3 data-verwerking: inferensieel<br />

bladsy 171


1.2 2 =<br />

= …9 12†2<br />

= … 3†2<br />

…O E† 2<br />

E<br />

12 ‡<br />

12<br />

52 ‡ 7<br />

…12 7†2<br />

7 ‡<br />

‡ … 2†2<br />

11<br />

32 ‡ 12<br />

…9 11†2<br />

11 ‡<br />

‡ … 5†2<br />

7<br />

…15 12†2<br />

12 ‡<br />

22 ‡ 11<br />

= 0; 75 ‡ 3; 75 ‡ 0; 36 ‡ 0; 75 ‡ 3; 75 ‡ 0; 36<br />

= 9,36<br />

1.3 a = 0,05<br />

df = (R ± 1) (C ± 1)<br />

= (2 ± 1)(3 ± 1)<br />

= 2<br />

2<br />

calc = 9; 36 2 crit ˆ 5; 99<br />

9,36 4 5,99<br />

; Verwerp H0<br />

…2 7†2<br />

7 ‡<br />

…13 11†2<br />

11<br />

; Daar is 'n betekenisvolle verskil tussen mans en vroue met betrekking<br />

tot hul mening oor stemmery vir die beoordelaars.<br />

Dink na oor die volgende addisionele vrae vir die Nuwe Sterre-projek wat ook<br />

deur die analise van Chi-kwadraat bereken kan word:<br />

. V1: Is daar 'n verskil in hoe kykers deelnemers beoordeel op grond van hulle<br />

haarkleur (blonde, rooi of bruin hare?) (chi-kwadraat)<br />

. V2: Is daar 'n verskil in hoe manlike en vroulike beoordelaars deelnemers<br />

beoordeel op grond van hulle liggaamsgewig?<br />

. V3: Ten opsigte van die beoordelaars wat deel van die siftingsproses is ± is daar<br />

'n verhouding tussen die rassegroep van 'n individuele beoordelaar en die<br />

rassegroep van die kandidate vir wie hulle 'n hoeÈ , gemiddelde of lae punt gee?<br />

Speel klein frekwensies 'n rol? _______________________________<br />

Ja, dit speel 'n rol. Selfs wanneer die frekwensies klein is, oefen hulle 'n invloed op<br />

'n toets uit. Soms word die frekwensies as proporsies uitgedruk, maar word<br />

gewoonlik weer na frekwensies omgeskakel. Dit is ook moontlik om nieonafhanklike<br />

observasies te doen. Lees die afdeling ``Measures of association in<br />

tables based on the 2 statistic'' op bladsy 371 tot 374 van Tredoux en Durrheim<br />

(2002).<br />

Bestudeer die uitgewerkte voorbeeld op bladsy 381 van Tredoux en Durrheim<br />

(2002) en sorg dat jy die 2 -waarde in die drukstukke kan identifiseer en<br />

interpreteer.<br />

bladsy 172 . studie-eenheid 14 die chi-kwadraattoets


. afdeling 3 data-verwerking: inferensieel<br />

Jy het nou heelwat nuwe kennis opgedoen. 'n Opsomming daarvan sal 'n oorsig<br />

bied van jou begrip daarvan. Jy behoort in staat te wees om die volgende te doen:<br />

. te weet wanneer om die chi-kwadraattoets toe te pas<br />

. die chi-kwadraattoets (pasgehaltetoets) vir twee of meer kategorieeÈ te kan<br />

bereken<br />

. te kan verduidelik wat 'n gebeurlikheidstabel is<br />

. te weet wanneer om 'n gebeurlikheidstabel te gebruik<br />

. die chi-kwadraattoets vir twee-klassifikasieveranderlikes te kan bereken<br />

. die resultate te kan interpreteer op grond van die verwerping of die<br />

nieverwerping van die nulhipotese<br />

bladsy 173


15<br />

studie-eenheid vyftien<br />

OnderskeidingsvermoeÈ<br />

OnderskeidingsvermoeÈ (power) is 'n konsep wat vandag al hoe<br />

belangriker word in navorsing. Al hoe meer skrywers van<br />

wetenskaplike artikels verduidelik die onderskeidingsvermoeÈ van<br />

hulle navorsing. Om hierdie rede is dit belangrik dat jy eerstens die konsep van<br />

onderskeidingsvermoeÈ verstaan, en dan ook hoe om onderskeidingsvermoeÈ (soos<br />

dit byvoorbeeld in wetenskaplike artikels bereken word) te interpreteer.<br />

Die basiese begrip ``onderskeidingsvermoeÈ'' ______________________<br />

Veronderstel jy doen navorsing oor die invloed van rook op die gesondheid van<br />

personeel in 'n gebou. In jou navorsing gebruik jy twee steekproewe, naamlik 'n<br />

departement waar daar glad nie gerook word nie en 'n departement waar baie<br />

personeel rook. Jou nulhipotese stel dat daar geen verskil in die gesondheid van<br />

personeel wat nie rook in die twee departemente is nie. Jou resultate toon dat jy nie<br />

die nulhipotese kan verwerp nie, dit wil seà daar is geen verskil in die gesondheidsvlak<br />

van die personeel wat nie rook in die twee departemente nie. Op grond van<br />

jou resultate stel die organisasie nie 'n rookbeleid in nie. Jy publiseer jou resultate<br />

in 'n wetenskaplike artikel. Na vyf jaar lees 'n professsor wat in jou soort<br />

navorsing gespesialiseer het jou resultate en kom agter dat jy 'n statistiese fout<br />

begaan het. Jou resultate was dus verkeerd en jy moes in der waarheid jou<br />

nulhipotese verwerp het wat beteken dat daar wel 'n verskil in die gesondheidsvlakke<br />

van die personeel in die twee departemente was wat nie rook nie.<br />

In die Nuwe Sterre-kompetisie waar die pryse hoeÈ moneteà re waarde het, moet die<br />

organiseerders verseker dat die resultate en die grondslag waarop besluite gemaak<br />

word, bo verdenking is. As die kwessie vanuit 'n kwantitatiewe perspektief<br />

benader word, is versekering van voldoende onderskeidingsvermoeÈ een manier om<br />

in staat te wees om besluite wat geneem is, te verdedig.<br />

1. Beskou die scenario soos hierbo gestel, en beantwoord dan die volgende vrae:<br />

1.1 Watter soort statistiese fout het jy begaan? Verduidelik jou antwoord.<br />

1.2 Die verkeerdelike nieverwerping van die nulhipotese hou implikasies vir<br />

die organisasie en die personeel in. Kan jy sommige van hierdie<br />

implikasies lys?<br />

bladsy 174 . studie-eenheid 15 onderskeidingsvermoeÈ


. afdeling 3 data-verwerking: inferensieel<br />

2. Om die begrip onderskeidingsvermoeÈ te verstaan moet jy die gedeelte ``Error<br />

and statistical tests'' op bladsy 231 tot 232 van Tredoux en Durrheim (2002)<br />

bestudeer. Jy sal sodoende ook Tipe I- en Tipe II-foute beter verstaan.<br />

Hierdie scenario dui op die belangrikheid van die korrekte verwerping van die<br />

onwaar nulhipotese.<br />

1.1 In studie-eenheid 11 het jy geleer wat 'n tipe II-fout, wat ook as b (beta)<br />

genoteer word, beteken. As jy deur die afdeling ``Error and statistical tests''<br />

op bladsy 231 tot 232 van Tredoux en Durrheim (2002) werk, sal jy sien dat<br />

dit baie nou verband hou met die konsep van onderskeidingsvermoeÈ .<br />

1.2 Voor die hand liggende implikasies sluit die volgende in:<br />

. Die tyd en geld wat jy aan die eksperiment gemors het<br />

. Produktiwiteit wat verlore gaan omdat personeel siek word en van die<br />

werk afwesig is as gevolg van die rokery<br />

. Mediese fondse wat met eise van siek personeel belas word<br />

2. Jy moet veral aandag gee aan die interpretasie van figuur 13.1 op bladsy 233<br />

tot 234 van Tredoux en Durrheim (2002).<br />

Dit behoort nou vir jou duidelik te wees dat dit ernorme implikasies in die meeste<br />

navorsingsituasies kan inhou indien die nulhipotese nie verwerp word nie waar<br />

daar in der waarheid 'n verskil tussen groepe is. Dit is waarom die konsep van<br />

onderskeidingsvermoeÈ so belangrik is. Die waarskynlikheid om die regte besluit te<br />

neem om die vals nulhipotese (H0) te verwerp, staan bekend as onderskeidingsvermoeÈ<br />

en word as 1± genoteer.<br />

Interpretasie van 'n onderskeidingsvermoeÈwaarde __________________<br />

Die onderskeidingsvermoeÈ kan vir 'n t-toets vir verwante en onafhanklike<br />

steekproewe bereken word, maar is 'n ingewikkelde proses. Hoewel ons nie van<br />

jou sal verwag om hierdie berekenings te kan doen nie, moet jy wel die<br />

onderskeidingsvermoeÈ waarde wat deur hierdie proses bereken is, kan interpreteer.<br />

In hul inleiding op bladsy 230 tot 231 gebruik Tredoux en Durrheim (2002) die<br />

analogie van die strafhof om die interpretasie van die onderskeidingsvermoeÈ -<br />

waarde te verduidelik.<br />

Soos jy kan sien, verwag ons net van jou om bladsy 230 tot 234 van Tredoux en<br />

Durrheim (2002) te bestudeer. Die res van hierdie hoofstuk is nie op jou van<br />

toepassing nie.<br />

1. Hersien die reeÈ ls in studie-eenheid 11 wat bepaal wanneer jy die nulhipotese<br />

moet verwerp of nie moet verwerp nie.<br />

bladsy 175


2. Verduidelik wat bedoel word met onderskeidingsvermoeÈ = 0,6.<br />

3. Wat is die vlak van sekerheid wat van die statistiese proses vereis sal word om<br />

te verseker dat die uitkoms van die stemming in Nuwe Sterre bo verdenking is?<br />

1. Hierdie reeÈ ls sal jou weer nuttig te pas kom om onderskeidingsvermoeÈ te<br />

verstaan.<br />

2. Wanneer ons seà dat die onderskeidingsvermoeÈ vir 'n spesifieke<br />

navorsingstudie gelyk is aan 0,6, bedoel ons dat as die nulhipotese vals is<br />

tot die mate wat ons verwag dit vals is, die waarskynlikheid 0,6is dat die<br />

resultate ons tot die verwerping van die nulhipotese sal lei. Hoe groter die<br />

onderskeidingsvermoeÈ vir 'n eksperiment is, hoe groter is die waarskynlikheid<br />

dat ons die vals nulhipotese sal verwerp, en hoe hoeÈ r is die<br />

onderskeidingsvermoeÈ van die eksperiment.<br />

3. 0,8.<br />

'n Toepassingsarea vir onderskeidingsvermoeÈ ____________________<br />

Bedryfsielkunde as vakgebied is een van die baie wat van meta-analise gebruik<br />

maak. Dit is 'n statistiese metode wat gebruik word om die resultate van<br />

onafhanklike navorsingstudies te kombineer. Meta-analise word hoofsaaklik in<br />

wetenskaplike artikels gebruik wat navorsing in 'n spesifieke area bespreek (Aron<br />

& Aron, 1994).<br />

Noudat jy studie-eenheid 15 bestudeer het behoort jy in staat te wees om die<br />

volgende te doen:<br />

. Die konsep van onderskeidingsvermoeÈ te kan omskryf en te weet waarom dit<br />

belangrik is<br />

. 'n Berekende onderskeidingsvermoeÈ waarde te kan interpreteer<br />

bladsy 176 . studie-eenheid 14 die chi-kwadraattoets


Nuwe Sterre<br />

Die sangkompetisie skop binnekort af! _______________________________<br />

Die Nuwe Sterre-leerlingskapprogram het verlede week op 'n hoeÈ noot ten einde<br />

geloop! Dit was so 'n moordende proses dat die organiseerders ietwat bekommerd<br />

was dat die deelnemers nie nog in die sangkompetisie ook sal kan deelneem nie!<br />

Die totale voorkomsverandering was die gunsteling deel van die leerlingskapprogram,<br />

vir die deelnemers sowel as die kykers! Teen alle verwagtings in het<br />

Vuyo K nie na die finale rondte deurgedring nie! Die vyf gekose deelnemers om<br />

aan die sangkompetisie deel te neem, is David, Tshepo, Shelly, Kerry en<br />

Cameron. Volgens hulle profiele in studie-eenheid 1, wie dink jy staan die grootste<br />

kans om te wen?<br />

bladsy 177


16 Data-analise:<br />

'n fiktiewe<br />

organisasie


Studie-eenheid 16: Data-analise: 'n fiktiewe organisasie<br />

bladsy 180<br />

Die studie-eenheid in hierdie afdeling is uniek in die sin dat jy niks nuuts gaan<br />

byleer nie. Jy gaan wel 'n geleentheid kry om alles toe te pas wat jy tot dusver<br />

geleer het. Hierdie studie-eenheid is dus eintlik selfevalueringsoefeninge.


16<br />

studie-eenheid sestien<br />

Data-analise: 'n<br />

fiktiewe organisasie<br />

Let daarop dat sommige vrae in hierdie studie-eenheid anders gevra word<br />

as vroeeÈ r in die ander studie-eenhede of in die werkopdragte. Moenie<br />

bekommer nie, die vrae in die eksamen sal in 'n formaat wees soos in die<br />

ander studie-eenhede en die werkopdragte! Die rede waarom ons die vrae hier soms<br />

anders gevra het, is om dit 'n meer realistiese oefening te maak ten opsigte van die<br />

vrae wat jy in 'n werksituasie sal moet kan beantwoord. 'n Werkgewer gaan net<br />

vir jou die probleemstelling gee en van jou verwag om self te weet watter stappe jy<br />

alles moet uitvoer om by die antwoord uit te kom.<br />

Noudat jy die studiemateriaal van hierdie kursus voltooi het, kan jy al begin<br />

droom van jou werk as bedryfsielkundige in 'n maatskappy. Gee jou verbeelding<br />

vrye teuels en geniet die volgende praktiese oefening.<br />

Verbeel jou jy is die bedryfsielkundige in diens van maatskappy MetalCan<br />

International wat metaalblikkies vervaardig. Dit is 'n fabriek wat 24 uur per dag<br />

produksie moet lewer en gevolglik word werkers in drie verskillende skofte<br />

ingedeel.<br />

Die tye van die drie skofte is soos volg: Die bestuursvlakke in die Produksieafdeling<br />

is die volgende:<br />

. Skof 1: 06:00±14:00 . Produksiebestuurder<br />

. Skof 2: 14:00±22:00 . Senior Skofleier<br />

. Skof 3: 22:00±06:00 . Skofleier<br />

. Skofwerker<br />

Die maatskappy het mans sowel as vroue van verskillende ouderdomme tydens al<br />

drie die skofte in diens. Daar is altesaam 350 werkers by die maatskappy. Tien<br />

werkers uit elke skofbeurt is ewekansig geselekteer en inligting van elkeen van die<br />

geselekteerde werkers word in die tabel hieronder gegee. Hierdie werkers is almal<br />

fabriekwerkers wat verpakking van die finale produkte doen. Om die vrae te<br />

beantwoord wat hierna gevra gaan word, moet jy hierdie inligting gebruik.<br />

Stel vir elke vraag 'n nuwe tabel op waarin jy slegs die nodige inligting uit die<br />

meestertabel in daardie tabel oorskryf. Dit sal jou berekeninge vergemaklik om<br />

net die nodige data vir die berekeninge byderhand te heà .<br />

bladsy 181


Die volgende inligting word verskaf vir die persone wat in die steekproef<br />

opgeneem is:<br />

. naam (van en voorletters)<br />

. skofnommer<br />

. ouderdom (in jare)<br />

. dienstydperk (by hierdie firma ± gegee in maande)<br />

. geslag (M = manlik, V = vroulik)<br />

. motoriese aanlegtelling (op skaal wat telling vir handvaardigheid gee)<br />

. produktiwiteitstelling (gemiddelde aantal produkte verpak oor laaste 5 skofte)<br />

Naam Skof Ouderdom Dienstyd Geslag Motoriese<br />

aanleg<br />

Produktiwiteit<br />

Khumalo, N 1 30 68 M 40 140<br />

Solomon, K 1 23 36M 32 120<br />

Shaw, I 1 25 15 V 41 130<br />

Mogale, S 1 19 6M 28 115<br />

Naidoo, P 1 42 41 M 38 130<br />

Peters, M 1 24 10 V 32 118<br />

Britz, K 1 43 60 M 43 153<br />

Singh, S 1 32 24 V 37 135<br />

Shizane, P 1 28 22 M 41 148<br />

Coetzee, N 1 41 48 M 36120<br />

Miller, A 2 2628 M 24 90<br />

Masego, P 2 31 20 V 30 140<br />

Ndimang, N 2 30 12 V 31 128<br />

Quele, P 2 27 5 M 40 146<br />

Valmer, B 2 24 38 M 41 140<br />

April, C 2 55 144 V 38 145<br />

Nkomo, D 2 48 12 M 36130<br />

Surrey, F 2 33 47 M 35 140<br />

Govender, S 2 25 8 M 40 145<br />

Mokoena, C 2 42 50 M 41 130<br />

Zitumane, P 3 25 10 M 35 130<br />

Lange, K 3 37 14 M 38 142<br />

Hatting, S 3 32 6V 42 136<br />

Bartlett, G 3 44 48 V 29 112<br />

bladsy 182 . studie-eenheid 16 data-analise: 'n fiktiewe organisasie


Naam Skof Ouderdom Dienstyd Geslag Motoriese<br />

aanleg<br />

Produktiwiteit<br />

Olivier, M 3 41 78 V 41 128<br />

Nkosi, T 3 28 15 V 33 116<br />

Richard, A 3 4624 M 34 111<br />

Jacobs, L 3 50 120 V 48 150<br />

Maluleke, T 3 41 60 M 29 102<br />

Collins, G 3 39 20 M 32 120<br />

Die res van die studie-eenheid bestaan uit 'n klomp vrae wat deel van hierdie een<br />

lang aktiwiteit vorm. Terugvoer word aan die einde van die studie-eenheid gegee.<br />

Vraag 1<br />

Voltooi die onderstaande tabel deur langs elke veranderlike hieronder aan te dui<br />

watter tipe metingskaal ter sprake is.<br />

Veranderlike Soort metingskaal<br />

(nominaal, ordinaal,<br />

interval of verhouding)<br />

Skofgroep<br />

Ouderdom<br />

Dienstyd<br />

Geslag<br />

Handvaardigheid/<br />

Motoriese-aanlegtelling<br />

Produktiwiteitstelling<br />

Bestuursvlak<br />

Vraag 2<br />

. afdeling 4 toepassing<br />

Een van die tellings wat gegee is, is 'n motoriese-aanlegtelling wat 'n meting van<br />

handvaardigheid is. Hierdie telling gee na bewering 'n aanduiding van die persoon<br />

se uiteindelike produktiwiteit binne die werksituasie.<br />

2.1 Bereken die gemiddeld van die motoriese-aanlegtellings van die groep wat<br />

skof 1 werk en ook vir die groep wat skof 3 werk.<br />

2.2 Bereken die modus van die produktiwiteitstellings van die groep wat skof 2<br />

werk.<br />

2.3 Bereken die mediaan van die produktiwiteitstellings van die werkers van skof<br />

3.<br />

bladsy 183


2.4 Gee 'n frekwensieverdeling van die ouderdomme van die persone wat in die<br />

steekproef opgeneem is deur die ouderdomme in 5-jaar intervalle te groepeer.<br />

Stel 'n frekwensietabel op. Dui ook die middelpunt van elke interval in die<br />

frekwensietabel aan.<br />

2.5 Teken die histogram van die frekwensieverdeling in vraag 2.4.<br />

2.6Beskryf die verspreiding van hierdie histogram ten opsigte van die volgende:<br />

. Modaliteit: unimodaal / bimodaal / trimodaal<br />

. Skeefheid: positief skeef / negatief skeef<br />

. Kurtose: platikurties / mesokurties / leptokurties<br />

2.7 Bereken die variansie en standaardafwyking van die motoriese-aanlegtellings<br />

vir skofgroep 1 asook vir skofgroep 3.<br />

2.8 Bereken die verband tussen die motoriese-aanlegtellings en die<br />

produktiwiteitstellings van die hele groep.<br />

Opmerking: Die kwadrate van sommige syfers mag onmoontlik wees om te<br />

bereken met sakrekenaars wat net agt karakters kan hanteer.<br />

Interpreteer dan die korrelasiekoeÈ ffisieÈ nt en seà ook wat jou afleiding is ten opsigte<br />

van die verband is.<br />

Vraag 3<br />

Jy wil die motoriese-aanlegtellings gebruik om werkprestasie (produktiwiteit) te<br />

voorspel.<br />

3.1 Watter veranderlike is die voorspellerveranderlike?<br />

3.2 Bereken die veranderlikes wat in die regressievergelyking gebruik word,<br />

naamlik:<br />

. bereken b<br />

. bereken a<br />

3.3 Gee die finale regressieformule.<br />

3.4 Wat sal die voorspelde produktiwiteitstelling wees van 'n persoon wat 'n<br />

telling van 30 op die motoriese-aanlegtoets kry?<br />

3.5 Maak 'n grafiese voorstelling van die regressielyn.<br />

Vraag 4<br />

Beskou vir hierdie vraag hierdie groep van 30 werkers as die totale populasie van<br />

werkers wat normaal versprei is. Hulle gemiddeld ten opsigte van motoriese<br />

aanleg is 32,53 en die standaardafwyking is 11,98. Beantwoord nou die volgende<br />

vrae:<br />

4.1 Bereken die ooreenstemmende z-telling vir 'n persoon met 'n routelling van<br />

41.<br />

bladsy 184 . studie-eenheid 16 data-analise: 'n fiktiewe organisasie


4.2 Bereken die ooreenstemmende z-telling vir 'n persoon met 'n routelling van<br />

31.<br />

4.3 Bepaal die proporsie gevalle met 'n routelling kleiner as 31.<br />

4.4 Bepaal die persentasie gevalle met 'n routelling groter as 41.<br />

4.5 Bepaal die aantal werkers wie se motoriese-aanlegtellings tussen 31 en 41 val.<br />

Vraag 5<br />

Enkele gevalle binne die maatskappy dui daarop dat mans moontlik meer betaal<br />

word as vroue, alhoewel hulle dieselfde werk doen en naastenby dieselfde<br />

ondervinding het. Beweringe oor verskille in die produktiwiteit het nou kop<br />

uitgesteek as deel van die probleem en jy is gevra om ondersoek in te stel. Bestuur<br />

het na aanleiding van bogenoemde gevra dat die syfers ten opsigte van die<br />

produktiwiteit van die twee geslagte aan hulle beskikbaar gestel moet word.<br />

Gebruik die inligting wat in die tabel gegee is om vas te stel of daar 'n verskil<br />

tussen die produktiwiteit van mans en vroue is.<br />

5.1 Stel 'n gepaste nulhipotese in woorde en in simbole.<br />

5.2 Stel 'n gepaste alternatiewe hipotese in woorde en in simbole.<br />

5.3 Bereken die gepaste toetsstatistiek en beantwoord die navorsingsvraag.<br />

Vraag 6<br />

As jy dienstyd oorweeg, kan jy ses persone in skofgroep 1 afpaar met ses persone<br />

met dieselfde lengte dienstydperk in skofgroep 3. Skofgroep 1 werk van 06:00 tot<br />

14:00 terwyl skofgroep 3 van 22:00 saans tot 06:00 die volgende oggend werk. Jy<br />

wil vasstel of daar 'n verskil tussen die produktiwiteitstellings van skofgroep 1 en<br />

skofgroep 3 is. Doen al die nodige berekeninge (beginnende met die stel van 'n<br />

nul- en alternatiewe hipotese) om die vraag te beantwoord.<br />

Vraag 7<br />

Gebruik twee ouderdomsgroepe naamlik die groep persone wat jonger as 30 is in<br />

een groep en die groep persone wat ouer as 40 is in die ander groep. Bepaal of daar<br />

'n verskil tussen die motoriese-aanlegtellings van hierdie twee groepe is. Wys alle<br />

stappe duidelik en doen alle nodige berekeninge om die vraag te kan beantwoord.<br />

Vraag 8<br />

. afdeling 4 toepassing<br />

8.1 Is daar 'n beduidende verskil tussen die ouderdomme van die drie<br />

verskillende skofgroepe? Doen alle nodige berekeninge om die antwoord te<br />

bepaal.<br />

8.2 Evalueer die praktiese waarde wat hierdie berekening vir jou as<br />

bedryfsielkundige het in twee of drie sinne.<br />

bladsy 185


Vraag 9<br />

Die hoof- uitvoerende beampte (HUB) (Chief Executive Officer) van die<br />

maatskappy het die volgende gemiddeldes en standaardafwykings van<br />

produktiwiteitsdata vir die drie skofte bekom:<br />

Skof 1 Skof 2 Skof 3<br />

X 130,9 133,4 124,7<br />

s 13,08 16,65 15,16<br />

Hy het samesprekings met jou aangevra en die volgende gesprek het plaasgevind:<br />

HUB: ``Dit lyk asof skof 2 die produktiefste in die maatskappy is, terwyl skof 1<br />

kort op hulle hakke is. Die produktiwiteit van skof 3 is regtig swak. Stem<br />

jy saam?''<br />

Jy: `` 'n Mens kan nie aflei of daar 'n betekenisvolle verskil is in die<br />

produktiwiteit van die drie skofte is deur slegs na die gemiddeldes te kyk<br />

nie.''<br />

HUB: ``Kan jy die data verder verwerk? Ek moet weet of daar 'n betekenisvolle<br />

verskil is.''<br />

Jy: ``Sekerlik, ek moet net 'n statistiese toets bekend as `Eenrigting ANOVA'<br />

doen om jou vraag te kan beantwoord. Ek sal my afleiding aan jou<br />

rapporteer met 99% sekerheid.''<br />

HUB: ``Dankie.''<br />

Vraag 10<br />

Die produksiebestuurder wou vasstel of daar 'n verskil in die voorkeur tussen<br />

manlike en vroulike werkers is vir die skof wat hulle sou verkies om te werk. Die<br />

senior skofleier het die volgende response gekry van 280 werkers op die vraag:<br />

``Watter skof verkies jy?''<br />

Skof 1 Skof 2 Skof 3<br />

Manlik 60 22 30<br />

Vroulik 40 68 60<br />

Die produksiebestuurder het jou gevra om die data te ontleed om sy vraag te kan<br />

beantwoord.<br />

bladsy 186 . studie-eenheid 16 data-analise: 'n fiktiewe organisasie


Vraag 1<br />

Veranderlike Soort veranderlike<br />

(nominaal, ordinaal,<br />

interval of verhouding)<br />

Skofgroep nominaal<br />

Ouderdom ratio<br />

Dienstyd ratio<br />

Geslag nominaal<br />

Handvaardigheid/<br />

Motoriese-aanlegtelling<br />

interval<br />

Produktiwiteitstelling ratio<br />

Bestuursvlak ordinaal<br />

Vraag 2<br />

2.1 Gemiddelde van die motoriese aanlegtellings van skofgroep 1 en skofgroep 3<br />

Skofgroep 1: (X1) = X1<br />

N1<br />

= 368<br />

10<br />

= 36,8<br />

Skofgroep 3: (X3) = X3<br />

N3<br />

= 361<br />

10<br />

= 36,1<br />

2.2 Modus van die produktiwiteitstellings van skofgroep 2<br />

Produktiwiteitstellings: 90 140 128 146140 145 130 140 145 130<br />

Geordende tellings: 90 128 130 130 140 140 140 145 145 146<br />

Modus = 140<br />

. afdeling 4 toepassing<br />

Motoriese aanlegtellings<br />

Skofgroep 1<br />

(X1)<br />

Skofgroep 3<br />

(X3)<br />

40 35<br />

32 38<br />

41 42<br />

28 29<br />

38 41<br />

32 33<br />

43 34<br />

37 48<br />

41 29<br />

3632<br />

Som 368 361<br />

bladsy 187


o f met 'n frekwensietabel Prod-2 Frek W<br />

90 1<br />

128 1<br />

130 2<br />

Modus = 140 iiiiK 140 3<br />

145 2<br />

1461<br />

2.3 Bereken die mediaan van die produktiwiteitstellings van skofgroep 3<br />

Produktiwiteitstellings (skofgroep 3):<br />

130 142 136112 128 116111 150 102 120<br />

Geordende tellings:<br />

102 111 112 116120 128 130 136142 150<br />

~<br />

N ‡ 1<br />

Mediaanposisie =<br />

2<br />

= 10 ‡ 1<br />

2<br />

= 5,5<br />

Mediaanwaarde leà tussen 120 en 128 (gemiddelde van die twee tellings)<br />

; 120 ‡ 128<br />

2<br />

= 248<br />

2<br />

= 124<br />

2.4 Frekwensieverdeling van ouderdomme<br />

Ouderdomsinterval Frekwensie Kumulatiewe<br />

frekwensie<br />

Middelpunt<br />

van interval<br />

16±20 1 1 18<br />

21±25 67 23<br />

26±30 6 13 28<br />

31±35 4 17 33<br />

36±40 2 19 38<br />

41±45 7 2643<br />

46±50 3 29 48<br />

51±55 1 30 53<br />

bladsy 188 . studie-eenheid 16 data-analise: 'n fiktiewe organisasie


2.5 Histogram van frekwensieverdeling van ouderdomme gegee in vraag 2.4<br />

Frekwensie<br />

6<br />

5<br />

4<br />

3<br />

2<br />

1<br />

0 3 8 13 18 23 28 33 38 43 48 53<br />

Ouderdom in jare<br />

Het jy die fout in die grafiek hierbo opgemerk? Indien nie, kyk na die<br />

frekwensietabel op die vorige bladsy en korrigeer dit op die grafiek. (Die<br />

posisies van die histogram en frekwensiepoligoon vir die intervalle 36±40 en<br />

41±45 is foutief in die grafiek as 3 en 6in plaas van 2 en 7 onderskeidelik<br />

aangedui.)<br />

2.6 . bimodaal<br />

. positief skeef<br />

. leptokurties<br />

2.7 Variansie en standaardafwyking van motoriese aanlegtellings vir skofgroep 1<br />

(X1) en skofgroep 3 (X3)<br />

… X 1 † 2<br />

N<br />

s2 X1 = X2 1<br />

N 1 s2 X3 = X2 3<br />

= 13752<br />

9<br />

…368† 2<br />

10<br />

= 13752 13542;4<br />

9 =<br />

= 209;6<br />

9<br />

= 13369<br />

N 1<br />

9<br />

… X 3 † 2<br />

N<br />

…361† 2<br />

10<br />

13369 13032;1<br />

9<br />

= 336;9<br />

9<br />

= 23,28888 = 37,43333<br />

= 23,29 = 37,43<br />

p<br />

s = 23; 29<br />

X1<br />

p<br />

s = 37; 43<br />

X3<br />

= 4,82597 = 6,11800<br />

= 4,83 = 6,12<br />

. afdeling 4 toepassing<br />

X1 X2 1 X3 X2 3<br />

40 1 600 35 1 225<br />

32 1 024 38 1 444<br />

41 1 681 42 1 764<br />

28 784 29 841<br />

38 1 444 41 1 681<br />

32 1 024 33 1 089<br />

43 1 849 34 1 156<br />

37 1 369 48 2 304<br />

41 1 681 29 841<br />

361 29632 1 024<br />

Som 368 13 752 361 13 369<br />

bladsy 189


2.8 Verband tussen motoriese aanlegtellings (X) en produktiwiteitstellings (Y)<br />

van die hele groep (al drie skofgroepe)<br />

r = p<br />

=<br />

p<br />

N XY … X†… Y †<br />

‰N X 2 … X† 2 Š‰N Y 2 … Y † 2 Š<br />

30…142 550† …1 085†…3890†<br />

‰30…40 085† …1 085† 2 Š‰30…510 906† …3890† 2 Š<br />

4 276 500 4 220 650<br />

= p<br />

‰1 202 550 1 177 225Š‰15 327 180 15 132 100Š<br />

=<br />

=<br />

=<br />

p 55 850<br />

…25 325†…195 080†<br />

55 850<br />

4 940 401 000<br />

p 55 850<br />

70 287;98617<br />

= 0; 79458<br />

= 0; 79<br />

Daar is 'n sterk positiewe verband.<br />

" Hoekom sterk?<br />

Jy kan dit so interpreteer: Dit<br />

is net 0,01 minder as 0,80 (die<br />

onderste grens van sterk op die<br />

korrelasie-interpretasieskaal<br />

soos gegee in studie-eenheid 8).<br />

Hoe beter 'n persoon se motoriese aanleg, hoe hoeÈ r die persoon se<br />

produktiwiteitstelling.<br />

Vraag 3<br />

Voorspelling van werkprestasie (produktiwiteit) op grond van motoriese<br />

aanlegtellings deur 'n regressievergelyking op te stel.<br />

3.1 Motoriese aanleg Y = 129,67 (Y = Produktiwiteit)<br />

3.2 ^Y = bX ‡ a<br />

b =<br />

= 30…142 550† …1 085†…3890†<br />

= 4 276 500 4 220 650<br />

= 55 850<br />

X = 36,17 (X = Motoriese aanleg)<br />

N XY … X†… Y †<br />

N X 2 … X† 2 a = Y bX<br />

30…40 085† …1 085† 2 = 129,67 ± (2,21)(36,17)<br />

1 202 550 1 177 225 = 129,67 ± 79,9357<br />

25 325<br />

= 49,7343<br />

= 2,20533 = 49,73<br />

= 2,21<br />

Y = Y<br />

N<br />

X = X<br />

N<br />

ˆ 3890<br />

30<br />

ˆ 1 085<br />

30<br />

ˆ 129; 67<br />

ˆ 36; 17<br />

bladsy 190 . studie-eenheid 16 data-analise: 'n fiktiewe organisasie


3.3 ^Y ˆ 2; 21X ‡ 49; 73<br />

3.4 Vir X = 30:<br />

Y = 2,21(30) + 49,73<br />

= 66,3 + 49,73<br />

= 116,03<br />

3.5<br />

120<br />

100<br />

80<br />

60<br />

40<br />

20<br />

Vraag 4<br />

4.1 z = X<br />

4 Produktiwiteit<br />

^Y = 2,21X + 49,73<br />

a = 49,73 of (0; 49,73)<br />

4<br />

(30; 116,03)<br />

5 10 15 20 25 30 35 40<br />

Motoriese-aanlegtelling<br />

ˆ 32; 53 = 11; 98<br />

= 41 32; 53<br />

11; 98<br />

= 8; 47<br />

11; 98<br />

= 0,71<br />

4.2 z = X<br />

= 31 32; 53<br />

= 1; 53<br />

11; 98<br />

11; 98<br />

= 70,13<br />

. afdeling 4 toepassing<br />

bladsy 191


4.3<br />

4.4<br />

4.5<br />

(z = 0)<br />

z = 0,13<br />

z=70,13<br />

Vraag 5<br />

"<br />

"<br />

(z = 0 z = 0,71<br />

~<br />

"<br />

"<br />

~ ~<br />

z=0<br />

z=0,71<br />

Ondersoek of daar 'n verskil tussen die<br />

produktiwiteit van mans en vroue is.<br />

P(z ±0,13)<br />

= 0,4483<br />

P(z 4 0,71)<br />

= 0,2389<br />

= 23,89%<br />

bladsy 192 . studie-eenheid 16 data-analise: 'n fiktiewe organisasie<br />

P(70,13 < z < 0,71)<br />

= 0,0517 + 0,2611<br />

= 0,3128<br />

30 6 0,31287 = 9,38<br />

; 9 persone


5.1 Daar is geen verskil<br />

tussen mans en vroue<br />

se produktiwiteitstellings<br />

nie.<br />

H0 : M = V<br />

5.2 Daar is 'n beduidende<br />

verskil tussen<br />

mans en vroue se<br />

produktiwiteitstellings.<br />

5.3<br />

H1 : M = V<br />

t = XM XV q<br />

= 129;05 130;73<br />

=<br />

=<br />

= 1; 68<br />

p<br />

S 2 p<br />

N M ‡ S2 p<br />

N V<br />

231;54<br />

19<br />

‡ 231;54<br />

11<br />

1; 68<br />

p<br />

12; 186 ‡ 21; 049<br />

1; 68<br />

p<br />

33; 235<br />

5; 76<br />

= 70,29<br />

Mans XM Vrouens XV X2 M X2 V<br />

140 130 19 600 16 900<br />

120 118 14 400 13 924<br />

115 135 13 225 18 225<br />

130 140 16900 19 600<br />

153 128 23 409 16384<br />

148 145 21 904 21 025<br />

120 13614 400 18 496<br />

90 112 8 100 12 544<br />

146128 21 31616384<br />

140 11619 600 13 456<br />

130 150 16900 22 500<br />

140 19 600<br />

145 21 025<br />

130 16900<br />

130 16900<br />

142 20 164<br />

111 12 321<br />

102 10 404<br />

120 14 400<br />

S 2 452 1 438 321 468 189 438<br />

XM= XM<br />

N<br />

XV = XV<br />

N<br />

=129,05 = 130,73<br />

s2 M = X2 M<br />

N 1<br />

= 321 468<br />

18<br />

… XM† 2<br />

N<br />

…2 452† 2<br />

19<br />

s2 V = X2 V<br />

N 1<br />

= 189 438<br />

= 321 468 136 437;05<br />

18 =<br />

= 5030;947<br />

18<br />

= 1 452;18<br />

10<br />

… XV† 2<br />

N<br />

… 438† 2<br />

11<br />

189 438 187 985;82<br />

10<br />

10<br />

=279,50 = 145,22<br />

s 2 p =…NM 1†s 2 M ‡…NV 1†s 2 V<br />

NM ‡ NV 2<br />

18…279;50† ‡…10†…145;22†<br />

19 ‡ 11 2<br />

= 5031‡ 1452;20<br />

28<br />

Tweekantige toets<br />

df = NM + NV7 2 = 19 + 11 7 2=28<br />

ta =0,05 = 2,0484<br />

ta =0,01 = 2,7633<br />

. afdeling 4 toepassing<br />

= 231,54<br />

bladsy 193


Berekende t-waarde = 70,29<br />

|t| 5 t krities op 5% en op 1% -vlak.<br />

; Verwerp nie H0 nie<br />

; Kan nie met 99% sekerheid seà dat daar 'n verskil is tussen mans en vroue se<br />

produktiwiteit is nie, dit wil seà geen betekenisvolle verskil nie.<br />

Vraag 6<br />

Is daar 'n verskil tussen die produktiwiteitstellings van skofgroep 1 en skofgroep 3<br />

as jy persone met dieselfde dienstyd vergelyk?<br />

D = D<br />

N<br />

ˆ 64<br />

6<br />

s2 D = D2 … D† 2<br />

N<br />

N 1<br />

…64† 2<br />

6<br />

ˆ 10; 67<br />

= 4022<br />

5<br />

= 4022 682; 67<br />

5<br />

= ˆ<br />

3339; 33<br />

5<br />

= 667,87<br />

sD = s2 p p<br />

D ˆ 667; 87<br />

= 25,84<br />

H 0 : D =0<br />

H1 : D<br />

= 0<br />

df = N 7 1=5<br />

Tweekantige toets<br />

t0;05 = 2,5706<br />

t0;01 = 4,0321<br />

|t bereken|


Vraag 7<br />

Bepaal of daar 'n verskil tussen die motoriese-aanlegtellings van die<br />

ouderdomsgroep jonger as 30 (X) en die groep ouer as 40 (Y) is.<br />

H0 : X 1 = X2<br />

H1 : X 1 = X2<br />

t = X1 X2<br />

S2 1<br />

N1 ‡ S2 q<br />

2<br />

N2<br />

= 35; 18 37; 55<br />

=<br />

=<br />

= 2; 37<br />

q<br />

34;96<br />

11<br />

‡ 32;67<br />

11<br />

2; 37<br />

p<br />

3; 1782 ‡ 2; 97<br />

2; 37<br />

p<br />

6; 1482<br />

2; 480<br />

= 70,96<br />

Tweekantig<br />

df = N1 ‡ N2 2<br />

= 20<br />

t0;05 = 2,0860<br />

t0;01 = 2,8453<br />

|t|


Vraag 8<br />

8.1 Is daar 'n verskil tussen die ouderdomme van die drie skofgroepe?<br />

H 0: m 1 = m 2 = m 3<br />

H 1: m 1 = m 2 = m 3<br />

SS total = X 2 … X† 2<br />

ˆ 37 979<br />

N<br />

…1 031† 2<br />

30<br />

= 37 979 735 432,03<br />

= 2546,97<br />

SSgroup = n …Xj X::† 2<br />

= 10[(30,7 7 34,37) 2 + (34,1 734,37) 2 + (38,3 7 34,37) 2 ]<br />

= 10[(73,67) 2 +(7 0,27) 2 + 3,93) 2 ]<br />

= 10[13,468 + 0,072 + 15,444]<br />

= 10(28,984)<br />

= 289,84<br />

SSerror = SStotal 7 SSgroup<br />

= 2 546,97 7 289,84<br />

= 2 257,13<br />

X1 X2 X3 X2 1 X2 2 X3 2<br />

30 26 25 900 676 625<br />

23 31 37 529 961 1 369<br />

25 30 32 625 900 1 024<br />

19 27 44 361 729 1 936<br />

42 24 41 1 764 576 1 681<br />

24 55 28 5763 025 784<br />

43 48 461 849 2 304 2 116<br />

32 33 50 1 024 1 089 2 500<br />

28 25 41 784 625 1 681<br />

41 42 39 1 681 1 764 1 521<br />

S 307 341 383 10 093 12 649 15 237<br />

|‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚{z‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚} |‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚{z‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚}<br />

X ˆ 1031 X 2 ˆ 37 979<br />

X1 = 30,7<br />

X2 = 34,1<br />

X3 = 38,3<br />

X:: = 34,37<br />

Bron df SS MS F<br />

F0,05 & 3,35 Group 2 289,87 144,94 1,73<br />

F0,01 & 5,49 Error 27 2 257,1 83,60<br />

Fcalc < Fcrit Total 29 2 546,97<br />

; Verwerp nie H0 nie.<br />

; Daar is geen beduidende verskil tussen die ouderdomsgroepe van die<br />

verskillende skoftye nie.<br />

8.2 Jy het geen beduidende verskil tussen die ouderdomme van die drie<br />

skofgroepe gevind nie. Was jou reaksie op hierdie antwoord ``Wat daarvan?''<br />

Indien wel, is jy reg ± hierdie resultaat as sodanig het nie werklik praktiese<br />

waarde nie.<br />

bladsy 196 . studie-eenheid 16 data-analise: 'n fiktiewe organisasie


Vraag 9<br />

Die belangrikste boodskap vir jou is dus: Onthou dat statistiese ontledings<br />

altyd gedoen word met die oog daarop om vrae te beantwoord deur sinvolle<br />

resultate te bekom.<br />

Indien bepaalde resultate nie gebruikswaarde het nie, is dit sinloos om die<br />

berekeninge uit te voer. Dit is baie belangrik dat jy deurgaans 'n kritiese<br />

ingesteldheid sal behou!<br />

Is daar 'n betekenisvolle verskil in die produktiwiteit van die drie skofte?<br />

H 0 : m Skof 1 = m Skof 2 = m Skof 3<br />

H1 : mSkof 1 = mSkof 2 = mSkof 3<br />

X1 = Skof 1 X2 = Skof 2 X3 = Skof 3<br />

X1 = 130,9 X2 = 133,4 X3 = 124,7 X.. = 129,67<br />

X 1 X 2 X 3 X 2 1 X 2 2 X 2 3<br />

140 90 130 19 600 8 100 16 900<br />

120 140 142 14 400 19 600 20 164<br />

130 128 136 16900 16384 18 496<br />

115 146112 13 225 21 31612 544<br />

130 140 128 16900 19 600 16384<br />

118 145 11613 924 21 025 13 456<br />

153 130 111 23 409 16900 12 321<br />

135 140 150 18 225 19 600 22 500<br />

148 145 102 21 904 21 025 10 404<br />

120 130 120 14 400 16900 14 400<br />

1 309 1 334 1 247 172 887 180 450 157 569<br />

SStotal = X 2 … X† 2<br />

SX = 1 309 + 1 334 + 1 247 = 3 890<br />

SX 2 = 172 887 + 180 450 + 157 569 = 510 906<br />

N dftotal = N 1<br />

= 510 906<br />

…3890† 2<br />

30<br />

= 510 906<br />

101 124<br />

30<br />

= 510 906 7 504 403,33<br />

= 6502,67<br />

. afdeling 4 toepassing<br />

=307 1<br />

=29<br />

bladsy 197


SSgroup = n …Xj X::† 2<br />

dfgroup = k 7 1<br />

= 10‰…130; 9 129; 67† 2 ‡ =37 1<br />

…133; 4 129; 67† 2 ‡ …124; 7 129; 67† 2 Š =2<br />

= 10‰…1; 23† 2 ‡ …3; 73† 2 ‡ … 4; 97† 2 Š<br />

= 10‰1; 51 ‡ 13; 91 ‡ 24; 7Š<br />

= 401,27<br />

SSerror = SStotal SSgroup dferror = k(n 7 1)<br />

= 6502,67 7 401,27 = 3(10 7 1)<br />

= 6101,41 = 27<br />

MSgroup = SSgroup=dfgroup<br />

= 401,27 / 2<br />

= 200,64<br />

MSerror = SSerror=dferror<br />

= 6101,4 / 27<br />

= 225,98<br />

F = MSgroup<br />

MSerror<br />

= 200;64<br />

225;98<br />

= 0,89<br />

Bron df SS MS F<br />

Groep 2 401,27 200,60,89<br />

Fout 27 6101,40 225,98<br />

Totaal 29 6502,67<br />

Jou afleiding<br />

Kritieke waarde: F0,01 (2,27) = 5,49<br />

[Deur interpolasie: 27 grade van vryheid is halfpad tussen 26en 28 en die kritieke<br />

waarde van 5,49 is presies halfpad tussen 5,53 en 5,45.<br />

(5,53 + 5,45 = 10,98 7 2 = 5,49).]<br />

0,89 5 5,49<br />

; Kon nie H0 verwerp nie<br />

Daar is dus geen betekenisvolle verskil nie.<br />

bladsy 198 . studie-eenheid 16 data-analise: 'n fiktiewe organisasie


Jou antwoord aan die HUB<br />

``Alhoewel die gemiddeldes verskil en dus 'n verskil in produktiwiteit van die drie<br />

skofte weerspieeÈ l, is die verskil nie staties betekenisvol nie. Dit kan met 99%<br />

sekerheid afgelei word. Prakties gesproke, is daar geen rede vir jou aanvanklike<br />

kommer oor die vlak van produktiwiteit van enige van die drie skofte in ons<br />

maatskappy nie.''<br />

Vraag 10<br />

Is daar 'n betekenisvolle verskil tussen mans en vroue ten opsigte van die skof wat<br />

hulle verkies?<br />

Die frekwensies van antwoorde (in gebeurlikheidstabelformaat) is soos volg:<br />

Skof 1 Skof 2 Skof 3 Totaal<br />

Mans 60(40) 22(36) 30(36) 112<br />

Vroue 40(60) 68(54) 60(54) 168<br />

Totaal 100 90 90 280<br />

Die syfers in hakies is die verwagte frekwensies, wat volgens die onderstaande<br />

formule bereken is:<br />

Eij = Ri Cj<br />

N<br />

E11 =<br />

E12 =<br />

E13 =<br />

112 100<br />

280 = 40 E21 =<br />

112 90<br />

280 = 36 E22 =<br />

112 90<br />

280 = 36 E23 =<br />

2 = …O E† 2<br />

= …60 40†2<br />

= …20†2<br />

40<br />

= 400<br />

40<br />

E<br />

40 ‡<br />

‡ … 14†2<br />

36<br />

‡ 196<br />

36<br />

…22 36†2<br />

36 ‡<br />

‡ 36<br />

36<br />

‡ … 6†2<br />

36<br />

‡ 400<br />

60<br />

…30 36†2<br />

36 ‡<br />

‡ … 20†2<br />

60<br />

‡ 196<br />

54<br />

…40 60†2<br />

60 ‡<br />

…14†2<br />

‡ 54<br />

‡ 36<br />

54<br />

= 10 + 5,44 +1 +6,66 + 3,62 + 0,66<br />

= 27,38<br />

df = (R 7 1)(C 7 1)<br />

= (2 ± 1)(3 ± 1)<br />

= 2<br />

. afdeling 4 toepassing<br />

168 100<br />

280<br />

168 90<br />

280<br />

= 6 0<br />

= 54<br />

168 90<br />

280 ˆ 54<br />

‡ …6†2<br />

54<br />

…68 54†2<br />

54 ‡<br />

…60 54†2<br />

54<br />

bladsy 199


2<br />

2<br />

0;05…2† ˆ5; 99<br />

0:01 …2† ˆ9; 21<br />

27,41 > 5,99 27,41 > 9,21<br />

;Verwerp H0<br />

Interpretasie<br />

;Verwerp H0<br />

Daar is 'n betekenisvolle verskil tussen mans en vroue ten opsigte van die skof wat<br />

hulle verkies om te werk. Die aanname kan met 99 persent sekerheid gemaak<br />

word.<br />

Deur hierdie oefening het jy nou 'n oorsig gekry van sommige vrae waarmee 'n<br />

bedryfsielkundige te doen kan kry. In enige werksituasie is daar 'n verskeidenheid<br />

van probleme wat opgelos moet word of vrae wat beantwoord moet word. Dit is<br />

die taak van die bedryfsielkundige om hierdie probleme of vrae op 'n<br />

wetenskaplike manier te ondersoek en op te los of antwoorde te kry. Sodoende<br />

help die bedryfsielkundige mee om die maatskappy meer effektief te laat<br />

funksioneer en om die werkgewers sowel as die werknemers gelukkig te hou.<br />

bladsy 200 . studie-eenheid 16 data-analise: 'n fiktiewe organisasie


verwysings<br />

. afdeling 4 verwysings<br />

Aron, A. & Aron, E.N. (1994). Statistics for psychology. Englewood Cliffs, NJ:<br />

Prentice-Hall.<br />

Brown, T.S., & Brown, J.T. (1995). Prerequisite course grades and attitude<br />

toward statistics. College Student Journal, 29, 502±507.<br />

Christensen, L.B. (1994). Experimental methodology (6th ed). Boston: Allyn &<br />

Bacon.<br />

Cohen, J. (1992). A power primer. Psychological Bulletin, 112(1), 155±159.<br />

Fox, J.A., Levin, J., & Harkins, S. (1993). Elementary statistics in behavioral<br />

research. New York, NY: Harper Collins.<br />

Hair, J.F. (Jr), Anderson, R.E., Tatham, R.L. & Black, W.C. (1995). Multivariate<br />

data analysis: with readings (4th ed). Englewood Cliffs, NJ: Prentice-Hall.<br />

Howell, D.C. & Howell, C.T. (1995). Instructor's resource manual for fundamental<br />

statistics for the behavioral sciences (3rd ed). Belmont, CA: Duxbury.<br />

Johnson, D.E. (1989). An intuitive approach to teaching analysis of variance.<br />

Teaching of Psychology, 16(2), 67±68.<br />

Kaplan, R.M. (1987). Basic statistics for the behavioral sciences. Boston: Allyn &<br />

Bacon.<br />

Leedy, P.D. (1993). Practical research: Planning and design (5th ed). New York,<br />

NY: Macmillan.<br />

Leedy, P.D., & Ormrod, J.E. (2010). Practical Research: Planning and design. (9th<br />

ed). Upper Saddle River, New Jersey: Pearson.<br />

Lehman, R.S. (1991). Statistics and research design in the behavioral sciences.<br />

Belmont, CA: Wadsworth.<br />

McCall, R.B. (1986). Fundamental statistics for behavioral sciences (4th ed). San<br />

Diego: Harcourt Brace Jovanovich.<br />

Onwuegbuzie, A.J. (2000). Attitude toward statistics assessments. Assessment and<br />

Evaluation in Higher Education, 25(4), 321±339.<br />

bladsy 201


ladsy 202 . verwysings<br />

Porter, J.H. & Hamm, R.J. (1986). Statistics: Applications for the behavioral<br />

sciences. Monterey, CA: Brooks/Cole.<br />

Schau, C (2003). Students' attitudes: The ``other'' important outcome in statistics<br />

education. Joint Statistical Meetings, San Francisco, CA. Retrieved June, 24,<br />

2009, from the World Wide Web: http://evaluationandstatistics.com/<br />

JSM2003.pdf<br />

Spatz, C., & Johnston, J.O. (1984). Basic statistics: Tales of distributions (3rd ed).<br />

Monterey, CA: Brookes/Cole.<br />

Taylor, N., & Meyer, K. (2009). Personality characteristics of reality show<br />

applicants. Paper presented at the 15th South African Psychology Congress,<br />

12±14 August 2009, Cape Town, South Africa.<br />

Tredoux, C., & Durrheim, K. (eds.) (2002). Numbers, hypotheses and conclusions:<br />

A course in statistics for the social sciences. (1st ed). Lansdowne, Cape Town:<br />

UCT Press.


ylae: lys van formules<br />

middelpunt van klasinterval = WOG ‡<br />

persentielrang = % onder +<br />

…WBG WOG †<br />

2<br />

telling WOG<br />

klasintervalwydte<br />

(interval %)<br />

PR % onder<br />

telling van p = WOG ‡ interval % (intervalwydte)<br />

Mo = Most frequently occurring score<br />

Median Location =<br />

X ˆ X N<br />

N ‡ 1<br />

2<br />

Y ˆ Y N<br />

Range = Highest score minus lowest score<br />

s2 x ˆ X2 … X† 2<br />

N<br />

N 1<br />

s2 Y ˆ Y2 … Y† 2<br />

N<br />

N 1<br />

N XY X Y<br />

r ˆ<br />

‰N X2 … X† 2 Š‰N Y2 … Y† 2 p<br />

Š<br />

b ˆ<br />

sx ˆ S2 p<br />

x<br />

q<br />

sy ˆ S 2 y<br />

N XY … X†… Y†<br />

N X 2 … X† 2 a ˆ Y bX<br />

^Y ˆ bX ‡ a<br />

z ˆ X<br />

. afdeling 4 bylae<br />

bladsy 203


t ˆ<br />

D O<br />

p<br />

SD<br />

N<br />

df = N ±1<br />

t ˆ X1 X2<br />

s df = N1 +N2 ±2<br />

S 2 1<br />

N1<br />

‡ S2 2<br />

N2<br />

S 2 P ˆ …N1 1†s 2 1 ‡ …N2 1†s 2 2<br />

N1 ‡ N2 2<br />

SStotal = X 2 … X† 2<br />

SSgroup = n …Xj<br />

N<br />

X::† 2<br />

SSerror = SStotal ± SSgroup<br />

MSgroup =SSgroup /dfgroup<br />

F ˆ MSgroup<br />

MSerror<br />

w 2 =<br />

…O E†2<br />

E<br />

t ˆ X1 X2<br />

s<br />

S 2 p<br />

N1<br />

‡ S2 p<br />

N2<br />

dftotal = N ±1<br />

dfgroup = k ±1<br />

dferror = k(n ±1)<br />

MSerror = SSerror /dferror<br />

Eij ˆ Ri Cj<br />

N<br />

df = k ±1 df = (R ±1)(C ±1)<br />

bladsy 204 . bylae: lys van formules

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!