12.07.2015 Views

Noter om R - Københavns Universitet

Noter om R - Københavns Universitet

Noter om R - Københavns Universitet

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Den resulterende tekstfil output.csv kan åbnes direkte i (dansk) Excel ved at dobbeltklikke på den, ogden kan importeres i amerikansk OpenOffice.Bemærk, at hvis man udeladerrow.names=FALSEtil de to funktionerwrite.csv ogwrite.csv2vil der k<strong>om</strong>me en ekstra kolonne med rækkenumrene, hvilket fint kan indlæses i regnearket men måskeer lidt redundant.10.6 Overblik over et datasætFunktionensummary beregner mindste værdi, største værdi, middelværdi, kvartiler og andre oplysninger<strong>om</strong> et datasæt. Hvisder datasættet indlæst i afsnit 10.1.1, giversummary dette resultat:> summary(d)Tid Kontrol VaekstMin. : 30.0 Min. :5.430 Min. :5.3101st Qu.: 101.2 1st Qu.:5.485 1st Qu.:5.330Median : 225.0 Median :5.735 Median :5.345Mean : 287.2 Mean :5.776 Mean :5.4783rd Qu.: 367.5 3rd Qu.:5.990 3rd Qu.:5.560Max. :1440.0 Max. :6.450 Max. :6.070Når du har indlæst et datasæt er det en god idé at bruge summary til at undersøge <strong>om</strong> det ser rimeligtud. Desuden kan du bruge oplysningerne <strong>om</strong> mindste og største værdi til at vælge aksegrænser ud fra nårdu plotter datasættet; se afsnit 5.2.Hvis væksthormonforsøgsdatasættet havde været indlæst forkert således at søjlerne Kontrol ogVaekst var blevet opfattet s<strong>om</strong> tekst i stedet for tal (se afsnit 10.1.1) ville summary afsløre det meddet samme:> summary(fejl)Tid Kontrol VaekstMin. : 30.0 5,43 : 2 5,34 :41st Qu.: 101.2 5,44 : 1 5,31 :2Median : 225.0 5,45 : 1 5,32 :2Mean : 287.2 5,47 : 1 5,33 :23rd Qu.: 367.5 5,49 : 1 5,35 :1Max. :1440.0 5,52 : 1 5,37 :1(Other):13 (Other):8Bemærk at de to forkerte søjler ikke vises med de sædvanlige kvartiler.Summary fortæller ikke hvor mange rækker, der er i det indlæste datasæt. For at få denne oplysningkan man bruge funktionennrow:> nrow(d)[1] 20Tilsvarende kunne man bruge funktionen ncol til at få oplyst antal søjler. Bådenrow ogncol virkerogså for matricer (afsnit 16).S<strong>om</strong> supplement til at kontrollere en indlæsning med summary kan man ønske at se de første ellersidste rækker i datasættet. Funktionerne head og tail kan bruges til dette. S<strong>om</strong> standard viserfunktionerne de første hhv. sidste 6 rækker, men dette antal kan ændres:39

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!