Grafiken und Statistik in R
Grafiken und Statistik in R
Grafiken und Statistik in R
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
2 Daten<br />
log(...) # natürlicher Logarithmus<br />
log10(...) # 10er Logarithmus<br />
exp(...) # Exponentialfunktion<br />
sqrt(...) # Wurzel<br />
abs(...) # Absolutbetrag<br />
##trigonometrische Funktionen:<br />
s<strong>in</strong>(...), cos(...), tan(...), as<strong>in</strong>(...), acos(...), atan(...)<br />
##hyperbolische Funktionen:<br />
s<strong>in</strong>h(...), cosh(...), tanh(...), as<strong>in</strong>h(...), acosh(...), atanh(...)<br />
gamma(...) # Gammafunktion<br />
� siehe auch Kapitel Transformieren auf Seite 25.<br />
2 Daten<br />
2.1 Allgeme<strong>in</strong>es<br />
Daten verwalten ist das A <strong>und</strong> O. Deshalb bei großen Daten (immer) e<strong>in</strong>e Datenbank anlegen, <strong>in</strong> der Tabellen<br />
über e<strong>in</strong>deutige Nummern, sogenannte ID’s verknüpft s<strong>in</strong>d. Freie Datenbanken: http://de.openoffice.org/ BASE,<br />
MySQL (mit Server http://www.apachefriends.org/de/xampp.html).<br />
Abbildung 1: Datenbankschema mit verknüpften<br />
Tabellen, die über e<strong>in</strong>deutige,<br />
numerische id’s verknüpft s<strong>in</strong>d. Abfragen<br />
wie: Zeige mir Arten, pH-Wert<br />
mit den <strong>und</strong> den Proben an, s<strong>in</strong>d leicht<br />
<strong>und</strong> flexibel möglich. Abfragen dieser<br />
Art allgeme<strong>in</strong> mit: SELECT spalte1,<br />
spalte2 ... FROM tabelle WHERE<br />
tabelle.spalte=bed<strong>in</strong>gung<br />
Tab.: samplecode<br />
id<br />
name<br />
memo<br />
Tab.: data<br />
id<br />
id.samplecode<br />
id.genus<br />
id.species<br />
time<br />
time_memo<br />
Tab.: genus<br />
id<br />
name<br />
memo<br />
Tab.: species<br />
id<br />
name<br />
memo<br />
Falls der Datenumfang kle<strong>in</strong> ist, dann immer(!) e<strong>in</strong>e fortlaufende Tabelle anlegen mit Spalten als Variablen <strong>und</strong><br />
neuen Daten als Zeilen. Diese Daten lassen sich dann mit Hilfe des Datenpilotes (<strong>in</strong> http://de.openoffice.org/<br />
Calc) oder dem PIVOT Tabellen - Assistenten (Excel) schnell <strong>und</strong> flexibel(!) auswerten.<br />
Für die Datenbankverb<strong>in</strong>dung benutze man RODBC oder RMySQL (s. auf der nächsten Seite) <strong>und</strong> um Textdokumente<br />
mit zu verb<strong>in</strong>den benutze man das Paket odfWeave oder die Funktion Sweave() aus dem Paket utils<br />
(S.142).<br />
2.2 Gr<strong>und</strong>legendes <strong>in</strong> R<br />
Arbeitsverzeichnis festlegen mit setwd(""). Anzeigen läßt es sich mit getwd() setwd("")<br />
getwd()<br />
setwd("C:/Media/Eigene Dateien/Dokumente/Praktikum/R")<br />
# oder<br />
setwd("C:\\Media\\Eigene Dateien\\Dokumente\\Praktikum\\R")<br />
Um sich alle Dateien des Arbeitsverzeichnisses anzuzeigen gibt man den Befehl dir() e<strong>in</strong>. dir()<br />
Löschen kann man e<strong>in</strong> Objekt mit rm("") für remove. Umgekehrt lassen sich alle Objekte durch ls() anzeigen. rm("")<br />
13