Buffl

RStudio

CC
by Cathérine C.

Befehle


TabelleVerwaltung von Objekten

Befehl

Funktion

ls()

zeigt alle aktuell vorhandenen Objekte an

remove(x) oder rm(x)

löscht das Objekt x

Environment-Fenster (RStudio)

zeigt vorhandene Objekte grafisch an

Verwaltung von Vektoren

Mit eckigen Klammern [] kann man auf einzelne Elemente oder Teilbereiche eines Vektors zugreifen.

Befehl

Bedeutung

Beispiel

alter[1]

erstes Element

→ 18

namen[3]

drittes Element

→ "Lisa"

alter[2:4]

Elemente 2 bis 4

→ 27, 38, 47

namen[c(1,5)]

bestimmte Reihenfolge

→ "Thomas", "Gerrit"

alter[-1]

alle außer dem 1. Element

→ 27, 38, 47, 63

namen[-(1:3)]

alle außer den ersten drei

→ "Christian", "Gerrit"

:

Doppelpunkt-Notation, Um Zahlenreihen automatisch zu erzeugen

1:5

→ erzeugt die Werte 1, 2, 3, 4, 5

rep(____, times = )

rep(____, each= , times=2)

Wiederholung

rep(1:5, times=3)

ganze Reihe wird 3x wiederholt

rep(1:3, each=3, times=2)

jede Zahl wird 3× wiederholt, Reihe 2×

seq(from= , to= , by= )


seq(from= , to= , by=- )


seq(______, length.out= )

Sequenzen mit Start, Ende und Schrittweite


Sequenz absteigend


Genannten Werte werden gleichmäßig nach length.out bestimmter Anzahl verteilt

seq(from=3, to=9, by=0.5)

= 3, 3.5, 4, ..., 9


seq(from=5, to=-5, by=-1)

= absteigend von 5 bis -5


seq(1.5, 8.2, length.out=9)

=9 Werte gleichmäßig verteilt zwischen 1.5 und 8.2


head(x)

zeigt die ersten 6 Elemente

head(sequenz)

= 0,1,2,3,4,5

tail(x, anzahl(n))

zeigt die letzten (Anzahl) Elemente

tail(alter, 10)

= 91-100

length(x)

gibt Anzahl der Elemente

length(sequenz)

=101 (0 bis 100)

Tabellen

Konzept

Beschreibung

Beispiel

Data Frame

Tabelle mit Spalten (Vektoren) gleicher Länge

data.frame()

Spaltenzugriff

Zugriff mit $

daten2$punkte

Tabellenansicht

Öffnet Editor-Ansicht

View(daten2)

Löschen von Objekten

Entfernt Objekte aus dem Environment

remove(objekt)

Häufigkeiten

Zeigt, wie oft bestimmte Werte vorkommen (z. B. wie viele Personen ein bestimmtes Alter haben).

table(daten2$alter)

table(daten2$punkte)

Minimum

kleinster Wert

min(daten2$alter)

Maximum

größter Wert

max(daten2$alter)

Wertebereich

größter u. kleinster Wert zsm

range(daten2$alter)

Arithmetisches Mittel

Durchschnitt

mean(daten2$alter)

Zusammenfassung

Statistik-Übersicht (Minimum, 1. Quartil, Median, Mittelwert, 3. Quartil, Maximum) aus.

summary(daten2§alter)

Grafik aus einer Tabelle generieren

plot( )

Streudiagramm

plot(daten2$alter, daten2$einkommen,

xlim = c(_____)

Achsenbegrenzung der X-Achse

xlim = c(0, 70)

ylim = c(____)

Achsenbegrenzung der Y-Achse

ylim = c(0, 2500)

main =

Titel der Grafik

main = "Streudiagramm"

ylab =

Beschriftung Y Achse

ylab = “Einkommen”

xlab =

Beschriftung X Achse

xlab = “Alter”

col =

Farbe der Punkte

col = “red”

pch =

*plotting character (Punktsymbole)

pch = 19

gefüllter Kreis (Standard in vielen Beispielen

cex =

Punktgröße

normal: 2

*pch

Symbol

Beschreibung

0

offenes Quadrat

1

offener Kreis

2

offenes Dreieck nach oben

3

+

Plus-Zeichen

4

×

Kreuz

5

offener Diamant

6

gefülltes Dreieck

15

gefülltes Quadrat

16

gefüllter Kreis

17

gefülltes Dreieck

18

gefüllter Diamant

19

● (etwas größer)

gefüllter Punkt (häufig genutzt)


Tabelle

Grundprinzip: Ein Vektor entspricht einer Spalte einer Tabelle.Mehrere Vektoren gleicher Länge können zu einer Tabelle zusammengefasst werden.

➡️ In R heißen Tabellen data.frame (engl. Datenrahmen).


Tabelle aus 2 vorhandenen Vektoren erstellen:

Vektor 1: namen <- c("Thomas", "Julia", "Lisa", "Christian", "Gerrit")

Vektor 2: alter <- c(18, 27, 38, 47, 63)


Tabelle erstellen: daten1 <- data.frame(namen, alter)


Tabelle ohne vorhandene Vektoren direkt erstellen:

daten2 <- data.frame(

name = c("Oliver", "Julia", "Thomas", "Stefanie", "Daniel"),

alter = c(32, 38, 49, 35, 52),

punkte = c(12, 18, 6, 14, 9),

einkommen = c(1900, 2000, 1800, 2200, 1600))

View(daten2)

➡️ daten2 enthält jetzt vier Spalten und fünf Zeilen(n = 5 Personen, m = 4 Merkmale).


Befehle:

  • Mit $ kannst du auf einzelne Spalten zugreifen:

    • daten1$alter # gibt Alterswerte der Tabelle daten1

    • daten2$name # gibt die Namen der Tabelle daten2


Konzept

Beschreibung

Beispiel

Data Frame

Tabelle mit Spalten (Vektoren) gleicher Länge

data.frame()

Spaltenzugriff

Zugriff mit $

daten2$punkte

Tabellenansicht

Öffnet Editor-Ansicht

View(daten2)

Löschen von Objekten

Entfernt Objekte aus dem Environment

remove(objekt)


Achtung: In R müssen fehlende Werte (NA) aktiv ausgeschlossen werden, damit Berechnungen funktionieren.

  • Fehlende Werte werden in R durch NA (Not Available) dargestellt.

  • Sie treten häufig in realen Datensätzen auf, z. B. wenn Befragte keine Angabe machen.

  • beispiel_na <- c(1900, 2000, 1800, 2200, NA)

    → Der letzte Wert ist fehlend.

  • Problem, wenn man direkt Berechnung durchführen möchte, gibt R NA aus, da fehlende Werte das Ergebnis ungültig machen.

Lösung: Mit dem Argument na.rm = TRUE (remove NAs = TRUE) werden fehlende Werte ignoriert:

  • Beispiel: min(beispiel_na, na.rm = TRUE)

    max(beispiel_na, na.rm = TRUE)

    • Statt TRUE kann auch das Kürzel T verwendet werden.



Author

Cathérine C.

Information

Last changed