Mathematische Funktionen
Zeichen / Funktion
Beschreibung
Beispiel
Ergebnis
+
Addition
5 + 5
10
-
Subtraktion
9 - 3
6
*
Multiplikation
3 * 3
9
/
Division
9 / 3
3
^
Potenz
4 ^ 2
16
sqrt(x)
Quadratwurzel
sqrt(16)
4
abs(x)
Betrag
abs(-4)
factorial(x)
Fakultät
factorial(5)
120
Logische Abfragen
==
Gleichheit – prüft, ob zwei Werte identisch sind
2 == 2
TRUE
!=
Ungleichheit – prüft, ob zwei Werte verschieden sind
2 != 2
FALSE
>
Größer-als-Vergleich
4 > 2
<
Kleiner-als-Vergleich
4 < 2
>=
Größer-gleich-Vergleich
4 >= 4
<=
Kleiner-gleich-Vergleich
4 <= 4
&
Logisches UND – beide Bedingungen müssen wahr sein
2 == 2 & 5 == 4
|
logisches ODER
mindestens eine Bedingung muss wahr sein
2==2 | 5==4
Befehle
TabelleVerwaltung von Objekten
Befehl
Funktion
ls()
zeigt alle aktuell vorhandenen Objekte an
remove(x) oder rm(x)
remove(x)
rm(x)
löscht das Objekt x
x
Environment-Fenster (RStudio)
zeigt vorhandene Objekte grafisch an
Verwaltung von Vektoren
Mit eckigen Klammern [] kann man auf einzelne Elemente oder Teilbereiche eines Vektors zugreifen.
[]
Bedeutung
alter[1]
erstes Element
→ 18
namen[3]
drittes Element
→ "Lisa"
alter[2:4]
Elemente 2 bis 4
→ 27, 38, 47
namen[c(1,5)]
bestimmte Reihenfolge
→ "Thomas", "Gerrit"
alter[-1]
alle außer dem 1. Element
→ 27, 38, 47, 63
namen[-(1:3)]
alle außer den ersten drei
→ "Christian", "Gerrit"
:
Doppelpunkt-Notation, Um Zahlenreihen automatisch zu erzeugen
1:5
→ erzeugt die Werte 1, 2, 3, 4, 5
rep(____, times = )
rep(____, each= , times=2)
Wiederholung
rep(1:5, times=3)
ganze Reihe wird 3x wiederholt
rep(1:3, each=3, times=2)
jede Zahl wird 3× wiederholt, Reihe 2×
seq(from= , to= , by= )
seq(from= , to= , by=- )
seq(______, length.out= )
Sequenzen mit Start, Ende und Schrittweite
Sequenz absteigend
Genannten Werte werden gleichmäßig nach length.out bestimmter Anzahl verteilt
seq(from=3, to=9, by=0.5)
= 3, 3.5, 4, ..., 9
seq(from=5, to=-5, by=-1)
= absteigend von 5 bis -5
seq(1.5, 8.2, length.out=9)
=9 Werte gleichmäßig verteilt zwischen 1.5 und 8.2
head(x)
zeigt die ersten 6 Elemente
head(sequenz)
= 0,1,2,3,4,5
tail(x, anzahl(n))
zeigt die letzten (Anzahl) Elemente
tail(alter, 10)
= 91-100
length(x)
gibt Anzahl der Elemente
length(sequenz)
=101 (0 bis 100)
Tabellen
Konzept
Data Frame
Tabelle mit Spalten (Vektoren) gleicher Länge
data.frame()
Spaltenzugriff
Zugriff mit $
$
daten2$punkte
Tabellenansicht
Öffnet Editor-Ansicht
View(daten2)
Löschen von Objekten
Entfernt Objekte aus dem Environment
remove(objekt)
Häufigkeiten
Zeigt, wie oft bestimmte Werte vorkommen (z. B. wie viele Personen ein bestimmtes Alter haben).
table(daten2$alter)
table(daten2$punkte)
Minimum
kleinster Wert
min(daten2$alter)
Maximum
größter Wert
max(daten2$alter)
Wertebereich
größter u. kleinster Wert zsm
range(daten2$alter)
Arithmetisches Mittel
Durchschnitt
mean(daten2$alter)
Zusammenfassung
Statistik-Übersicht (Minimum, 1. Quartil, Median, Mittelwert, 3. Quartil, Maximum) aus.
summary(daten2§alter)
Grafik aus einer Tabelle generieren
plot( )
Streudiagramm
plot(daten2$alter, daten2$einkommen,
xlim = c(_____)
Achsenbegrenzung der X-Achse
xlim = c(0, 70)
ylim = c(____)
Achsenbegrenzung der Y-Achse
ylim = c(0, 2500)
main =
Titel der Grafik
main = "Streudiagramm"
ylab =
Beschriftung Y Achse
ylab = “Einkommen”
xlab =
Beschriftung X Achse
xlab = “Alter”
col =
Farbe der Punkte
col = “red”
pch =
*plotting character (Punktsymbole)
pch = 19
gefüllter Kreis (Standard in vielen Beispielen
cex =
Punktgröße
normal: 2
*pch
Symbol
0
□
offenes Quadrat
1
○
offener Kreis
2
△
offenes Dreieck nach oben
Plus-Zeichen
×
Kreuz
5
◊
offener Diamant
▴
gefülltes Dreieck
15
■
gefülltes Quadrat
●
gefüllter Kreis
17
▲
18
◆
gefüllter Diamant
19
● (etwas größer)
gefüllter Punkt (häufig genutzt)
Hilfe in R
help(mean) ODER ?mean
um im Reiter “help” (unten rechts im RStudio) Hilfe zu bekommen
Beschreibung der Funktion
Erklärung der Argumente
Beispiele zur Anwendung
Tipp:
Mit Klick auf das Haus-Symbol im „Help“-Fenster gelangt man zu einer Übersicht nützlicher Seiten.
Wenn der Cursor in einer Funktion steht, kann auch die Taste F1 gedrückt werden.
Objekte
Grundprinzip: R ist eine objektbasierte Befehlssprache.→ Alles, was in R erstellt oder berechnet wird, wird als Objekt gespeichert.
Ein Objekt kann z. B. enthalten:
einen einzelnen Wert (z. B. x <- 3),
x <- 3
mehrere Werte (z. B. Vektoren oder Listen),
Variablen oder Datensätze,
oder Ergebnisse von Berechnungen oder Analysen.
Regeln für Objektnamen
Muss mit einem Buchstaben beginnen.
Darf Buchstaben, Ziffern, Unterstriche _ und Punkte . enthalten.
_
.
Keine Umlaute oder Sonderzeichen (z. B. ä, ß).
Kleinschreibung empfohlen, da R case sensitive ist:
x ≠ X.
X
Zuweisung (Werte speichern)
erfolgt mit dem Zuweisungspfeil <-aus < und -
<-
💡 Tipp: Tastenkombination Alt + - erzeugt <- automatisch mit Leerzeichen.
Beispiel:
x <- 32
→ erstellt ein Objekt namens x mit dem Wert 32. Das Objekt kann dann in weiteren Berechnungen verwendet werden:
32
x + 5
Ergebnis: 37
37
Überschreiben:
x <- 42
→ ersetzt den alten Wert (32) durch den neuen (42).
Befehle Gesamt:
x <- 32 # Objekt erstellen
x + 5 # mit Objekt rechnen
x <- 42 # Objekt überschreiben
ls() # alle Objekte anzeigen
rm(x) # Objekt löschen
Vektor
= Grundbausteine vieler Datenstrukturen in R (z. B. Data Frames) = wie eine Spalte in einer Tabelle. z. B. das Alter, Einkommen oder die Namen mehrerer Personen.
➡️ Ein Vektor enthält mehrere Werte gleichen Typs (Zahlen oder Text). Jeder Wert hat eine Position (Index), beginnend bei 1.
Vektoren erstellen
Mit der Funktion c() (für concatenate = verbinden) werden mehrere Werte zu einem Vektor zusammengefasst:
c()
alter <- c(18, 27, 38, 47, 63)
namen <- c("Thomas", "Julia", "Lisa", "Christian", "Gerrit")
! Alle Werte eines Vektors müssen vom gleichen Datentyp sein.
alter ist ein numerischer Vektor
alter
namen ist ein Textvektor (character) → Text immer in Anführungszeichen!
namen
Tabelle
Grundprinzip: Ein Vektor entspricht einer Spalte einer Tabelle.Mehrere Vektoren gleicher Länge können zu einer Tabelle zusammengefasst werden.
➡️ In R heißen Tabellen data.frame (engl. Datenrahmen).
data.frame
Tabelle aus 2 vorhandenen Vektoren erstellen:
Vektor 1: namen <- c("Thomas", "Julia", "Lisa", "Christian", "Gerrit")
Vektor 2: alter <- c(18, 27, 38, 47, 63)
Tabelle erstellen: daten1 <- data.frame(namen, alter)
Tabelle ohne vorhandene Vektoren direkt erstellen:
daten2 <- data.frame(
name = c("Oliver", "Julia", "Thomas", "Stefanie", "Daniel"),
alter = c(32, 38, 49, 35, 52),
punkte = c(12, 18, 6, 14, 9),
einkommen = c(1900, 2000, 1800, 2200, 1600))
➡️ daten2 enthält jetzt vier Spalten und fünf Zeilen(n = 5 Personen, m = 4 Merkmale).
daten2
Befehle:
Mit $ kannst du auf einzelne Spalten zugreifen:
daten1$alter # gibt Alterswerte der Tabelle daten1
daten2$name # gibt die Namen der Tabelle daten2
Achtung: In R müssen fehlende Werte (NA) aktiv ausgeschlossen werden, damit Berechnungen funktionieren.
NA
Fehlende Werte werden in R durch NA (Not Available) dargestellt.
Sie treten häufig in realen Datensätzen auf, z. B. wenn Befragte keine Angabe machen.
beispiel_na <- c(1900, 2000, 1800, 2200, NA)
→ Der letzte Wert ist fehlend.
Problem, wenn man direkt Berechnung durchführen möchte, gibt R NA aus, da fehlende Werte das Ergebnis ungültig machen.
Lösung: Mit dem Argument na.rm = TRUE (remove NAs = TRUE) werden fehlende Werte ignoriert:
na.rm = TRUE
Beispiel: min(beispiel_na, na.rm = TRUE)
max(beispiel_na, na.rm = TRUE)
Statt TRUE kann auch das Kürzel T verwendet werden.
T
Grafiken
wird noch aufgefüllt in Kapitel 7
Shortcuts
1. Neue Skript-Datei öffnen: Strg + Shift + N
2. Bestehende Skript-Datei öffnen: Strg + O
3. Neuen Abschnitt in R-Skript erstellen: Strg + Shift + R
4. Codezeile in R-Skript ausführen: Strg + Eingabetaste (Enter)
5. Zuweisungspfeil erstellen: Alt + Minus (-)
Last changed8 days ago