Was ist Deskriptive Statistik?
Beschreibende Statistik, d.h. numerische oder graphische Darstellung des erhobenen Datenmaterials sowie aufdeckung der Verhältbnisse verschiedener Massen zueinander
Was ist die induktive Statistik?
Schließende Statistik, d.h. eine auf Wahrscheinlichtskeitstheorie funtiderte Statistik, die aus den Beobachtungen allgemeingültige Aussagen lieger.- Ihr Gegenstand ist die Schätzung von unbekannten Parametern und das Prüfen von Hypothesen
Was bedeutet Grundgesamtheit?
Die Menger alle Elemente, über die eine gewisse Aussage getroffen werden soll
Beispiel: Die Grundgesamtheit besteht aus allen Personen/Objekten/Fällen, die prinzipiell befragt werden könnten
Was sit eine Stichprobe
Teilmenge der Gesamtheit
Was ist ein Probant/Entität?
Das einzelne, zu untersuchende Element: Merkmalsträger
Was ist eine Variable
die zu erhebende Größe
Das Merkmal des Probanten
Was ist eine Variablenausprügung
Der, der die Variable besitzt
Was sind Qualitative Variablen?
Daten habe qualitative Eingeschaften, sofern sie nicht metrisch bzw. quantitativ zu fassen sind
Was sind Quantitative Variablen?
Daten sind quantitativer Aret, sofern sie zahlenmäßig quantifizierbar sind(also mit Zahlen zu identifizieren sind, bzgl Ihrem Wert eindeutig interpretierbar)
Was sind Dichotome Variablen
Variablem die nur zwei qualitativ unterschiedlichen Merkmalsausprügungen haben heißen dichotom
Was sind Kategoriale Variablen?
Variablen die mehrere qualitative unterschiedliche Merkmalsausprägungen beseitzen heißen kategorial
Beispiel Regilion (Christ, Kath, Ev, Mos)
Geschlecht(Men,Wei,Div)
Was sind stetige Variablen?
Ein Merkmal heißt stetig, wenn seine Auspr ̈agungen beliebige Zahlenwerteaus einem Intervall annehmen k ̈onnen (z.B. L ̈ange, Gewicht).
Ein Merkmal heißt stetig, falls es in einem bestimmten Intervall alle reelen Zahlen annhemen kann, gleichgültig ob dies Meßgenauigkeit zulässt oder nicht
Ein MErkmal ist steig, wenn es unendliche viele Ausprägungen möglich sind
Beispiel Welche Zeit benötigen Sie fürr einen 100 Meter Sprint?
11,7 Sekunden oder 12,754321 Sekunden….
Als stetig wird eine statische Variable bezeichnet, bei der alle Werte eines Interrvalls als Realisationen möglich sin; d.h. es gibt überzählbar viele Realisationsmöglichkeiten.
BeispieL: BMI kann verschiedene werte aus [0;90] annehmen
Was sit eine Statische Variable?
Eine statische Variable X ist eine Zuordnung, die jedem Element der Grundgesamtheit genau einen Zahlenwert zuordnet
Beispiel: Kaltmiete von Studenten. QAnna und Ahmed sind Studiten und gehöären zur Grundgesamtheit aller Studenten in Deutschland
Anna X= 280€ Ahmend X=33
Was sind diskrete Variablen
Ein MErkmal ist diskret, wenn nur eine begrenze Anzahl an ausprägungen möglich ist
Welche europäischen Haupstaße haben Sie bereits besucht?
Ein MErkmal heißt diskret wenn sich die einzelnen Ausprägungen immer um ganze,m nicht mehr teilbare größen unterscheiden
Nur ganze Zahlen könne vorkommen, diese könne gezählt werden bzw. sind Abzählbar
Ein Merkmal heißt diskret, wenn seine Auspr ̈agungen bei geeigneter Skalie-rung (bzw. Kodierung) nur ganzzahlige Werte annehmen k ̈onnen (z.B. Feh-lerzahlen, Schulnoten, Geschlecht). Diskrete Merkmale haben abzählbar viele Ausprägungen.
Als Diskret wird eine statische Variable bezeichnet, bei der die Anzahl der Realisationsmöglichkjeiten endlich oder abzählbar undendlich ist.
Nominalskala
Diese Skala wird bei Merkmalen verwendet, bei denen diue Ausprägung keine natürliche Reihenfolge bilden, sonder gelcihberechtigt nebeneinanderstehen
Beispiel
Geschlecht oder Religion
Mann kann keine unterscheidung treffen welches Merkmal besser ist
Ordinalskala
Diese Skala wird bei Merkmalen verwendet, bei dene eine natürliche Rangordnung existiert. die Abstände zwischen Mermalsausprägung aber nicht quantifizierbat sind
Nicht messbarer Abstand der Rangordnung, Abstand zwischen den Ausprägungen ist nicht Messbar.
Zumbeispiel Zufriedenheit, abstand zwischen gut und sehr gut nicht messbar
Metrische Skala
Beispiel:
9 Kunden bei einer Bank sind besser als 4 Kunden
Modus
Der Modus MO ist derjenige Mermalswert x für den relative Häufigkeit h(x) ihr Maximum annimmt: alkso der häufigste Wer.
Bei stitigen Merkmalen gibt man die modale Klasse an:
das ist die Klasse mit der größten Höäufigkeitsdichte f(x)
Anwendung:
Nominal, ordinal metrisch-skalierten Daten
Eigenschaften
Modus ist der Lageparameter für nominale Daten!
Modus hat nur bei eingipfeligen Verteilungen Aussagekraft
Modus ist sehr informationsarmt: die Verteilung der Werte wird so gut wie gar nicht berücksichtigt
{1,1,1,4,5,7} Modalwert = 1 da er 3x vorkommt
Mediam
Der Median Me ist der Wert, der die geordnete Urliste in zwei Hälften teilt
Anwendung bei ordinal und metrisch-skalierten Daten
Eingeschaften:
Median darf bei ordinal-skalierten Daten genutzt werden
Median bleibt von extremen Werten(Ausreißern unbeinflusst
Median verlässt nicht die Ausgangsmenge
Median minimiert die Summe der absoluten Abweichungen von Mittel
Median Stelle = Anzahl der Elemente + 1 / 2 bei ungeraden Listen
gerade Anzal an Werten die beiten mittleren Werte addieren und durch 2 Teilen
Arithmetisches Mittel
Welcher Lageparamter für welche Daten?
Modus?
Median?
Arth Mittel?
Geometrisches Mittel
Formel?
Anwendung?
Das geopmetrische Mittel GM ist die n-te Wurzel aus dem Produkt der n merkmalswerte
Anwendung
Bei der Mittelung voin multiplikation verknüpfen, metrisch skalierten Mermalswerten(Wachstumsraten)
Streuungsparameter
Spannweite
Die Differenz zwischen gröxtem Xmax und kleinstem Xmin
Merkmalswert wird als Spannweite oder Range R definiert
R = Xmax- Xmin
eingeschränkt bei ordinal, v.a. bei metrischen Danten
Einfach zu brechnen und sollte standartmäßig als erste Orientierung angegeben werden
Große Zahl, besonders empflindlich auf Extremwerte
Quartile & Interquartilsabstand(IQR)
Definition
Was ist IQR
Einsatz
Qartile teilen die geordnete Urliste in viertel Teile:
X0 = Min
X25 = Wert der 25% der Werte unter sich hat
X50 Median
X75 = Werte der 75% der Werte unter sich hat
x100 = Max
IQR = mittlere Spannbreite, zeigt an wie weiter die mittleren 50% zusammenliegen.
Ist der Wer kleiner als die Hälfte der Spannbreite dann herscht hier eine stärklere Dichte
IQR wird für den Boxplot gebraucht - er bildet den Kasten
Einbsatz
ordinale und metrische Daten
Bei ordinal IQR problematisch
Wie berechnet man Perzentile
Was bedeutet das 95. Perzentil?
Perzentilie teilen die Messwerte in 100 gleiche Einheiten auf
Das Perzentil eines Messwerts gibt dir Auskunft darüber, welcher Anteil der Verteilung über oder unter diesem Messwert liegt. Betrachtest du beispielsweise das 95. Perzentil, bedeutet das, dass 95% der Messwerte kleiner als oder gleich groß wie der Messwert des 95. Perzentils sind.
Boxplot/Kastenlogik
Über was ibt er auskunft?
Wie sieht so ein Boxplot aus?
Boxplot liefert infop über+
Minimum
Unteres Quartil
Median
Oberes Quantil
Maximum
Rechteck vom unteren bis oberen bis unteren Quartil. 2 Whsier die Rrechteckt mit Minimum und maximum verbinden, Median als vertikaler Strick in der Box
Whisker > 1,5 der der box alle werte als Ausreiser
Berechnung: q3 - q1 * 1,5 = Wert dann vom q1 wert abziehen und bei q3 wert addierren
Streuungsparamter: durchschnittliche absolute Abweichung
Als durchschnittlich absolute abweichung d der MErmalswerte x1, x2, x3, … , xn von dem arith. Mittel definiert man die Größe:
Anwendung bei metrisch skalierten Daten
Eigenschafte.
Wert ist naheliegend, aber duirch den Betrag in der Regel schwieriger zu berechnen
Ohne Betrag sog. Nulleffekt
Kann für Arithmetisches Mittel, Modus und Median gemacht werden
Streuungsparameter Varianz
Die Varianz v ist das arithmetische Mittel des quadrierten Aberweichungen der Ausgangsdaten von Ihrem Mittelwert und heißt auch quadratische Abweichung
Anwedung bei metrisch-saklierten Daten
Mittlere quadratische Abweichung vom arithmetischen Mittel
Die Varianz besitzt die Mimension eines Quadrats der Maßeinheit des MErkmals x
die Varianu gewichtet größere Abweichungen vom AM stärker als die Standardabweichung
Streuungsparameter: Standardabweichung
Die Standardabweichung ist die Wurzel aus der Varianz
bei metrisch-skalierten Daten
Eigenschaften:
Die Standardabweichung besitzt die Dimension der Maßeinheit des Merkmals X
Sie bleibt bei der Addition einer Konstanten zu den Ausgangsdaten unverändert und ändert sich bei Multiplikation der daten mit einem Faktor a um den gleichen Faktor a
Die Konzentration einer Verteilung
Absolute Konzentration:
25 Häuser/ 15 gehören 2 Familien
Relative:
Es gibt 10 Familien, 2 Familien gehören 60% damit gehören 20% der Familien 60% der Häuser
Streuungsparameter: Variationskoeffizient
V = Standartabweihung / Mittelwert
-> Steeuung üm den Mittelwert
Vergöeoch verschiedener Skalierrungen
Was bedeutet Regressionsanalyse
Untersuchung der Art und Abhängigkeit zwischen metrisch Daten, d.h. Auffinden einer mathematischen Funktion durch die sich die zwischen den Variablen bestehende Abhängigkeit bereschrieben lässt
Was bedeutet Lineare Regression
Annahme eines lineraren Zusammenhangs
Was bedeutet Einfachregression
Untersuchung von nur zwei variablen
Y: abhänige Variablen Regressand
X: unabhäöbngige Variablen Regressor
Wie ist der Zusammenhang von Einfrachregression
Was ist ein Streuungsdiagramm
Was ist eine Regressionsgerade
Was ist die Korrelationsanalyse?
Welche Korrelationsmethoden gibt es für
Metrische Daten
Ordinale Daten
nominale Daten
Korrelationskoeffizient nach Bravais-Pearson
Was ist das Bestimmtheitsmaß
Korrelationskoeffizient nach Spearman
Phi Koeffizient
Kontingenz-Koeffizient nach Pearson
Was sit ein Zufallsexperiment?
Was ist ein Ereignis
Begriffe der Wahrscheinlichkeitsrechnung:
Fakultät
Binomialkoeffizient
Kombination
Wie sehen die 4 Kombinatioinen für mit Wiederholung/Ohnewiederhlung, Berücksichtigung der Reihenfolge und ohne Berücksichtigung der Rihenfolge aus?
Wahrscheinlichkeit
Additionssatz der Wahrscheinlichkeit
Multiplikationssatz der Wahrscheinlichkeit
Bedingte Wahrscheinlichkeit
Beispiel Vierfeldertafel
Definition Zufallsvariable
Wahrscheinlichkeitsfunktion
Verteilungsfunktion
Binomialverteilung
Poissonverteilung
Normaverteilung
Last changed2 years ago