Was ist der Modus?
Der Modus ist der Wert einer Variablen, der am häufigsten auftritt.
Was ist der Median
Der Median splittet die Verteilung einer Variablen in zwei gleich große Hälften und
entspricht dem 50%-Quantil.
Was ist der Mittelwert
Der Mittelwert ist der durchschnittliche Wert aller Messwerte.
Was ist die Quadratsumme?
Die Quadratsumme ist die Summe der quadrierten Abweichungen aller Messwerte vom
Mittelwert.
Was ist die Varianz
➢ Die Varianz ist die mittlere quadrierte Abweichung der Messwerte vom Mittelwert.
Was ist die Standartabweichung
Die Standardabweichung ist die Wurzel der Varianz.
Was sind die Skalenniveaus von Variablen
Bei Kategorialen Daten:
Nominalskala -> Gleichheit, Verschiedenheit (Geschlecht, Haarfarbe, Partei)
Ordinalskala -> Größer-Kleiner Relationen, Rangfolgen (Platzierung, Schulnoten)
Bei Kardinalen (Metrisch) Daten:
Intervallskala -> Gleichheit von Differenzen (Temperatur, Intelligenzquotient)
Verhältnisskala -> Gleichheit von Verhältnissen (Einkommen, Alter, Körpergewicht)
Erkläre die beiden Quantitative Forschungsmethoden:
Experimentelle Designs:
Manipulation unabhängiger Variablen,
Messen abhängiger Variablen
50% der Kunden erhalten vor dem Kauf ein kleines Geschenk, die anderen nicht. Wer kauft mehr ein?
T-Test, ANOVA
Korrelative Designs
Untersuchung von Zusammenhängen zwischen Variablen
Haben Bildung, Einkommen und Familienstand Einfluss auf den Konsum bestimmter Güter?
Korrelationen, Regression
-> Aufklären von Unterschieden und Zusammenhängen
Was sind die Typen von Variablen in Dependenzanalysen
Unabhängige Variablen (UV)
Prädiktoren, Independent Variables, Einflussgrößen, Exogene Variablen, Predictor
Variablen, die einen Einfluss ausüben, manipuliert werden oder prädizieren
Ausprägung der Kundenzufriedenheit
Abhängige Variablen (AV)
Kriteriumsvariablen, Dependent Variables, Zielgrößen, Endogene Variablen, Outcome
Variablen, auf die Einflüsse wirken und die aufgrund von Manipulation der UV variieren
Umsatz des Kunden und Kaufverhalten
Unabhängige und abhängige Designs
Zwischensubjekt-Designs (Between-Subject-Designs)
Innersubjekt-Designs (Within-Subject-Designs)
Untersuchung unabhängiger Gruppen (Autofahrer vs. Motorradfahrer)
Untersuchung abhängiger Gruppen (Patient vor und nach der Behandlung)
Was sind sie Systematische und unsystematische Variabilität
Systematische Variabilität -> Variabilität begründet sich aufgrund von gezielter Manipulation der UV, Nachweis von Kausalität.
Unsystematische Variabilität-> Variabilität kann nicht erklärt werden und entsteht aus nicht erhobenen Einflüssen.
Erkläre Systematischer und zufälliger Fehler
Systematischer und zufälliger Fehler
Der systematische Fehler wird auch als “Bias” bezeichnet, der zufällige Fehler auch als “Error”.
Bei Reliabilitätsstudien sprechen wir synonym von hoher Präzision (geringer zufälliger Fehler) und hoher Richtigkeit (geringer systematischer Fehler). Sind Präzision und Richtigkeit ausreichend ausgeprägt, so ist Genauigkeit gegeben (notwendige Bedingungen).
Was ist wichtig bei Fragestellungen und Hypothesen
Fragestellungen sollten ethisch vertretbar sowie exakt formuliert sein und wissenschaftlichen Nutzen bieten.
Hypothesen müssen empirisch überprüfbar sein.
Deskriptive und explorative Untersuchungen dienen zur Generierung von Hypothesen.
Explanative Untersuchungen haben das Ziel, vorab formulierte Hypothesen zu prüfen.
Was sind gerichtete und umgerichtete Hypothesen?
Gerichtete Hypothesen
Es wird die konkrete Richtung der Einflüsse, Unterschiede oder Zusammenhänge formuliert.
Ungerichtete Hypothesen
Es wird keine Annahme über die Richtung getroffen.
Erklär Randomisation
In unabhängigen Designs bedeutet Randomisation die zufällige Zuordnung zu Untersuchungsgruppen.
In abhängigen Designs bedeutet Randomisation die zufällige Abfolge zu den Untersuchungsbedingungen.
Konfundierende Variablen werden durch Randomisation neutralisiert und üben keinen systematischen Einfluss aus.
Erkläre die drei Typen der Verblindung.
Verblindung
Einfach Untersuchungsobjekte
Doppelt Untersuchungsobjekte, Untersuchungsleiter
Dreifach Untersuchungsobjekte, Untersuchungsleiter, Statistischer Auswerter
Gütekriterien: Welche Qualität hat meine Untersuchung?
Welche Formen von Validität können wir unterscheiden?
Interne Validität Veränderungen der AV sind eindeutig auf die UV zurückzuführen.
Externe Validität Die Ergebnisse lassen sich auch auf die Population generalisieren.
Konstruktvalidität Das formulierte Konstrukt wird tatsächlich gemessen.
Kriteriumsvalidität Es gibt einen Zusammenhang zwischen Messinstrument und Zielgröße.
Inhaltsvalidität Das Konstrukt wird bestmöglich erfasst und operationalisiert.
In wiefern ist Interne und externe Validität in Abhängig vom Design
Felduntersuchungen finden im Gegensatz zu Laboruntersuchungen in natürlicher Umgebung statt.
Experimentelle Untersuchungen arbeiten mit zufälligen, quasi-experimentelle mit natürlichen Gruppen.
in welchem standartfehlerbereich liegen 95% der Stichproben-Mittelwerte
➢95% der Stichproben-Mittelwerte liegen im Bereich von −1.96 x Standardfehler bis +1.96 x Standardfehler. (SE = Standard Error)
Wie seitig müssen Gerichte Hypothesen getestet werden?
➢Gerichtete Hypothesen müssen 1-seitig getestet werden.
Wie gerichtet müssen Ungerichtete Hypothesen getestet werden
➢Ungerichtete Hypothesen müssen 2-seitig getestet werden
Fasse die wichtigsten Punkte von Hypothesentests und statistische Signifikanz zusammen
➢Die Alternativhypothese entspricht unserer Forschungshypothese, die Nullhypothese behauptet das komplementäre Ereignis.
➢Die Alternativhypothese wird mit H1, die Nullhypothese mit H0 bezeichnet.
➢Bevor getestet wird, muss die Irrtumswahrscheinlichkeit (α; Signifikanzniveau) festgelegt werden. Dieses liegt in der Regel bei 5%.
➢Ein signifikantes Ergebnis liegt vor, wenn der empirisch ermittelte p-Wert des Tests unter oder gleich dem vorab festgelegten Signifikanzniveau liegt (üblicherweise p ≤ .05).
➢Der p-Wert gibt an, wie wahrscheinlich das gefundene Ergebnis oder ein noch extremeres Ergebnis unter Annahme der Nullhypothese wäre.
➢Ein nicht signifikantes Ergebnis bedeutet nicht, dass die Nullhypothese wahr ist!
➢Nicht signifikante Ergebnisse sind genauso wichtig wie signifikante Ergebnisse!
Was beschreibt die Statistische Signifikanz Testentscheidung.
➢Behalten wir die Nullhypothese bei, obwohl in Wahrheit die Alternativhypothese gilt, sobegehen wir einen β-Fehler oder Fehler 2. Art.
➢Ergebnisse statistischer Tests sind immer nur Aussagen über Wahrscheinlichkeiten, es gibt keine absolute Sicherheit!
➢Lehnen wir die Nullhypothese ab und nehmen die Alternativhypothese an, obwohl in Wahrheit die Nullhypothese gilt, so entspricht dies einem α-Fehler oder Fehler 1. Art.
Wie beeinflusst die Stichprobengröße den p-Wert
➢Mit wachsendem Stichprobenumfang werden Standardfehler und p-Wert immer kleiner.
Worüber trifft die Effektstärke keine Aussage
➢Ein statistisch signifikantes Ergebnis sagt noch nichts über die praktische oder klinische Relevanz des gefundenen Effektes aus!
Wie wird die effektstärke von Cohen’s d (Mittelwerte) eingeschätzt?
Wie wird die effektstärke vom Koeffizienten r (Korrelation) eingeschätzt?
Was ist die Teststärke und wovon hängt sie ab (Statistische Power)
➢Die Teststärke (1 − β) ist die Wahrscheinlichkeit, eine in der Population gültige H1 durch den eingesetzten statistischen Test tatsächlich zu bestätigen.
➢Die Teststärke hängt von der Effektstärke, α und N ab. Alle 4 Größen beeinflussen sich gegenseitig. Sind drei davon bekannt, lässt sich die vierte Größe berechnen.
Womit hängt der Anstieg der Teststärke ab?
höherem α-Niveau
größerer Effektstärke
wachsendem Stichprobenumfang
Womit hängt ein sinken der Teststärke zusammen
geringerem α-Niveau
geringerer Effektstärke
geringerem Stichprobenumfang
Wie wird der optimale Stichprobenumfang berechnet.
➢A priori Analyse: Aus geplanter Teststärke, Signifikanzniveau und Effektstärke wird der optimale Stichprobenumfang berechnet.
Wie wird die tatsächliche Teststärke berechnet.
➢Post hoc Analyse: Aus dem Signifikanzniveau, der Effektstärke und dem Stichprobenumfang wird die tatsächliche Teststärke berechnet.
Was sind die wichtigsten Konzepte um Wichtige Konzepte um statistische Modelle aufzustellen und zu prüfen:
1. Welche Bedeutung hat der Standardfehler?
2. Wie können wir Konfidenzintervalle berechnen?
3. Was ist ein Signifikanztest?
4. Was sind Parameter?
5. Wie schätzen wir Parameter?
Wodurch wird der Populationsmittelwert geschätzt?
➢ Der Mittelwert der Population wird durch den Stichprobenmittelwert geschätzt.
womit werden Parameter und womit Schätzer gekennzeichnet.
➢Parameter werden mit griechischen, Schätzer hingegen mit lateinischen Buchstaben gekennzeichnet.
Was ist die Kleinst-Quadrate-Methode (KQ) auch Ordinary Least Squares (OLS) genannt?
Die Parameter b0, b1, …, bn werden so geschätzt, dass die Summe der quadrierten Abweichungen des Fehlerterms minimal wird. Dies nennt man Kleinst-Quadrate-Methode (KQ) oder Ordinary Least Squares (OLS).
Wie findet die Quadratsummenzerlegung im ALM statt
Gib einen Überblick zum Allgemeinen Linearen Modell (ALM)
➢Die abhängige Variable muss metrisch sein und sollte nicht zu schief verteilt sein oder Ausreißerwerte enthalten. Liegt eine stark abweichende Verteilung vor oder ist die AV nicht metrisch, so können Transformationen helfen oder der Einsatz eines verallgemeinerten linearen Modells (Generalized Linear Model).
➢Die unabhängigen Variablen können metrisch oder kategorial sein, also beliebiges Skalenniveau aufweisen. Haben kategoriale Variablen mehr als 2 Ausprägungen, müssen diese vorab dummy-codiert (dichotomisiert) werden.
➢Alle unabhängigen Variablen müssen Varianz aufweisen (s² > 0)
➢Die UVs und die AV sollten in der Realität linear miteinander verknüpft sein.
➢Alle Fälle (Beobachtungen, Personen, …) müssen voneinander unabhängig sein.
Welchen Einfluss haben Ausreißer auf die geschätzte Regressionsgerade und das Modell!
Ausreißer haben einen starken Einfluss auf die geschätzte Regressionsgerade und das Modell!
Einflussreiche Fälle können durch die Hebelwirkung ebenso die Regressionsgerade und die Modellparameter beeinflussen und so „vom Weg abbringen“.
Welche Lösungengibt es um Bias zu entdecken:
Lösungen, um Bias zu entdecken:
➢Visuelle Prüfung: Histogramme, Box-Plots (univariat) und Streudiagramme (bivariat): Sind alle Werte plausibel?
➢Berechnung der standardisierten Residuen (M = 0; SD = 1). 95 % der Werte sollten im Bereich −2 bis +2 liegen. Werte < −3 oder > +3 sind höchstwahrscheinlich Ausreißer.
➢Berechnen von Distanzmaßen (z. B. Cook‘s Distance). Sie misst, wie einflussreich ein Fall auf das Modell wirkt. Fälle >1 sollten genauer untersucht werden.
Welche Lösungen gibt es um Bias zu vermeiden?
:
➢Trimming: Daten „beschneiden“ und somit Ausreißerwerte ausschließen → muss Ausnahme bleiben!
➢Einsatz robuster Methoden, die Parameter und Standardfehler verlässlich schätzen können, z. B. via Bootstrapping.
➢Transforming: Bessere Verteilung durch eine mathematische Transformation erzeugen (z. B. Logarithmieren linksschiefer Verteilungen).
Welche Voraussetzungen müssen erfüllt sein um die Ergebnisse generalisierbar zu machen und so Die Inferenzstatistiken verlässlich machen.
1) Additivität und Linearität
2) Unkorrelierte Residuen
3) Varianzhomogene Residuen (Homoskedastizität)
4) Normalverteilte Residuen
5) Keine zu starke Multikollinearität (nur relevant wenn Anzahl UVs >1)
Was ist Voraussetzung Additivität und Linearität
➢Additivität: Die einzelnen Effekte addieren sich.
➢Linearität: Jede einzelne UV ist linear mit der AV verknüpft. Das Modell ist linear in seinen Parametern.
Was besagt die Vorraussetzung der Unkorrelierten Residuen
Unkorrelierte Residuen
➢ Die Voraussetzung ergibt sich aus dem Versuchsdesign bzw. der Datenerhebung. Kein Fall darf mit anderen Fällen zusammenhängen.
Was besagen die Varianzhomogenen Residuen (Homoskedastizität)
Varianzhomogene Residuen (Homoskedastizität)
➢Die Residuen ei sollten über alle Werte der UV gleichmäßig streuen (homogene Varianzen haben).
Was besagt die Vorraussetzung der Normalverteilten Residuen
Normalverteilte Residuen
➢Die Residuen ei sollten annähernd normalverteilt sein.
Warum ist die Vorraussetzung für alm Keine zu starke Multikollinearität
➢Die UVs dürfen untereinander nicht zu stark korrelieren. Prüfen der Voraussetzungen in SPSS:
➢Anfordern der Kollinearitätsdiagnose im Untermenü „Statistiken“, anschließend Beurteilung des VIF (Variance Inflation Factor). Der VIF sollte für alle UVs < 10 sein.
Was bedeutet Korrelation für Kausalität
Korrelationen sind für kausale Beziehungen notwendige Bedingung, aber keine hinreichende.
Beschreibe einen Positiven linearen Zusammenhang
Beschreibe einen negativen linearen Zusammenhang im Diagramm
Beschreibe einen monotonen aber nicht linearen positiven Zusammenhang im Diagramm
Beschreibe einen nicht monotonen Zusammenhang im Diagramm
Beschreibe wie ein Diagramm ohne Zusammenhang der Residuen aussieht.
Erkläre die Linearen Zusammenhänge von Kovarianz und Korrelation
➢Die Höhe der Kovarianz hängt von der Einheit der Variablen ab.
➢Um Zusammenhänge zu quantifizieren, müssen die Kovarianzen standardisiert werden.
➢Die Pearson-Korrelation teilt die gemeinsame Kovarianz durch das Produkt der einzelnen Standardabweichungen. Die Kovarianz wird somit an den Streuungen der beiden Variablen „relativiert“.
Erläutere den Korrelationskoeffizient, als Maß für die Stärke eines Zusammenhangs:
Der Wertebereich reicht von −1 bis +1 und entspricht einem Kontinuum.
➢Positive Zusammenhänge zeigen sich durch Werte > 0, negative Zusammenhänge durch Werte < 0.
➢Ist der Wert = 0 oder nahe 0 so besteht statistisch kein Zusammenhang zwischen den Variablen.
➢Sind die Voraussetzungen der parametrischen Korrelation nicht erfüllt oder die Zusammenhänge non-linear, so muss eine non-parametrische Korrelation eingesetzt werden, z. B. Spearman‘s ρ (=rs) oder Kendall‘s τ
➢Wird der Zusammenhang metrischer Variablen untersucht und gibt es eine lineare Beziehung zwischen den Variablen, so wird die Pearson-Korrelation r eingesetzt.
➢Für die Überprüfung von Zusammenhängen mit Beteiligung nominaler Variablen werden spezielle Korrelationskoeffizienten berechnet.
➢Für Korrelationskoeffizienten können Standardfehler, Konfidenzintervalle und Signifikanz berechnet werden.
Wie heißen die Non-parametrische Korrelationskoeffizienten
Spearman‘s ρ
Kendall t
Erkläre Spearman‘s ρ im Zusammenhang mit non-parametrischen Korrelationskoeffizienten
Konvertiert Original-Messwerte in Ränge
Berücksichtigt die Differenzen der Ränge
Berechnet mit den Differenzen Pearson’s r
Erkennt nur monotone Zusammenhänge
Erkläre Kendall τ im Zusammenhang mit non-parametrischen Korrelationskoeffizienten
Berücksichtigt nur Unterschiede zwischen Rängen
Berechnet die (Dis)-Konkordanzen der Rangpaare
Was sind die Ablaufschritte der Linearen Regression
Modellformulierung
Schätzung der Regressionsfunktion
Prüfung der Regressionsfunktion
Prüfung der Regressionskoeffizienten
Prüfung der Modellprämissen
Was besagt der Schritt der Modellformulierung für lineare Regression
Wir starten mit der einfachen linearen Regression (1 UV).
Grafische Prüfung des Zusammenhangs zwischen UV und AV
Umgangssprachlich: Was können wir ohne Berechnung des Regressionsmodells schon anhand der Streudiagramme ablesen?
Wie wird die Schätzung der Regressionsfunktion vorgenommen
➢Die Schätzung der Regressionskoeffizienten erfolgt mittels KQ-Methode (= OLS). Das ist händisch theoretisch möglich, wir verwenden dazu SPSS.
➢ Kennen wir den Wert der UV (Werbung, X), so können wir den geschätzten Wert der AV (Geschätzter Absatz, Ŷ) berechnen und anschließend das Residuum (Differenz zum tatsächlichen Absatz, Y)
Zuletzt geändertvor 21 Tagen