001 Wie unterscheiden sich strukturen-prüfende und strukturen-entdeckende Verfahren? Nennen Sie jeweils zwei Beispiele multivariater Verfahren.
Strukturen-prüfende Verfahren:
Kausalanalysen
vorab sachlogische Annahmen über zu erwartenden Kausalzusammenhänge
teilen danach die Variablen in abhängige und unabhängige Variablen ein.
Beispiele: Regressionsanalyse, Varianzanalyse.
strukturen-entdeckenden Verfahren
Zusammenhänge erste entdeckt werde
vorab keine Annahmen und auch keine Einteilung in abhängige und unabhängige Variablen
auch Interdependenzanalysen genannt
Beispiele: Clusteranalyse, exploratorische Faktorenanalyse.
002 Erläutern Sie die Besonderheiten von mit Hilfe von Rating-Skalen gemessenen Variablen und bi- nären Variablen im Hinblick auf die Einordnung des Skalenniveaus.
Zuordnung Skalenniveaus bei Rating-Skalen Variablen ist abhängig von Benennung der Skalenpunkte
Skalenpunkte so benannt, dass Gleichabständigkeit nahelegen = intervallskaliert
ungleichen Abständen = Ordinalskalenniveau
Binäre Variablen: = nominale Variablen
Bei statistischen Analysen ebenfalls intervallskaliert
003 Erläutern Sie die Begriffe Nullhypothese, Alternativhypothese
Nullhypothese: keine Effekte vorhanden
Alternativhypothese: Effekte
Zustände entweder von Null- oder von Alternativhypothese abgedeckt
003 Erläutern Sie die Begriffe Teststatistik, Signifikanzniveau
Teststatistik: Empirischer Wert, aus Inferenzstatistischen Verfahrens aus Daten berechnet
Signifikanzniveau: Irrtumswahrscheinlichkeit, von Forschenden festgelegt
Wie groß darf die Wahrscheinlichkeit eines Fehlers sein, bei der man sich noch für die Alternativhypothese entscheiden darf.
003 Erläutern Sie die Begriffe kritischer Testwert
- kritische Wert: Auf Basis Irrtumswahrscheinlichkeit und Freiheitsgrade
Betrag des berechneten Werts über kritischen Wert, wird Nullhypothese abgelehnt
liegt er unter kritischen Wert, wird Nullhypothese beibehalten
003 Erläutern Sie die Begriffe p-Wert und Konfidenzintervall.
p-Wert = aus den Daten berechnete Wahrscheinlichkeit für Fehler erster Art (die Alternativhypothese wird angenommen, obwohl sie nicht zutrifft)
aus Testwert und Freiheitsgraden auf Basis des Wissens über Verteilung der Teststatistik
Beurteilung Signifikanz: entweder p-Wert oder kritischer Testwert herangezogen werden
Konfidenzintervall: in welchem Bereich wahre Wert (z.B. Mittelwert einer Gruppe) mit bestimmten Wahrscheinlichkeit
Messfehler (Standardabweichung) und Verteilung berücksichtigt
004 Welche Verfahrenstypen definieren abhängige und unabhängige Variablen? Diskutieren Sie, in- wiefern mit diesen Verfahren Kausalität nachgewiesen werden kann.
Strukturen-prüfende Verfahren.
Ob Kausalität nachgewiesen, hängt nicht nur von Signifikanz, auch von Datenbasis: ab
Wurde die abhängige Variable in einem ausreichenden zeitlichen Abstand zu den unabhängigen Variablen gemessen und können andere Ursachen als die untersuchten unabhängigen Variablen ausgeschlossen werden?
005 Wodurch können Ausreißerwerte entstehen, wie können Sie entdeckt werden und wie sollte mit ihnen umgegangen werden?
Durch Zufall, Dateneingabefehler und ungewöhnliche Ereignisse
über Standardisierung (Werte über 2 SA sind als Ausreißerwerte zu definieren)
Histogramme (weit abgelegen Werte)
Boxplots (Kennzeichnung von Ausreißern)
Streudiagramme (weit abgelegene Werte) identifiziert werden
Ausreißer nur eliminiert bzw. korrigiert werden, wenn eindeutige Ursache, die außerhalb Forschungskontextes liegt (falsche Dateneingabe, besonderes Ereignis)
Zufällig zustande gekommene Ausreißer müssen im Datensatz verbleiben.
006 Überlegen Sie sich zwei psychologische Beispielfragestellungen, für die eine multiple Regressions- analyse angewendet werden kann. Welche Merkmale haben jeweils die Funktion der abhängigen und unabhängigen Variablen? Veranschaulichen Sie sich alle im Weiteren beschriebenen Schritte anhand eines der Beispiele, indem Sie das Lehrbuchbeispiel auf Ihr eigenes Beispiel übertragen.
(Wie stark) Beeinflussen verschiedene Persönlichkeitsmerkmale (z.B. Big-Five) das Präventions- verhalten (z.B. die Nutzung von Vorsorgeuntersuchungen)?
UV = Persönlichkeitsmerkmal
AV = Präventionsverhalten
Welche Rolle spielen Intelligenz, Kre- ativität, Verträglichkeit und Fachwissen für den Berufserfolg?
UV = Intelligenz usw.
AV = Berufserfolg
AV und UV metrisch (erklärte Zusammenhänge und Prognosen)
AV = Y, erklärte, Response Variable
UV = X, erklärende, Prädiktor Variable
007 Welche Schritte werden bei der Durchführung einer Regressionsanalyse durchlaufen?
Modellformulierung: Auswahl und Definition variablen, Annahme Störgrösße, Regressionsgerade (Y = a+bX)
Schätzung der Regressionsfunktion: mit Datensatz, einfache vs multiple regression
Prüfung der Regressionsfunktion: Prüfung Güte/ Qualität, SE, R2, stochastisches Modell und F Test
Prüfung der Regressionskoeffizienten: t-Test, Konfidenzintervall
Prüfung der Modellprämissen: 7 Punkte
008 Was versteht man unter einer Regressionsfunktion? Aus welchen Bestandteilen besteht sie?
Zusammenhang zwischen abhängigen und unabhängigen Variablen
aus Konstanten (Achsenabschnitt) sowie Regressions- koeffizienten (Steigung), welche Gewichtung der einzelnen unabhängigen Variablen angeben
009 Was versteht man im Rahmen der Regressionsanalyse unter dem Begriff "Kleinst-Quadrate-Kri- terium"? In welchem Schritt wird es genutzt?
Das "Kleinst-Quadrate-Kriterium" wird bei Schätzung der Regressionsfunktion herangezogen
aus allen möglichen Regressionsfunktionen diejenige ausgewählt, deren Summe aller Abweichungen der beobachteten Werte von der errechneten Regressionsfunktion am geringsten ("kleinsten") ist
Werte sowohl positiv als auch negativ von Funktion abweichen können, werden Abweichungen vor Summierung quadriert
Begriff "Kleinst-Quadrate-Kriterium"
010 Wie unterscheidet sich die Überprüfung der Modellgüte von der Überprüfung der Regressionsko- effizienten? Welche Kriterien werden dabei jeweils herangezogen?
Überprüfung der Modellgüte wird Passung der gesamten Regressionsfunktion an Daten überprüft:
alle unabhängigen Variablen geeignet, signifikante Vorhersage abhängigen Variablen zu leisten?
deskriptiven Kennwerte = Standardfehler sowie Bestimmtheitsmaß R2 bzw. das korrigierte R2.
inferenzstatistische Überprüfung der Regressionskoeffizienten = Basis F-Werts. Die
der Regressionskoeffizienten = t-Tests oder den Konfidenzintervallen
Für Interpretation des relativen Beitrags einzelner Koeffizienten werden im psychologischen Kontext die Standardisierten Koeffizienten (Beta-Koeffizienten) herangezogen
011 Wie unterscheidet sich die Bedeutung der Regressionskoeffizienten von der Bedeutung der Beta- Koeffizienten? Versuchen Sie die Unterschiede anhand eines Beispiels aus dem psychologischen Kontext zu veranschaulichen.
Regressionskoeffizienten: um wie viele Einheiten abhängige Variable steigt oder fällt, wenn sich unabhängige Variable um 1 erhöht
Werte sind abhängig von eingesetzten Messinstrumenten
Mitarbeiterzufriedenheit anhand durchschnittlichen Gehalts vorhergesagt werden, hängt Regressionskoeffizient vom Messinstrument für die Mitarbeiterzufriedenheit ab.
Wird die Zufriedenheit lediglich mit einem likert-skalierten Item erhoben (Spannweite von 1 bis 5) so fällt der Regressionskoeffizient naturgemäß deutlich kleiner aus, als wenn eine Mes- sung über eine umfangreichere Skala und einem Summenwert (Spannweite von 10 bis 50) erfolgt.
Da der Beta-Koeffizient standardisiert ist, wäre er in beiden Fällen gleich.
012 Welche Voraussetzungen sollten bei der Durchführung einer Regressionsanalyse gegeben sein beziehungsweise überprüft werden? Welche Folgen können Verletzungen dieser Voraussetzun- gen haben und wie kann den Verletzungen begegnet werden?
(1) Linearität: AV und UV linear zusammenhängen. Bei Abweichungen, Transformationen (z.B. Logarithmierung)
(2) Störgröße gleich Null: Messfehler unsystematisch sein und sich ausmitteln. Falls AV konstant zu hoch oder zu niedrig gemessen = Auswirkung auf Konstante, in den meisten Fällen irrelevant.
(3) Korrekte Auswahl der Regressoren: Auswahl der UV möglichst vollständig alle relevanten Merkmale enthalten, aber nicht zu viele, Ansonsten ist Schätzung verzerrt, indem sich die Konstante ändert
(4) Homoskedastizität: Die Fehler (Residuen) sollten sich über alle Ausprägungen der AV gleichermaßen verteilen. Überprüfung Residuen visuell oder mit Tests.
(5) Unabhängigkeit der Residuen. Maßnahmen wie bei (4).
(6) Keine Multikollinearität: Die UV sollten nicht korreliert sein. Inspektion z.B. über das Venn-Diagramm. Folge kann R2 signifikant werden, obwohl keiner der Koeffizienten signifikant ist. Bei hochkorrelierten Prädiktoren = einer von beiden Prädiktoren ausgeschlossen
(7) Normalverteilung der Störgrößen. nicht gegeben = beeinflusst Signifikanztests (t-Test, F-Test). Regressionsanalyse insgesamt recht unempfindlich gegenüber kleineren Verletzungen dieser Voraussetzungen. Bei Stichproben über 30 Personen, kann Normalverteilung intervallskalierter Variablen auf der Basis des zentralen Grenzwerttheorems als gegeben angenommen werden
013 Welche Vorteile bietet eine schrittweise Regression gegenüber einer Regression mit gleichzeitigem Einschluss aller Variablen?
Bei Durchführung Analyse aufgrund vorher festgelegter statistischer Parameter zu den einzelnen unabhängigen Variablen dasjenige Modell ermittelt, das beste Vorhersage der AV erlaubt
Nicht-signifikante Variablen werden ausgeschlossen
Vorgehen sinnvoll, wenn große Zahl potenzieller Einflussfaktoren vorhanden
014 Wann ist die Bildung von Dummy-Variablen erforderlich und wie wird dabei vorgegangen? Wes- halb muss die Nutzung von Dummy-Variablen immer offengelegt werden?
wenn ordinalskalierte oder mehrkategoriale nominale Variablen in linearen Regressionsanalyse berücksichtigt werden sollen
Ihre Nutzung muss offengelegt werden, damit für andere Forschende ersichtlich ist
(a) dass man die Voraussetzung intervallskalierter Variablen bei der Analyse berücksichtigt hat und
(b) wie viele Dummy-Variablen gebildet wurden. relevant, weil Bildung von Dummy-Variablen Gewichtung des zugrundeliegenden Merkmals verstärkt.
015 Um welche Art von Regression handelt es sich beim linearen Trendmodell und wie wird der Fak- tor Zeit dabei berücksichtigt?
einfache lineare Regression, in der die Zeit als (einzige) UV berücksichtigt wird.
016 Was versteht man unter der mittleren absoluten Abweichung (MAD) und welchem Parameter der Regressionsanalyse von Querschnittsdaten entspricht dieser Wert?
Abweichungen Einzelmessungen von vorhergesagten Messwerten der verschiedenen Zeitpunkte bei linearen Regressionen mit Zeitreihendaten
Sie entspricht Summe der quadrierten Residuen (SSR) bei Regressionsanalysen mit Querschnittsdaten
017 Wie können saisonale Schwankungen bei der Analyse von Zeitreihendaten berücksichtigt werden und welche Art von Regression entsteht dadurch (im Vergleich zum linearen Trendmodell)? Be- schreiben Sie den Unterschied zwischen der grafischen Darstellung von Prognosen linearer Trendmodelle und Modellen, die saisonale Schwankungen berücksichtigen.
Saisonale Schwankungen in Form von Dummy-Variablen berücksichtigt
Pro saisonalem Abschnitt wird Dummy-Variable erstellt, wobei erste Abschnitt als Referenzwert herangezogen wird
Durch Einbezug Dummy-Variablen wird einfache lineare Regression des linearen Trendmodells zu multiplen linearen Regression
Beim linearen Trendmodell liegen prognostizierten Werte auf geraden Linie, bei der Berücksichtigung saisonaler Schwankungen hat die prognostizierte Funktion ein zackenförmiges Aussehen.
018 Überlegen Sie sich zwei psychologische Beispielfragestellungen, bei denen die Daten mit Hilfe von Varianzanalysen untersucht werden. Formulieren Sie zunächst jeweils eine Fragestellung, die nur einen Einflussfaktor auf die abhängige Variable berücksichtig und erweitern Sie diese dann um einen zweiten Faktor. Veranschaulichen Sie sich alle im Weiteren beschriebenen Schritte an- hand eines der Beispiele, indem Sie das Lehrbuchbeispiel auf Ihr eigenes Beispiel übertragen.
Haben unterschiedliche Therapieformen (kognitive Verhaltenstherapie, Anti- depressiva, Sport) bei männlichen und weiblichen Depressionspatienten unterschiedliche Auswirkungen auf die Schwere der Depression?
UV = Therapieformen
AV = Schwere Depression
Welche Auswirkungen haben unterschiedliche Lehr- methoden auf die Mathematikleistung von Mädchen und Jungen?
UV = Lehrmethoden
AV = Mathematikleistung + Konzentration
UV = nominal
AV = metrisch
019 Welche Schritte werden bei der Durchführung einer Varianzanalyse durchlaufen?
Modellformulierung: stochastisches Modell der ANOVA (systematische + stochastisches Komponente)
Zerlegung der Streuung: ob Effekt durch XX verursacht, Streuungszerlegung
Prüfung auf statistische Signifikanz: f Test
Ergebnisinterpretation: in varianzanqlysen, Kontrastanalysen (a priori Vermutung), Post hoc Test (f-Test signifikant)
020 Nach welchem Schritt wurde die Varianzanalyse benannt und wie wird dabei vorgegangen?
Im 3. Schritt erfolgt Signifikanzprüfung mit Hilfe F-Werts
Berechnung = erklärte und nicht erklärte Varianz ins Verhältnis gesetzt
Im 2. Schritt erfolgt Streuungszerlegung
Abweichungen der einzelnen beobachteten Werte von unterschiedlichen Mittelwerten zueinander ins Verhältnis gesetzt
Bei einfachen Varianzanalyse wird beispielsweise der Frage nachgegangen, ob Summe der Abweichungen der Einzelwerte von Gruppenmittelwert geringer ist als die Summe ihrer Abweichungen vom Gesamtmittelwert.
Streuung Einzelwerte aufgeteilt nach Ursachen und deren Anteil zueinander in Beziehung gesetzt
Für Berechnung F-Werts analog verschiedene Varianzanteile gebildet, indem Streuungen anhand von Freiheitsgraden gewichtet
021 Wie unterscheiden sich die Modelle ein- und zweifaktorieller Varianzanalysen? Nutzen Sie Ihre Antwort, um die Formel für das Modell einer dreifaktoriellen Varianzanalyse zu entwickeln.
Neben Effekt Faktors (αg) wird Effekt zweiten Faktors (βh) sowie der Effekt der Interaktion beider Faktoren (αβgh) berücksichtigz
dreifaktorielle Modell = sowohl Effekte von drei Faktoren als auch Effekte ihrer paarweisen Interaktionen als auch Effekte der Interaktion aller drei Faktoren
Formel: yghii =μ+αg +βh +γj +αβgh +αγgj +βγhj +αβγghi +εghii
022 Welche Streuungsarten sind für die Überprüfung der Modellgüte relevant? Welche Unterschiede stellen Sie hier zwischen ein- und mehrfaktoriellen Modellen fest?
Modellgüte anhand Eta2-Wertes ermittelt
erklärte Streuung ins Verhältnis zur Gesamtstreuung gesetzt
Die Formel für das Eta2 ist bei ein- und mehrfaktoriellen Analysen gleich, jedoch unterscheidet sich die Berechnung der erklärten Streuung.
023 Aus welchen Streuungen ist die erklärte Streuung bei einer dreifaktoriellen Varianzanalyse zusammengesetzt?
Streuung zwischen Gruppen
haupteffekte (Streuung durch einzelne Faktoren)
Interaktion (Streuung durch Wechselwirkung Faktoren)
Streuung innerhalb Gruppen
024 Wie unterscheiden sich Berechnung und Interpretation von Eta2 und F-Wert?
Berechnung Eta2 = Streuungen ins Verhältnis gesetzt
Berechnung des F-Werts = Varianzen ins Verhältnis gesetzt
F-Wert berücksichtigt Verhältnis zwischen erklärter und nicht-erklärter Varianz
ob das Modell ausreichend gut ist, dass Übertragbarkeit auf Grundgesamtheit angenommen werden kann.
025 Welche Rolle spielen Freiheitsgrade bei der Berechnung des F-Werts und auf welche Aspekte der Studienplanung beziehen sie sich?
zur Standardisierung der Streuungen
zur Berechnung der Varianzen erforderlich
beziehen sich auf Anzahl der Faktorstufen der im Modell berücksichtigten Faktoren sowie Anzahl der Personen pro Gruppe
026 Was versteht man unter "Interaktionseffekten"? Bei welcher Art von Varianzanalyse können diese auftreten? Welche Arten von Interaktionseffekten lassen sich unterscheiden?
wenn Unterschiede in Gruppen des Faktors A abhängig von Ausprägung des Faktors B unterschiedlich stark sind
Beispielsweise : Mathematikleistung von Jungen grundsätzlich höher als die von Mädchen (Faktor A), bei einer Interaktion mit der Lehrmethode (Faktor B) wären die Unterschiede für die eine Methode jedoch deutlich stärker ausgeprägt als für die andere.
Interaktionseffekte nur bei mehrfaktoriellen Varianzanalysen auftreten, d.h. bei Varianzanalysen, die mehr als zwei unabhängige Variablen berücksichtigen.
Arten:
ordinal: Rangfolge Stufen des einen Faktors für Stufen des anderen Faktors identisch, Haupteffekt isoliert interpretierbar (schwacher Effekt auf AV)
Disordinal: kein gemeinsamer Trend Faktoren erkennbar, keine Interpretation möglich (stärkster Effekt auf AV)
Hybrid: beide anderen Effekte gleichzeitig (Interpretation nur für einen einflussfaktor möglich)
027 Wie viele Hypothesen können im Kontext einer dreifaktoriellen Varianzanalyse formuliert werden? Anhaltspunkt finden Sie im Modell, das Sie für Übungsaufgabe 021 formuliert haben.
Sieben Hypothesen: Jeweils eine pro Haupteffekt eines einzelnen Faktors, jeweils eine pro Interaktionseffekt zweier Faktoren sowie eine zur Interaktion aller drei Faktoren.
028 Was sind "multiple Vergleichstests" und welche Funktion haben sie? Welche Gefahr besteht da- bei und wie wird ihr begegnet?
ob zwischen mindestens zwei der Gruppen signifikante Unterschiede auftreten, jedoch nicht, zwischen welchen.
Dies muss bei einem signifikanten Ergebnis im Anschluss geprüft werden
spezielle "Post-hoc-Tests" durchgeführt, die für die Anzahl der Tests korrigieren (z.B. Bonferroni-Korrektur)
Kontrastanalyen vs. Post hoc Analysen
029 Wofür wird der „Levene-Test“ eingesetzt? Erläutern Sie kurz die Bedeutung der Ergebnisse für die Durchführung einer Varianzanalyse.
„Levene-Test“ überprüft, ob Varianzen der Gruppen gleich sind, also Varianzhomogenität besteht
H0 überprüft, die von Gleichheit der Varianzen ausgeht
Ein signifikantes Ergebnis spricht also für signifikante Abweichung der Gruppenvarianzen voneinander, wodurch Voraussetzung der Varianzanalyse verletzt ist
durch Korrektur der Prüfwerte (Welch-Korrektur) begegnet werden
Bei nicht-signifikantem Levene-Test = Varianzanalyse
030 Wie unterscheiden sich Kontrastanalysen und Post-hoc Tests?
Beide = Testung paarweiser Unterschiede von Gruppen
Für Kontrastanalysen = vorab Hypothesen formuliert, welche Gruppen sich (in welcher Art) unterscheiden
A priori Vermutung
sind hypothesenprüfend
Post-hoc-Tests = ohne vorherige Annahmen durchgeführt. Sie sind daher explorativ, d.h. hypothesengenerierend
F Test signifikant
031 Sie überprüfen in einem experimentellen Design die Auswirkungen von zwei unterschiedlichen computergestützten Lernprogrammen (A: nur Text, B: Text und Bilder) auf das interkulturelle Wissen männlicher und weiblicher Probanden. Welche Art von Varianzanalyse müssen Sie bei der Analyse der Daten anwenden? Wie würde sich die Analyseart verändern, wenn Sie zusätzlich das Alter in Form von (a) „jung“ vs. „alt“ oder (b) Altern in Jahren berücksichtigen würden?
zweifaktorielle Varianzanalyse durchgeführt
Im Fall (a) würde diese auf eine dreifaktorielle Analyse erweitert
im Fall (b) auf eine Kovarianzanalyse
kovariate = metrisch skalierte UV
Zusätzlich zu nominal skalierten Faktoren
Keine Post hoc Ergänzungen möglich
032 Für welche Fragestellungen werden Faktorenanalysen genutzt? Nennen Sie zwei Beispielfrage- stellungen aus psychologischen Forschungskontexten. Veranschaulichen Sie sich alle im Weite- ren beschriebenen Schritte anhand eines der Beispiele, indem Sie das Lehrbuchbeispiel auf Ihr eigenes Beispiel übertragen.
Faktorenanalysen: Strukturen in großen Anzahl von Variablen (z.B. Fragen eines Fragebogens) zu entdecken
Gruppen von Variablen identifiziert, die jeweils hoch miteinander korrelieren
hohe Anzahl von Variablen auf geringe Anzahl von übergeordneter Variablen (Faktoren) reduziert
Beispielfragestellungen: Wie lassen sich Fragen zu einem Merkmalsbereich (z.B. Mitarbeiterzufriedenheit) zu Skalen zusammenfassen?
Lassen sich Verhaltensweisen zur Stressbewältigung zu Gruppen zusammenfassen und welche übergeordneten Strategien repräsentieren diese?
= strukturentdeckendes Verfahren
033 Stellen Sie inhaltliche Überlegungen zur Korrelationsmatrix in Tabelle 7.3 in Bezug auf die Über- tragung auf das angesprochene psychologische Beispiel an: Welche Emotion würden Sie wel- chem Schokoladenmerkmal zuordnen, damit sich ähnliche Korrelationswerte ergäben? Welche zugrunde liegende Struktur würden Sie (in Anlehnung an Abbildung 7.4) erwarten?
Da milchig, schmelzend und künstlich hoch korrelieren, könnten ihnen die drei „negativen“ Emotionen ängstlich, traurig und verärgert zugeordnet werden.
fruchtig und erfrischend könnten durch die zwei „positiven“ Emotionen freudig und ruhig ersetzt werden.
Es ergäben sich somit die Faktoren „positive Emotionen“ und „negative Emotionen“.
Beziehung
034 Was versteht man unter dem Fundamentaltheorem der Faktorenanalyse?
Das Fundamentaltheorem (auch Fundamentalsatz) = Korrellations-Matrix der Ausgangsdaten (R) durch die Faktorladungsmatrix (A) und Korrelationsmatrix zwischen Faktoren (C) reproduziert
035 Welche Schritte umfasst die Durchführung einer Faktorenanalyse? Erläutern Sie kurz.
(1) Überprüfung Eignung Korrelationsmatrix (z.B. Anhand Bartlett-Test oder KMO-Kriterium)
(2) Faktorenextraktion und Bestimmung Faktorenanzahl anhand Kaiserkriterium oder Screetest
Basis = Korrelation der Variablen untereinander.
verschiedene Verfahren: Hauptkomponenten oder Hauptachsenanalyse eingesetzt
(3) Faktoreninterpretation auf Basis der rotierten Faktorenladungsmatri
orthogonale oder schiefwinklige Rotation erfolgen kann, um Mehrfachladungen zu vermeiden
Faktoren anhand der Variablen interpretiert, die Ladung von > .50 haben
(4) Bestimmung der Faktorwerte (regressionsanalytische Berechnung anhand der Faktorladungen)
036 Anhand welcher Kriterien kann die Eignung der Korrelationsmatrix für eine Faktorenanalyse über- prüft werden? Welche Werte sprechen jeweils für eine Eignung?
037 Was versteht man unter "Kommunalität", (Faktorenanalyse)
Kommunalität: Anteil Varianz Variablen, die durch alle extrahierten Faktoren gemeinsam erklärt
038 Welche Verfahren werden bei der Bestimmung der Anzahl von Faktoren angewendet? Wann kommen Sie zu unterschiedlichen Ergebnissen und was ist dann zu tun?
Kaiser-Kriterium: Auswahl aller Faktoren, die Eigenwert über 1 aufweisen
Scree-Test: Auswahl aller Faktoren, die bei graphischen Darstellung der Eigenwerte oberhalb sichtbaren Knicks liege
Unterschiedliche Ergebnisse, wenn viele Faktoren Eigenwerte größer 1 haben, einige davon aber auf einer sich dem horizontalen Verlauf annähernden Linie liegen
zusätzlich inhaltliche Überlegungen zu Anzahl und Inhalt erwarteter Faktoren
039 Wie unterscheiden sich Hauptkomponenten- und Hauptachsenanalyse?
Hauptkomponentenanalyse: angewendet, wenn a priori noch kein Wissen über Datenstruktur vorliegt
Ziel: Verdichtung Daten zu Faktoren
gesamte Varianz der Variablen durch Faktoren erklärt
Somit Kommunalitäten anfänglich auf 1 gesetzt
Faktoren anhand analysierten Variablen interpretiert: Wie lassen sich die auf einer Hauptkomponente (Faktor) hoch ladenden Variablen durch einen Sammelbegriff zusammenfassen?
Hauptachsenanalyse: faktorenanalytischen Verfahren
Kommunalität Variablen aus der durch alle Faktoren erklärten Varianz und Restvarianz zusammensetzt
anfänglichen Kommunalitäten sind kleiner als 1
ermittelten Faktoren als Ursache der beobachteten Korrelationen angesehen: Wie kann der Effekt beschrieben werden, der die hohen Ladungen der Variablen auf dem Faktor verursacht?
040 Was versteht man unter einer "Rotation" und welche Arten können unterschieden werden? Wa- rum wird rotiert und warum gibt es unterschiedliche Rotationsarten? Erläutern Sie anhand von psychologischen Beispielen.
Drehung des Koordinatenkreuzes bei graphischen Darstellung der Faktoren
Durch Rotation werden Faktorenladungen auf zugeordneten Faktor erhöht, auf allen anderen verringert.
Dadurch wird Zuordnung der Variablen zu Faktoren eindeutiger und Interpretation erleichter
unterscheidet rechtwinklige (orthogonale) und schiefwinklige (oblique) Rotation
rechtwinkligen = bleiben Faktoren im Koordinatensystem rechtwinklig zueinander angeordnet, d.h. Faktoren untereinander nicht korreliert
oblique = dürfen Faktoren untereinander korrelieren und dürfen aus grafischer Sicht auch schiefwinklig zueinander stehen
Psychologische Beispiele:
Big- Five-Fragebögen: zugrundeliegenden Skalen Big-Five unkorreliert (orthogonale Rotation)
Items eines Stressbewältigungsfragebogens analysiert, um Gruppen von Stressbewältigungsstrategien zu ermitteln = schiefwinklige Rotation
041 Wie werden die ermittelten Faktoren interpretiert? Faktorenanalyse
Basis Interpretation ist rotierte Faktorenladungsmatrix
In dieser näherungsweise Einfachstruktur herrschen
Faktoren anhand der Variablen interpretiert, die auf diesen hoch (> .50) laden
Variablen auf mehreren Faktoren hoch laden, müssen sie für alle Faktoren zur Interpretation herangezogen werden
Bei Konstruktion von Fragebögen sollten solche Lösungen allerdings vermieden werden, damit Items eindeutig zu Skalen zuzuordnen
042 Welche Möglichkeiten der Ermittlung von Faktorwerten gibt es? Erläutern Sie kurz.
Surrogate: Verwendung der höchsten Ladung einer Variablen als Ersatz für Faktorwert
Sehr grobe Schätzung, nur geeignet, wenn sich höchste Ladung stark von nächsthöchsten unterscheidet.
Summierte Skalen: Mittelwert aller hoch ladenden Variablen gebildet
Nutzen mehr, jedoch nicht alle vorhandene Information aller Variablen.
Regressionsanalyse: Information aller Variablen genutzt
Ladungen auf jeweiligen Faktor als Regressionskoeffizienten in Gleichung zur Berechnung Faktorwerte genutzt
043 Welche Vorteile bieten Strukturgleichungsmodelle gegenüber Regressionsanalysen? Überlegen Sie sich neben der vorgestellten eine weitere psychologische Fragestellung, die mit Hilfe von Strukturgleichungsmodellen untersucht werden kann.
Regressionsanalysen = nur eine AV definiert
Psychologische Fragestellungen oft komplexe Merkmalszusammenhänge
Strukturgleichungsmodelle bilden Sachverhalte besser ab, da mehrere AV berrücksichtig + Zusammenhänge untereinander abgebildet
latente Variablen durch Messmodelle auf Basis von manifesten Indikatoren repräsentiert werden
Beispielfragestellung: Inwiefern können Merkmale wie soziale Beziehungen, Gesundheitsverhalten und Einkommen das psychische und physische Wohlbefinden von Perso- nen vorhersagen und wie hängen Prädiktoren und Wohlbefinden untereinander zusammen?
UV = soziale Beziehungen usw.
AV = wohlbefinden
044 Auf welchen inferenzstatistischen Verfahren beruhen Strukturgleichungsmodelle?
Regressionsanalysen
konfirmatorischen Faktorenanalysen.
045 Wie werden Strukturgleichungsmodelle grafisch dargestellt und welche Begriffe spielen bei der Beschreibung der Modelle eine Rolle?
mit Hilfe von Pfaddiagrammen dargestellt
Relevante Begriffe sind
latente Variablen (Kausalanalysen)
manifesten Variablen (direkt durch metrischen Skalenniveau messbar)
endogene (AV) und exogene (UV) Variablen
Messmodell der latenten exogenen Variablen,
Messmodell der latenten endogenen Variablen
Strukturmodell
046 Wenden Sie die Begriffe aus Aufgabe 045 auf Ihre Beispielfragestellung an.
Latente endogene Variablen: psychisches und physisches Wohlbefinden (AV)
Latente exogene Variablen: Gesundheitsverhalten, soziale Beziehungen, Einkommen (UV)
mit Hilfe von Indikatoren (manifeste Variablen) messbar gemacht werden
beispielsweise Fragebogen sein ("Fühlen Sie sich durch Schmerzen in der Bewältigung ihrer alltäglichen Aufgaben eingeschränkt?")
Manifeste Variablen = direkt messbar
z.B. Gewichtm Körpergröße, Gehalt
Zusammenhänge der zugeordneten Indikatorvariablen im Messmodell der latenten exogenen Variablen abgebildet
Zusammenhänge der zugeordneten Indikatorvariablen mit psychischer und physischer Gesundheit im Messmodell der latenten endogenen Variablen abgebildet
Zusammenhänge latenten Variablen endogenen (psychische und physische Gesundheit) und exogenen Variablen (soziale Beziehungen, Gesundheitsverhalten, Gehalt) untereinander = Strukturmodell
047 Erläutern Sie kurz die Schritte der Durchführung einer Strukturgleichungsanalyse.
(1) Modellformulierung auf Basis Pfadmodells
Modelle mit latenten Variablen = Modell der Beziehungen der latenten Variablen untereinander (Strukturmodell) + Modelle zur Messung latenten Variablen
(2) Parameterschätzung
alle Parameter gleichzeitig geschätzt oder in zwei Schritten
1. Schätzung der Messmodelle auf der Basis kon- firmatorischer Faktorenanalysen
2. Schätzung des Strukturmodells auf der Basis von Regressi- onsanalyse)
3) Beurteilung der Schätzergebnisse mittels Chi2-Anpassungstest und weiterer FitIndizes wie CFI oder RMSEA.
048 Welche zwei Verfahren bei der Schätzung von Strukturgleichungsmodellen können grundsätzlich unterschieden werden?
(1) Die gleichzeitige Schätzung aller Parameter vs.
(2) das schrittweise Schätzen von
1. der Messmodelle und
2. des Strukturmodells.
049 Was versteht man unter Goodness-of-Fit-Indizes? Nennen Sie zwei Beispiele und ihre Bewertung.
Kriterien, anhand derer Passung Strukturgleichungsmodells an Daten bewertet werden
Neben Chi2-Test weitere Parameter berechnet
Namen und Bewertung s. Tabelle am Ende des Leittextabschnitts zu Strukturgleichungsanalysen.
050 Wie können Strukturgleichungsmodelle im Rahmen der computergestützten Analyse definiert werden?
Grafisch = Pfaddiagrammen
per Syntax = statistisch definierten Zusammenhänge
051 Erläutern Sie Unterschiede und Parallelen zwischen einer exploratorischen und einer konfirmato- rischen Faktorenanalyse. Bei welchem Verfahren handelt es sich um ein "strukturen-entdecken- des" und bei welchem um ein "strukturen-prüfendes" Verfahren? Warum?
Beide Verfahren beruhen auf Korrelationsmatrix der analysierten Variablen
explorativen Faktorenanalyse = Anzahl der zu extrahierenden Faktoren sowie Zuordnung der Variablen zu Faktoren im Rahmen Analyse ermittelt
stellen Ergebnis der Analyse dar
konfirmatorischen Faktorenanalyse = beide Informationen dagegen a priori (d.h. vorab) festgelegt
Ergebnis stellt Grad der Anpassung der Daten an vorgegebene Struktur dar
explorativen Faktorenanalyse = strukturen-entdeckendes Verfahren
konfirmatorischen Faktorenanalyse = strukturen-überprüfendes Verfahren.
052 Führen Sie sich den Prozess einer wissenschaftlichen Fragebogenvalidierung beispielsweise zum Thema Mitarbeitendenzufriedenheit vor Augen. Wann werden explorative, wann konfirmatorische Faktorenanalysen eingesetzt? Wie unterscheiden sich Vorannahmen und Fragestellungen jeweils?
explorative Faktorenanalyse = am Anfang Prozesses eingesetz
Vielzahl von Fragen zum Thema formuliert und dann untersucht, zu welchen Variablengruppen (Skalen) sich diese zuordnen lassen
Fragen identifiziert, die inhaltlich nicht passen oder für Befragten nicht ausreichend verständlich sind.
Konfirmatorische Faktorenanalysen = eher später im Prozess eingesetzt
geeignete Items schon feststehen sowie Merkmalsdimensionen, die sie messen sollen (z.B. Zufriedenheit im Team)
ob Items sich angenommenen Faktoren wie erwartet zuordnen, d.h. ob zugrunde gelegte Messmodell zutrifft
überprüfen, ob anderssprachigen Versionen des Fragebogens dasselbe Modell zugrunde liegt oder ob das Modell gleichermaßen für männliche und weibliche oder älteren und jüngeren Mitarbeitenden passt.
053 Wie unterscheiden sich reflektive und formative Messmodelle? Welche sind Basis konfirmatori- scher Faktorenanalysen? Wie sieht es im Vergleich dazu bei explorativen Faktorenanalysen aus?
unterscheiden sich hinsichtlich postulierten Kausalrichtung zwischen latenten Variablen und Indikatoren
Formative Messmodelle = Ausprägung der Indikatoren bestimmt Ausprägung der latenten Variablen
Indikatoren (oder mehrere) ausgetauscht, so würde sich Ausprägung der latenten Variablen ändern
Grundlage regressionsanalytischer Verfahren
Reflektive Messmodelle = umgekehrten Verursachungsrichtung: Veränderungen in Indikatoren durch Veränderungen latenten Variablen verursacht
Indikatoren austauschbar, weil nur "Reflexionsflächen" der latenten Variablen
Reflektive Messmodelle sind Grundlage
054 Was versteht man im Kontext von konfirmatorischen Faktorenanalysen unter freien und festen Parametern?
Feste Parameter = bei Modellspezifikation festgelegt
Beispielsweise = Ladungen von Items auf anderen als den zugeordneten Faktoren auf 0 gesetzt
A priori festgelegt
Freie Parameter = Parameter, die bei Modellschätzung aus Daten geschätzt
Beispielsweise = Ladungen von Items auf zugeordneten Faktoren oder Korrelation der Faktoren untereinander
Werte unbekannt, aus empirischen Daten geschätzt
055 Welche Möglichkeiten, der Modellspezifizierung gibt es bei der konfirmatorischen Faktorenana- lyse? Bei welcher Möglichkeit wird der Unterschied zwischen freien und festen Parametern be- sonders deutlich?
(1) Grafische Darstellung in Form eines Pfaddiagramms,
(2) als Gleichungssystem,
(3) in Matrixschreibweise (gut sichtbar, welche Parameter feste sind, weil beispielsweise als 0 erscheinen)
056 Welche Rolle spielt die Einfachstruktur bei einer konfirmatorischen Faktorenanalyse? Und wie ist es im Vergleich dazu bei der explorativen Faktorenanalyse?
Bei Modellformulierung wird Einfachstruktur zugrunde gelegt, d.h. Indikatoren dürfen nur auf zugeordneten Faktor laden
Bei explorativen Faktorenanalyse = Einfachstruktur angestrebt, aber meist nicht erreicht
Doppelladungen in der Faktorladungsmatrix = durch Rotation reduziert
Nebenladungen bleiben bei rotierten Lösungen immer
Faktorenextraktion?
Faktorenextraktion: Prozess, entschieden, zu wie vielen Faktoren Variablen zusammengefasst werden und für jede Variable Faktorenladung auf einzelnen Faktoren bestimmt
Eigenwert
Eigenwert: Summe der quadrierten Ladungen aller Variablen für Faktor
Faltorenladung
Faktorenladungen: Korrelationen Variablen mit einzelnen Faktoren. Geben Stärke und Richtung des Zusammenhangs zwischen Variablen und Faktor an
Faktorenwerte
Faktorwerte: Aus Faktorladungen mittels Regressionen berechnete individuelle Werte der einzelnen Personen für ermittelten Faktoren
stellen Repräsentationen Ausprägung des übergeordneten Merkmals bei Person dar und für weitere Analysen verwendet werden
standardisierte Werte, die als Abweichungen vom Gesamtmittelwert dargestellt
Zuletzt geändertvor einem Jahr