Arten von Daten
Zeitreihen Daten - Die Daten werden bei derselben Einheit zu verschiedenen Zeitpunkten (BIP)
Querschnittsdaten - Die Daten werden für verschiedene Merkmalsträger (i = 1,…,N) zu einem einheitlichen Zeitpunkt erhoben. → X (Konsumausgaben von haushalten in 1 Monat)
Paneldaten - Kombination aus Zeitreihen- und Querschnittsdaten Für eine Vielzahl von Merkmalsträgern (i = 1,…,N) werden über die Zeit (t = 1,…,N) wiederholt Beobachtungen erhoben. → Xit (monatliche Befragung von Unternehmen über die Geschäftslage)
Ziele der Datenaufbereitung
Ziel 1: Komprimierung/Verdichtung der in den Daten enthaltenen Informationen Graphische Darstellung von Daten Einfache Transformationen von Daten Statistische Kennzahlen Verdichtung führt zu Verlust an Informationen Deskriptive Statistik: meist hoher Verdichtungsgrad Ökonometrie: Nutzung weniger verdichteter Daten (da ökonometrische Verfahren selbst als Informationsverdichtung fungieren)
Ziel 2: Bereinigung von Ausreißern und Fehlern Beobachtung: einzelne Werte einer Zeitreihe oder eines Querschnitts weichen deutlich von den übrigen Werten ab Handelt es sich um eine unnormale Beobachtung oder nur um eine besonders starke Ausprägung? → i. d. R. schwierig festzustellen Mögliche Ursachen Fehler bei der Eingabe oder Übertragung der Daten Effekt eines einzelnen Ereignisses Fehlerhafte Datenerhebung oder Datenaufbereitung Änderungen in der Definition oder Abgrenzung der Daten Überprüfung der Daten auf Plausibilität muss vor dem Einsatz ökonometrischer Verfahren erfolgen!
Operationalisierung
Legt fest wie ein technisches Konstrukt messbar und beobachtbar gemacht werden kann
Konjunktur nach NBER
Plausibilität theoretische Begründung für den Zusammenhang zwischen Indikator und der Stellung im Konjunkturzyklus
Statistisch-datentechnisch keine oder nur interpretierbare Strukturbrüche, verlässliche Erhebung
Konformität Entwicklung des Indikators entsprach in der Vergangenheit der konjunkturellen Entwicklung
Datenaktualität Zeitnahe Verfügbarkeit
Konjunktur Indikatoren
Indikatoren für den Beschäftigungsstand
Arbeitslosenquote = registrierte Arbeitslose / Erwerbspersonen
Definition Zähler: Zahl der registrieren Arbeitslosen enthält nicht alle Arbeitssuchenden, manche registriere Arbeitslose stehen dem Arbeitsmarkt aber gegenwärtig nicht zur Verfügung Definition Nenner: verschiedene Abgrenzungen sind möglich Aussagegehalt: im ILO-Konzept gelten Personen mit geringer Stundenzahl bereits nicht mehr als arbeitslos → Maß für Unterbeschäftigung nötig
Offene Stellen ähnliche Probleme wie bei Zahl der registrierten Arbeitslosen
Anspannungsindex = Zahl der Arbeitslosen / Zahl d. offenen Stellen
enthält keine Information über die tatsächliche Kompatibilität von Arbeitslosen und offenen Stellen (z. B. bzgl. Qualifikation, Region)
Mittlere Dauer der AL = Zahl der Arbeitslosen / Abgänge aus AL p.M. erlaubt keine Aussagen über die Verteilung der Arbeitslosigkeit → dafür z. B. nötig: Anteil der Langzeitarbeitslosen an allen Arbeitslosen
Gauss Markov Annahmen
Was ist BLUE
KQ-Schätzer ist BLUE, d.h. Best Linear Unbiased Estimator, und normalverteilt
Was bedeutet Heteroskedastizität?
Heteroskedastizität tritt auf, wenn die Fehlervarianz in einer Regression nicht konstant ist. Das bedeutet, dass die Streuung der Residuen nicht gleichmäßig über alle Werte der unabhängigen Variablen verteilt ist.
Sorgt dafür das t-test und Konfidenzintervalle nicht mgölich sin
Wie kann man das testen? Visualisieren -> bei Trichterfrom starker Hinweis
3 Anforderungen an Daten
Objektivität: Die Ergebnisse der Datenerhebung dürfen nicht vom Beobachter beeinflusst werden, sodass verschiedene Forscher unter gleichen Bedingungen zu denselben Ergebnissen kommen.
Reliabilität (Zuverlässigkeit): Wiederholte Messungen unter gleichen Bedingungen sollten zu identischen Ergebnissen führen, um eine konsistente Datenbasis zu gewährleisten.
Validität: Die erhobenen Daten müssen tatsächlich das messen, was sie laut theoretischem Modell erfassen sollen, damit fundierte Schlussfolgerungen gezogen werden können
Unterschiede zwischen dem BA- und dem ILO-Konzept
BA-Konzept (amtliche Arbeitslosenquote in Deutschland)
Berücksichtigt alle arbeitslos gemeldeten Personen bei den Arbeitsagenturen und Jobcentern.
Voraussetzung: Die Person ist arbeitslos gemeldet, sucht aktiv eine Beschäftigung und steht dem Arbeitsmarkt zur Verfügung.
Berechnung: Arbeitslosenquote (BA)=registrierte Arbeitslose/Zivile Erwerbspersonen×100
LO-Konzept (internationale Vergleichbarkeit)
Definition laut ILO: Arbeitslos ist, wer:
keine Beschäftigung hat,
aktiv nach einer Arbeit sucht (innerhalb der letzten vier Wochen),
innerhalb von zwei Wochen für eine neue Stelle verfügbar wäre.
Das ILO-Konzept basiert auf Haushaltsbefragungen (z. B. Mikrozensus in Deutschland), nicht auf Registrierung bei Behörden.
Berechnung (ähnlich wie das BA-Konzept): Arbeitslosenquote (ILO)=arbeitslose Personen nach ILO-Definition/ Erwerbspersonen insgesamt×100
Beispiel: Eine Person, die aktiv nach Arbeit sucht, aber nicht bei der Agentur für Arbeit gemeldet ist, wird hier als arbeitslos gezählt.
Allgemeine Aufgabe von Indizes in der empirischen Wirtschaftsforschung
Messung von Veränderungen über die Zeit
Vergleich zwischen verschiedenen Regionen oder Gruppen
Vereinfachung komplexer Datenmengen
Grundlage für wirtschaftspolitische Entscheidungen
Berechnung von Kaufkraft- und Wohlstandsindikatoren
Fehler 1. und 2. Art
Unterschied Preisindex nach Laspeyres und Paasche
Laspeyres-Preisindex:
Nutzt die Mengen aus dem Basisjahr (q0q_0q0) als Gewichtung.
Vorteil: Einfache Berechnung, da nur Basisjahr-Daten benötigt werden.
Nachteil: Überschätzt die Preissteigerung, da es keine Anpassung an veränderte Konsumgewohnheiten gibt (Substitutionseffekt).
Paasche-Preisindex:
utzt die aktuellen Mengen (qtq_tqt) als Gewichtung.
Vorteil: Berücksichtigt Veränderungen im Kaufverhalten (Substitutionseffekt).
Nachteil: Aufwendiger, da aktuelle Mengen erfasst werden müssen
Vorteil der Arbeitseinkommensquote (AEQ) gegenüber der Lohnquote
Was bedeutet eine rückläufige Arbeitseinkommensquote?
Die AEQ berücksichtigt zusätzlich das Einkommen der Selbstständigen, während die Lohnquote nur die Einkommen der abhängig Beschäftigten erfasst. Dadurch bietet die AEQ ein umfassenderes Bild der funktionalen Einkommensverteilung zwischen Arbeit (Löhne & Selbstständigen-Einkommen) und Kapital (Gewinne, Zinsen, Mieten).
Eine sinkende AEQ bedeutet, dass der Anteil der Einkommen aus Arbeit (Löhne & Selbstständigen-Einkommen) am Volkseinkommen abnimmt.
Mögliche Gründe:
Steigende Kapitalgewinne → Einkommen aus Unternehmen, Aktien & Immobilien wächst schneller als Arbeitseinkommen.
Schwache Lohnentwicklung → Löhne steigen langsamer als das Wirtschaftswachstum.
Automatisierung & Globalisierung → Mehr Produktionsfaktoren werden kapitalintensiv, weniger Arbeitskraft wird benötigt.
➡ Folge: Die Einkommensverteilung verschiebt sich zugunsten der Kapitaleinkommen, was zu steigender wirtschaftlicher Ungleichheit führen kann.
ifo-Geschäftsklimaindex – Erklärung & Verwendung
Was bildet der ifo-Geschäftsklimaindex ab? Der ifo-Geschäftsklimaindex misst die Stimmung in der deutschen Wirtschaft, basierend auf monatlichen Umfragen unter ca. 9.000 Unternehmen aus Industrie, Baugewerbe, Handel und Dienstleistungen. Er setzt sich aus zwei Komponenten zusammen:
Aktuelle Geschäftslage: Wie bewerten Unternehmen ihre derzeitige wirtschaftliche Situation?
Geschäftserwartungen: Wie schätzen Unternehmen ihre wirtschaftliche Entwicklung in den nächsten sechs Monaten ein?
Der Indexwert ergibt sich als gewichteter Mittelwert dieser beiden Einschätzungen.
Wofür wird der Index verwendet?
Frühindikator für die wirtschaftliche Entwicklung → Gibt Hinweise auf Konjunkturtrends vor anderen Wirtschaftsdaten.
Entscheidungsgrundlage für Politik & Unternehmen → Hilft bei Investitions- und Wirtschaftspolitik-Entscheidungen.
Marktsignale für Finanzmärkte → Investoren nutzen ihn zur Einschätzung der Wirtschaftslage.
💡 Fazit: Der ifo-Geschäftsklimaindex ist ein zentraler Stimmungsindikator für die deutsche Wirtschaft und dient als wichtiger Frühindikator für konjunkturelle Entwicklungen.
Was gibt R^2 an
R2 gibt an, wie viel Prozent der Variation der abhängigen Variable (YYY) durch die unabhängigen Variablen (XXX) erklärt werden kann. Wertebereich: 0≤R2≤10 \leq R^2 \leq 10≤R2≤1
R2= 1 → Das Modell erklärt 100 % der Variation von YYY (perfekte Anpassung).
R2=0 → Das Modell erklärt gar nichts, YYY variiert unabhängig von XXX.
R2=0.70→ 70 % der Variation von YYY werden durch XXX erklärt, der Rest durch andere Faktoren.
Achtung: Ein hohes R2 bedeutet nicht, dass das Modell gut oder kausal ist! Ein zu hohes R2 kann auf Overfitting hindeuten. Das adjustierte R2R^2R2 ist besser für Modelle mit vielen Variablen.
Was ist der Unterschied zwischen dem Adjusted R² und dem R²? Wird sich das Adjusted R² im vorliegenden Beispiel stark vom R² unterscheiden oder nicht?
R2(Bestimmtheitsmaß) gibt an, wie viel der Variation von YYY durch die unabhängigen Variablen erklärt wird.
Adjusted R2(korrigiertes Bestimmtheitsmaß) berücksichtigt die Anzahl der erklärenden Variablen und bestraft überflüssige Variablen.
Falls das Modell viele unnötige Variablen enthält, wird Adjusted R2 deutlich niedriger sein als R2 ➡ Falls alle Variablen relevant sind, bleibt der Unterschied gering.
Fazit: Wenn das Modell gut spezifiziert ist (keine unnötigen Variablen), wird sich das Adjusted R2nicht stark von R2unterscheiden. Falls viele irrelevante Variablen enthalten sind, fällt das Adjusted R2 spürbar niedriger aus.
Evaluationsproblem
Problem: Wir können nie gleichzeitig beobachten, wie eine Person mit und ohne eine Maßnahme abschneidet. ➡ Frage: Hat eine Maßnahme wirklich einen kausalen Effekt oder wäre das Ergebnis auch ohne sie eingetreten?
Beispiel:
Wir wollen wissen, ob Nachhilfe den Notendurchschnitt verbessert.
Ein Schüler kann aber nicht gleichzeitig mit und ohne Nachhilfe existieren → Wir wissen nicht, was ohne Nachhilfe passiert wäre.
Um das Problem zu lösen, vergleicht man eine Behandlungsgruppe mit einer Kontrollgruppe:
Randomisierte Experimente (RCTs) → Zufällige Gruppenzuordnung vermeidet Verzerrungen. Doppelter Differenzen-Ansatz (DiD) → Vergleicht Veränderungen über die Zeit zwischen Gruppen.
Matching-Verfahren → Personen mit ähnlichen Eigenschaften werden verglichen. ✅ Instrumentvariablen (IV) → Nutzt externe Faktoren zur Identifikation des kausalen Effekts.
Fazit: Das fundamentale Evaluationsproblem macht kausale Schlussfolgerungen schwierig, aber mit cleveren Methoden kann man es umgehen! 🚀
DiD Ansatz
Der Differenz-von-Differenzen-Ansatz (DiD) wird verwendet, um kausale Effekte einer Maßnahme zu identifizieren, wenn eine randomisierte Zuweisung nicht möglich ist.
➡ Idee: Vergleicht die Veränderung über die Zeit zwischen einer Behandlungsgruppe (Treatment) und einer Kontrollgruppe (Control). ➡ Dadurch werden allgemeine Trends herausgerechnet, die beide Gruppen gleichermaßen betreffen.
Parallele Trends (Key-Assumption) 📉
Beide Gruppen hätten ohne die Maßnahme einen ähnlichen Verlauf gehabt.
Wenn die Kontrollgruppe sich vorher anders entwickelt hat, ist der Vergleich verzerrt!
2. Keine systematische Selektion
Die Behandlungs- und Kontrollgruppe sollten vor der Maßnahme vergleichbar sein.
Falls sich z. B. nur besonders arme Regionen für den Mindestlohn entscheiden, kann das das Ergebnis verfälschen.
3. Keine Spillover-Effekte
Die Kontrollgruppe darf nicht indirekt von der Maßnahme betroffen sein.
Beispiel: Falls Unternehmen aus der Behandlungsgruppe in die Kontrollgruppe abwandern, ist das Modell problematisch.
Korrigiert für allgemeine Zeittrends (anders als eine einfache Vorher-Nachher-Analyse).
Kein randomisiertes Experiment nötig, da bestehende Gruppen verglichen werden.
Einfache Berechnung und Interpretation.
Parallele Trends müssen überprüft werden → Falls die Gruppen schon vor der Maßnahme anders verlaufen, ist das Modell unbrauchbar.
Ergebnisse hängen von der Kontrollgruppe ab → Eine schlechte Vergleichsgruppe führt zu verzerrten Ergebnissen.
Verzerrungen durch externe Faktoren → Falls zwischen den beiden Zeitpunkten andere wirtschaftliche Schocks passieren, könnte das Ergebnis fälschlicherweise der Maßnahme zugeschrieben werden.
Zuletzt geändertvor 3 Monaten