Buffl

1-2

NA
by Nazira A.

Wie kommt man von einem theoretischen (ökonomischen) Modell zu einem ökonometrischen

Modell? Die Erste Schritte

Das theoretische Modell muss dann zu einem ökonometrischen Modell

y = b1x1 + b2x2 + ... + bkxk + e

transformiert werden, welches mit Daten geschätzt werden kann. Für die Ermittlung der Koeffizienten, die das angenommene Modell quantifizieren, werden für y und

xi (mit i = 1, ..., k) reale Werte eingesetzt. Die Koeffizienten können dann nach bestimmten Regeln, die wir sogleich noch diskutieren werden, gesetzt werden.

Im Unterschied zu Gleichung 1.1 wird in der Schätzgleichung bereits ein bestimmter Prozess unterstellt. Wir gehen zunächst einmal davon aus, dass ein linearer Zusammenhang zwischen y und den k unabhängigen Variablen auf der rechten Seite existiert.

Es sei angemerkt, dass wir den wahren Zusammenhang noch nicht kennen und dass der Übergang von Gleichung 1.1 zu Gleichung 1.2 zunächst einmal willkürlich ist.

Tatsächlich wird in der Regel zunächst immer ein stark vereinfachtes, lineares Modell geschätzt. Aufbauend auf diesen ersten Ergebnissen können dann komplexere Zusammenhänge in weiterführenden Analysen untersucht werden. Ein solches “trial and error“ Vorgehen, das verschiedene Schätzmethoden miteinander vergleicht, kann uns dabei helfen, den wahren Zusammenhang näherungsweise zu ermitteln.

Je robuster(более надежный) die Ergebnisse, desto belastbarer die aus der Analyse gewonnen Rückschlüsse. In seriösen Analysen wird also in der Regel nicht nur ein Modell gezeigt, sondern viele Robustheitsanalysen präsentiert, um die Allgemeingültigkeit der Ergebnisse zu untermauern und den Leser davon zu überzeugen, dass der wahre Zusammenhang ausfindig (найден)gemacht wurde.1 Außerdem enthält die Gleichung 1.2 einen zusätzlichen Störterm e.

Wie kommt man von einem theoretischen (ökonomischen) Modell zu einem ökonometrischen

Modell? Vorgehen mit den Variablen

Um zu sehen, wie sich die Modellgleichung in die Schätzgleichung überträgt, schauen wir uns zunächst einmal ein paar Eigenschaften der beiden Gleichungen an.Wie wirkt sich eine Änderung der erklärenden Variable xi mit i 2 f1, ..., kg auf die abhängige Variable aus? Dazu bilden wir zunächst die erste Ableitung der beiden Gleichungen 1.1 und 1.2. Beachten Sie, dass es sich hierbei um eine ceteris paribus(При прочих равных условиях) Betrachtung handelt.

Wir schauen uns an, wie sich die Variable y ändern muss, wenn sich eine der x variablen ändert. Das heißt, dass mit Ausnahme der betrachteten Variable xi, alle anderen Variablen xj6=i konstant(nicht veränderlich) bleiben. An dieser Stelle reicht also die Betrachtung der partiellen(частичный) Ableitung völlig aus, da zunächst ein lineares Modell unterstellt(предполагалось) wird.

Aus Gleichung 1.1 lässt sich exemplarisch die erste Ableitung nach x1 bilden, um folgenden Zusammenhang zu bekommen:


Gemäß des Modells führt eine Änderung der Variable x1 um dx1 Einheiten zu einer Anpassung der endogenen Variable y um insgesamt dy Einheiten. Es sei noch einmal angemerkt, dass die Änderung von x1 isoliert betrachtet und alle anderen x Variablen als konstant angenommen wurden. Die erste Ableitung der Funktion f bestimmt die Stärke und die Richtung des Effekts. Wie sieht dieser Zusammenhang in der zugehörigen Schätzgleichung aus?

Warum ist der Umgang mit dem Fehlerterm oder Störterm (e) in einem ökonometrischen Modell so wichtig, und wie unterscheidet sich das ökonometrische Modell vom "wahren Modell", das in der Realität nicht direkt beobachtbar ist?

Auch für dieses Beispiel lassen sich ganz einfach die marginalen(nicht unmittelbar wichtig) Effekte berechnen.

Aus dieser Berechnung lässt sich erkennen, dass das postulierte ökonometrische Modell auch tatsächlich linear ist. Egal wie alt die Person bereits ist, ein weiteres Jahr (dAlter = 1) erhöht den Lohn um dLohn = b3 Einheiten, wobei d für Veränderung (difference) steht.

Die Konstanten b0, b1, b2 und b3 sind also die Parameter des theoretischen Modells und beschreiben die Richtung und die Intensität der Beziehung zwischen dem Lohn und dessen Determinanten.

Variable e erfasst hier alle übrigen Effekte auf den Lohn einer Person. Der Umgang mit diesem Fehlerterm oder Störterm (e) ist extrem wichtig für die Anfertigung einer validen Analyse.

Das ökonometrische Modell wird oft als das wahre Modell bezeichnet, das für den Forscher in der Realität auf Grund der Abstraktheit nicht so ohne weiteres beobachtbar ist. Durch die Anwendung der statistischen (empirischen) Methode auf die Daten, wird das wahre Modell dann geschätzt.

Die Koeffizienten im Vektor b, die den wahren Zusammenhang angeben und unbeobachtbar sind, werden durch die geschätzten Parameter b approximiert(приблизительный). Der wahre Störterm e wird durch den geschätzten Störterm e approximiert. Wir können eine Vermutung über den Zusammenhang aufstellen und diesen dann anhand von Daten schätzen. Dennoch wird der wahre Zusammenhang auch durch die Schätzung niemals entdeckt werden. Lediglich die geschätzten Werte können anhand von Hypothesentests mit einer bestimmten Sicherheit validiert oder abgelehnt werden.

univariate Regression (Einfachregression)

Die einfachste Form einer Regressionsanalyse ist die univariate Regression (Einfachregression), die benutzt werden kann, um die Beziehung zwischen zwei Variablen zu analysieren. Eine abhängige Variable wird auf eine unabhängige Variable regressiert.

Diese Regression liefert einen Koeffizienten für die unabhängige Variable auf der rechten Seite und er gibt uns die Richtung und die Stärke des Zusammenhangs zwischen den beiden betrachteten Variablen an.

Das Konzept ist vergleichbar mit der Berechnung einer Korrelation-(взаимозависимость) zwischen zwei Variablen mit dem Unterschied, dass bei der Einfachregression bestimmte Annahmen getroffen werden und ein kausaler(begründend) Zusammenhang zwischen den durch die unabhängige Variable beschriebenen Einflussfaktoren und der abhängigen Variable unterstellt wird. Im Unterschied zur Regressionsanalyse wird in einer einfachen Korrelationsanalyse in der Regel keine kausale Interpretation gemacht. Die univariate Regression vernachlässigt außerdem definitionsgemäß eine mögliche Interaktion dieser beiden Variablen mit anderen Variablen.

Häufig sind die untersuchten Zusammenhänge allerdings so komplex, dass die vernachlässigung weiterer Einflussgrößen zu Verzerrungen in der Schätzung führt. Als Werkzeug in einer empirischen Analyse der komplexen Welt stößt diese Methode somit schnell an ihre Grenzen. Trotzdem liefert sie eine gute Intuition für die multivariate Regression und wird an dieser Stelle nur zur Wiederholung angesprochen.

Warum ist die Mehrfachregression in der Analyse von Daten mit mehreren Regressoren von Bedeutung, und wie werden Personen, Firmen oder Länder in einem Datensatz anhand eines Index identifiziert, um Informationen zu beobachtbaren Größen auszuwerten?

Im Unterschied zur univarianten Regression berücksichtigt die Mehrfachregression k

Regressoren und wird definiert als


Index i identifiziert ein bestimmtes Individuum, einen bestimmten Gegenstand, ein bestimmter Zeitpunkt oder eine bestimmte Sache.

Je nach betrachtetem Datensatz können das beispielsweise Personen, Firmen oder Länder sein.

Stellen Sie sich vor, es liegen Arbeitsmarktdaten über 1000 Arbeitskräfte in Deutschland vor. Alle Daten seien in einem bestimmten Jahr erhoben worden, so dass die Zeitdimension zunächst einmal keine Rolle spielt.

Jede Arbeitskraft wird nun eindeutig über die Indexvariable i identifiziert. Aus dem Datenbestand lassen sich dann Informationen zu beobachtbaren Größen auswerten.

Zieht man beispielsweise eine bestimmte Person i aus der Grundgesamtheit aller Beobachtungen heraus, dann lässt sich der Lohn dieser Person mit den persönlichen Merkmalen xki vergleichen. Hierbei haben wir vorausgesetzt, dass die Lohninformation auch tatsächlich als Variable vorliegt und dass zusätzliche Informationen zur Charakteristik der Arbeitskräfte ebenfalls im Datensatz enthalten sind.

Logischerweise kann der Forscher nur auf Informationen in den Daten zurückgreifen, die beobachtbar sind. Unbeobachtbare Eigenschaften stellen den Analysten häufig vor Probleme, die nur mit aufwendigen Methoden adressiert werden können.

Warum beginnt der Index, der die Variable identifiziert, die persönliche Merkmale wie Alter, Bildung und Berufserfahrung in einer Regressionsanalyse repräsentieren, in der Regel mit "2"? Und was ist die Rolle der Regressionskonstanten in diesem Zusammenhang, insbesondere in Bezug auf den Lohn von Arbeitskräften?

In der Regel sind zumindest Merkmale wie Qualifikation, Alter und Berufserfahrung beobachtbar und können entsprechend im Modell berücksichtigt werden. Denkbar wäre also eine Analyse, die die Löhne der Arbeitskräfte (abhängige Variable auf der linken Seite der Regression in Gleichung 2.1) den persönlichen Merkmalen (Regressoren auf der rechten Seite der Gleichung 2.1) gegenüberstellt, um so den Einfluss dieser Merkmale auf das Einkommen der Arbeiterschaft zu identifizieren. Die Datenstruktur sei an einem Beispiel veranschaulicht. Nehmen wir uns die Beobachtung mit dem Index i = 1 hervor. Der Lohn dieser ersten Beobachtung sei y1 = 10. Außerdem können wir den vorliegenden Daten auch weitere Informationen über die Variablen x21, x31, ..., xk1 entnehmen.

Der erste Index identifiziert die jeweilige Variable 2, ..., k und der zweite Index wiederum identifiziert jede Beobachtung (in diesem Fall jede Person). Warum beginnt der Index, der die Variable identifiziert (Alter, Bildung, Erfahrung usw.) mit einer 2?

Der Grund hierfür ist eine Zusätzliche Variable in der Regression, nämlich die Regressionskonstante.

Diese Konstante ist identisch für alle Individuen und misst den von den erklärenden Variablen unabhängigen aber messbaren Anteil des Lohns einer Arbeitskraft.

Dieser konstante Anteil des Lohns könnte hier als eine Art Grundgehalt interpretiert werden, dass jeder Person stets unabhängig von ihrer Bildung, ihrer Berufserfahrung oder dem Alter ausgezahlt wird. Auch dies wird später noch viel ausführlicher erklärt.

Technisch lässt sich dies sehr einfach zeigen. Nehmen Sie an, für eine Person sind alle erklärenden Variablen genau gleich Null. Der Lohn dieser Person j müsste gemäß unseres Modells also entsprechen.


Warum kann ein ökonometrisches Modell in manchen Fällen unrealistische Ergebnisse liefern, wie zum Beispiel einen positiven Lohn für ein einjähriges Kind in einer Wirtschaft ohne Grundgehalt? Wie wird dieser Fehler durch den Fehlerterm im Modell berücksichtigt und welche Bedeutung hat er bei der Modellierung von realen Daten?

Diese Person dient als eine Art Referenzpunkt. Ausgehend von diesem Referenzpunkt können alle 1000 Personen relativ dazu angeordnet werden.

Nehmen Sie an, wir beobachten eine Person, die genau ein Jahr alt ist und für die alle anderen Variablen weiterhin eine Ausprägung in Höhe von 0 aufweisen.

Wie hoch wäre der Lohn gemäß der Regressionsergebnisse? Angenommen das Alter wird über die Variable x2i gemessen, dann würden wir einen Lohn


erwarten. Aber ist das ein realistisches Ergebnis? Kann ein Kind in einer Ökonomie

ohne Grundgehalt mit einem Jahr bereits einen positiven Lohn bekommen?

Mit Sicherheit nicht und das ist der Grund, warum der Fehlerterm (e) sehr wichtig ist. Der

Fehler, den das Modell bei einem Kind macht, ist enorm groß! Das Modell berücksichtigt

eben nicht, dass Kinder im Alter von 1 noch nicht arbeiten dürfen oder können und auch kein Grundgehalt erhalten.

Das Modell macht daher in der Prognose einen Fehler, der über den Fehlerterm berücksichtigt wird. Der Lohn sollte Null sein und die Diskrepanz zwischen Modell und Realität wird über den Fehlerterm modelliert.

Für diese eine Beobachtung beträgt der Fehlerterm nämlich ,

so dass der Lohn

als Ergebnis herauskommen würde. Tatsächlich würde man in der Anwendung natürlich nur sinnvolle Beobachtungen zulassen und sich auf Individuen im erwerbsfähigen Alter konzentrieren.

Warum ist die Darstellung von Regressionsmodellen in Matrixschreibweise eine nützliche Methode und wie können die ursprünglichen Gleichungen aus dieser Matrixschreibweise rekonstruiert werden? Erklären Sie, warum für eine Analyse mit 1000 Beobachtungen ein Gleichungssystem mit 1000 Gleichungen erstellt werden müsste und warum die Koeffizienten b1 ... bk für jede Beobachtung gleich sind.

Statt die Gleichung 2.1 n mal untereinander zu schreiben, werden sie in einer kompakten Matrix zusammengefasst, die sich allerdings auch problemlos wieder in die ursprüngliche Form zurückführen lässt.

Wir könnten die Matrix nämlich jederzeit wieder Zeile für Zeile auflösen. In der folgenden Matrix sind alle zur ersten Beobachtung gehörenden Elemente der Matrix gelb hinterlegt:


Da es sich bei y und e um Vektoren handelt und keine Koeffizienten berücksichtigt werden, können die Elemente einfach zeilenweise übernommen werden. Etwas komplizierter ist der Umgang mit der Beobachtungsmatrix und dem Vektor der Koeffizienten, die Element für Element richtig miteinander multipliziert werden müssen.

Das erste Element der ersten Zeile wird mit dem ersten Element des Spaltenvektors b multipliziert, dann das zweite Element der ersten Zeile mit dem zweiten Element des Spaltenvektors der Koeffizienten, bis hin zum kten Element der Zeile, das mit dem kten Element des Spaltenvektors multipliziert wird. Diese Prozedur kann für alle n Beobachtungen wiederholt werden, um folgendes Gleichungssystem aus der Matrix zu gewinnen:

In unserem Beispiel mit insgesamt 1000 Beobachtungen müssten wir also ein Gleichungssystem mit insgesamt 1000 Gleichungen aufschreiben. Beachten Sie, dass die Koeffizienten b1 ... bk für jede Beobachtung gleich sind.

Aus den individuellen Daten werden gemeinsame Effekte identifiziert, die alle Beobachtungen repräsentieren.

Ausgehend von dem Modell der Multivariaten Regression ist der nächste Schritt in der empirischen Analyse die Schätzung dieses (ökonometrischen) Modells! Ziel ist es, die unbekannten Parameter entsprechend einer bestimmen Optimierungsvorschrift zu ermitteln. Wir wollen dafür den OLS Schätzer benutzen.


Wie wird die Methode der kleinsten Quadrate (OLS) verwendet, um den optimalen Parameterwert für den Koeffizienten in einem Modell zu bestimmen, und warum ist es in der Praxis normalerweise nicht notwendig, diese Prozedur unendlich oft zu wiederholen? Welche Art von Zusammenhang wird durch ein analytisches Minimierungsproblem behandelt, und wie hilft es, den optimalen Parameterwert zu finden?

Der Parameter, der den Zusammenhang zwischen Preis und Nachfrage im Modell festlegt, wird nun solange variiert, bis die minimale durchschnittliche Abweichung erreicht wird. Iterativ könnte man ganz einfach einen beliebigen Startwert für den Koeffizienten setzen und alle Abweichungen zwischen real beobachteter Nachfrage und der vom Modell prognostizierten Nachfrage berechnen.

Vergleicht man die Abweichungen dieser Modellvariante mit den Abweichungen, die aus einem alternativen Modell mit abweichenden Koeffizienten resultieren, dann würde man diejenige Variante mit der geringsten Abweichung zwischen Modell und beobachteten Werten bevorzugen.

Nun ist ein Vergleich zweier Modellvarianten nicht ausreichend. Um eine verlässliche Schätzung zu bekommen, müsste diese Prozedur unendlich oft wiederholt werden, um so iterativ zum Parameter für den Koeffizienten zu gelangen, der die beobachteten Daten bestmöglich beschreibt. Anders ausgedrückt: man würde die Prozedur unendlich oft wiederholen, um dann den Parameter zu wählen, für den die durchschnittliche Abweichung zwischen Modell und Beobachtungen minimal ist. Diese Vorgehensweise ist natürlich in der Praxis nicht praktikabel und auch in den häufigsten Fällen nicht notwendig.

Bei einem so einfachen Zusammenhang reicht ein analytisches Minimierungsproblem völlig aus, um den optimalen Parameterwert für den Koeffizienten im Modell zu bestimmen.

Wie wird die Methode der kleinsten Quadrate (OLS) verwendet, um die Parameter der Mehrfachregression zu schätzen, und welche analytische Lösung wird benötigt, um die Summe der quadrierten Abweichungen zu berechnen? Erklären Sie, wie das geschätzte Modell in diesem Zusammenhang verwendet wird.

Wie werden die Parameter der Mehrfachregression durch Einsetzen der gegebenen Daten in die entsprechende Gleichung geschätzt? Welche Notation wird für den geschätzten Wert der Parameter verwendet, und wie wird der Fehlerterm (Residuum) in Abhängigkeit von den Parametern dargestellt? Erklären Sie den Prozess der Berechnung der quadrierten Fehlerterme und wie der OLS-Schätzer definiert ist.

Durch Einsetzen der gegebenen Daten einer empirischen Analyse in diese Gleichung bekommt man eine Lösung für die Parameter der Mehrfachregression. Hierfür benötigen wir allerdings zunächst eine analytische Lösung für die Summe der quadrierten Abweichungen.


Zur Erinnerung, das geschätzte Modell lautet wobei b der geschätzte Wert für b und e der geschätzte Fehlerterm bzw. das Residuum der Regression ist. Je nachdem wie viele Variablen berücksichtigt werden ist b also ein Skalar oder ein Vektor. Da die Residuen durch den oder die Parameter b determiniert werden, wählen wir die Notation e(b). Wie bereits erwähnt, schreiben wir den Fehlerterm e als eine Funktion in Abhängigkeit von b auf. Durch eine einfache Multiplikation der geschätzten Fehlerterme mit sich selbst bekommen wir die quadrierten Fehlerterme. Da die geschätzten Fehlerterm in einem Vektor zusammengefasst wurden, muss der Vektor e(b) zunächst einmal transponiert werden. Dann ist der OLS Schätzer definiert als



Wie werden die geschätzten Residuen in der Mehrfachregression durch Variation der Koeffizienten b beeinflusst? Erklären Sie den Prozess, bei dem die Parameter b so variiert werden,

dass die Bedingungen für ein Minimierungsproblem erfüllt sind.

Wie werden die Terme in eckigen Klammern umgeformt, und welche Rechenregeln werden angewandt? Erläutern Sie den Trick, der im nächsten Schritt angewandt wird, und warum die Terme b'X'y und y'Xb die gleiche Dimension haben.

Aus der zweiten Zeile wird auch ersichtlich, warum die Parameter b die geschätzten Residuen bestimmen. Die Differenz zwischen dem beobachteten y und dem geschätzten y = Xb ergibt das vorhergesagte y. Häufig wird der vorhergesagte Wert von y als ˆ y = Xb bezeichnet, so dass das Residuum als e = y-ˆ y berechnet werden kann. Durch Variation der Koeffizienten b verändern sich auch dementsprechend die geschätzten Residuen e. In einem Minimierungsproblem werden nun die bs solange variiert, bis die Bedingungen für ein Minimierungsproblem erfüllt sind. Doch zuvor müssen wir die Terme in der eckigen Klammer noch etwas umformen. Die Klammern werden unter Beachtung der Matrixregeln aufgelöst, um


zu bekommen. Die Anwendung einer weiteren Rechenregel im Umgang mit transponierten Matrizen ergibt dann


Für diese Lösung wurde die Regel (Xb)’ = b’X’ angewandt. Im nächsten Schritt wird ein Trick angewandt. Bei näherer Betrachtung fällt auf, dass die Terme b’ X’y und y’Xb die gleiche Dimension haben, nämlich die Dimension eines Skalars (1 x1).

  1. Warum ist es notwendig, ein theoretisches Modell in ein ökonometrisches Modell zu transformieren, wenn man die Zusammenhänge zwischen unabhängigen und abhängigen Variablen analysieren möchte?

  2. Welches Ziel verfolgt man bei der Transformation eines theoretischen Modells in ein ökonometrisches Modell, und warum ist ein linearer Zusammenhang zwischen den Variablen in der ökonometrischen Schätzgleichung wünschenswert?

  3. In welchen praktischen Fällen kann eine Linearisierung des Modells erreicht werden, und wie kann sie durch Logarithmieren der Modellgleichung erzielt werden?

  4. Welche Voraussetzungen sind erforderlich, um den OLS (Ordinary Least Squares) Schätzer anwenden zu können, um die unbekannten Parameter in einem ökonometrischen Modell zu schätzen?

  5. Warum ist das Vorhandensein ausreichender Daten zu den Variablen y und den unabhängigen Variablen x2, ..., xk eine wichtige Voraussetzung für die Schätzung mithilfe des OLS Schätzers?


Ausgangspunkt der angestellten Überlegungen war ein beliebiges Modell

der theoretischen Form


– es wird also angenommen, dass ein unbeobachteter Zusammenhang zwischen der unabhängigen Variablen x1, ..., xk und der abhängigen Variable y besteht.

Diese modelltheoretische Überlegung muss zu einem ökonometrischen Modell transformiert werden. Idealerweise bekommt man eine Schätzgleichung der Form:

– Als Ergebnis sollte ein linearer Zusammenhang zwischen den unabhängigen und den abhängigen Variablen resultieren, um mit einfachen Schätzmethoden arbeiten zu können.

– In der praktischen Anwendung kann eine Linearisierung sehr häufig durch Logarithmieren der Modellgleichung herbeigeführt werden.

Ist die Transformation des Modells in einen solch linearen Zusammenhang möglich, kann der OLS Schätzer angewandt werden, um die unbeobachtbaren Parameter zu schätzen. Als Ergebnis bekommen wir


– Voraussetzung für die Schätzung ist das Vorhandensein von ausreichend

Daten zu den Variablen y und x2, ..., xk.

– Liegen diese Daten vor, können die einzelnen Punktschätzer über das

Minimierungsproblem


gelöst werden. Als Ergebnis bekommen wir einen k * 1 Vektor, der die

k Koeffizienten für b enthält.

Frage 1: Welche Eigenschaften des OLS-Schätzers werden innerhalb des Gauß-Markov-Theorems durch das Akronym BLUE (Best Linear Unbiased Estimator) zusammengefasst?

Frage 2: Was bedeutet "Best" im Kontext des Akronyms BLUE, und wie bezieht es sich auf die Varianz des Schätzers?

Frage 3: Welche Rolle spielt die Varianz bei der Bestimmung des OLS-Schätzers, und warum ist ein Schätzer effizient, wenn seine Varianz minimiert ist?

Frage 4: Welche Annahmen sind erforderlich, um die wünschenswerten Eigenschaften des OLS-Schätzers, wie die Effizienz und Unverzerrtheit, zu gewährleisten?

Frage 5: Können Sie die Bedeutung des Begriffs "Unbiased" im Akronym BLUE erläutern und warum ist es wichtig, dass der Schätzer unverzerrt ist?

Frage 6: Welche Konsequenzen ergeben sich aus dem Gauß-Markov-Theorem und den wünschenswerten Eigenschaften des OLS-Schätzers für die Schätzung von Parametern in einem Mehrfachregressionsmodell?

Die Wahl des OLS Schätzers als eine mögliche Lösung für die Parameter des Mehrfachregressionsmodells ist natürlich nicht arbiträr. Unter bestimmten Annahmen können einige wertvolle Eigenschaften des OLS Schätzers nachgewiesen werden.

Diese wünschenswerten Eigenschaften des OLS Schätzers werden innerhalb des sogenannten Gauß-Markov-Theorems häufig mit dem Akronym BLUE zusammengefasst. Wobei sich dieses Akronym aus den folgenden Wörtern zusammensetzt

 Best

 Linear

 Unbiased

 Estimator

Das Best bezieht sich auf die kleinste Varianz des Schätzers. Die Werte für den OLS Schätzer wurden über das Minimierungsproblem so gewählt, dass die Varianz am geringsten ist. Das heißt, dass die Koeffizienten auf Werte gesetzt wurden, die das Modell bestmöglich in die Punktewolke der vorhandenen Beobachtungen einpasst.

Dieser Schätzer wird als effizient bezeichnet. Im folgenden Kapitel werden wir auf die Eigenschaften des OLS Schätzers und der Annahmen, die wir für dessen Berechnung benötigen, eingehen. Zunächst werden wir aber noch die einzelnen Schritte für eine konkrete Berechnung mit dem OLS Schätzer durchgehen und anschließend zwei empirische Anwendungen besprechen.

Author

Nazira A.

Information

Last changed