Warum nutzt die VWL fast immer Fixed Effects? Wie funktioniert der Hausman-Test? Ein praxisnaher Leitfaden mit Stata- und R-Code für Bachelorarbeiten und Masterarbeiten.
In der angewandten VWL gilt eine einfache Faustregel: Im Zweifel Fixed Effects. Der Grund: FE kontrolliert für alle zeitkonstanten unbeobachteten Unterschiede zwischen Ihren Einheiten – ohne dass Sie wissen müssen, welche das sind. Random Effects ist effizienter, setzt aber eine starke Annahme voraus: dass die unbeobachtete Heterogenität nicht mit den erklärenden Variablen korreliert. Der Hausman-Test prüft genau diese Annahme – und verwirft sie in den meisten VWL-Anwendungen.
Paneldaten (auch: Längsschnittdaten) beobachten dieselben Einheiten – Personen, Firmen, Länder, Regionen – über mehrere Zeitpunkte hinweg. Diese Struktur bietet gegenüber reinen Querschnittsdaten einen entscheidenden Vorteil: Sie können unbeobachtete Heterogenität kontrollieren.
Unbeobachtete Heterogenität meint: Einheiten unterscheiden sich in Merkmalen, die Sie nicht messen können – die aber sowohl das Outcome als auch die erklärenden Variablen beeinflussen. Wenn Sie diese Unterschiede ignorieren, sind Ihre Schätzer verzerrt (Omitted Variable Bias). Paneldaten ermöglichen es, diese Verzerrung zu beseitigen – und genau darum dreht sich die Wahl zwischen Fixed und Random Effects.
Sie untersuchen den Effekt von Bildung auf Einkommen. Personen mit höherer Motivation verdienen mehr und investieren mehr in Bildung – aber Motivation ist nicht im Datensatz. In Querschnittsdaten überschätzen Sie den Bildungseffekt, weil Motivation als Omitted Variable wirkt. Mit Paneldaten und Fixed Effects vergleichen Sie jede Person mit sich selbst über die Zeit – die zeitkonstante Motivation fällt raus.
| Datensatz | Einheiten | Zeitraum | Typische Anwendung |
|---|---|---|---|
| SOEP | Personen/Haushalte | Seit 1984, jährlich | Arbeitsmarkt, Bildung, Ungleichheit |
| EU-SILC | Personen/Haushalte | Seit 2005, jährlich | Armut, Einkommensverteilung, europ. Vergleich |
| Penn World Table | Länder | Seit 1950 | Wachstum, Produktivität, Konvergenz |
| Compustat / Amadeus | Firmen | Variabel | Corporate Finance, Investitionen, Produktivität |
| IAB-Daten (LIAB, SIAB) | Beschäftigte/Betriebe | Variabel | Arbeitsmarktforschung, Löhne, Beschäftigung |
Annahme: αi darf mit Xit korrelieren.
Methode: αi wird durch Within-Transformation eliminiert: Jede Variable wird um ihren individuellen Mittelwert bereinigt (Demeaning). Man vergleicht jede Einheit nur noch mit sich selbst über die Zeit.
Vorteil: Konsistent, auch wenn unbeobachtete Heterogenität mit X korreliert. Das ist der Normalfall in der VWL.
Nachteil: Zeitkonstante Variablen (Geschlecht, Region, Branche) werden eliminiert – deren Effekt kann nicht geschätzt werden. Weniger effizient als RE.
Annahme: αi ist nicht mit Xit korreliert – die unbeobachtete Heterogenität ist „zufällig“.
Methode: αi wird als Teil des zusammengesetzten Fehlerterms behandelt. Schätzung per GLS (Generalized Least Squares).
Vorteil: Effizienter als FE (kleinere Standardfehler). Zeitkonstante Variablen können geschätzt werden.
Nachteil: Inkonsistent, wenn die zentrale Annahme verletzt ist – und in der VWL ist sie es fast immer.
| Kriterium | Fixed Effects | Random Effects |
|---|---|---|
| Behandlung von αi | Eliminiert (Within-Transformation) | Teil des Fehlerterms (GLS) |
| Korrelation αi mit Xit | Erlaubt | Nicht erlaubt (H0 im Hausman-Test) |
| Konsistenz | Immer konsistent | Nur unter RE-Annahme konsistent |
| Effizienz | Weniger effizient | Effizienter (unter RE-Annahme) |
| Zeitkonstante Variablen | Nicht schätzbar | Schätzbar |
| Stata-Befehl | xtreg Y X, fe / reghdfe Y X, absorb(id) | xtreg Y X, re |
| R-Paket | plm: plm(... , model="within") / fixest: feols(... | id) | plm: plm(... , model="random") |
| Verwendung in VWL-Journals | Dominierend – de-facto Standard | Selten als Hauptspezifikation; ggf. als Robustheitscheck |
Der Hausman-Test (1978) prüft, ob die FE- und RE-Schätzer systematisch voneinander abweichen. Wenn ja, ist die RE-Annahme verletzt und FE ist die korrekte Wahl.
Der Hausman-Test kann bei kleinen Stichproben geringe Power haben (H0 wird nicht verworfen, obwohl FE korrekt wäre) oder bei sehr großen Stichproben fast immer H0 verwerfen. In der Praxis ist der Test ein Argument unter mehreren – aber die inhaltliche Begründung („Ist es plausibel, dass die unbeobachtete Heterogenität unkorreliert ist?“) wiegt schwerer. In den meisten VWL-Anwendungen ist die Antwort: Nein – und deshalb ist FE Standard.
In der angewandten Mikroökonometrie – Arbeitsmarkt, Bildung, Gesundheit, Entwicklung, Public Economics – sind Fixed Effects seit den 1990er-Jahren der unbestrittene Standard. Dafür gibt es vier Gründe.
In ökonomischen Fragestellungen gibt es fast immer unbeobachtete Merkmale (Motivation, Fähigkeit, Unternehmenskultur, institutionelle Qualität), die sowohl das Outcome als auch die erklärenden Variablen beeinflussen. FE eliminiert all diese zeitkonstanten Faktoren – ohne dass Sie sie messen müssen.
Die Annahme, dass unbeobachtete individuelle Effekte „zufällig“ und unkorreliert mit den Regressoren sind, ist in ökonomischen Kontexten fast nie überzeugend. Beispiel: Wenn Sie den Effekt von Firmengröße auf Produktivität schätzen, ist die unbeobachtete Managementqualität mit Sicherheit sowohl mit Größe als auch mit Produktivität korreliert.
Seit Angrist und Pischke (2009, 2010) hat sich in der VWL ein Konsens herausgebildet, dass kausale Identifikation Vorrang vor Effizienz hat. FE ist zwar weniger effizient als RE, aber robuster gegenüber Fehlspezifikation. In einer Disziplin, die kausale Aussagen anstrebt, wiegt Konsistenz schwerer als Effizienz.
In Top-Journals (AER, QJE, Econometrica, RESTAT) werden RE-Schätzungen als Hauptspezifikation kaum noch akzeptiert – es sei denn, die RE-Annahme wird explizit und überzeugend begründet. Das prägt auch die Erwartungen von Betreuern an Bachelorarbeiten und Masterarbeiten.
RE kann als Hauptspezifikation verwendet werden, wenn: (1) die Einheiten tatsächlich zufällig aus einer größeren Population gezogen wurden (z. B. Schulen in einer randomisierten Studie), (2) der Hausman-Test H0 nicht verwirft, und (3) Sie zeitkonstante Variablen schätzen müssen. Selbst dann sollten Sie FE als Robustheitscheck berichten. In der Praxis wird RE häufig in der Gesundheitsökonomie und Bildungsforschung verwendet – in der Arbeitsmikro und Entwicklungsökonomik fast nie.
Der folgende Workflow deckt die typischen Schritte einer Paneldatenanalyse in einer empirischen Abschlussarbeit ab – von der Datenstruktur bis zum Tabellenexport.
xtreg, fe ist der Klassiker. reghdfe (von Correia 2017) ist schneller und ermöglicht mehrere Fixed Effects gleichzeitig (z. B. Firmen- und Zeit-FE) – in den meisten Masterarbeiten die bessere Wahl. areg absorbiert einen FE und ist älter. Empfehlung: Verwenden Sie reghdfe für neue Arbeiten.
Die Schätzung allein reicht nicht. In einer guten Methodiksektion dokumentieren Sie auch die Diagnostik. Hier die wichtigsten Tests und Checks für Paneldaten.
| Test / Check | Was er prüft | Stata | R |
|---|---|---|---|
| Hausman-Test | FE vs. RE | hausman fe re | phtest(fe, re) |
| F-Test auf individuelle Effekte | Sind FE überhaupt nötig? (H0: alle αi = 0) | In xtreg, fe-Output enthalten | pFtest(fe, ols) |
| Breusch-Pagan LM-Test | RE vs. Pooled OLS | xttest0 (nach xtreg, re) | plmtest(re, type="bp") |
| Modifizierter Wald-Test | Gruppenweise Heteroskedastie | xttest3 (nach xtreg, fe) | – |
| Wooldridge-Test | Autokorrelation erster Ordnung | xtserial Y X | pbgtest(fe) |
| Geclusterte Standardfehler | Robustheit gegen Heterosk. + Autokorrel. | vce(cluster id) | cluster = ~id (fixest) |
| Between-Variation prüfen | Gibt es genug Within-Variation für FE? | xtsum variable | summary(Between(pdata$x)) |
In Paneldaten sind die Fehlerterme innerhalb einer Einheit (Person, Firma, Land) fast immer korreliert. Ohne Clustering sind die Standardfehler zu klein und die t-Werte zu groß – Sie finden „Signifikanz“, wo keine ist. Clustern Sie auf der Ebene der Einheit (oder auf der Ebene der Treatment-Zuweisung). Das ist in Stata mit vce(cluster id) und in R mit fixest nativ möglich.
| # | Fehler | Warum problematisch | Lösung |
|---|---|---|---|
| 1 | RE ohne Begründung als Hauptmodell | Die RE-Annahme ist in den meisten VWL-Kontexten nicht haltbar | FE als Standard; RE nur mit expliziter Begründung + Hausman-Test |
| 2 | Hausman-Test nicht berichtet | Prüfer können die Modellwahl nicht nachvollziehen | Immer durchführen und im Methodenteil oder Anhang berichten |
| 3 | Keine geclusterten Standardfehler | SE sind nach unten verzerrt → falsche Signifikanzen | Auf Panel-Ebene clustern: vce(cluster id) / cluster = ~id |
| 4 | Zeitkonstante Variable in FE-Modell | Wird durch Within-Transformation eliminiert – Koeffizient = 0 oder Fehler | Interaktion mit Zeitvariable oder Correlated Random Effects (Mundlak) |
| 5 | Unbalanced Panel nicht adressiert | Selektiver Dropout kann Schätzer verzerren | Attrition-Analyse: Wer fällt raus? Selektionskorrektur prüfen |
| 6 | Nur Einheiten-FE, keine Zeit-FE | Gemeinsame Zeittrends (Konjunktur, Inflation) werden ignoriert | Immer Two-Way FE prüfen: absorb(id year) / feols(... | id + year) |
| 7 | Keine Within-Variation geprüft | Wenn Ihre Schlüsselvariable kaum über die Zeit variiert, ist FE machtlos | xtsum / summary – between vs. within SD vergleichen |
| 8 | Ergebnistabelle mit falschen Angaben | Within-R² und Overall-R² verwechselt; N = Beobachtungen statt Einheiten | Immer N (Beobachtungen), n (Einheiten) und T (Perioden) berichten |
(1) Formale Modelldarstellung mit αi und λt. (2) Begründung der FE-Wahl – inhaltlich + Hausman-Test. (3) Geclusterte Standardfehler mit Angabe der Cluster-Ebene. (4) Robustheitschecks: RE als Alternative, Pooled OLS zum Vergleich, alternative Spezifikationen. (5) Korrekte Berichterstattung: N, n, T, Within-R², F-Test. Bei Fragen zur Umsetzung helfen unsere Statistik-Experten weiter.
Unsere VWL-Ghostwriter und Statistik-Experten helfen Ihnen bei Stata- und R-Code, Hausman-Test, Diagnostik und der Formulierung Ihres Methodenteils – vom Data Cleaning bis zur fertigen Ergebnistabelle.
Jetzt unverbindlich anfragen