Forschungsprojekt des Quartals

"Schätzungen für den Household Finance and Consumption Survey (HFCS) - Ein Zusammenspiel zwischen Small Area Estimation im Panel-Kontext und multipler Imputation"

Projektleitung: Prof. Dr. Timo Schmid

Förderer: Deutsche Forschungsgemeinschaft

Inhalt und Ziele

Der Household Finance and Consumption Survey (HFCS) ist der erste Versuch, Vermögensdaten auf individueller Haushaltsebene auf einer einheitlichen Grundlage in Europa zu erheben. Diese Daten können z.B. die Bedeutung verschiedener Vermögenskomponenten und die Verteilung von Verbindlichkeiten und Vermögen über die Haushalte beschreiben. Die Statistiken aus diesen Daten können als Grundlage für die Analyse der möglichen Auswirkungen von Fiskal-, Geld- und Regulierungspolitik verwendet werden. Es gibt jedoch Beispiele dafür, dass das Verhalten spezifischer Untergruppen, so genannter "kleiner Domänen", sehr wichtig für das Verständnis der makroökonomischen Theorie ist. Eine Herausforderung besteht darin, qualitativ hochwertige Schätzungen auf spezifischen Domänenebenen zu liefern, z. B. für kreuzklassifizierte Gruppen von Alter und Finanzanlagen in bestimmten Ländern. Diese Fragestellung basiert hauptsächlich auf drei Problemen:
i.) Kleine Stichprobengrößen - Kleine subgruppenspezifische Stichprobengrößen können zu inakzeptabel großen Varianzen führen und damit ist die Zuverlässigkeit/ Validität der Analyse nicht mehr gegeben.
ii.) Niedrige Antwortquoten - Da der HFCS sensible Informationen über Finanzen und Vermögen der Haushalte erhebt, ist eine niedrige Antwortrate zu beobachten.
iii.) Inkonsistenzen zwischen Panelwellen - Unterschiede in Schätzern zwischen Panelwellen scheinen nicht immer von strukturellen/ inhaltlichen Veränderungen getrieben zu sein, sondern können methodische Ursachen haben.


Ziel ist die Entwicklung neuer Schätzverfahren, welche verlässliche Schätzergebnisse für Mittelwerte und andere Indikatoren liefern und sowohl die kleinen Stichprobenumfänge, die fehlenden Werte und die Zeitdimension der Daten berücksichtigen. Des Weiteren werden die vorgeschlagenen Schätzer auf die HFCS-Daten angewendet, um Unterschiede in den Schätzergebnissen zwischen Panelwellen umfassend zu untersuchen und zeitstabile Analysen der Daten zu ermöglichen.

Methode

Eine Lösung für das erste Problem sind Small Area Schätzmethoden. Diese Methoden können zu einer erheblich verbesserten Genauigkeit der interessierenden Schätzwerte führen und Schätzungen für Regionen/Domänen außerhalb der Stichprobe liefern. Die Hauptidee dieser Methoden ist es, die Genauigkeit durch die Kombination verschiedener Datenquellen zu erhöhen und domänenübergreifend "Stärke zu leihen". Die Methoden können grob in Unit- und Area-Level-Modelle unterteilt werden. Die erste Gruppe erfordert Daten auf Unit-Level, d.h. Informationen für jedes Individuum oder jeden Haushalt, während Area-Level-Modelle nur aggregierte Informationen für jede Domain/Region benötigen. Da die Datenanforderungen oft sehr restriktiv sind, werden in diesem Projekt Area-Level Modelle verwendet. Um im Falle des zweiten Problems zuverlässige Schätzungen zu erhalten, müssen fehlende Werte imputiert werden, was durch verschiedene Imputationsverfahren geschehen kann. Im HFCS und vielen anderen Umfragen wird Item-Non-Response aufgrund sensibler Fragen mittels multipler Imputation abgefangen. Für das dritte Problem werden Verfahren, die Längsschnittdaten handhaben können, verwendet, welche die Korrelation der gleichen Beobachtungen über die Zeit berücksichtigen.

(Erste) Ergebnisse oder Zentrale Ergebnisse

Erste Analysen zeigen Unterschiede des mittleren Haushaltsnettovermögens in Deutschland zwischen den Panelwellen. Die Unterschiede zwischen den Panelwellen sind insbesondere für einige Bundesländer/ Kreise größer. Allerdings sind auch die Standardabweichungen groß. Daher stellt sich bei der Betrachtung der Zahlen die Frage, ob die großen Unterschiede signifikant sind und was die Ursache für die Unterschiede ist. Wenn die Veränderungen signifikant sind, sind diese auf eine strukturelle Entwicklung zurückzuführen oder haben methodische Gründe.

Abbildung 1: Das durchschnittliche Nettovermögen für 96 Raumordnungsregionen basierend auf einem multiple imputierten Area-Level Modell (Kreutzmann et al. 2021).

Ein weiteres Ergebnis ist, dass Unterschiede in der Verteilung von privatem Vermögen in Deutschland 30 Jahre nach der Wiedervereinigung weitaus vielfältiger auf regionaler Ebene sind, als diese nur zwischen Ost und West zu betrachten.

Gesellschaftliche Relevanz und Nutzungsmöglichkeiten der Ergebnisse

Für wirtschaftliche und soziale Analysen helfen Informationen zu einem bestimmten Zeitpunkt, um Erkenntnisse über den aktuellen Stand der Wirtschaft oder einer bestimmten Bevölkerung zu erhalten. Zum Beispiel entsprach das verfügbare Einkommen der ostdeutschen Haushalte kurz nach der Wiedervereinigung 1991 56% der westdeutschen Haushalte. Solche statistischen Indikatoren haben dazu beigetragen, zu entscheiden, dass Ostdeutschland finanzielle Unterstützung benötigt, um den Anschluss an den westlichen Teil des Landes zu finden. Forscher und Politiker sind zusätzlich an der zeitlichen Entwicklung dieser Indikatoren interessiert, z.B. wie sich das Ost-Einkommen im Laufe der Zeit entwickelt hat. Wären die Einkommenszuwächse im Westen und Osten über die Jahre gleich gewesen, würden die Unterschiede immer noch auf dem gleichen Niveau liegen. Allerdings war das Einkommenswachstum im Osten vor allem in den 90er Jahren höher als im Westen, was auf die Subventionen im Osten, z.B. im Bausektor, zurückzuführen ist.

Aktuelle Publikationen