Projects
Currently various research projects are anchored within the Chair of Statistics and Econometrics. Below you find an overview of ongoing and completed projects.
Ongoing research projects
NeDaMo
For the Federal Transport Infrastructure and Mobility Plan, there is a need for small-area, up-to-date, and reliable data. Traditional traffic surveys and official statistics are reaching their limits in this regard. Digital data sources such as anonymized mobile phone data offer new and promising possibilities. However, initial studies reveal significant limitations: the customer structure of mobile network operators differs systematically, and market shares vary depending on the population group. Therefore, direct use of this data for mobility estimation has so far been only partially feasible.
As a follow-up to the project VerBindungen, the goal of the NeDaMo project is to process this mobile phone data methodologically and link it with traditional official data sources in order to make it usable for transport and mobility planning purposes. New statistical methods aim to correct biases caused by unequal network coverage or sociodemographic differences. At the same time, a voluntary supplementary survey will be conducted to fill quality gaps.
The result should be high-quality datasets that enable valid conclusions about the origin and destination of citizens’ movements — and thus allow for data-driven mobility forecasts. These mobility forecasts are intended to be integrated into the Federal Transport Infrastructure and Mobility Plan.
Key questions include:
- What routes do people travel on a daily basis — and how can these be reliably derived from mobile phone data?
- To what extent do movement patterns differ by population group and region?
- How can mobile phone data be combined with traditional data sources to enable more precise mobility analyses?
Partner:
Statistisches Bundesamt, Bergische Universität Wuppertal, Universität Trier, Deutsche Telekom GmbH, Teralytics GmbH, Statistisches Landesamt IT.NRW, Bundesagentur für Arbeit
Coordination:
Prof. Dr. Markus Zwick (Statistisches Bundesamt)
Subproject Collaboration:
Prof. Dr. Timo Schmid
Scientific Staff:
Dr. Florian Meinfelder, Johanna Einhorn
Funding:
mFUND-Initiative des Bundesministeriums für Digitales und Staatsmodernisierung
Duration:
04/2025 – 03/2028
Bamberg Survey of Language Variation and Change (BSLVC)
This project investigates the use of lexical and grammatical structures in global varieties of English. An interdisciplinary approach provides the means to statistically analyse data from the extensive BSLVC database and to detect (supra-)regional patterns as well as globalization trends. A key goal is the development of new statistical methods for analysing hierarchically structured ordinal data generated in questionnaire surveys. The results will be made accessible to the linguistic research community through an interactive platform and didactic resources.
Background and Problem Statement
Empirical research on global varieties of English is primarily based on corpora. However, this method has certain limitations, as comparable corpora are often unavailable, sociodemographic information is incomplete, and rare or hard-to-detect features may not be adequately represented in textual data. The BSLVC project uses questionnaires to address these gaps. Nonetheless, the resulting data—structured hierarchically and in Likert-scale format—pose challenges for statistical analysis. In linguistics, the treatment of ordinal data is still in its early stages, and there is a shortage of suitable, accessible tools for the statistical modelling of complex, high-dimensional data.
Project Objectives
This interdisciplinary project between linguistics and statistics pursues three main objectives:
- Development of new statistical methods: Designing and evaluating flexible estimation methods for ordinal data in language research, taking into account the hierarchical structure of questionnaire data. Among other approaches, random forest methods and ordinal regression models will be investigated.
- Investigation of grammatical features: Detailed analysis and typological comparison of grammatical features across different varieties of English, with a focus on features that are rare or difficult to detect in corpora. The findings aim to advance the linguistic debate on modelling global English.
- Dissemination of data and methods:Creation of an interactive data analysis platform with a graphical user interface, enabling researchers to intuitively explore the BSLVC database. In addition, didactic resources (R packages, web tutorials) will be developed to make the new statistical methods accessible to a broader linguistic research community.
Selected References:
Sönning, Lukas, Manfred Krug, Fabian Vetter, Timo Schmid, Anne Leucht, and Paul Messer. (2024): Latent-Variable Modelling of Ordinal Outcomes in Language Data Analysis. Journal of Quantitative Linguistics 31 (2): pp.77–106.
Coordination:
Manfred Krug, Anne Leucht, Timo Schmid (Universität Bamberg)
Scientific Staff:
Michael Mühlbauer, Florian Scholze
Internet surveys for small-scale analyses
The project aims to examine, using a realistic dataset, the extent to which bias in an online survey can be reduced by controlling for demographic characteristics. Such a dataset must include three groups of variables: analytical variables, whose population values are to be estimated; internet-related variables, which operationalize participation behavior; and finally control variables, for which population values are known and which can be used for calibration. Since online surveys are often used for election forecasting, the evaluation dataset should include variables on party preference. It should also capture the frequency of internet use. This frequency can be used to operationalize participation in online surveys.
The data from the European Social Survey (ESS) meet these requirements. In addition, access to the data is straightforward and well supported through remote table queries. Other datasets, such as the Socio-Economic Panel (SOEP), may also be used for supplementary analyses. A special survey conducted by the Federal Statistical Office, the Information and Communication Technology (ICT) Survey, collects very detailed information on private households’ access to information technology and its use. Due to the regular repetition of the survey, trends in usage and internet coverage among private households can be identified.
References:
Prücklmair F. and Rendtel U. (2025): Alternative Selection Mechanisms in Online Surveys. Working Paper
Partner:
DIW Berlin und Civey
Coordination:
Prof. Dr. Timo Schmid
Project staff:
Franz Prücklmair and Angelina Hammon
Sponsor:
Civey
Project duration:
05/2021 - 05/2024
Extreme Poverty – Building Evidence for Effective Action
The programme will investigate what is driving extreme poverty, and test potential poverty measures and solutions to support the design and implementation of effective policies, programmes and strategies.
The programme will work in eight focus countries: Bangladesh, Ethiopia, India, Madagascar, Mozambique, Myanmar, Nigeria and Tanzania.
Research under the programme is organised into three themes:
- Identifying and testing better poverty measures for a changing world.
- Investigating poverty trends and drivers to 2030 including those that may serve to perpetuate or reduce extreme poverty over the next ten years.
- Explaining what works to tackle extreme poverty through a range of types of research, including a series of impact and operational evaluations.
By 2030, we seek for governments and key decision makers in multiple contexts to have better access to data, diagnostics and resources that will inform and influence policy and practice, hereby accelerating the eradication of extreme poverty. We aim to have a broad influence through drawing-on, engaging with and developing the networks of the consortium partners, FCDO and World Bank to support uptake of our research beyond the ExPov focus countries.
From a methodological perspective we will experiment with using a range of statistical and analytical techniques and new sources of data to yield measures of poverty that are more granular (available at smaller geographical areas); more frequent and also less dependent on having access to traditional sources of data, particularly census data; so providing new approaches to overcome the ‘data gap problem’.
Partner:
University of Copenhagen, University of Southampton, Oxford Policy Management, Worldbank
Koordination:
Oxford Policy Management
Teilprojektmitarbeit:
Prof. Dr. Timo Schmid
Förderer:
Worldbank
Projektlaufzeit:
2020 - 2027
Completed research projects
VerBindungen
Zu Fuß, mit dem Fahrrad, mit Bus, Bahn oder dem Auto – jeden Tag legen die Menschen in Deutschland mehr als drei Milliarden Kilometer zurück. Wie können wir die Infrastruktur so gestalten, dass es möglich ist, unsere Wege sicher, schnell und ressourcenschonend zurückzulegen? Ein Schlüssel dafür ist, das Mobilitätsverhalten möglichst gut zu verstehen. Neben den amtlichen Datenquellen und klassischen Verkehrserhebungen, drängt sich die Nutzung von Floating Car Data (FCD) und Mobilfunkdaten auf, denn nach zuverlässiger Anonymisierung lassen sich typische Mobilitäts-strukturen kleinräumig herleiten. Das Forschungsprojekt „VerBindung“ will dieses Themenfeld beleuchten und Chancen sowie Möglichkeiten dieser neuen digitalen Daten aufzeigen. Ausgangslage für das Projekt ist der kleinräumige Datenbedarf des Bundesministeriums für Verkehr und digitale Infrastruktur (BMVI) im Rahmen des Bundesverkehrswegeplans. Vier Fragestellungen stehen dabei im Vordergrund:
1. Wie viele Personen möchten bzw. bewegen sich von wo nach wo – also welche Quelle-Ziel-Verflechtungen gibt es?
2. Zu welchem Zweck möchten bzw. bewegen sich die Personen von wo nach wo?
3. Wie ist die Erreichbarkeit für diese Quelle-Ziel-Verflechtungen im Vergleich PKW und ÖPNV?
4. Wo halten sich wann wie viele Personen auf?
Partner:
Statistisches Bundesamt, Bergische Universität Wuppertal, Bundesagentur für Arbeit, Information und Technik NRW, Intraplan und Teralytics
Coordination:
Prof. Dr. Markus Zwick (Statistisches Bundesamt)
Subproject management:
Prof. Dr. Timo Schmid
Scientific staff:
Michael Mühlbauer
Funding:
Bundesministerium für Digitales und Verkehr
Duration:
12/2020 - 12/2023
Time-consistent Estimates for the Household Finance and Consumption Survey
The main objective of this project is to develop stable estimates across panel waves, i.e. over time, when multiple imputation is conducted and the sample sizes are small. This problem arises in the Household Finance and Consumption Survey (HFCS) but the method will be transferable to other panel surveys, e.g. the German Socioeconomic-Panel (SOEP). The project is an extension of the project QUESSAMI (2016-2018).
The HFCS data enable to describe components of wealth, income and consumption of European households. Especially, the behavior of specific subgroups, so called “small domains”, is very important for the understanding of macroeconomic theory. A challenging issue is to deliver reliable estimates on specific domain levels, e.g. across low regional levels. This issue is based on several problems. The following two problems are already solved within the project QUESSAMI:
- Small sample sizes: Small subgroup-specific sample sizes can lead to unacceptably large variances and hence, the reliability of the analysis is not given anymore.
- Low response rates: As the HFCS collects sensitive information about households’ finances and wealth, a low unit response rate is expected.
A third problem is the time dimension of a panel survey:
- Inconsistencies across panel waves: Differences in the estimates between panel waves seem not always to be due to structural changes but may be driven by methodological reasons.
In the HFCS data, as well as in many other survey data sets, missing values, small sample sizes and a panel structure occur at the same time. Furthermore, the inconsistencies do not only appear for indicators as the mean that is sensitive to outliers but also for more stable indicators as ratios. Hence, the extension of the methodology developed within the project QUESSAMI from the cross-section to the panel context and to other indicators is essential to receive consistent estimates across time and thus, to gain knowledge about changes in important economic variables as private wealth. Up to date, there are no relevant results in the scientific community concerning this issue. Therefore, this project will close this gap by:
- New estimation techniques: Methodology will be developed in order to receive reliable estimates for means and other indicators such as ratios that accounts for small sample sizes, multiple imputation and the time dimension of the panel data.
- Application to HFCS: Proposed estimators will be applied on the HFCS data to assess differences between panel waves thoroughly and to ensure a time-consistent analysis of the data.
The results of this project will guarantee a more valid basis for policy-making in several issues, such as impacts of policy decisions on the regional distribution of income and wealth.
Selected literature:
- Kreutzmann, A.-K.; Marek, P.; Runge, M.; Salvati, N.; Schmid, T. (2021): The Fay–Herriot model for multiply imputed data with an application to regional wealth estimation in Germany, Journal of Applied Statistics, forthcoming.
- Kreutzmann, A.-K.; Pannier, S.; Rojas-Perilla, N.; Schmid, T.; Templ, M.; Tzavidis, N. (2019): The R Package emdi for Estimating and Mapping Regionally Disaggregated Indicators, Journal of Statistical Software, 91, pp. 1-33.
- Halbmeier, C.; Kreutzmann, A.-K.; Schmid, T.; Schröder, C. (2019): The fayherriot command for estimating small-area indicators, Stata Journal, 19, pp. 626-644.
Coordination:
Prof. Dr. Timo Schmid
Scientific staff:
Marina Runge
Funding:
German Research Foundation
Duration:
04/2019 - 04/2023
Ermittlung der Verteilung studentischen Wohnens in Berlin
Im Rahmen des Projektes „Ermittlung der Verteilung studentischen Wohnens in Berlin“ soll untersucht werden, wie sich die Studierenden der Berliner Hochschulen auf die lebensweltlich orientierten Räume verteilen. Sind die genauen Wohnstandorte der Studierenden bekannt, lassen sich wichtige Fragen nach dem benötigten Wohnraum und der nachgefragten Infrastruktur beantworten, sowie Projekte zugunsten Studierender zielgerichteter umsetzen. Als Datenquellen dienen unter anderem der Zensus 2011, die Belegung der Studentenwohnheime, wie auch die Anzahl der Studierenden nach Wohnort auf der Ebene der Postleitzahlbezirke für große Berliner Universitäten/ Hochschulen (u.a. Freie Universität, Humboldt Universität, Technische Universität) für die Jahre 2005, 2010 und 2015 im Vergleich.
Weitere Informationen finden Sie hier und hier.
Selected literature:
- Erfurth, K.; Groß, M.; Rendtel, U.; Schmid, T. (2021): Kernel density smoothing of composite spatial data on administrative area level, AStA Wirtschafts- und Sozialstatistisches Archiv, forthcoming.
- Groß, M.; Kreutzmann, A.-K.; Rendtel, U.; Schmid, T.; Tzavidis, N. (2020): Switching between different non-hierarchical administrative areas via simulated geo-coordinates: A case study for student residents in Berlin, Journal of Official Statistics, 36, pp. 297-314.
- Groß, M.; Rendtel, U.; Schmid, T.; Schmon S.; Tzavidis, N. (2017): Estimating the density of ethnic minorities and aged people in Berlin: Multivariate kernel density estimation applied to sensitive geo-referenced administrative data protected via measurement error, Journal of the Royal Statistical Society: Series A, 180, pp. 161-183.
Coordination:
Prof. Dr. Timo Schmid
Funding:
Berliner Senatsverwaltung für Stadtentwicklung und Umwelt
Duration:
01/2016 - 04/2016
High Quality Estimates for the Household Finance and Consumption Survey
The main objective of this project is to develop an adequate methodology for high quality estimates using the Household Finance and Consumption Survey (HFCS). Therefore, small area estimators and multiple imputation approaches will be combined to a new estimation method.
The HFCS is the first attempt to survey wealth data on individual household level on a consistent basis in Europe. These data can describe, for instance, the importance of different wealth components and how liabilities and assets are distributed across households. The statistics out of these data can be used as a basis to analyze the potential impact of fiscal, monetary, and regulatory policies. However, there are examples that the behavior of specific subgroups, so called “small domains”, is very important for the understanding of macroeconomic theory. A challenging issue is to deliver high quality estimates on specific domain levels, e.g. cross-classified groups of age and financial assets in particular countries. This issue is mainly based on two problems:
- Small sample sizes: Small subgroup-specific sample sizes can lead to unacceptably large variances and hence, the reliability of the analysis is not given anymore.
- Low response rates: As the HFCS collects sensitive information about households’ finance and wealth, a low unit response rate is expected
One solution to handle the first problem is small area estimation. These methods may lead to highly improved accuracy of the estimates of interest. To gain reliable estimates in the case of the second problem, there is a need to impute missing values which can be done by different imputation methods.
However, in the HFCS data, missing values and small sample sizes occur at the same time. Hence, the combination of small area estimation and multiple imputation is essential to gain precise results for the analysis of small sub-groups of households in the HFCS data. Up to date, there are no relevant results in the scientific community concerning this issue. Therefore, this project will close this gap by:
- New estimation techniques: New estimation methods which combine multiple imputation and small area estimation will be derived.
- Application to HFCS: Proposed estimators will be applied on the HFCS data to derive very precise estimations of the relevant indicators, for instance, the portfolio selection of elder people in different countries or the portfolio selection of the wealthiest households.
The results of this project will guarantee a more valid basis for policy-making in several issues, such as access to credit and credit constraints or wealth effects on consumption.
Selected literature:
- Kreutzmann, A.-K.; Marek, P.; Runge, M.; Salvati, N.; Schmid, T. (2021): The Fay–Herriot model for multiply imputed data with an application to regional wealth estimation in Germany, Journal of Applied Statistics, forthcoming.
- Kreutzmann, A.-K.; Pannier, S.; Rojas-Perilla, N.; Schmid, T.; Templ, M.; Tzavidis, N. (2019): The R Package emdi for Estimating and Mapping Regionally Disaggregated Indicators, Journal of Statistical Software, 91, pp. 1-33.
- Halbmeier, C.; Kreutzmann, A.-K.; Schmid, T.; Schröder, C. (2019): The fayherriot command for estimating small-area indicators, Stata Journal, 19, pp. 626-644.
Coordination:
Prof. Dr. Timo Schmid
Scientific staff:
Ann-Kristin Kreutzmann
Funding:
German Research Foundation
Duration:
04/2016 - 03/2019
Präzise Schätzverfahren für die Household Finance and Consumption Survey
Im Mittelpunkt dieses Projektes steht die Entwicklung geeigneter Methoden für qualitativ hochwertigeSchätzer auf der Basis der Household Finance and Consumption Survey (HFCS). Hierfür werden multiple Imputationsmethoden mit Small-Area-Schätzern kombiniert, um neue Schätzmethoden herzuleiten.
Die Erhebung des HFCS-Netzwerkes ist der erste Versuch, Vermögensdaten auf Haushaltsebene für einige europäische Länder zu erhalten. Die HFCS-Daten beschreiben unter anderem verschiedene Vermögenskomponenten sowie die Verteilung von Verbindlichkeiten und vorhandenem Kapital (Geldvermögen) unter den europäischen Haushalten. Die Statistiken dieser Daten können beispielsweise herangezogen werden, um potenzielle Einflüsse der Fiskal-, Geld- und Regulierungspolitik zu analysieren. Darüber hinaus kann das Verhalten von Subgruppen, so genannter „Small Domains“, für das Verstehen makroökonomischer Theorien von großer Bedeutung sein. Die Herausforderung liegt hierbei darin, hochwertige Schätzer auf Domainebene zu erhalten, wie etwa für Altersgruppen kreuzklassifiziert mit den teilnehmenden europäischen Staaten. Dieser Herausforderung liegen zwei Probleme zugrunde:
- Kleine Stichprobenumfänge: Geringe Stichprobengrößen in den entsprechenden Subgruppen können zu großen Varianzen der Schätzer führen und somit verringern sie die Verlässlichkeit der Analyse.
- Niedrige Antwortrate: Aufgrund der Erfragung sensibler Informationen zur Vermögens- und Finanzsituation der Haushalte kann das Problem einer niedrigen Antwortrate auftreten.
Eine Möglichkeit zur Lösung des ersten Problems sind Small-Area-Methoden, welche zu einer größeren Genauigkeit in den Schätzungen der interessierenden Parameter führen. Im zweiten Fall besteht ein dringender Bedarf fehlende Werte zu ergänzen, um verlässliche Schätzungen zu erhalten. Dies kann mit verschiedenen Imputationsmethoden realisiert werden.
Die Kombination von multipler Imputation und Small-Area-Schätzung ist essenziell, um genaue Ergebnisse für Haushaltssubgruppen auf Basis der HFCS-Daten zu erhalten, da wir hier sowohl mit dem Problem der kleinen Stichprobenumfänge, als auch dem der niedrigen Antwortrate konfrontiert sind. Nach heutigem Stand gibt es zu diesem Thema noch keine relevanten Resultate, so dass dieses Projekt diese Lücke wie folgt schließen möchte:
- Neue Schätzmethoden: Entwicklung neuer Schätzverfahren, welche multiple Imputation und Small-Area-Schätzmethoden miteinander kombinieren.
- Anwendung auf HFCS-Daten: Vorgeschlagene Schätzer werden auf die HFCS-Daten angewendet, um präzise Kennwerte für interessierende und relevante Fragestellungen, wie die Wahl des Portfolios älterer Menschen oder die der wohlhabendsten Haushalte in verschiedenen Ländern, zu bestimmen.
Die Ergebnisse dieses Projektes bieten der Politik valide Daten als Entscheidungsgrundlage für verschiedenste Fragestellungen, wie etwa von Kreditzugang und -beschränkungen oder von Vermögenseffekten auf den Konsum.
Ausgewählte Literatur:
- Kreutzmann, A.-K.; Marek, P.; Runge, M.; Salvati, N.; Schmid, T. (2021): The Fay–Herriot model for multiply imputed data with an application to regional wealth estimation in Germany, Journal of Applied Statistics, forthcoming.
- Kreutzmann, A.-K.; Pannier, S.; Rojas-Perilla, N.; Schmid, T.; Templ, M.; Tzavidis, N. (2019): The R Package emdi for Estimating and Mapping Regionally Disaggregated Indicators, Journal of Statistical Software, 91, pp. 1-33.
- Halbmeier, C.; Kreutzmann, A.-K.; Schmid, T.; Schröder, C. (2019): The fayherriot command for estimating small-area indicators, Stata Journal, 19, pp. 626-644.
Koordination:
Prof. Dr. Timo Schmid
Prokeltmitarbeiter/-innen:
Ann-Kristin Kreutzmann
Förderer:
Deutsche Forschungsgemeinschaft
Projektlaufzeit:
04/2016 - 03/2019
Construction of socio-demographic indicators with digital breadcrumbs (Mobile data)
In diesem Projekt wurde ein statistisches Schätzverfahren entwickelt, welches Handy-Metadaten und Zensusinformationen miteinander verknüpft, um Informationen über die aktuelle Situation in Bezug auf Armut, Alphabetisierung und andere soziodemografische Indikatoren im Senegal zu erhalten. Die Analyse basiert auf der These, dass sich die Situation einer Bevölkerungsgruppe in ihrem Handy-Nutzungsverhalten niederschlägt und deshalb beispielsweise alphabetisierte Nutzer ihr Handy anders verwenden als Nutzer, die nicht oder nur bedingt lesen und schreiben können. Da Handy-Metadaten zur Produktion von Indikatoren genutzt werden, wie sie u.a. in der Messung des Erfolgs von Nachhaltigkeitszielen herangezogen werden, wird in Kooperation mit den Mobilfunkanbietern Orange und Sonatel sowie den Behörden im Senegal untersucht, wie diese Daten die Umsetzung von nationalen Entwicklungsplänen und internationalen Monitoring-Anforderungen unterstützen können.
Weitere Informationen finden Sie „hier“.
Selected literature:
- Schmid, T.; Bruckschen, F.; Salvati, N.; Zbiranski, T. (2017): Constructing socio-demographic indicators for National Statistical Institutes using mobile phone data: Estimating literacy rates in Senegal, Journal of the Royal Statistical Society: Series A, 180, pp. 1163-1190.
Tzavidis, N.; Zhang, L.-C.; Luna Hernandez, A.; Schmid, T.; Rojas-Perilla, N. (2018): From start to finish: A framework for the production of small area official statistics, Journal of the Royal Statistical Society: Series A, Read paper, 181, pp. 927-979.
Partner:
University at Buffalo, USA
Coordination:
Prof. Dr. Timo Schmid
Scientific staff:
Fabian Bruckschen und
Till Koebe
Funding:
Bill & Melinda Gates Foundation
Duration:
06/2015 - 12/2016
Innovations in Small Area Estimation Methodologies
Dieses Projekt setzt sich mit Innovationen von Methoden der „Small Area Estimation (SAE)“ auseinander, da diese zunehmend genutzt werden und zuverlässige Statistiken äußerst wichtig für politikrelevante Forschungen sind. SAE Methoden generieren robuste, verlässliche und konsistente Statistiken bei geografischen Maßstäben, für welche Survey Daten entweder nicht existieren oder zu dürftig sind, um Schätzer von zulässiger Präzision zu erhalten. Der Bedarf an komplexen Statistiken steigt, bringt allerdings auch signifikante methodische und angewandte Herausforderungen mit sich. Das Projekt zielt darauf ab, neue SAE Methoden zu entwickeln, welche die Bedürfnisse der Nutzer und Entwickler der SAE besser bedienen, verschiedene methodische Ansätze zur SAE zu überbrücken, SAE für die Beantwortung von stichhaltigen Fragen der Sozialwissenschaften einzusetzen und SAE innerhalb der quantitativen Sozialwissenschaften durch die Erschaffung von methodisch umfassenden und zugänglichen Ressourcen zu etablieren.
Weitere Informationen finden Sie „hier“.
Selected literature:
- Tzavidis, N.; Zhang, L.-C.; Luna Hernandez, A.; Schmid, T.; Rojas-Perilla, N. (2018): From start to finish: A framework for the production of small area official statistics, Journal of the Royal Statistical Society: Series A, Read paper, 181, pp. 927-979.
- Kreutzmann, A.-K.; Pannier, S.; Rojas-Perilla, N.; Schmid, T.; Templ, M.; Tzavidis, N. (2019): The R Package emdi for Estimating and Mapping Regionally Disaggregated Indicators, Journal of Statistical Software, 91, pp. 1-33.
- Rojas-Perilla, N.; Pannier, S.; Schmid, T.; Tzavidis, N. (2020): Data-Driven Transformations in Small Area Estimation, Journal of the Royal Statistical Society: Series A, 183, pp. 121-148.
Walter, P.; Groß, M.; Schmid, T. and Tzavidis, N. (2021): Domain prediction with grouped income data, Journal of the Royal Statistical Society: Series A, 184, pp. 1501-1523.
Partners:
8 Partner, insbesondere die Universitäten von Southampton (UK), Liverpool (UK), Sheffield (UK), Portsmouth (UK), Wollongong (Australia), Technology Sydney (Australia), Massey (New Zealand)
Coordination:
Prof. Dr. Nikos Tzavidis, University of Southampton (UK)
Subproject management
Prof. Dr. Timo Schmid
Funding:
National Centre for Research
Methods (NCRM, UK)
Duration:
01/2016 - 12/2018
Producing small area estimates of income related indicators for municipalities in Mexico
In diesem Projekt werden für das statistische Amt in Mexiko „small area estimates“ von linearen und nicht-linearen Armutsindikatoren (Gini, Armutsgefährungsquote oder Quintile Share Ratio) für Gemeinden in Mexiko entwickelt, um Informationen über soziodemografische Merkmale zu erhalten. Die Schätzer für die Indikatoren werden erzeugt, indem man zwei modellgestützte Methoden heranzieht: Zum einen den „Empirical Best Prediction“ Ansatz und zum anderen eine Methode, die auf der Schätzung der gesamten Verteilung des Einkommens basiert („Microsimulation via Quantiles“). Eine synthetische Schätzung unter einem multinomialen Modell wird für die Bestimmung der multidimensionalen Armut verwendet, welche sich durch die zwei Dimensionen „Einkommen“ und „soziale Benachteiligung“ definiert. Die in diesem Projekt entwickelten Schätzer werden dem statistischen Amt Mexiko (CONEVAL) zur Verfügung gestellt.
Selected literature:
- Tzavidis, N.; Zhang, L.-C.; Luna Hernandez, A.; Schmid, T.; Rojas-Perilla, N. (2018): From start to finish: A framework for the production of small area official statistics, Journal of the Royal Statistical Society: Series A, Read paper, 181, pp. 927-979.
Rojas-Perilla, N.; Pannier, S.; Schmid, T.; Tzavidis, N. (2020): Data-Driven Transformations in Small Area Estimation, Journal of the Royal Statistical Society: Series A, 183, pp. 121-148.
Partner:
University of Southampton, UK
Coordination:
Prof. Dr. Nikos Tzavidis, University of Southampton (UK)
Subproject management:
Prof. Dr. Timo Schmid
Funding:
Statistisches Amt Mexiko (CONEVAL)
Duration:
01/2015 - 12/2015
Multidimensional poverty estimation using small area estimation - Two perspectives
The project will develop novel SAE statistical methodologies for resolving the challenges faced by statistical organizations in estimating complex indicators. In recent years there has been growing demand for developing SAE methods suitable for estimating the incidence of income poverty, the quantile share ratio, the Gini coefficient and multidimensional deprivation. This has been at the centre of methodological work at the World Bank (WB), Eurostat or CONEVAL. Estimating non-linear indicators requires the estimation of the distribution function of the outcome variable for example, income. A popular method is the use of Empirical Best Prediction (EBP). The EBP was developed in order to improve what is considered to be the industry standard method the so called World Bank (WB) method.
The methodologies mentioned above assume that the outcome of interest is continuous for example, household income. Practitioners, however, are also interested in discrete outcomes. An example is the estimation of deprivation indicators that encompass a number of dimensions such as income, food, health, education and social security. More specifically, the interest is in estimating the proportion of households deprived in each of the dimensions and the average number of combined deprivations (multidimensional deprivation) in small areas. The discrete nature of such indicators means that the methods for continuous data are no longer applicable and models for discrete outcomes are needed. The project will extend the methodologies for continuous data to discrete outcomes as follows:
- We will use parametric estimation of the empirical function for discrete outcomes of the multidimensional poverty. In particular, the outcomes will be modelled by using a multilevel model that reflects the discrete nature of the target outcome (German group).
- We will investigate semi-parametric models based on M-quantile regression with more flexible assumptions that also allow for robust estimation of discrete outcomes (Italian group).
Selected literature
Kreutzmann, A.-K.; Pannier, S.; Rojas-Perilla, N.; Schmid, T.; Templ, M.; Tzavidis, N. (2019): The R Package emdi for Estimating and Mapping Regionally Disaggregated Indicators, Journal of Statistical Software, 91, pp. 1-33.
Partners:
Università degli Studi di Milano-Bicocca (Italien), Università di Pisa (Italien)
Coordination:
Prof. Dr. Timo Schmid
Funding:
Deutscher Akademischer Austauschdienst
Duration:
05/2016 - 04/2018
Deep Mobility
Informierte politische Entscheidungen basieren auf allen Verwaltungsebenen zu einem wesentlichen Teil auf Bevölkerungsdaten der amtlichen Statistik. Deren Erhebung ist teuer und zeitaufwändig und erfolgt daher selbst in entwickelten Industriestaaten nur alle zehn Jahre in Form einer Volkszählung bzw. durch stichprobenartige Erhebungen. Damit fehlen in den Industrieländern repräsentative Datensätze für weite Gegenden oder einzelne Kommunen. In den Ländern des globalen Südens ist die Datenlage z. B. infolge fehlender finanzieller Mittel oder Bürgerkriegen oftmals veraltet, unvollständig oder mit zu großen Informationslücken behaftet.
Deep Mobility löst dieses Problem durch die Auswertung von Mobilfunkmetadaten als Hilfsdaten für die amtliche Statistik. Seit 2014 forscht das Gründerteam zu dem Thema und hat einen neuartigen Ansatz entwickelt, um aus Kommunikations- und Mobilitätsmustern sozio-demografische Schlüsselindikatoren wie z. B. zu Armut oder Alphabetisierungsgrad für kleine geografische Gebiete zu bestimmen. Hierbei wird eine Schätzmethode aus der räumlichen Statistik angewandt, um mit Hilfe von Mobilfunkmetadaten einen höheren Grad an Regionalisierung vorhandener Befragungsdaten zu erreichen. Eine weitere Besonderheit des Verfahrens besteht in einem rigorosen Datenschutzansatz in Form einer modularen Engine. Dadurch können insbesondere Stichprobenumfragen präzisiert und regionalisiert werden.
Coordination:
Prof. Dr. Timo Schmid
Scientific staff:
Fabian Bruckschen, Till Koebe
und Melina Ludolph
Funding:
Bundesministerium für Wirtschaft und Energie
Duration:
04/2018 - 05/2019
