Donald B. Rubin von der Harvard University leitete den Workshop an der Feki (Bilder: Matthias Schönhofer).

Lehrstuhlinhaberin Susanne Rässler hatte den Kontakt zu Rubin hergestellt und ist dessen Hauptkontaktperson in Deutschland.

Christine Licht vom Lehrstuhl für Statistik und Ökonometrie stellt ihre Forschungen vor.

- Matthias Schönhofer

Simulierte Abstraktionen

Harvard-Professor und Statistik-Koryphäe Donald B. Rubin zu Gast in Bamberg

Als einer der „meistzitierten Statistiker der Welt“ wurde Prof. Dr. Donald B. Rubin am 26. März von Prof. Dr. Susanne Rässler den Teilnehmern eines ersten Bamberger Workshops zu „Analysis of Incomplete Data (AID)“ vorgestellt. Am 27. März wurde ihm der renommierte Alexander von Humboldt-Preis in Bamberg verliehen.

Arbeitslosenzahlen, medizinische Statistiken, Tabellen zur Vermögensverteilung und Volkszählung: die Liste der Datensätze, mit denen auch der Normalbürger im Alltag konfrontiert wird, ist höher als gedacht. Selten erwähnt wird dabei, wie diese Werte zustande kommen, und noch seltener, dass den Auswertungen oft nur unvollständige Datensätze zu Grunde liegen. Datenschutzbestimmungen, Nachlässigkeiten bei der Datenerhebung in Interviews und schlicht Veränderungen im Laufe der Zeit stehen den Statistikern nur zu oft im Weg und sorgen für Unschärfen und Verzerrungen.

Bereits seit 1977 rückt Rubin daher diesem Phänomen mathematisch zu Leibe, die „Multiple Imputation“ Methode ist seine ureigene Entwicklung. 2002, nach über 13 Jahren gab er die Leitung des Statistik-Departments an der Harvard Universität ab und wirkt dort seitdem mit dem begehrten Titel eines John L. Loeb Professor for Statistics weiter. Am Abend des 27. März nahm er den mit 60.000 Euro dotierten Preis der Humboldt-Stiftung im Bamberger Residenz Hotel entgegen. Verliehen wird dieser an herausragende ausländische Forscher, die sich im Austausch mit der deutschen Wissenschaft verdient gemacht haben. Der Preis ist somit auch eine Auszeichnung für die Internationalität und Arbeit des Lehrstuhls von Rässler, die mit dem Preisträger seit Jahren kooperiert. Tags zuvor hatte sie bereits einen Workshop mit dem „meistzitierten Statistiker der Welt“ organisiert. Engagiert und auskunftsfreudig präsentierte sich Rubin dabei in der Kritik der Präsentationen, die sich allesamt um Anwendungen seiner „Multiple Imputation“ Methode zur Ergänzung fehlender Daten drehten.

Missing Data in Action

Dass gerade in der Arbeitsmarktforschung Rubins Methoden zum Einsatz kommen, zeigte die Teilnahme von gleich drei Mitarbeitern des Instituts für Arbeitsmarkt- und Berufsforschung (IAB) in Nürnberg. Dr. Hans Kiesl führte dabei anhand miteinander konkurrierender Arbeitslosigkeitsstatistiken die Problematik und Konsequenzen fehlender oder fehlerhafter Datensätze deutlich vor Augen. So werde seit Jahren vermutet, dass die auf europäischen Kriterien beruhende Labour Force Survey (LFS) bestimmte Typen der Erwerbstätigkeit wie etwa geringfügige Beschäftigungsverhältnisse nur unzureichend abbilde, was zu einer Überzeichnung der Erwerbslosenzahl (nach international üblicher Definition) führen dürfte. Rubins „Multiple Imputation“ könnte dazu beitragen, die Labour Force Survey an dieser Stelle zu korrigieren.

Weitere Beiträge des Workshops beschäftigten sich mit Anwendungsmöglichkeiten der „Multiple Imputation“ in medizinischen und mathematischen Zusammenhängen. Als Vertreterin der Universität Bamberg stellte die Diplom-Mathematikerin Christine Licht vom Lehrstuhl für Statistik und Ökonometrie eine neuartige Kombinationsmethode so genannter p-Werte vor und erntete dafür Zustimmung und interessierte Nachfragen seitens des amerikanischen Statistikgurus. Dieser gemeinsam mit Rubin entwickelte Ansatz würde die Analyse von ergänzten Datensätzen massiv vereinfachen sowie bislang ausgeschlossenen Methoden wieder Relevanz verleihen.

Friendship, Food and Drink ...

… waren es, für die sich Rubin bei Rässler in seinen Schlussbemerkungen zunächst bedankte. Einzeln wurden dabei Aspekte der Vorträge nochmals herausgegriffen und von Rubin kommentiert, wobei der Preisträger nicht mit Vorschlägen und Ermunterungen sparte, sich von den Bergen komplexer Daten nicht einschüchtern zu lassen. Der Beginn der Zusammenarbeit mit Rässler geht auf ein Treffen 2001 in den Niederlanden zurück und hat seitdem in mehreren Projekten Früchte getragen. Als Höhepunkt der Zusammenarbeit darf wohl die im Rahmen des Projektes „Treatment, Effects and Prediction“ (TrEffeR) aufgebaute Wirkungsanalyse für die Bundesagentur für Arbeit aus dem Jahr 2008 gelten, weitere Workshops und ähnliche Projekte sind für die Zukunft geplant.