Fakultät Geistes- und Kulturwissenschaften

Lehrstuhl für Engl. Sprachwissenschaft einschl. Sprachgeschichte

Forschung

Projekt: Language Contact, Variation and Change in (Pen)Insular Contexts

Eine digitale Datenbank lexikalischer und grammatischer Präferenzen von Sprechern verschiedener Varietäten des Englischen

Der Lehrstuhl für Englische Sprachwissenschaft einschl. Sprachgeschichte verfolgt mit diesem Projekt das Ziel der Erstellung einer digitalen Datenbank für vergleichende Studien von lexikalischen und grammatischen Präferenzen in verschiedenen Varietäten des Englischen. Das Hauptaugenmerk liegt auf Varietäten des Englischen, die geographisch oder kulturell in Kontakt mit romanischen Sprachen stehen (z.B. Malta, Channel Islands, Gibraltar, Puerto Rico). Diese Kontaktszenarien erlauben interessante Einsichten in die Dynamik der Sprachwahl im Kontext sozio­linguistischer Variablen (z.B. Alter, Geschlecht, Muttersprache, Bildungslevel) und in Einflüsse der lokalen Kontaktsprachen sowie der global einflussreichen Standards des britischen und amerikanischen Englisch. Gleichzeitig werden aber auch Daten der englischen Standardvarietäten erhoben (z.B. Großbritannien, USA, Kanada und Australien), um eventuelle Gemeinsamkeiten oder Abweichungen untersuchen zu können.

Datenerhebung

Da die im Zentrum des Projekts stehenden Varietäten bisher noch wenig untersucht wurden, ist zur Sammlung sprachlicher Daten eine Präsenz der beteiligten Wissenschaftler vor Ort unabdingbar. Die Erhebung der Daten erfolgt hauptsächlich durch persönliche Befragung im Rahmen von universitären Exkursionen. Hierfür kommt ein standardisierter Fragebogen in Papierform zum Einsatz. Ergänzend befindet sich eine digitale, für mobile Endgeräte optimierte Version in Vorbereitung. Die Fragebögen bestehen aus mehreren Teilen, die auch unabhängig voneinander eingesetzt werden können. Neben soziolinguistischen Informationen werden Daten zu lexikalischen und grammatischen Präferenzen der Informanten erhoben. Um auch die Unterschiede zwischen gesprochener und geschriebener Sprache erfassen zu können, werden Teile des Fragebogens deshalb von einem Muttersprachler der jeweiligen Varietät vorgelesen, aufgezeichnet und anschließend von den Informanten bewertet.

Digitalisierung & Verwaltung

Ausgefüllte Fragebögen werden seit 2010 mittels einer OMR-Software (Optical Mark Recognition) digitalisiert und manuell überprüft. In Zusammenarbeit mit dem Lehrstuhl für Medieninformatik werden die digitalisierten Daten im nächsten Schritt mit einem eigens dafür entwickelten, webbasierten Tool in eine Datenbank überführt und verwaltet. Gleichzeitig wird hierdurch eine Anbindung an weitere Frameworks für visuelle und statistische Analysen ermöglicht.

Poster

Projekt: Erstellung repräsentativer Textdatenbanken englischer Varietäten

The International Corpus of English: Malta & Puerto Rico

Seit 1990 arbeiten über 20 Forscherteams weltweit an dem Projekt „International Corpus of English“ (ICE) mit dem Ziel der Erstellung vergleichbarer Korpora (Textdatenbanken) des Englischen. Für die meisten Varietäten stellt dies die erste systematische Erfassung der nationalen Varietät dar. Es existieren bereits mehr als 10 solcher ICE Korpora (u.a. Canada, Jamaica, Great Britain, Hong Kong, India, Ireland, Singapore, East Africa, New Zealand, Sri Lanka und Nigeria).
Jede der Komponenten beinhaltet 1 Mio Wörter (60% gesprochene, 40% geschriebene Daten) und folgt einem einheitlichen Korpusdesign. Um die Varietät möglichst umfassend abzubilden, werden insgesamt Daten aus 32 Genres erhoben (z.B. face-to-face conversations, legal cross-examinations, broadcast news, student essays, administrative writing, press editorials).
Der Lehrstuhl für Englische Sprachwissenschaft arbeitet hierbei intensiv an der Erstellung der ICE Komponenten für Malta und Puerto Rico, in denen das Englische jeweils starken Einflüssen seiner Kontaktsprachen (Maltesisch, Italienisch bzw. Spanisch) unterliegt. Da bei der Zusammenstellung des Korpus größtenteils gedruckte Texte und Audioaufnahmen zum Einsatz kommen, ist die Datenaufbereitung ein aufwändiger Schritt. Sie umfasst nicht nur die Digitalisierung (Transkription bei Audio­dateien, Scan und Texterkennung bei Texten), sondern auch das manuelle Hinzufügen von Markup und eine Annotation der Wortarten (parts-of-speech tagging).
Aufgrund der bisher kompilierten Daten wurden bereits systematische Erkenntnisse zu ausgewählten Bereichen der Lexik, Syntax und Pragmatik gewonnen.

Poster(3.9 MB)


Forschungsbericht

Den Forschungsbericht des Lehrstuhls für Englische Sprachwissenschaft einschließlich Sprachgeschichte finden Sie hier.

Die einzelnen Forschungsarbeiten der Professoren und Dozenten finden Sie unter dem Link Personen.