Das "Bamberg Survey of Lexical Variation and Change" Projekt (DFG finanziert)
Der Bamberg Survey of Lexical Variation and Change (BSLVC) ist eine Datenbank zu lexikalischen und grammatischen Präferenzen von Sprecherinnen und Sprechern verschiedener Varietäten des Englischen und erforscht so Sprachvariation und mögliche Sprachwandel. Das aktuelle Projekt ist eine interdisziplinäre Zusammenarbeit zwischen Sprachwissenschaftlern (Lehrstuhl für Englische Sprachwissenschaft einschl. Sprachgeschichte, Universität Bamberg) und Statistikern (Professur für Mathematik in den Wirtschaftswissenschaften und Lehrstuhl für Statistik und Ökonometrie, Universität Bamberg) und wird derzeit von der Deutschen Forschungsgemeinschaft (DFG) für den Zeitraum vom 1. Oktober 2024 bis zum 30. September 2027 gefördert.
Mit diesem Projekt verfolgen wir die Erstellung einer digitalen Datenbank für vergleichende Studien zu lexikalischen und grammatischen Präferenzen in verschiedenen englischen Varietäten. Das BSLVC-Projekt wurde im Jahr 2008 initiiert, zunächst mit einem Fokus auf Sprachkontakt zwischen dem Englischen und romanischen Sprachen. Inzwischen hat sich der Fokus erweitert und umfasst nun auch Regionen, in denen Englisch als Erstsprache gesprochen wird (English as a Native Language, ENL), darunter England, Wales, Schottland, Australien, Puerto Rico und die USA, sowie Regionen, in denen Englisch als Zweitsprache (English as a Second Language, ESL, z. B. Malta, Gibraltar, Puerto Rico) oder als Fremdsprache (English as a Foreign Language, EFL, z. B. Deutschland, Slowenien und Schweden) verwendet wird.
Bis heute (Stand: Januar 2025) haben wir rund 400.000 lexikalische und 250.000 grammatische Datenpunkte aus über 6.000 Fragebögen gesammelt.
Mit der Veröffentlichung wird das BSLVC-Projekt in eine Crowdsourcing-Phase übergehen. Externe Wissenschaftler, die sich mit bestimmten englischen Varietäten beschäftigen, haben dann die Möglichkeit, durch lokale Datenerhebungen und Feldforschung zur Datenbank beizutragen. Zudem hat der Ethikrat der Universität Bamberg dem BSLVC-Projekt eine ethische Unbedenklichkeit bescheinigt.
Fragebögen als Datenquelle
Fragebögen weisen häufig einen engen linguistischen Fokus auf, was dazu beiträgt, dass es kaum vielseitige Erhebungsdatenbanken gibt. Drei bemerkenswerte Ausnahmen, der World Atlas of Language Structures Online (WALS; Dryer & Haspelmath 2022), The Atlas of Pidgin and Creole Language Structures (APiCS; Michaelis et al. 2022) sowie der electronic World Atlas of Varieties of English (eWAVE; Kortmann et al. 2020) wurden in der linguistischen Fachwelt positiv aufgenommen. Allerdings spiegeln sie Expertenurteile über den globalen Status von Merkmalen in einer Varietät wider (z. B. nicht vorhanden, selten, weit verbreitet). Solche Daten haben zweifellos enzyklopädischen Wert, sind jedoch als Primärquelle für quantitative Untersuchungen zu Variationsmustern innerhalb einer Varietät, insbesondere im Hinblick auf soziale und stilistische Dimensionen, ungeeignet.
Hier setzt der Bamberg Survey of Lexical Variation and Change (BSLVC) an, der sich zu einer groß angelegten, empirisch fundierten Fragebogendatenbank entwickelt. Diese stellt eine sinnvolle Ergänzung dar zu (i) den in eWAVE dokumentierten Expertenurteilen (die bislang keine EFL-Varietäten und nur wenige der im Projekt behandelten Varietäten umfassen) sowie (ii) dem gängigen korpusbasierten Ansatz in der Untersuchung englischer Varietäten. In Bezug auf den empirischen Umfang adressiert der BSLVC explizit einige der Schwächen korpusbasierter Ansätze und kann wichtige Beiträge zur übergeordneten Diskussion über die Modellierung des Englischen weltweit leisten (vgl. Deshors 2018; Hundt 2021; Buschfeld & Kautzsch 2022). Mixed-Methods-Designs und speziell entwickelte Instrumente wie Fragebögen (vgl. Dollinger 2015), wie sie im BSLVC zum Einsatz kommen, bieten folgende Vorteile für die Untersuchung von Sprachvariation und -wandel:
i) Sie liefern vergleichbare Daten für verschiedene Varietäten des Englischen und ermöglichen somit robustere varietätenübergreifende Analysen.
ii) Die Erhebung umfassender soziodemografischer Angaben erlaubt es Sprachwissenschaftlern, die soziale Dimension von Sprachvariation zu beleuchten.
iii) Durch ein geeignetes Erhebungsdesign und die Formulierung von Items können Auskünfte zu nahezu jedem sprachlichen Merkmal erhoben werden.
Fragebogendaten bringen jedoch auch eigene Herausforderungen mit sich. Ihre komplexe Struktur und abgestuften Antwortformate erfordern spezifische Analyseansätze und benutzerfreundliche Tools zur Verarbeitung sind derzeit noch rar. In diesem Zusammenhang können vielseitige Umfragedatenbanken wie das BSLVC-Projekt einen wichtigen Beitrag leisten. Obwohl noch nicht veröffentlicht, zeichnet sich der BSLVC bereits durch eine starke empirische Basis und eine große Bandbreite aus und bietet wertvolles Potenzial für Forschende, die über traditionelle Datenquellen hinausgehen möchten.
Finanzierung
Das BSLVC Projekt wird derzeit von der Deutschen Forschungsgemeinschaft (DFG) vom 1. Oktober 2024 bis zum 30. September 2027 gefördert (Zuschuss ID: 548274092). Zuvor wurde es vom Bayerischen Staatsministerium für Wissenschaft und Kunst von 2008 bis 2014 sowie vom spanischen Ministerium für Bildung und Wissenschaft mit Mitteln des Europäischen Fonds für regionale Entwicklung (EFRE) gefördert (Zuschuss ID: HUM2007 -60706/FILO).
Datenerhebung
Der Fragebogen besteht aus drei Teilen:
Im ersten Teil werden soziodemografische Daten der Teilnehmer erhoben (u. a. Alter, Geschlecht, Bildungs- und Berufshintergrund).
Im zweiten Teil werden die lexikalischen Präferenzen für britisch-amerikanische (Beinahe-)Synonyme (z. B. pavement-sidewalk, diapers-nappies) untersucht.
Der dritte Teil erhebt die Verwendungsraten für 345 Sätze (138 gesprochene und 207 geschriebene Sätze). Im gesprochenen Teil hören die Teilnehmer aufgezeichnete Sätze, die von einem Muttersprachler der Zielvarietät vorgelesen werden. Sowohl die gesprochenen als auch die schriftlichen Stimuli werden in zwei unterschiedlichen Kontexten präsentiert, die verschiedene Stufen der Formalität widerspiegeln:
(i) ein informelles Gespräch unter Freunden
(ii) eine formelle E-Mail an einen ehemaligen Lehrer
Die Sätze enthalten ein breites Spektrum an grammatikalischen Merkmalen, wie z. B. doppelte Komparative, Nullmarkierung der dritten Person Singular und but am Satzende, wodurch sichergestellt wird, dass die Datenbank ein breites Spektrum an linguistischen Forschungsfragen abdecken kann. Die BSLVC-Datenbank kann dann quantitative Informationen über die Verteilung eines Merkmals liefern und soziale (z. B. Alter, Geschlecht) sowie stilistische Aspekte aufzeigen. Die im Fragebogen verwendete Form der Bewertungsaufgabe liefert Daten auf einer ordinalen Likert-Skala.
Da die Varietäten, die im Mittelpunkt des BSLVC stehen, bisher kaum erforscht sind, ist die Datenerhebung vor Ort ein wesentlicher Bestandteil des Projekts. Die Daten werden hauptsächlich durch persönliche Befragungen während Exkursionen, die vom Lehrstuhl für Englische Sprachwissenschaft durchgeführt werden, erhoben. Während der Großteil der Datenerhebung bisher mit einem standardisierten Papierfragebogen stattfand, wurde mittlerweile auch eine digitale Version entwickelt. Die Fragebögen bestehen aus mehreren Abschnitten, die unabhängig voneinander verwendet werden können.
Die Teilnahme am Fragebogen ist freiwillig und anonym. Die Teilnehmenden werden darüber informiert, dass sie das Ausfüllen des Fragebogens jederzeit beenden können. Studierende, die den Fragebogen (Lexikon und Grammatik) vollständig ausfüllen, erhalten in der Regel 10 € (oder einen entsprechenden Betrag). Die Mitglieder des BSLVC-Teams haben stets eine ethische Genehmigung für die Erhebung des Fragebogens an den Universitäten eingeholt, an denen diese benötigt wurde (z. B. Malta, Edinburgh). Die erhobenen soziodemografischen Informationen enthalten keine persönlichen Daten, die eine Identifizierung von Einzelpersonen ermöglichen.
Digitalisierung
Die ausgefüllten Fragebögen werden eingescannt, mit einer Optical Mark Recognition (OMR)-Software digitalisiert und von studentischen Hilfskräften des Lehrstuhls für Englische Sprachwissenschaft manuell überprüft. Daneben kommt eine digitale Version des Fragebogens auf Basis von Limesurvey zum Einsatz. Im letzten Schritt werden die Daten normalisiert und in einer Datenbank zusammengeführt. Die Datenanalyse und -visualisierung erfolgt hauptsächlich in R und Python.
Literaturverzeichnis
Buschfeld, Sarah & Alexander Kautzsch. 2022. Modelling World Englishes: A joint approach to Postcolonial and non-postcolonial varieties. In Modelling World Englishes. Edinburgh University Press. https://doi.org/10.1515/9781474445887
Deshors, Sandra C. (Hrsg.). 2018. Modeling World Englishes: Assessing the interplay of emancipation and globalization of ESL varieties (Varieties of English Around the World G61). Amsterdam: John Benjamins. https://doi.org/10.1075/veaw.g61
Dollinger, Stefan. 2015. The written questionnaire in social dialectology: history, theory, practice (IMPACT volume 40). Amsterdam, Philadelphia: John Benjamins. https://doi.org/10.1075/impact.40
Dryer, Matthew & Martin Haspelmath. 2022. The World Atlas of Language Structures Online. Zenodo. https://doi.org/10.5281/ZENODO.7385533
Hundt, Marianne. 2021. On models and modelling. World Englishes 40(3). 298–317. https://doi.org/10.1111/weng.12467
Kortmann, Bernd, Kerstin Lunkenheimer & Katharina Ehret (Hrsg.). 2020. The Electronic World Atlas of Varieties of English. Zenodo. https://zenodo.org/record/3712132
Kortmann, Bernd and Schneider, Edgar (Hrsg.) with Burridge, Kate, Mesthrie, Rajend and Upton, Clive. 2004. A handbook of varieties of English. Vol. 1: Phonology; Vol. 2: Morphology and syntax. Berlin and New York: Mouton de Gruyter. https://doi.org/10.1515/9783110197181
Michaelis, Susanne Maria, Philippe Maurer, Martin Haspelmath, Magnus Huber & Robert Forkel (Hrsg.). 2022. Atlas of Pidgin and Creole Language Structures Online. Oxford: Oxford University Press. http://apics-online.info
Diese Literaturangaben beziehen sich auf alle Seiten, die sich mit dem BSLVC befassen.