VinKo

Varietäten im Kontakt/Varietà in Contatto/Varieties in Contact

Das Akronym VinKo steht für Varietäten im Kontakt, ein gemeinsam von den Universitäten Verona, Trient und Bozen 2018-2022 durchgeführtes Forschungsprojekt, welches den Ausgangspunkt für AlpiLinK bildet. VinKo war eine Forschungsinfrastruktur mit dem Zweck der Dokumentation und Untersuchung der Dialekte und Minderheitensprachen in Nordost-Italien (Regionen Trentino-Südtirol und Venetien). Die Varietäten im Kontakt waren die Tiroler Dialekte und die deutschen Minderheitensprachen Fersentalerisch, Zimbrisch, Sauranisch und Plodarisch auf der einen Seite und venetische, venetisch-lombardische und ladinische Varietäten auf der anderen. Die Infrastruktur umfasste eine Internet-Plattform für die Sammlung und Darstellung der Sprachdaten, ein Repositorium für die dauerhafte Sicherung der Daten und verschiedene Public Outreach-Initiativen, vor allem ein Projekt mit den Oberschulen der Region Venetien mit dem Namen VinKiamo.

Das Ziel von VinKo war es, Vergleiche von deutscher und italienischer Sprachstruktur zu ermöglichen. Systematische geolinguistische Analysen liegen bisher zur Morphologie von Artikeln und Pronomen (Kruijt 2022), zu Subjektexpletiven bei Wetterverben (Tomaselli & Bidese 2023) und zum Expletivartikel bei Personennamen vor (Rabanus 2023). Als Beispiel für die Variation bezüglich des Gebrauchs von Expletivartikeln mit Personennamen (z.B. der Hans, die Maria statt Hans und Maria) können die folgenden Sätze dienen: In diesem Saal ist Maria die schönste/In questa stanza Maria è la più bella (S0015).

Im Tiroler Dialekt von Völs am Schlern lautet der Satz In dem Saal isch die Maria die schianschte.

Im venetischen Dialekt von Grezzana in der Provinz Verona lautet er: In questo locale la Maria l’è la più bela.

Rabanus (2023) kann mit VinKo-Daten zeigen, dass in der Provinz Trient Personennamen in 74% der Fälle mit Expletivartikeln auftreten, in der Region Venetien dagegen nur in 22% der Fälle. Das bedeutet, dass interessanterweise für den Gebrauch des Expletivartikels die Grenze zwischen den Provinzen Trient und Verona (als Teil Venetiens) relevanter ist als die Grenze zwischen den Provinzen Trient und Bozen (wo Expletivartikel in ca. 90% der Fälle auftreten), obwohl diese Grenze der deutsch-italienischen Sprachgrenze entspricht. Eine ausführlichere Beschreibung der Ergebnisse dieser Studie finden Sie in der Sektion “Ergebnisse” , und zwar hier.

Datensammlung per Crowdsourcing

Die Datensammlung wurde in VinKo mit der mehrsprachigen (Deutsch-Italienisch-Englisch) Internet-Plattform vinko.it durchgeführt, auf der Informanten Sprachdaten lieferten, indem sie Reaktionen auf Stimuli eines Online-Fragebogens als Audiodateien aufzeichneten. Der Fragebogen umfasste drei Typen von Aufgaben: Aussprache von Dialektwörtern, Übersetzung von Sätzen aus der Standardsprache (Deutsch oder Italienisch) in den Dialekt oder die Minderheitensprache (manche Sätze wurden isoliert präsentiert, andere eingebettet in Bildergeschichten) und freie Sprachproduktion durch die Vervollständigung von Stimulussätzen auf der Grundlage des Inhalts der Bildergeschichten (zu den Details der Datensammlung vgl. Kruijt, Cordin & Rabanus 2023). Insgesamt wurden so 189.679 Audiodateien von Sätzen und Einzelwörtern von 1.439 Informanten aus 387 verschiedenen Orten aufgezeichnet. Die Zusammenarbeit zwischen den lokalen Sprachgemeinschaften, der allgemeinen Öffentlichkeit und der Forschungsgruppe ist ein wesentlicher Teil der Crowdsourcing-Methode. Für die Sprachgemeinschaften sollte das Projekt zur Erhöhung des eigenen sprachlich-kulturellen Selbstbewusstseins beitragen, indem die Dialekte und Minderheitensprachen als immaterielles Kulturerbe im digitalen Raum dokumentiert wurden. Für die allgemeine Öffentlichkeit gab eine frei zugängliche Karte die Möglichkeit, die lokalen sprachlichen Diversitäten zu entdecken und ein Bewusstsein vom Wert des immateriellen Kulturerbes der sog. “Triveneto”-Region zu bekommen. Die VinKo-Karte in ihrer ursprünglichen Form (wie hier nebenstehend abgebildet) ist nicht mehr online. Allerdings sind alle Daten der VinKo-Karte in die Karte eingegangen, die sich auf dieser AlpiLink-Webseite in der Sektion “Anhören und Entdecken” befindet. Damit kann weiterhin mit einem geographischen Instrument auf die Daten zugegriffen werden.

VinKo-Karte (nicht mehr online)

FAIRe Forschungsdaten: Repositorium

Für die Forschungsgemeinschaft sind die Daten im VinKo Corpus (Rabanus et al. 2023; Handle: http://hdl.handle.net/20.500.12124/74 ), einem frei zugänglichen Repositorium (Lizenz: CC BY-NC-SA 4.0 International) archiviert worden, wobei so weit wie möglich die FAIR-Prinzipien befolgt wurden. Die Reorganisation und Archivierung der Daten in einer externen, von der Universität unabhängigen Datenbank dient dazu, die Langzeit-Sicherung und den freien Zugang zu den Daten auch nach Projektende sicherzustellen. Das Repositorium wird vom Eurac Research Clarin Centre (ERCC) in Bozen verwaltet. Als Teil der europäischen CLARIN-Infrastruktur folgt das Zentrum den internationalen Standards für den Umgang mit Daten.

Das bedeutet, dass für Beispiele wie die oben zitierten ein direkter Zugriff auf die Audiodateien möglich ist, indem man die entsprechenden IDs verwendet: S0015_tir_U0372 (Völs) und S0015_vec_U0556 (Grezzana). Für die Logik der Benennungen und dazu, wie man die Audiodateien im Repositorium findet, siehe Kruijt, Rabanus & Tagliani (2023, S. 212-214). Insgesamt enthält das Vinko-Korpus 12.511 Audiodateien für die Trentiner Dialekte, 502 für Fersentalerisch, 683 für Zimbrisch, 7.133 für die verschiedenen ladinischen Varietäten (Gadertalerisch, Grödnerisch, Fassanisch, Buchensteinerisch, Ampezzo-Ladinisch), 158 für Plodarisch, 268 für Zahrerisch, 20.659 für die tirolischen Dialekte und 147.765 für die venetischen Dialekte, die damit mehr als 3/4 des Gesamtkorpus mit 189.679 Audiodateien repräsentieren.

Im Rahmen von VinKo sind auch die Daten in einem Repositorium zugänglich gemacht worden, die in traditionaller Feldforschung im Projekt AThEME erhoben wurden, in dem der Prototyp von VinKo entwickelt worden war (siehe Cordin et al. 2019). Das AThEME Verona-Trento Corpus (Tomaselli et al. 2022; handle http://hdl.handle.net/20.500.12124/53) hat genau dieselbe Struktur wie das VinKo Corpus und erlaubt also das Auffinden, Konsultieren und Zitieren der Daten genau so, wie es oben für das VinKo Corpus beschrieben ist. Für Anwendungsbeispiele und einen Vergleich der Validität von in traditioneller Feldforschung und per Crowdsourcing erhobenen Daten siehe Kruijt, Cordin & Rabanus (2023).

Literaturangaben

Cordin, Patrizia, Stefan Rabanus, Birgit Alber, Antonio Mattei, Jan Casalicchio, Alessandra Tomaselli, Ermenegildo Bidese & Andrea Padovan. VinKo. 2. In Thomas Krefeld & Roland Bauer (Hrsg.) (2019): Lo spazio comunicativo dell’Italia e delle varietà italiane, Versione 67. Korpus im Text.
Kruijt, Anne (2022): Crowdsourcing language contact: pronoun and article morphology in Trentino-South Tyrol and Veneto. Dissertation, Universität Verona.
Kruijt, Anne, Patrizia Cordin & Stefan Rabanus (2023): On the validity of crowdsourced data. In Elissa Pustka, Carmen Quijada Van den Berghe & Verena Weiland (Hrsg.): Corpus Dialectology. Amsterdam/Philadelphia: Benjamins, 10-33.
Kruijt, Anne, Stefan Rabanus & Marta Tagliani (2023). The VinKo-Corpus: Oral data from Romance and Germanic local varieties of Northern Italy. In Marc Kupietz & Thomas Schmidt (Hrsg.): Neue Entwicklungen in der Korpuslandschaft der Germanistik: Beiträge zur IDS-Methodenmesse 2022. (= Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache (CLIP) 11). Tübingen: Narr, 203-212.
Rabanus, Stefan (2023): Nome di battesimo e articolo espletivo – crowdsourcing e cartografica linguistica nello studio della variazione linguistica in Trentino-Alto Adige e Veneto. In Robert Schöntag & Laura Linzmeier (Hrsg.): Neue Ansätze und Perspektiven zur sprachlichen Raumkonzeption und Geolinguistik. Fallstudien aus der Romania und der Germania. Lausanne: Lang, 93-134.
Rabanus, Stefan, Anne Kruijt, Marta Tagliani, Alessandra Tomaselli, Andrea Padovan, Birgit Alber, Patrizia Cordin, Roberto Zamparelli & Barbara Maria Vogt (2023): VinKo (Varieties in Contact) Corpus v1.2. Bozen: ERCC.
Tomaselli, Alessandra & Ermenegildo Bidese (2023): Fortune and decay of lexical expletives in Germanic and Romance along the Adige River. Languages 8(1), 44.
Tomaselli, Alessandra, Anne Kruijt, Birgit Alber, Ermenegildo Bidese, Jan Casalicchio, Patrizia Cordin, Joachim Kokkelmans, Andrea Padovan, Stefan Rabanus & Francesco Zuin (2022), AThEME Verona-Trento Corpus. Bozen: ERCC.