VinKo

Varietäten im Kontakt/Varietà in Contatto/Varieties in Contact

Das Akronym VinKo steht für Varietäten im Kontakt, ein gemeinsam von den Universitäten Verona, Trient und Bozen 2018-2022 durchgeführtes Forschungsprojekt, welches den Ausgangspunkt für AlpiLinK bildet. VinKo war eine Forschungsinfrastruktur mit dem Zweck der Dokumentation und Untersuchung der Dialekte und Minderheitensprachen in Nordost-Italien (Regionen Trentino-Südtirol und Venetien). Die Varietäten im Kontakt waren die Tiroler Dialekte und die deutschen Minderheitensprachen Fersentalerisch, Zimbrisch, Sauranisch und Plodarisch auf der einen Seite und venetische, venetisch-lombardische und ladinische Varietäten auf der anderen. Die Infrastruktur umfasste eine Internet-Plattform für die Sammlung und Darstellung der Sprachdaten, ein Repositorium für die dauerhafte Sicherung der Daten und verschiedene Public Outreach-Initiativen, vor allem ein Projekt mit den Oberschulen der Region Venetien mit dem Namen VinKiamo.

Das Ziel von VinKo war es, Vergleiche von deutscher und italienischer Sprachstruktur zu ermöglichen. Systematische geolinguistische Analysen liegen bisher zur Morphologie von Artikeln und Pronomen (Kruijt 2022), zu Subjektexpletiven bei Wetterverben (Tomaselli & Bidese 2023) und zum Expletivartikel bei Personennamen vor (Rabanus 2023). Als Beispiel für die Variation bezüglich des Gebrauchs von Expletivartikeln mit Personennamen (z.B. der Hans, die Maria statt Hans und Maria) können die folgenden Sätze dienen: In diesem Saal ist Maria die schönste/In questa stanza Maria è la più bella (S0015).

Im Tiroler Dialekt von Völs am Schlern lautet der Satz In dem Saal isch die Maria die schianschte.

 

Im venetischen Dialekt von Grezzana in der Provinz Verona lautet er: In questo locale la Maria l’è la più bela.

 

Rabanus (2023) kann mit VinKo-Daten zeigen, dass in der Provinz Trient Personennamen in 74% der Fälle mit Expletivartikeln auftreten, in der Region Venetien dagegen nur in 22% der Fälle. Das bedeutet, dass interessanterweise für den Gebrauch des Expletivartikels die Grenze zwischen den Provinzen Trient und Verona (als Teil Venetiens) relevanter ist als die Grenze zwischen den Provinzen Trient und Bozen (wo Expletivartikel in ca. 90% der Fälle auftreten), obwohl diese Grenze der deutsch-italienischen Sprachgrenze entspricht.

Datensammlung per Crowdsourcing

Die Datensammlung wurde in VinKo mit der mehrsprachigen (Deutsch-Italienisch-Englisch) Internet-Plattform vinko.it durchgeführt, auf der Informanten Sprachdaten lieferten, indem sie Reaktionen auf Stimuli eines Online-Fragebogens als Audiodateien aufzeichneten. Der Fragebogen umfasste drei Typen von Aufgaben: Aussprache von Dialektwörtern, Übersetzung von Sätzen aus der Standardsprache (Deutsch oder Italienisch) in den Dialekt oder die Minderheitensprache (manche Sätze wurden isoliert präsentiert, andere eingebettet in Bildergeschichten) und freie Sprachproduktion durch die Vervollständigung von Stimulussätzen auf der Grundlage des Inhalts der Bildergeschichten (zu den Details der Datensammlung vgl. Kruijt, Cordin & Rabanus 2023). Bis Januar 2023 wurden so 186.135 Audiodateien von Sätzen und Einzelwörtern von 1.392 Informanten aus 377 verschiedenen Orten aufgezeichnet. Die Zusammenarbeit zwischen den lokalen Sprachgemeinschaften, der allgemeinen Öffentlichkeit und der Forschungsgruppe ist ein wesentlicher Teil der Crowdsourcing-Methode. Für die Sprachgemeinschaften sollte das Projekt zur Erhöhung des eigenen sprachlich-kulturellen Selbstbewusstseins beitragen, indem die Dialekte und Minderheitensprachen als immaterielles Kulturerbe im digitalen Raum dokumentiert wurden. Für die allgemeine Öffentlichkeit gibt eine frei zugängliche Karte die Möglichkeit, die lokalen sprachlichen Diversitäten zu entdecken und ein Bewusstsein vom Wert des immateriellen Kulturerbes der sog. „Triveneto“-Region zu bekommen. Die Karte ist nach wie vor zugänglich, auf dieser AlpiLink-Webseite in der Sektion „Anhören und Entdecken“ .

FAIRe Forschungsdaten: Repositorium

Für die Forschungsgemeinschaft sind die Daten im VinKo Corpus (Rabanus et al. 2023; Handle: http://hdl.handle.net/20.500.12124/74), einem frei zugänglichen Repositorium (Lizenz: CC BY-NC-SA 4.0 International) archiviert worden, wobei so weit wie möglich die FAIR-Prinzipien befolgt wurden. Die Reorganisation und Archivierung der Daten in einer externen, von der Universität unabhängigen Datenbank dient dazu, die Langzeit-Sicherung und den freien Zugang zu den Daten auch nach Projektende sicherzustellen. Das Repositorium wird vom Eurac Research Clarin Centre (ERCC) in Bozen verwaltet. Als Teil der europäischen CLARIN-Infrastruktur folgt das Zentrum den internationalen Standards für den Umgang mit Daten.

Das bedeutet, dass für Beispiele wie die oben zitierten ein direkter Zugriff auf die Audiodateien möglich ist, indem man die entsprechenden IDs verwendet: S0015_tir_U0372 (Völs) und S0015_vec_U0556 (Grezzana). Für die Logik der Benennungen und dazu, wie man die Audiodateien im Repositorium findet, siehe Kruijt, Rabanus & Tagliani (2023, S. 212-214). Zum Zeitpunkt der Abfassung dieses Texts enthält das Vinko-Korpus 13.617 Audiodateien für die Trentiner Dialekte, 518 für Fersentalerisch, 743 für Zimbrisch, 194 für Ladinisch im Grödnertal, 1.242 für Ladinisch im Abteital, 499 für Ladinisch im Fassatal, 2.455 für Buchensteinerisch, 1.680 für Ampezzo-Ladinisch, 305 for Sauranisch, 90.918 für Venetisch und 13.294 für Tirolisch.

Im Rahmen von VinKo sind auch die Daten in einem Repositorium zugänglich gemacht worden, die in traditionaller Feldforschung im Projekt AThEME erhoben wurden, in dem der Prototyp von VinKo entwickelt worden war (siehe Cordin et al. 2019). Das AThEME Verona-Trento Corpus (Tomaselli et al. 2022; handle http://hdl.handle.net/20.500.12124/53) hat genau dieselbe Struktur wie das VinKo Corpus und erlaubt also das Auffinden, Konsultieren und Zitieren der Daten genau so, wie es oben für das VinKo Corpus beschrieben ist. Für Anwendungsbeispiele und einen Vergleich der Validität von in traditioneller Feldforschung und per Crowdsourcing erhobenen Daten siehe Kruijt, Cordin & Rabanus (2023).

Literaturangaben

  • Cordin, Patrizia, Stefan Rabanus, Birgit Alber, Antonio Mattei, Jan Casalicchio, Alessandra Tomaselli, Ermenegildo Bidese & Andrea Padovan. VinKo. 2. In Thomas Krefeld & Roland Bauer (Hrsg.) (2019): Lo spazio comunicativo dell’Italia e delle varietà italiane, Versione 67. Korpus im Text.
  • Kruijt, Anne (2022): Crowdsourcing language contact: pronoun and article morphology in Trentino-South Tyrol and Veneto. Dissertation, Universität Verona.
  • Kruijt, Anne, Patrizia Cordin & Stefan Rabanus (2023): On the validity of crowdsourced data. In Elissa Pustka, Carmen Quijada Van den Berghe & Verena Weiland (Hrsg.): Corpus Dialectology. Amsterdam/Philadelphia: Benjamins, 10-33.
  • Kruijt, Anne, Stefan Rabanus & Marta Tagliani (2023). The VinKo-Corpus: Oral data from Romance and Germanic local varieties of Northern Italy. In Marc Kupietz & Thomas Schmidt (Hrsg.): Neue Entwicklungen in der Korpuslandschaft der Germanistik: Beiträge zur IDS-Methodenmesse 2022. (= Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache (CLIP) 11). Tübingen: Narr, 203-212.
  • Rabanus, Stefan (2023): Nome di battesimo e articolo espletivo – crowdsourcing e cartografica linguistica nello studio della variazione linguistica in Trentino-Alto Adige e Veneto. In Robert Schöntag & Laura Linzmeier (Hrsg.): Neue Ansätze und Perspektiven zur sprachlichen Raumkonzeption und Geolinguistik. Frankfurt: Lang.
  • Rabanus, Stefan, Anne Kruijt, Marta Tagliani, Alessandra Tomaselli, Andrea Padovan, Birgit Alber, Patrizia Cordin, Roberto Zamparelli & Barbara Maria Vogt (2023): VinKo (Varieties in Contact) Corpus v1.2. Bozen: ERCC.
  • Tomaselli, Alessandra & Ermenegildo Bidese (2023): Fortune and decay of lexical expletives in Germanic and Romance along the Adige River. Languages 8(1), 44.
  • Tomaselli, Alessandra, Anne Kruijt, Birgit Alber, Ermenegildo Bidese, Jan Casalicchio, Patrizia Cordin, Joachim Kokkelmans, Andrea Padovan, Stefan Rabanus & Francesco Zuin (2022), AThEME Verona-Trento Corpus. Bozen: ERCC.