VinKo

Varietà in Contatto/Varietäten im Kontakt/Varieties in Contact

L’acronimo VinKo sta per Varietà in Contatto, un progetto di ricerca condotto in collaborazione dalle Università di Verona, Trento e Bolzano (2018-2022) che costituisce il punto di partenza di AlpiLinK. VinKo era un’infrastruttura di ricerca con lo scopo di documentare e analizzare i dialetti e le lingue minoritarie dell’Italia nord-orientale (in particolare delle regioni del Veneto e del Trentino-Alto Adige). Le varietà in contatto erano da un lato i dialetti tirolesi e le lingue minoritarie germaniche mòcheno, cimbro, saurano e sappadino, dall’altro le varietà venete, veneto-lombarde e ladine. L’infrastruttura comprendeva una piattaforma internet per la raccolta e la rappresentazione dei dati linguistici, un repository per la conservazione permanente dei dati e diverse iniziative di sensibilizzazione del pubblico, in particolare un progetto con le scuole secondarie di secondo grado del Veneto denominato VinKiamo.

L’obiettivo di VinKo era quello di permettere il confronto fra le strutture linguistiche dell’italiano e del tedesco. Ad oggi sono disponibili analisi geolinguistiche sistematiche relative alla morfologia degli articoli e dei pronomi (Kruijt 2022), all’uso dei soggetti espletivi con i verbi metereologici (Tomaselli & Bidese 2023) e all’uso dell’articolo espletivo con i nomi propri (Rabanus 2023). Ad esempio, la seguente frase può essere utilizzata nell’ambito di una ricerca sull’uso dell’articolo definito con il nome proprio (ad esempio il Gianni, la Maria invece di Gianni e Maria): In diesem Saal ist Maria die schönste/In questa stanza Maria è la più bella (S0015).

Nel dialetto tirolese di Fiè allo Sciliar (BZ) questa frase viene realizzata come: In dem Saal isch die Maria die schianschte.

 

Nel dialetto veneto di Grezzana in provincia di Verona si dice: In questo locale la Maria l’è la più bela.

 

Basandosi sui dati raccolti in VinKo, Rabanus (2023) ha mostrato che nella provincia di Trento i nomi propri sono accompagnati dall’articolo espletivo nel 74% dei casi, mentre nella regione Veneto solo nel 22% dei casi. Questo dimostra che, per quanto riguarda l’utilizzo dell’articolo espletivo, il confine tra le province di Trento e Verona (in quanto parte del Veneto) è più rilevante di quello tra le province di Trento e Bolzano (dove l’articolo espletivo viene usato in circa il 90% dei casi), sebbene quest’ultimo corrisponda al confine linguistico italo-tedesco.

Raccolta dati tramite crowdsourcing

La raccolta data in VinKo è stata condotta utilizzando la piattaforma internet multilingue (italiano-tedesco-inglese) vinko.it, dove i partecipanti hanno fornito dati linguistici sotto forma di file audio registrando le proprie risposte agli stimoli di un questionario online. Il questionario prevedeva tre compiti specifici: la pronuncia di parole dialettali; la traduzione dalla lingua standard (italiano o tedesco) al dialetto o alla lingua minoritaria di frasi (alcune presentate in modo isolato, altre inserite in brevi storie illustrate); la produzione di parlato libero attraverso il completamento di frasi stimolo relative al contenuto delle storie illustrate (per maggiori dettagli sulla raccolta dati si veda Kruijt, Cordin & Rabanus 2023). Fino a gennaio 2023, sono state raccolte 186.135 registrazioni audio di frasi e singole parole prodotte da 1.392 informanti provenienti da 377 località diverse. La collaborazione tra le comunità linguistiche locali, la popolazione in generale e il team di ricerca è un aspetto fondamentale della metodologia crowdsourcing. Per le comunità linguistiche, il progetto intendeva contribuire ad accrescere la loro consapevolezza linguistico-culturale documentando i dialetti e le lingue minoritarie come patrimonio culturale immateriale nello spazio digitale. Per il pubblico, una mappa liberamente accessibile offriva l’opportunità di scoprire la diversità linguistica locale e di acquisire consapevolezza del patrimonio culturale immateriale dell’area del Triveneto. La mappa è ancora accessibile sul sito di AlpiLinK nella sezione “Ascolta & Esplora“.

Dati di ricerca FAIR: repository

Per la comunità di ricerca, i dati sono stati depositati nel VinKo Corpus (Rabanus et al. 2023; handle: http://hdl.handle.net/20.500.12124/74) che è un repository liberamente accessibile (licenza: CC BY-NC-SA 4.0 International), attenendosi il più possibile ai principi FAIR. I dati sono stati riorganizzati e archiviati in questo database esterno indipendente dall’università al fine di garantirne la conservazione a lungo termine e il libero accesso anche dopo la fine del progetto. Il repository è gestito dal Centro di Ricerca Eurac Clarin (ERCC) con sede a Bolzano (Alto Adige). In quanto parte dell’infrastruttura europea CLARIN, il centro aderisce a standard internazionali ben definiti per la gestione e la conservazione dei dati.

Ciò significa che per gli esempi sopracitati è possibile accedere direttamente ai file audio utilizzando gli ID corrispondenti: S0015_tir_U0372 (Fiè allo Sciliar) e S0015_vec_U0556 (Grezzana). Per approfondire la logica delle denominazione e le modalità di ricerca delle registrazioni audio nell’archivio si veda Kruijt, Rabanus & Tagliani (2023, pp. 212-214). Al momento della stesura di questo testo, il corpus VinKo contiene 13.617 registrazioni audio per i dialetti trentini, 518 per il mòcheno, 743 per il cimbro, 194 per il ladino gardenese, 1.242 per il ladino badiot, 499 per il ladino fassan, 2.455 per il ladino fodom, 1.680 per il ladino anpezan, 305 per il saurano, 90.918 per i dialetti veneti e 13.294 per i dialetti tirolesi.

Nel contesto di VinKo sono stati resi accessibili in un repository anche i dati raccolti in fieldwork tradizionale nel progetto AThEME in cui era stato sviluppato il primo prototipo di VinKo (cfr. Cordin et al. 2019). L’AThEME Verona-Trento Corpus (Tomaselli et al. 2022; handle http://hdl.handle.net/20.500.12124/53) ha esattamente la stessa struttura del VinKo Corpus e permette, quindi, l’identificazione, la consultazione e la citazione dei dati esattamente come descritto prima per il VinKo Corpus. Per un esemplificazione dell’utilizzo e il confronto della validità dei dati raccolti in fieldwork tradizionale e in crowdsourcing si veda Kruijt, Cordin & Rabanus (2023).

Per approfondire

  • Cordin, Patrizia, Stefan Rabanus, Birgit Alber, Antonio Mattei, Jan Casalicchio, Alessandra Tomaselli, Ermenegildo Bidese & Andrea Padovan. VinKo. 2. In Thomas Krefeld & Roland Bauer (a cura di) (2019): Lo spazio comunicativo dell’Italia e delle varietà italiane, Versione 67. Korpus im Text.
  • Kruijt, Anne (2022): Crowdsourcing language contact: pronoun and article morphology in Trentino-South Tyrol and Veneto. Tesi di dottorato, Università di Verona.
  • Kruijt, Anne, Patrizia Cordin & Stefan Rabanus (2023): On the validity of crowdsourced data. In Elissa Pustka, Carmen Quijada Van den Berghe & Verena Weiland (a cura di): Corpus Dialectology. Amsterdam/Philadelphia: Benjamins, 10-33.
  • Kruijt, Anne, Stefan Rabanus & Marta Tagliani (2023). The VinKo-Corpus: Oral data from Romance and Germanic local varieties of Northern Italy. In Marc Kupietz & Thomas Schmidt (a cura di): Neue Entwicklungen in der Korpuslandschaft der Germanistik: Beiträge zur IDS-Methodenmesse 2022. (= Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache (CLIP) 11). Tubinga: Narr, 203-212.
  • Rabanus, Stefan (2023): Nome di battesimo e articolo espletivo – crowdsourcing e cartografica linguistica nello studio della variazione linguistica in Trentino-Alto Adige e Veneto. In Robert Schöntag & Laura Linzmeier (a cura di): Neue Ansätze und Perspektiven zur sprachlichen Raumkonzeption und Geolinguistik. Francoforte: Lang.
  • Rabanus, Stefan, Anne Kruijt, Marta Tagliani, Alessandra Tomaselli, Andrea Padovan, Birgit Alber, Patrizia Cordin, Roberto Zamparelli & Barbara Maria Vogt (2023): VinKo (Varieties in Contact) Corpus v1.2. Bolzano: ERCC.
  • Tomaselli, Alessandra & Ermenegildo Bidese (2023): Fortune and decay of lexical expletives in Germanic and Romance along the Adige River. Languages 8(1), 44.
  • Tomaselli, Alessandra, Anne Kruijt, Birgit Alber, Ermenegildo Bidese, Jan Casalicchio, Patrizia Cordin, Joachim Kokkelmans, Andrea Padovan, Stefan Rabanus & Francesco Zuin (2022), AThEME Verona-Trento Corpus. Bolzano: ERCC.