VinKo

Varietà in Contatto/Varietäten im Kontakt/Varieties in Contact

VinKo est l’acronyme de Varieties in Contact (‘Variétés en contact’), un projet de recherche mené en collaboration par les universités de Vérone, Trente et Bozen-Bolzano (2018-2022) qui constitue le point de départ du projet AlpiLinK. VinKo était une infrastructure de recherche qui avait pour but de documenter et d’analyser les dialectes et langues minoritaires de l’Italie du Nord-Est (en particulier dans les régions de la Vénétie, du Trentin et du Sud-Tyrol). Les variétés en contact étaient, d’une part, les dialectes tyroliens et les langues minoritaires germaniques mòcheno, cimbre ainsi que le dialecte de Zahre et celui de Plodn, et d’autre part, les variétés vénitiennes, vénéto-lombardes et ladines. L’infrastructure comprenait une plateforme internet pour la collecte et la représentation des données linguistiques, une archive pour la conservation permanente des données et différentes initiatives de sensibilisation du public, en particulier un projet avec les écoles secondaires de la Vénétie appelé VinKiamo.

L’objectif de VinKo était de rendre possible la comparaison des structures linguistiques de l’italien et de l’allemand. Actuellement, des analyses géolinguistiques systématiques sont disponibles portant sur les thèmes suivants: la morphologie des articles et pronoms (Kruijt 2022), l’usage de sujets explétifs avec des verbes météorologiques (Tomaselli & Bidese 2023) et l’usage de l’article explétif avec des noms propres (Rabanus 2023). Par exemple, la phrase suivante peut être utilisée pour étudier l’usage de l’article défini avec un nom propre (par ex. le Jean, la Marie plutôt que Jean et Marie): In diesem Saal ist Maria die schönste/In questa stanza Maria è la più bella (S0015; “Dans cette salle, c’est Marie qui est la plus belle”).

Dans le dialecte tyrolien de Völs am Schlern (BZ), cette phrase est réalisée comme suit: In dem Saal isch die Maria die schianschte.

 

Dans le dialecte vénitien de Grezzana, dans la province de Vérone, l’on dit: In questo locale la Maria l’è la più bela.

 

En se basant sur les données collectées au moyen de VinKo, Rabanus (2023) a montré que dans la province de Trente, les noms propres sont accompagnés par l’article explétif dans 74% des cas, tandis que ce nombre ne s’élève qu’à 22% dans la région de Vénétie. Ceci montre que, en ce qui concerne l’usage de l’article explétif, la frontière entre les provinces de Trente et Vérone en Vénétie est plus pertinente que celle entre Trente et Bozen-Bolzano au Sud-Tyrol, où l’usage de l’article explétif atteint environ 90%, malgré la frontière linguistique germano-italophone entre ces deux dernières villes. (Note: Trente se situe grosso modo à mi-distance entre Vérone et Bozen-Bolzano). Une description plus détaillée des résultats est disponible dans la section « Résultats« .

Collecte de données au moyen du crowdsourcing

Le projet VinKo a collecté des données par le biais de la plateforme internet multilingue (italo-germano-anglophone) vinko.it, où les participant.e.s ont fourni des données linguistiques sous forme de fichiers audio, en enregistrant leur propres réponses aux stimuli d’un questionnaire en ligne. Le questionnaire avait trois objectifs spécifiques: la prononciation de mots en dialecte, la traduction par les participant.e.s de phrases en italien ou allemand standard vers leur dialecte ou langue minoritaire (soit des phrases isolées, soit des phrases insérées dans le contexte narratif d’une histoire illustrée), et troisièmement, la production libre de phrases liées au contenu des histoires illustrées (voir Kruijt, Cordin & Rabanus 2023 pour plus de détails sur la collecte de données). Au total, 189.679 fichiers audio de mots et phrases ont été enregistrés par 1.439 informateurs provenant de 387 localités différentes. La collaboration entre les communautés linguistiques locales, la population en général et l’équipe de recherche scientifique est un aspect fondamental de la méthodologie du crowdsourcing. Pour les communautés linguistiques, le projet avait pour but de contribuer à accroître la conscience de la richesse linguistique et culturelle, en documentant les dialectes et langues minoritaires en tant que patrimoine culturel immatériel dans l’espace digital. Une carte en accès libre a permis à tout le monde de découvrir les variétés linguistiques locales et, ainsi, de prendre conscience de la valeur du patrimoine culturel immatériel de la région dite « des Trois Vénéties ». La carte « VinKo » dans sa forme originale (comme illustrée ci-contre) n’est plus en ligne. Cependant, toutes les données de la carte « VinKo » ont été intégrées dans la carte disponible sur le site « AlpiLink » dans la section « Écouter & Explorer« , et sont donc toujours accessibles du point de vue géographique.

Carte VinKo (non plus en ligne)

Données de recherche FAIR: archive

Pour la communauté des chercheuses et des chercheurs, les données ont été sauvegardées dans le VinKo Corpus (Rabanus et al. 2023; handle: http://hdl.handle.net/20.500.12124/74),  qui est une archive en accès libre (licence: CC BY-NC-SA 4.0 International), en prenant soin de respecter au mieux possible les principes FAIR. Les données ont été réorganisées et archivées dans cette base de données externe et indépendante de l’université, afin de garantir leur conservation à long terme et le libre accès à tout moment, même après la date de clôture du projet. L’archive est gérée par le Centre de Recherche Eurac Clarin (ERCC) situé à Bozen-Bolzano (Sud-Tyrol). En tant que membre de l’infrastructure européenne CLARIN, le centre adhère à des standards internationaux bien définis pour la gestion et la conservation de données.

Ceci signifie qu’il est par exemple possible d’avoir accès directement aux fichiers audio des phrases-exemple ci-dessus, en utilisant les ID correspondants: S0015_tir_U0372 (Völs am Schlern) et S0015_vec_U0556 (Grezzana).

Pour approfondir la logique de la dénomination et les modalités de recherche des enregistrements audio de l’archive, voir Kruijt, Rabanus & Tagliani (2023, pp. 212-214). Au moment de la rédaction de ces lignes, le corpus VinKo contient 12.511 enregistrements audio pour les dialectes trentins, 502 pour le mòcheno, 683 pour le cimbre, 7.133 pour les différentes variétés ladines (la variété de la vallée de Gherdëina et celle de Badia, la variété de la vallée de Fascia, la variété de la vallée de Fodom, ainsi que celle de Anpezo), 158 pour la langue minoritaire parlée à Plodn/Sappada, 268 pour la langue minoritaire parlée à Zahre/Sauris, 20.659 pour les dialectes tyroliens et 147.765 pour les dialectes vénitiens, représentant ainsi plus des 3/4 du corpus total de 189.679 fichiers audio.

Pour approfondir

  • Kruijt, Anne (2022): Crowdsourcing language contact: pronoun and article morphology in Trentino-South Tyrol and Veneto. Thèse de doctorat, Université de Vérone.
  • Kruijt, Anne, Patrizia Cordin & Stefan Rabanus (2023): On the validity of crowdsourced data. In Elissa Pustka, Carmen Quijada Van den Berghe & Verena Weiland (dir.): Corpus Dialectology. Amsterdam/Philadelphie: Benjamins, 10-33.
  • Kruijt, Anne, Stefan Rabanus & Marta Tagliani (2023). The VinKo-Corpus: Oral data from Romance and Germanic local varieties of Northern Italy. In Marc Kupietz & Thomas Schmidt (dir.): Neue Entwicklungen in der Korpuslandschaft der Germanistik: Beiträge zur IDS-Methodenmesse 2022. (= Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache (CLIP) 11). Tübingen: Narr, 203-212.
  • Rabanus, Stefan (2023): Nome di battesimo e articolo espletivo – crowdsourcing e cartografica linguistica nello studio della variazione linguistica in Trentino-Alto Adige e Veneto. In Robert Schöntag & Laura Linzmeier (dir.): Neue Ansätze und Perspektiven zur sprachlichen Raumkonzeption und Geolinguistik. Fallstudien aus der Romania und der Germania. Lausanne: Lang, 93-134.
  • Rabanus, Stefan, Anne Kruijt, Marta Tagliani, Alessandra Tomaselli, Andrea Padovan, Birgit Alber, Patrizia Cordin, Roberto Zamparelli & Barbara Maria Vogt (2023): VinKo (Varieties in Contact) Corpus v1.2. Bozen-Bolzano: ERCC.
  • Tomaselli, Alessandra & Ermenegildo Bidese (2023): Fortune and decay of lexical expletives in Germanic and Romance along the Adige River. Languages 8(1), 44.