VinKo

Varietà in Contatto/Varietäten im Kontakt/Varieties in Contact

VinKo est l’acronyme de Varieties in Contact (‘Variétés en contact’), un projet de recherche mené en collaboration par les universités de Vérone, Trente et Bozen-Bolzano (2018-2022) qui constitue le point de départ du projet AlpiLinK. VinKo était une infrastructure de recherche qui avait pour but de documenter et d’analyser les dialectes et langues minoritaires de l’Italie du Nord-Est (en particulier dans les régions de la Vénétie, du Trentin et du Sud-Tyrol). Les variétés en contact étaient, d’une part, les dialectes tyroliens et les langues minoritaires germaniques mòcheno, cimbre ainsi que le dialecte de Zahre et celui de Plodn, et d’autre part, les variétés vénitiennes, vénéto-lombardes et ladines. L’infrastructure comprenait une plateforme internet pour la collecte et la représentation des données linguistiques, une archive pour la conservation permanente des données et différentes initiatives de sensibilisation du public, en particulier un projet avec les écoles secondaires de la Vénétie appelé VinKiamo.

L’objectif de VinKo était de rendre possible la comparaison des structures linguistiques de l’italien et de l’allemand. Actuellement, des analyses géolinguistiques systématiques sont disponibles portant sur les thèmes suivants: la morphologie des articles et pronoms (Kruijt 2022), l’usage de sujets explétifs avec des verbes météorologiques (Tomaselli & Bidese 2023) et l’usage de l’article explétif avec des noms propres (Rabanus 2023). Par exemple, la phrase suivante peut être utilisée pour étudier l’usage de l’article défini avec un nom propre (par ex. le Jean, la Marie plutôt que Jean et Marie): In diesem Saal ist Maria die schönste/In questa stanza Maria è la più bella (S0015; “Dans cette salle, c’est Marie qui est la plus belle”).

Dans le dialecte tyrolien de Völs am Schlern (BZ), cette phrase est réalisée comme suit: In dem Saal isch die Maria die schianschte.

 

Dans le dialecte vénitien de Grezzana, dans la province de Vérone, l’on dit: In questo locale la Maria l’è la più bela.

 

En se basant sur les données collectées au moyen de VinKo, Rabanus (2023) a montré que dans la province de Trente, les noms propres sont accompagnés par l’article explétif dans 74% des cas, tandis que ce nombre ne s’élève qu’à 22% dans la région de Vénétie. Ceci montre que, en ce qui concerne l’usage de l’article explétif, la frontière entre les provinces de Trente et Vérone en Vénétie est plus pertinente que celle entre Trente et Bozen-Bolzano au Sud-Tyrol, où l’usage de l’article explétif atteint environ 90%, malgré la frontière linguistique germano-italophone entre ces deux dernières villes. (Note: Trente se situe grosso modo à mi-distance entre Vérone et Bozen-Bolzano).

Collecte de données au moyen du crowdsourcing

Le projet VinKo a collecté des données par le biais de la plateforme internet multilingue (italo-germano-anglophone) vinko.it, où les participant.e.s ont fourni des données linguistiques sous forme de fichiers audio, en enregistrant leur propres réponses aux stimuli d’un questionnaire en ligne. Le questionnaire avait trois objectifs spécifiques: la prononciation de mots en dialecte, la traduction par les participant.e.s de phrases en italien ou allemand standard vers leur dialecte ou langue minoritaire (soit des phrases isolées, soit des phrases insérées dans le contexte narratif d’une histoire illustrée), et troisièmement, la production libre de phrases liées au contenu des histoires illustrées (voir Kruijt, Cordin & Rabanus 2023 pour plus de détails sur la collecte de données). Au mois de janvier 2023, 186.135 fichiers audio de mots et phrases ont été collectés, produits par 1.392 informateur.rice.s provenant de 377 localités différentes. La collaboration entre les communautés linguistiques locales, la population en général et l’équipe de recherche scientifique est un aspect fondamental de la méthodologie du crowdsourcing. Pour les communautés linguistiques, le projet avait pour but de contribuer à accroître la conscience de la richesse linguistique et culturelle, en documentant les dialectes et langues minoritaires en tant que patrimoine culturel immatériel dans l’espace digital. Pour le public, une carte librement accessible proposait de découvrir la diversité linguistique locale et de prendre conscience du patrimoine culturel immatériel de la zone s’étendant du Sud-Tyrol à la Vénétie. La carte est encore accessible sur le site d’AlpiLinK, dans la rubriqueÉcouter & Explorer”.

Données de recherche FAIR: archive

Pour la communauté des chercheuses et des chercheurs, les données ont été sauvegardées dans le VinKo Corpus (Rabanus et al. 2023; handle: http://hdl.handle.net/20.500.12124/74),  qui est une archive en accès libre (licence: CC BY-NC-SA 4.0 International), en prenant soin de respecter au mieux possible les principes FAIR. Les données ont été réorganisées et archivées dans cette base de données externe et indépendante de l’université, afin de garantir leur conservation à long terme et le libre accès à tout moment, même après la date de clôture du projet. L’archive est gérée par le Centre de Recherche Eurac Clarin (ERCC) situé à Bozen-Bolzano (Sud-Tyrol). En tant que membre de l’infrastructure européenne CLARIN, le centre adhère à des standards internationaux bien définis pour la gestion et la conservation de données.

Ceci signifie qu’il est par exemple possible d’avoir accès directement aux fichiers audio des phrases-exemple ci-dessus, en utilisant les ID correspondants: S0015_tir_U0372 (Völs am Schlern) et S0015_vec_U0556 (Grezzana).

Pour approfondir la logique de la dénomination et les modalités de recherche des enregistrements audio de l’archive, voir Kruijt, Rabanus & Tagliani (2023, pp. 212-214). Au moment de la rédaction de ces lignes, le corpus VinKo contient 13.617 enregistrements audio pour les dialectes trentins, 518 pour le mòcheno, 743 pour le cimbre, 194 pour le ladin de Gherdëina, 1.242 pour le ladin de la Val Badia, 499 pour le ladin de Fascia, 2.455 pour le ladin de Fodom, 1.680 pour le ladin d’Anpezo, 305 pour la variété germanique de Zahre, 90.918 pour les dialectes vénitiens et 13.294 pour les dialectes tyroliens.

Pour approfondir

  • Kruijt, Anne (2022): Crowdsourcing language contact: pronoun and article morphology in Trentino-South Tyrol and Veneto. Thèse de doctorat, Université de Vérone.
  • Kruijt, Anne, Patrizia Cordin & Stefan Rabanus (2023): On the validity of crowdsourced data. In Elissa Pustka, Carmen Quijada Van den Berghe & Verena Weiland (dir.): Corpus Dialectology. Amsterdam/Philadelphie: Benjamins, 10-33.
  • Kruijt, Anne, Stefan Rabanus & Marta Tagliani (2023). The VinKo-Corpus: Oral data from Romance and Germanic local varieties of Northern Italy. In Marc Kupietz & Thomas Schmidt (dir.): Neue Entwicklungen in der Korpuslandschaft der Germanistik: Beiträge zur IDS-Methodenmesse 2022. (= Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache (CLIP) 11). Tübingen: Narr, 203-212.
  • Rabanus, Stefan (2023): Nome di battesimo e articolo espletivo – crowdsourcing e cartografica linguistica nello studio della variazione linguistica in Trentino-Alto Adige e Veneto. In Robert Schöntag & Laura Linzmeier (dir.): Neue Ansätze und Perspektiven zur sprachlichen Raumkonzeption und Geolinguistik. Francfort sur le Main: Lang.
  • Rabanus, Stefan, Anne Kruijt, Marta Tagliani, Alessandra Tomaselli, Andrea Padovan, Birgit Alber, Patrizia Cordin, Roberto Zamparelli & Barbara Maria Vogt (2023): VinKo (Varieties in Contact) Corpus v1.2. Bozen-Bolzano: ERCC.
  • Tomaselli, Alessandra & Ermenegildo Bidese (2023): Fortune and decay of lexical expletives in Germanic and Romance along the Adige River. Languages 8(1), 44.