Datathon 2021

Le Groupement de recherche “Linguistique Informatique, Formelle et de Terrain” (GDR LIFT) et la plate-forme Collection de Corpus Oraux Numériques (Cocoon) organisent à Orléans un atelier “datathon de la parole” de quatre demi-journées du lundi 8 novembre à midi au mercredi 10 novembre à midi. L’événement s’inscrit également dans le cadre des activités soutenues par le consortium “Corpus, Langues et Interactions” (CORLI) et par l’Institut des Langues Rares (ILARA) de l’École Pratique des Hautes Études. L’appel à participation est ouvert à tous les chercheurs, chercheuses et doctorant.e.s qui ont un jeu de données orales et souhaitent en ouvrir l’accès (à diverses fins, y compris sa ré-utilisation à des fins de recherche nouvelles). L’atelier fournira un cadre dans lequel travailler à la description des ressources et de leur contexte de production, en vue d’une publication électronique des données.

Au fil des quatre demi-journées, les travaux pratiques (sur des jeux de données de participant.e.s) alterneront avec des présentations générales (programme à venir) visant à situer les enjeux et stratégies, dans un contexte de Science ouverte : dépôt, archivage et diffusion ; description des données et référencement ; articulation entre données, outils et publications. Les thématiques abordées couvriront les finalités aussi bien que les dimensions spécifiques du plan de gestion de données que sont le plan de classement, le plan de nommage, le formatage et autres étapes qui permettent d’aboutir au dépôt en archive dans les règles de l’art, dépôt qui ouvre les données à de nouvelles utilisations et recherches, dans une logique cumulative.

Date limite d’envoi des dossiers : 2 juillet 2021
Réponses le 16 juillet.

Merci d’envoyer à alexis.michaud@cnrs.fr un projet (1 page) qui comporte :
– langues concernées (on donnera la priorité aux langues peu documentées de tous les continents)
– description succincte du projet scientifique dans le cadre duquel les données ont été collectées
– description des données : type de données, format et quantité (des données primaires : les enregistrements audio et/ou vidéo, ainsi que des données secondaires : transcription, annotation, traduction)
– perspectives d’enrichissement futur

Laboratoires organisateurs : LLL et LACITO.

Au plaisir de vous rencontrer nombreux à Orléans
Les organisateurs
Flora Badin, Emmanuel Schang, Séverine Guillaume, Michel Jacobson, Alexis Michaud

Aller au contenu principal