Datathon de la parole | 18-19 novembre 2024, Paris, France

Datathon de la parole, 18-19 novembre 2024 :

dépôt, archivage et diffusion des corpus oraux

(linguistique, socio-linguistique, histoire orale)

Le Groupement de recherche « Linguistique Informatique, Formelle et de Terrain » (GDR LIFT), la plate-forme Collection de Corpus Oraux Numériques (Cocoon) et la Bibliothèque nationale de France organisent à Paris dans les espaces du DataLab de la Bibliothèque nationale de France un troisième atelier « Datathon de la parole » de quatre demi-journées, du lundi 18 novembre au mardi 19 novembre 2023. Il fait suite aux deux datathons de la parole qui ce sont déroulés en novembre 2021 à Orléans et novembre 2023 à Paris (BnF).

L’événement s’inscrit également dans le cadre des activités soutenues par le consortium « Corpus, Langues et Interactions » (CORLI) de l’Infrastructure de Recherche Huma-Num et par l’Institut des Langues Rares (ILARA) de l’École Pratique des Hautes Études.

L’appel à participation est ouvert à tous les chercheurs, chercheuses et doctorant·e·s qui ont un jeu de données orales et souhaitent en ouvrir l’accès (à diverses fins, y compris sa ré-utilisation à des fins de recherche nouvelles).

Objectifs

L’atelier se propose de fournir un cadre dans lequel travailler à la description des ressources et de leur contexte de production, en vue d’une publication des données. Cet atelier sera encadré de présentations générales par les animateurs et le BnF DataLab, visant à situer les enjeux et stratégies, dans un contexte de Science ouverte : dépôt, archivage et diffusion ; description des données et référencement ; articulation entre données, outils et publications ; fouille de données.

Les thématiques abordées couvrent les finalités aussi bien que les dimensions spécifiques du plan de gestion de données que sont le plan de classement, le plan de nommage, le formatage et autres étapes qui permettent d’aboutir au dépôt en archive dans les règles de l’art, dépôt qui ouvre les données à de nouvelles utilisations et recherches, dans une logique cumulative.

Inscription

Informations souhaitées par le comité d’organisation du datathon de la parole

Nature des données orales (parlées), langues concernées (on donnera une priorité aux langues peu documentées de tous les continents) ;
Description succincte du projet scientifique dans le cadre duquel les données ont été collectées ;
Description des données : type de données, format et quantité (des données primaires : les enregistrements audio et/ou vidéo, ainsi que des données secondaires : transcription, annotation, traduction) ;
Perspectives d’enrichissement futur.

Date limite d’inscription et de dépôt du dossier : 15 juillet 2024, en remplissant le formulaire suivant https://framaforms.org/datathon-de-la-parole-2024-1718364957

Nombre maximum de participants : 15

Les participants dont les dossiers auront été retenus seront contactés fin juillet par les animateurs.

Pour plus d’informations, veuillez consulter le site internet de l’atelier : BnF Datalab

Lieu

Bibliothèque nationale de France – Site Tolbiac/François Mitterrand, Quai François Mauriac, Paris. Métro ligne 14 : Bibliothèque François Mitterrand, ou métro ligne 6 : Quai de la Gare.

Ressources

Organisateurs

Flora Badin (LLL), Séverine Guillaume (LACITO), Michel Jacobson (Huma-Num), Audrey Viault (BnF), Fabrice Menneteau (BnF), Louise-Anne Charles (BnF-Datalab), Alexis Michaud (LACITO), Balthazar Do Nascimento (LACITO).

         

 

École thématique d’été │ « AnnoDeMo » │ June 3 to 7, 2024, Banyuls-sur-Mer

BlueBreezeWiki, CC BY-SA 3.0, via Wikimedia Commons

 

This CNRS summer school is organised by the thematic research network LIFT, which aims to foster scientific exchange between computational, formal field linguists. In particular, this school offers courses on computational modelling, formal theoretical linguistics, as well as courses targeted at the description of linguistic diversity (introduction to a language family). The school is a successor to Annotation 2022, following the same general format — which has worked very well for us before — but with new contents: morphologie, semantics, and a different language family. The summer school is suitable for researchers at all levels, including doctoral students and engineers (IR, IE).

The summer school will be held from June 3 to June 7 2024 at the Observatoire océanologique de Banyuls-sur-Mer, right on the Mediterranean Sea near Perpignan. Participants will stay at the maritime observatory, where all the courses will take place.

Registration:

The number of participants is limited. Therefore, you should pre-register as early as possible, but no later than 10 April 2024..

Link to program, practical information and registration: http://annodemo-2024.llf-paris.fr/

For further information, please contact:  Sylvain Loiseau

                            

Skip to content