18 Mar, 2024
The choice of grammatical forms and constructions used for event descriptions, such as voice, differential case marking, or the realization of argument expressions, can be influenced by many different factors. One such factor is the internal organization of a text into what we call here ?(larger) discourse units?.
In the late 1970s and early 1980s, a number of works on the internal structure of discourse have been published (cf. Chafe 1980, Longacre 1979, van Dijk 1981) that investigate the syntax and semantics of so-called ?paragraphs? or ?episodes? in spoken and written language, i.e. units characterized as ?coherent sequences of sentences of a discourse, linguistically marked for beginning and/or end, and further defined in terms of some kind of ‘thematic unity’ ? for instance, in terms of identical participants, time, location or global event or action? (van Dijk 1981: 177). While in written language, discourse units are usually signalled graphically, in oral or signed speech such units are much less easily recognizable.
The workshop is based on a collaboration between the projects? Morphosyntax in Discourse? of the LABEX /Empirical Foundations in Language /in Paris (https://en.labex-efl.fr/) and ?Prominence-related structures in symmetrical voice systems and Papuan languages? of the Collaborative Research Centre /Prominence in Language/ in Cologne (https://sfb1252.uni-koeln.de/en/ <https://sfb1252.uni-koeln.de/en/>).
We hope to discover operationalizable methods for identifying larger discourse units with the help of semantic, lexical, grammatical and/or prosodic cues both in well-studied and in more recently documented languages. We are particularly interested in cues that so far have not been considered as being discourse boundary related such as differential case marking, specific voice constructions, etc. The workshop is meant as an opportunity for researchers from different theoretical backgrounds and with an expertise on typologically distinct languages to make further progress in the analysis of discourse data.
Dates:
Workshop dates: March 21st -22nd , 2024
Program:
For more information, here’s the link to the workshop presentation: https://units.sciencesconf.org/
Scientific Committee:
Isabelle Bril
Katharina Haude
Nikolaus P. Himmelmann
Sonja Riesberg
Fahime Same
30 Sep, 2023
Datathon de la parole à Orléans, novembre 2021 : séance de travaux pratiques. Photo : Emmanuel Schang (licence : CC BY-NC-SA 3.0 fr)
Datathon de la parole, 13-14 novembre 2023 :
dépôt, archivage et diffusion des corpus oraux (linguistique, socio-linguistique, histoire orale)
Le Groupement de recherche « Linguistique Informatique, Formelle et de Terrain » (GDR LIFT), la plate-forme Collection de Corpus Oraux Numériques (Cocoon) et la Bibliothèque nationale de France organisent à Paris dans les espaces du DataLab de la Bibliothèque nationale de France un second atelier « Datathon de la parole » de quatre demi-journées, du lundi 13 novembre au mardi 14 novembre 2023. Il fait suite à un premier datathon de la parole qui s’est déroulé en novembre 2021 à Orléans.
L’événement s’inscrit également dans le cadre des activités soutenues par le consortium « Corpus, Langues et Interactions » (CORLI) de l’Infrastructure de Recherche Huma-Num et par l’Institut des Langues Rares (ILARA) de l’École Pratique des Hautes Études.
L’appel à participation est ouvert à tous les chercheurs, chercheuses et doctorant·e·s qui ont un jeu de données orales et souhaitent en ouvrir l’accès (à diverses fins, y compris sa ré-utilisation à des fins de recherche nouvelles).
Objectifs
L’atelier se propose de fournir un cadre dans lequel travailler à la description des ressources et de leur contexte de production, en vue d’une publication des données. Cet atelier sera encadré de présentations générales par les animateurs et le BnF DataLab, visant à situer les enjeux et stratégies, dans un contexte de Science ouverte : dépôt, archivage et diffusion ; description des données et référencement ; articulation entre données, outils et publications ; fouille de données.
Les thématiques abordées couvrent les finalités aussi bien que les dimensions spécifiques du plan de gestion de données que sont le plan de classement, le plan de nommage, le formatage et autres étapes qui permettent d’aboutir au dépôt en archive dans les règles de l’art, dépôt qui ouvre les données à de nouvelles utilisations et recherches, dans une logique cumulative.
Inscription
Informations souhaitées par le comité d’organisation du datathon de la parole
Nature des données orales (parlées), langues concernées (on donnera une priorité aux langues peu documentées de tous les continents) ;
Description succincte du projet scientifique dans le cadre duquel les données ont été collectées ;
Description des données : type de données, format et quantité (des données primaires : les enregistrements audio et/ou vidéo, ainsi que des données secondaires : transcription, annotation, traduction) ;
Perspectives d’enrichissement futur.
Date limite d’inscription et de dépôt du dossier : 15 juillet 2023, en remplissant le formulaire suivant https://framaforms.org/datathon-de-la-parole-2023-1686730891
Nombre maximum de participants : 15
Les participants dont les dossiers auront été retenus seront contactés fin juillet par les animateurs.
Pour plus d’informations, veuillez consulter le site internet de l’atelier : https://bnf.hypotheses.org/32248
Lieu
Bibliothèque nationale de France – Site Tolbiac/François Mitterrand, Quai François Mauriac, Paris. Métro ligne 14 : Bibliothèque François Mitterrand, ou métro ligne 6 : Quai de la Gare.
Ressources
Organisateurs
Flora Badin (LLL), Emmanuel Schang (LLL), Séverine Guillaume (LACITO), Michel Jacobson (Huma-Num), Audrey Viault (BnF), Fabrice Menneteau (BnF), Louise-Anne Charles (BnF-Datalab), Alexis Michaud (LACITO), Balthazar Do Nascimento (LACITO).