Le Traitement automatisé des verbes dans les corpus d'écrits scolaires - Université Sorbonne Nouvelle - Paris 3 Accéder directement au contenu
Communication Dans Un Congrès Année : 2019

Le Traitement automatisé des verbes dans les corpus d'écrits scolaires

Résumé

Un inventaire des travaux sur l’écriture scolaire montre l’insuffisance des méthodes d’analyse quantitative pour l’étude des corpus d’écrits scolaires. Plusieurs corpus ont été constitués, donnant lieu à des exploitations avec différents outils d’analyse, mais toujours limitées par la difficulté de pratiquer des traitements automatisés. Cette difficulté est liée à la présence de nombreuses variations dans ces corpus non normés. Ce sont ces variations touchant la graphie, l’orthographe, le lexique et la morphologie selon les genres scolaires, qui rendent ce type de corpus réfractaire à la numérisation, à l’étiquetage et même à l’analyse en traitement automatique du langage. (Elalouf & Boré, 2007). À partir de l’étude morphologique et lexicale des verbes dans deux corpus de CM2 et de 3e, nous montrons comment aborder la variation à l’intérieur des corpus d’écrits scolaires et comment la traiter. Ce type de données nécessite des prétraitements avec des règles particulières de transcriptions des manuscrits des élèves que nous allons exposer afin d’aboutir à l’analyse de nos données proprement dites.
Fichier principal
Vignette du fichier
Koulibali_actes_rcj_2019.pdf (2.33 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03192669 , version 1 (08-04-2021)

Identifiants

  • HAL Id : hal-03192669 , version 1

Citer

Yelle Koulibali. Le Traitement automatisé des verbes dans les corpus d'écrits scolaires. Rencontres des Jeunes Chercheurs en Sciences du Langage 2019, 2019, Paris, France. ⟨hal-03192669⟩
106 Consultations
81 Téléchargements

Partager

Gmail Facebook X LinkedIn More