Accéder directement au contenu Accéder directement à la navigation
Communication dans un congrès

Le Traitement automatisé des verbes dans les corpus d'écrits scolaires

Résumé : Un inventaire des travaux sur l’écriture scolaire montre l’insuffisance des méthodes d’analyse quantitative pour l’étude des corpus d’écrits scolaires. Plusieurs corpus ont été constitués, donnant lieu à des exploitations avec différents outils d’analyse, mais toujours limitées par la difficulté de pratiquer des traitements automatisés. Cette difficulté est liée à la présence de nombreuses variations dans ces corpus non normés. Ce sont ces variations touchant la graphie, l’orthographe, le lexique et la morphologie selon les genres scolaires, qui rendent ce type de corpus réfractaire à la numérisation, à l’étiquetage et même à l’analyse en traitement automatique du langage. (Elalouf & Boré, 2007). À partir de l’étude morphologique et lexicale des verbes dans deux corpus de CM2 et de 3e, nous montrons comment aborder la variation à l’intérieur des corpus d’écrits scolaires et comment la traiter. Ce type de données nécessite des prétraitements avec des règles particulières de transcriptions des manuscrits des élèves que nous allons exposer afin d’aboutir à l’analyse de nos données proprement dites.
Type de document :
Communication dans un congrès
Liste complète des métadonnées

https://hal-univ-paris3.archives-ouvertes.fr/hal-03192669
Contributeur : Vincent de Lavenne <>
Soumis le : jeudi 8 avril 2021 - 17:18:53
Dernière modification le : vendredi 9 avril 2021 - 09:36:28

Fichier

Koulibali_actes_rcj_2019.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-03192669, version 1

Citation

Yelle Koulibali. Le Traitement automatisé des verbes dans les corpus d'écrits scolaires. Rencontres des Jeunes Chercheurs en Sciences du Langage 2019, 2019, Paris, France. ⟨hal-03192669⟩

Partager

Métriques

Consultations de la notice

85

Téléchargements de fichiers

10