AraSeg : un segmenteur semi-automatique des textes arabes - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2008

AraSeg : un segmenteur semi-automatique des textes arabes

(1)
1

Résumé

Written in Visual Basic and running on Windows, AraSeg is a text segmentor, and grammar manual and dictionary at the same time. The analysis of each sequence of characters is based on the model of analysis of the graphic Arabic word in which a graphic word is regarded as a succession of immediate constituents. The main role of this text segmentor is tokenization, lexical segmentation.
Écrit en Visual Basic et tournant sous Windows, AraSeg est un segmenteur à la fois à grammaire et à dictionnaire. L'analyse de chaque séquence de caractères est basée sur le modèle d'analyse du mot graphique en arabe dans lequel un mot graphique est considéré comme une suite de constituants immédiats. Le rôle principal de ce segmenteur est l'itémisation, la segmentation lexicale.
Fichier principal
Vignette du fichier
mouelhi.pdf (1.08 Mo) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-01530765 , version 1 (31-05-2017)

Identifiants

  • HAL Id : hal-01530765 , version 1

Citer

Zoubeir Mouelhi. AraSeg : un segmenteur semi-automatique des textes arabes. JADT 2008 , Mar 2008, Rome, Italie. pp.867-877. ⟨hal-01530765⟩
100 Consultations
336 Téléchargements

Partager

Gmail Facebook Twitter LinkedIn More