AraSeg : un segmenteur semi-automatique des textes arabes
Résumé
Written in Visual Basic and running on Windows, AraSeg is a text segmentor, and grammar manual and dictionary at the same time. The analysis of each sequence of characters is based on the model of analysis of the graphic Arabic word in which a graphic word is regarded as a succession of immediate constituents. The main role of this text segmentor is tokenization, lexical segmentation.
Écrit en Visual Basic et tournant sous Windows, AraSeg est un segmenteur à la fois à grammaire et à dictionnaire. L'analyse de chaque séquence de caractères est basée sur le modèle d'analyse du mot graphique en arabe dans lequel un mot graphique est considéré comme une suite de constituants immédiats. Le rôle principal de ce segmenteur est l'itémisation, la segmentation lexicale.
Origine : Fichiers éditeurs autorisés sur une archive ouverte