Comparing PTB and UD information for PDTB discourseconnective identification - Conférences TALN RECITAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Comparing PTB and UD information for PDTB discourseconnective identification

Résumé

Our work on the automatic detection of English discourse connectives in the Penn Discourse Treebank (PDTB) shows that syntactic information from the Universal Dependencies (UD) framework is a viable alternative to that from the Penn Treebank (PTB) framework. In fact, we found minor increases when comparing between the use of gold standard PTB part-of-speech (POS) tag information and automatically parsed UD information. The former has traditionally been used for the task but there are now much more UD corpora and in many more languages than that available in the PTB framework. As such, this finding is promising for areas in discourse parsing such as in multilingual as well as under production settings, where gold standard PTB information may be scarce.
Fichier principal
Vignette du fichier
188.pdf (596.21 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-02786193 , version 1 (07-06-2020)
hal-02786193 , version 2 (17-06-2020)
hal-02786193 , version 3 (23-06-2020)

Identifiants

  • HAL Id : hal-02786193 , version 3

Citer

Kelvin Han, Phyllicia Leavitt, Srilakshmi Balard. Comparing PTB and UD information for PDTB discourseconnective identification. 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 3 : Rencontre des Étudiants Chercheurs en Informatique pour le TAL, Jun 2020, Nancy, France. pp.123-136. ⟨hal-02786193v3⟩
179 Consultations
132 Téléchargements

Partager

Gmail Facebook X LinkedIn More