Statut des noeuds lex dans les méta-grammaires TAG
Un article de Loria Wiki.
La question
A l'heure actuelle, il n'a pas été spécifié quels traits utiliser dans le cadre de la définition de noeuds pour items lexicaux dans les arbres TAG. Diverses configurations sont possibles dans les méta-grammaires de l'équipe LeD, par exemple :
- noeud de cat 'cl', noté flex, ayant un trait phon avec la valeur 'ce' et d'autres traits (top et bot notamment),
- noeud noté flex, ayant un unique trait cat auquel est associée la valeur 'ce',
- noeud noté flex, ayant un unique trait phon auquel est associée la valeur 'ce',
- noeud noté flex, avec traits cat='cl' et phon='ce'.
| cat | phon | autre traits? |
|---|---|---|
| cl | ce | non |
| ce | non | |
| ce | non | |
| cl | ce | oui |
En conséquence, les outils de conversion de format (xslt pour DyALog et SelectTAG pour ancrage avec GenI) doivent gérer toutes ces configurations (ce qui est source d'erreurs).
La question soulevée est :
Peut-on prendre une convention fondée linguistiquement pour la définition des noeuds accueillant des items lexicaux ?
L'avis de Benoit
A ma connaissance, le système actuel est le suivant :
- noeud noté flex, ayant un unique trait cat auquel est associée la valeur 'ce',
L'usage d'un trait phon devrait engendrer des arbres incorrects car la métagrammaire suppose que les traits cat de valeurs différentes n'unifient pas
Distinguer cat de phon risque d'éviter des clash à l'unification
Note en passant pour le coup c'est une décision technique qui n'a pas à recevoir de motivation linguistique, je me fonderais plutôt sur ce que les parseurs/générateurs attendent.
