Annotation des anaphores associatives
Un article de Loria Wiki.
Sommaire |
Utiliser MMAX
- Lancer MMAX sur un sous-corpus:
cd defNPNoEmbed ~/opt/MMAX2_1.0beta4/startmmax_linux.sh 0/0.mmax
- Commencez par desactiver l'annotation sur les niveaux autres que "defnp" en utilisant le markable level control panel:
Annotation scheme
J'ai crée des feuilles de style et des scripts pour passer de MMAX1 à MMAX2. -- Kowey 16 mar 2006 à 22:48 (CET) À noter:
- j'ai ajouté un niveau d'annotation 'coreferential', avec les valeurs 'no' et 'yes':
- les markables qui étaient auparavant marqués 'type=coref' ont été ré-annotés comme étant 'corefential=yes' et 'type=fixme'
- tous les 'type=fixme' sont affichés en rouge pour signaler qu'ils sont à reannoter
defnp
Voulons-nous séparer les niveaux 'defnp' et 'anaphor'? C'est à dire, de supprimer les valeurs 'tag=defnp/none' et les mettre sur un autre couche? MMAX2 nous donne le possibilité d'avoir plusieurs couches d'annotation. Par exemple, maintenant la seperation des mots en paragraphes est une couche d'annotation. Voulons-nous séparer les defnps aussi? L'idée serait que
- on peut éviter de créer des defnp ou de les supprimer par hasard
- tous les anaphores sont les defnp - ça ne sera pas verifié par MMAX, mais c'est facile: on évite de créer des anaphors où il n'y a pas de texte bleu
- tous les defnp ne sont pas forcement des anaphores
Set? Pointer?
Il y a peut-être une difference entre les pointer et les set. J'attend vos retours pour savoir si je peux les fusioner ou pas.
Set: Voici un exemple d'un markable set. Il s'agit d'une chaine co-réferentielle:
Pointer: Par contre: ce n'est pas très évident pour moi qu'on souhaiterait mettre ces deux markables "l'hygrometrie" et "l'hopital" dans le même ensemble:
