Annotation des anaphores associatives

Un article de Loria Wiki.

Sommaire

Utiliser MMAX

  • Lancer MMAX sur un sous-corpus:
cd defNPNoEmbed
~/opt/MMAX2_1.0beta4/startmmax_linux.sh 0/0.mmax
  • Commencez par desactiver l'annotation sur les niveaux autres que "defnp" en utilisant le markable level control panel:
    mmax level control panel

Annotation scheme

J'ai crée des feuilles de style et des scripts pour passer de MMAX1 à MMAX2. -- Kowey 16 mar 2006 à 22:48 (CET) À noter:

  • j'ai ajouté un niveau d'annotation 'coreferential', avec les valeurs 'no' et 'yes':
    coreferential
  • les markables qui étaient auparavant marqués 'type=coref' ont été ré-annotés comme étant 'corefential=yes' et 'type=fixme'
  • tous les 'type=fixme' sont affichés en rouge pour signaler qu'ils sont à reannoter

defnp

Voulons-nous séparer les niveaux 'defnp' et 'anaphor'? C'est à dire, de supprimer les valeurs 'tag=defnp/none' et les mettre sur un autre couche? MMAX2 nous donne le possibilité d'avoir plusieurs couches d'annotation. Par exemple, maintenant la seperation des mots en paragraphes est une couche d'annotation. Voulons-nous séparer les defnps aussi? L'idée serait que

  • on peut éviter de créer des defnp ou de les supprimer par hasard
  • tous les anaphores sont les defnp - ça ne sera pas verifié par MMAX, mais c'est facile: on évite de créer des anaphors où il n'y a pas de texte bleu
  • tous les defnp ne sont pas forcement des anaphores

Set? Pointer?

Il y a peut-être une difference entre les pointer et les set. J'attend vos retours pour savoir si je peux les fusioner ou pas.

Set: Voici un exemple d'un markable set. Il s'agit d'une chaine co-réferentielle:

Mmax member set

Pointer: Par contre: ce n'est pas très évident pour moi qu'on souhaiterait mettre ces deux markables "l'hygrometrie" et "l'hopital" dans le même ensemble:

Mmax pointer 2
Mmax pointer 1

Voir aussi

Outils personels