Constitución de un corpus de semántica verbal del español: Metodología de anotación de núcleos argumentales
Author
CASTELLÓN,IRENE
CLIMENT,SALVADOR
COLL-FLORIT,MARTA
LLOBERES,MARINA
RIGAU,GERMAN
Abstract
El presente artículo detalla la metodología y el desarrollo del proyecto de desambiguación semántica de los núcleos argumentales de SenSem, un corpus equilibrado constituido por 100 oraciones para cada uno de los 250 verbos más frecuentes del español. El resultado, unido a desarrollos anteriores del proyecto, es un corpus ricamente etiquetado con información sintáctica y semántica, conectado a una base de datos que recoge la información pertinente para cada sentido verbal, por lo que el recurso resultante es adecuado para estudios empíricos centrados en el verbo. Como resultado del proceso se presenta asimismo un análisis crítico de WordNet 1.6 del español como recurso de anotación lexico-semántica de corpus y una guía de criterios de anotación, ambos de utilidad para tareas similares de etiquetado con WordNet.