Verb and context of usage: A corpus-based analysis with quantitative and qualitative methods
Verbo y contexto de uso: un análisis basado en corpus con métodos cualitativos y cuantitativos
Author
Renau, Irene
Nazar, Rogelio
Castro, Ana
López, Benjamín
Obreque, Javier
Abstract
The semantic analysis of verbs is a theoretical and methodological challenge due to the syntactic and semantic complexity of these lexical units. The aim of this research is to identify the lexical-syntactic structures, that is, the patterns formed considering the syntactic structure, the arguments and the semantic types of the Spanish verbs. The analysis of Spanish verbs is carried out following the proposal of Corpus Pattern Analysis (Hanks, 2004a). This analysis is complemented with the automation of the procedure, combining a dependency analyser with a series of algorithms based on corpus statistics. As a result of the process, a database of lexical-syntactic patterns of 182 manually annotated verbs is offered, as well as an interface for automatic analysis which, according to the evaluation carried out, shows a 63.41% accuracy with respect to manual identification. This would be a contribution both to the theory of lexical semantics and to the description of the Spanish lexicon from a corpus-based methodology. En este trabajo se presenta una propuesta de análisis de verbos en corpus. Se utiliza el Corpus Pattern Analysis de Hanks (2004a) para identificar las estructuras léxico-sintácticas formadas con la sintaxis oracional, los argumentos y los tipos semánticos de estos. El patrón verbal es una unidad de análisis entre la unidad léxica y la oración, y permite describir el comportamiento del verbo más allá de la noción tradicional de palabra. Además de la propuesta manual, se propone una automatización del procedimiento combinando un analizador de dependencias con una serie de algoritmos basados en estadística de corpus. Los resultados del análisis manual y automático se muestran en la web del proyecto ([ANONIM.]) de forma abierta y gratuita.
Metadata
Show full item recordRelated items
Showing items related by title, author, creator and subject.
-
The score as multiplicity: the work of extracting utterances from a corpus: o trabalho de extração de afirmações de um corpus
Astaburuaga, Santiago. Hermenéutica Intercultural; Número 38 (julio-diciembre) 2022; 91-124 -
Corpus of digital interactions: systematization of techniques to collect data on WhatsApp
Cantamutto, Lucía; Vela Delfa, Cristina. Cuadernos.info; No. 54 (2023): Dossier: Discusiones metodológicas en los estudios de comunicación digital; 117-139 -
Approaching grammatical free indirect style based on the CEILE corpus
Estevez-Rionegro, Noelia. Árboles y Rizomas; Vol 2 No 2 (2020): Julio-Diciembre; 28-43