Show simple item record

Identificación de cambios en el estilo de escritura literaria con aprendizaje automático

dc.creatorRíos-Toledo, Germán
dc.creatorCastro-Sánchez, Noé Alejandro
dc.creatorSidorov, Grigori
dc.creatorPosadas-Durán, Juan-Pablo
dc.date2019-12-31
dc.date.accessioned2022-12-01T19:43:02Z
dc.date.available2022-12-01T19:43:02Z
dc.identifierhttp://onomazein.letras.uc.cl/index.php/onom/article/view/29699
dc.identifier10.7764/onomazein.46.04
dc.identifier.urihttps://revistaschilenas.uchile.cl/handle/2250/216572
dc.descriptionThis research aims to identify changes in the writing style over time of 7 authors of Englishspeaking novels. For each author, an organization of the novels was carried out according to the date of publication. The novels were classified in three stages called initial, intermediate and final; each stage contains 3 novels. Between two consecutive stages there are at least 2 years of separation between the publication dates of the novels. To solve the problem of detecting changes in writing style over time, it is proposed to use a supervised automatic learning-based approach. Vector space models were created from the frequencies of use of n-grams of different types and lengths. In addition, the algorithm of Principal Component Analysis (PCA) was used as the n-gram selection method. The solution was addressed as a classification problem using the Vector Support Machine algorithms (Support Vector Machine, SVM), Naive Bayes Multinomial (Multinomial Naive Bayes, MNB), Logistic Regression (LG) and Liblinear as classifiers. The metric to measure the efficiency of the learning algorithms was accuracy. The research showed significant changes in five of the authors with an average accuracy between 70% and 80% in the different types of n-grams.en-US
dc.descriptionEsta investigación tiene como objetivo identificar cambios en el estilo de escritura a través del tiempo de 7 autores de novelas de habla inglesa. Para cada autor se realizó una organización de las novelas de acuerdo a la fecha de publicación. Las novelas se clasificaron en tres etapas denominadas inicial, intermedia y final; cada etapa contiene 3 novelas. Entre dos etapas consecutivas existe por lo menos 2 años de separación entre las fechas de publicación de las novelas. Para resolver el problema de detección de cambios en el estilo de escritura a través del tiempo se propone utilizar un enfoque basado en aprendizaje automático supervisado. Se crearon modelos de espacio vectorial a partir de las frecuencias de uso de n-gramas de distintos tipos y longitudes. Además, se utilizó el algoritmo de Análisis de Componentes Principales (Principal Component Analysis, PCA) como método de selección de n-gramas. La solución se abordó como un problema de clasificación utilizando los algoritmos de Máquinas de Soporte Vectorial (Support Vector Machine, SVM), Naive Bayes Multinomial (Multinomial Naive Bayes, MNB), Regresión Logística (Logistic Regression, LG) y Liblinear como clasificadores. La métrica para medir la eficiencia de los algoritmos de aprendizaje fue la exactitud (accuracy). La investigación mostró cambios significativos en cinco de los autores con una exactitud promedio de entre 70% y 80% en los distintos tipos de n-gramas. es-ES
dc.formatapplication/pdf
dc.languagespa
dc.publisherFacultad de Letras de la Pontificia Universidad Católica de Chilees-ES
dc.relationhttp://onomazein.letras.uc.cl/index.php/onom/article/view/29699/23175
dc.sourceOnomázein ; No. 46: 2019; 102-128en-US
dc.sourceOnomázein ; Núm. 46: 2019; 102-128es-ES
dc.source0718-5758
dc.subjectdetección de cambios de estilo a través del tiempoes-ES
dc.subjectn-gramases-ES
dc.subjectn-gramas sintácticoses-ES
dc.subjectmodelo espacio vectoriales-ES
dc.subjectcambio de estiloes-ES
dc.subjectaprendizaje automáticoes-ES
dc.subjectdetection of style changes over timeen-US
dc.subjectn-gramsen-US
dc.subjectsyntactic n-gramsen-US
dc.subjectvector space modelen-US
dc.subjectstyle changeen-US
dc.subjectmachine learningen-US
dc.titleIdentification of changes in literary writing style using machine learningen-US
dc.titleIdentificación de cambios en el estilo de escritura literaria con aprendizaje automáticoes-ES
dc.typeinfo:eu-repo/semantics/article
dc.typeinfo:eu-repo/semantics/publishedVersion


This item appears in the following Collection(s)

Show simple item record