Este repositorio contiene los datos y los scripts utilizados en el trabajo "Estilometría computacional en las humanidades digitales: una propuesta metodológica para el análisis estilométrico de novelas anglofonas realistas y modernistas".
Este proyecto se centra en el análisis estilométrico de novelas anglofonas realistas y modernistas utilizando herramientas y técnicas de estilometría computacional. Los datos y scripts presentes en este repositorio son parte integral de esta investigación y están disponibles para su replicación.
-
Corpus de novelas anglófonas: En las carpetas llamadas corpus, encontrarás una colección de novelas en inglés que se utilizarán como base de datos para el análisis estilométrico. El corpus se encuentra en formato de texto plano (.txt) con la codificación UTF-8 y el ID autor_título.txt que stylo() requiere. También está la versión con el corpus lematizado.
-
Datos adicionales: En la carpeta data encontrarás dos archivos que contienen información sobre el corpus. metadata.md proporciona detalles sobre cada obra, como el autor, el título y el año de publicación. values.md contiene estadísticas importantes del corpus, como el número de tokens, tipos y la relación type-token.
-
Código en Python para el procesamiento del corpus: La carpeta python-code contiene un script para la generación de estadísticas básicas sobre el corpus.
-
Código en R para el análisis estilométrico con Stylo: En la carpeta r-code, encontrarás scripts en R que utilizan el paquete Stylo para realizar un análisis estilométrico.
-
Clona este repositorio o descárgalo como un archivo ZIP y descomprímelo en tu sistema local.
-
Utiliza los scripts en la carpeta r-code para realizar análisis estilométricos más avanzados utilizando el paquete Stylo en R.
-
Explora las tablas en la carpeta data para obtener información detallada sobre el corpus y las estadísticas clave.