MétricaText: Métricas para el análisis comparativo de textos

 

 

Accede a Estilometría TIP

 

 

REFERENCIA DEL PROYECTO: ULPGC2018-04

DURACIÓN: 01/01/2020 - 31/12/2021

ENTIDAD DE REALIZACIÓN: Universidad de Las Palmas de Gran Canaria

ENTIDAD/ES FINANCIADORA/S: Universidad de Las Palmas de Gran Canaria

INVESTIGADOR PRINCIPAL: Francisco Javier Carreras Riudavets

MIEMBROS DEL PROYECTO:

  • Zenón José Hernández Figueroa (ULPGC, IATEXT)
  • Marina Díaz Peralta (ULPGC, IATEXT)
  • Gustavo Rodríguez Rodríguez (ULPGC, IATEXT)

 

RESUMEN:
Las tecnologías de la información y la comunicación permiten iniciativas que pueden ayudar didácticamente al perfeccionamiento de escritores noveles, a la acreditación objetiva de la naturaleza lingüística de un texto en asuntos forenses, al establecimiento de índices de legibilidad y comprensión de textos, analizar patrones textuales en géneros literarios concretos e incluso a la investigación de los sistemas cognitivos en el ámbito de la psicología, entre otras posibilidades. La mayoría de las herramientas disponibles en Internet usa como lengua de análisis el inglés, limitando así las posibilidades en español.

Este proyecto pretende desarrollar una aplicación web que permita comparar métricas lingüísticas, sintácticas, semánticas y pragmáticas de dos textos escritos en español. Los aspectos a comparar deben ser detectables y evaluables automáticamente por la herramienta. Estos aspectos deben ser además parametrizables, de tal forma que el usuario pueda interpretar la ausencia, incremento o disminución de las características analizadas en un texto respecto del otro y poder así
extraer sus propias conclusiones. A tal fin, la herramienta mostrará los valores de los parámetros de cada texto en formato gráfico de barras y en formato tabla exportable a un fichero de hoja de cálculo (Excel) para su estudio y análisis.

La aplicación dará cuenta al usuario de los datos estadísticos relacionados con la segmentación y sus unidades que constituyen una fuente de información valiosa en la estrategia utilizada por el escritor en este ámbito. También será útil para observar la frecuencia de uso de las categorías gramaticales, la distribución de las palabras, de la primera aparición y de su acumulación en el texto. Ofrecerá también información sobre el uso de palabras frecuentes usando el Corpus CREA como referencia. Igualmente, la herramienta aportará información completa de los conectores discursivos y marcadores de modalidad de los textos descritos en la bibliografía de referencia sin limitar opciones de configuración personal.