La Base de Datos de Morfología del Español como ayuda a la confección del Nuevo Diccionario Histórico del Español

La Base de Datos de Morfología del Español como ayuda a la confección del Nuevo Diccionario Histórico del Español

Convenio: La Base de Datos de Morfología del Español como ayuda a la confección del Nuevo Diccionario Histórico del Español
Firmantes: Real Academia Española, Universidad de Santiago de Compostela y Universidad de Las Palmas de Gran Canaria
Investigador responsable de la USC: Dr. Jesús Pena Seijas
Investigador responsable de la ULPGC: Dr. Francisco Javier Carreras Riudavets
Entidad financiadora: Real Academia Española
Fecha de inicio: 01/06/2017
Fecha de finalización: 01/06/2019
Cuantía total: 21.600 Euros

RESUMEN

La aplicación MORFOGEN TIP es una herramienta de visualización que permite representar, bien en forma de grafos —próximos a diagramas arbóreos—, bien en forma lineal, las familias y subfamilias léxicas del español. La aplicación traslada a la representación visual una parte de la información morfoetimológica almacenada en una Base de datos morfológica del español (BDME). Al mostrar las relaciones de parentesco en forma de árbol genealógico, se pretende superar el inconveniente de las obras impresas, donde la ordenación de las familias léxicas está condicionada por su estructura lineal.

La BDME fue diseñada y organizada por Jesús Pena (USC) a mediados de 1980. Fue sometida a reformas, ampliaciones y correcciones entre los años 2009 y 2016, con dos objetivos: a) proporcionar apoyo al Nuevo diccionario histórico del español (NDHE) de la RAE en cuanto a su configuración morfológica y genética; b) facilitar a los especialistas en morfología y léxico información más precisa sobre relaciones derivativas y sobre familias léxicas. La reelaboración de la BDME se llevó a cabo al amparo de dos proyectos de ámbito estatal (MICINN FFI2008-03532 y MINECOFFI2012-38550) y de otro autonómico (Xunta de Galicia10PXIB204249PR).

En la base de datos morfológica se otorgó carácter privilegiado al latín como lengua madre de las lenguas románicas. Las más de 30.000 palabras latinas analizadas, en relación con las 50.000 del español, permiten contrastar las series de derivación latinas con las series heredadas por el español. Gracias a esta comparación, se observan los reajustes experimentados en esta lengua como consecuencia de las lagunas y dislocaciones respecto de las series latinas, y se confrontan de manera exhaustiva los patrones de formación de palabras en las lenguas latina (madre) y española (hija). El análisis de más de 5.000 palabras del griego proporciona el origen tanto de léxico común como del vocabulario científico-técnico.

El diseño de la base de datos morfológica permite que, en el futuro, se extienda el análisis a otras lenguas. El vocabulario románico de origen latino y griego que se incorpore ya dispondrá de mucho léxico analizado en estas dos lenguas, y también estarán configuradas las series de derivación en que se integrarán las nuevas palabras analizadas. Desde su génesis, la base de datos fue concebida para dar cabida, no solo al español, sino también a las restantes lenguas románicas, lo que obligó al análisis previo de muchas de las familias léxicas del griego y, sobre todo, del latín.

Debido a la vinculación de la BDME-MORFOGEN con el NDHE, dirigido por José Antonio Pascual, la Real Academia Española ha suscrito un convenio de colaboración (RAE-USC-ULPG, 2017/2019). En representación de la USC, coordinan la parte lingüística del proyecto los profesores Jesús Pena y María José Rodríguez Espiñeira y, en representación de la División de lingüística computacional del IATEXT, coordina la parte informática el profesor Francisco Javier Carreras Riudavets.