La base de données de la langue espagnole vient à la fin du livre noir historique en espagnol

Accord: La base de données de la langue espagnole vient à la fin du livre noir historique en espagnol
Signataries: Real Academia Española, Universidad de Santiago de Compostela y Universidad de Las Palmas de Gran Canaria
Chercheur responsable de 'lUSC: Dr. Jesús Pena Seijas
Chercheur responsable de l'ULPGC: Dr. Francisco Javier Carreras Riudavets
Organisame de financement: Real Academia Española
Date de début: 01/06/2017
Date de fin: 01/06/2019
Montant total: 21.600 Euros

RÉSUMÉ

L’application MORFOGEN TIP est un outil d’affichage qui permet de représenter les familles et sous-familles lexicales de l’espagnol soit sous forme de graphiques, comme les diagrammes en arbre, soit de manière linéaire. L'application transpose une partie des informations morpho-étymologiques stockées dans une base de données morphologique de l’espagnol (BDME) en une représentation visuelle. En montrant les relations de parenté sous la forme d'un arbre généalogique, elle vise à supprimer l’inconvénient des travaux au format papier, où la disposition des familles lexicales est conditionnée par leur structure linéaire.

La BDME a été conçue et constituée par Jesús Pena (USC) au milieu des années 1980. Elle a connu des réformes, des extensions et des corrections entre 2009 et 2016 visant deux objectifs : a) soutenir le Nouveau dictionnaire historique de l’espagnol (NDHE) de la RAE (Académie royale espagnole) quant à sa configuration morphologique et génétique ; b) fournir aux spécialistes de la morphologie et du lexique des informations plus précises sur les relations dérivées et les familles lexicales. La réécriture de la BDME a été réalisée dans le cadre de deux projets de l'État espagnol (MICINN FFI2008-03532 et MINECOFFI2012-38550) et d’un autre projet d’une région autonome (Xunta de Galicia10PXIB204249PR).

Dans la base de données morphologique, le latin bénéficie d'une place privilégiée, car il est considéré comme la langue mère des langues romanes. Les plus de 30 000 mots latins analysés, par rapport aux 50 000 en espagnol, permettent de comparer les séries provenant du latin avec les séries héritées de la langue espagnole. Grâce à cette comparaison, on peut observer les réajustements qui ont eu lieu dans cette langue à la suite des lacunes et des dislocations par rapport aux séries latines, et on peut comparer de manière exhaustive les modèles de formation des mots dans les langues latine (mère) et espagnole (fille). L'analyse de plus de 5 000 mots grecs nous permet de connaître aussi bien l'origine d'un lexique commun que l’origine du vocabulaire scientifique et technique.

La base de données morphologique a été conçue de façon à pouvoir étendre cette analyse à d’autres langues à l’avenir. Ainsi, le vocabulaire roman d’origine latine et grecque incorporé inclura déjà l‘analyse de nombreux lexiques dans ces deux langues et les séries d’origine dans lesquelles les nouveaux mots analysés seront intégrés seront également configurées. Depuis sa création, la base de données a été conçue pour traiter non seulement l'espagnol, mais également les autres langues romanes, ce qui a forcé l'analyse préalable de nombreuses familles lexicales du grec et, surtout, du latin.

En raison du lien entre la BDME-MORFOGEN et le NDHE, dirigé par José Antonio Pascual, l'Académie royale espagnole a signé un accord de partenariat (RAE-USC-ULPG, 2017/2019). Au nom de l'USC, la partie linguistique du projet est gérée par les professeurs Jesús Pena et María José Rodríguez Espiñeira et, en ce qui concerne la Division de linguistique informatique de l’IATEXT, le professeur Francisco Javier Carreras Riudavets gère la partie informatique.