Centre National de Ressources Textuelles et Lexicales

Présentation

Créé en 2005 par le CNRS, le CNRTL fédère au sein d’un portail unique, un ensemble de ressources linguistiques informatisées et d’outils de traitement de la langue.
Le CNRTL intègre le recensement, la documentation (métadonnées), la normalisation, l’archivage, l’enrichissement et la diffusion des ressources.
La pérennité du service et des données est garantie par l’adossement à l’UMR ATILF (CNRS – Nancy Université), le soutien du CNRS ainsi que son intégration dans le projet d’équipement d'excellence ORTOLANG.

Nouveautés

Corpus journalistique de l'Est Républicain (CNRTL - Est Républicain).

Prolex : Lexique relationnel multilingue de noms propres (Laboratoire d'informatique - Université François Rabelais - Tours).

Pompamo : Outil de détection de candidats à la néologie (ATILF/ CNRS - Nancy Université).

Portail lexical : un ensemble de ressources et de données

Les lexiques et dictionnaires sont intégrés au sein d’un portail lexical unique qui permet leur consultation croisée ainsi qu’un export dans un format normalisé (LMF, ISO-24613). Projet évolutif, le portail lexical a pour vocation de fédérer, de valoriser et de partager, en priorité avec la communauté scientifique, un ensemble de données issues des travaux de recherche sur les lexiques.

Ressources

Le CNRTL propose et documente des corpus librement accessibles dont les corpus Frantext libre de droits et DEDE (DEscriptions DEfinies). Progressivement, les données sont converties en TEI et enrichies par des annotations linguistiques. Le CNRTL offre également la possibilité de téléchargement du lexique MORPHALOU (Lexique Morphologique Ouvert du Français) ainsi que l'accès à un ensemble de dictionnaires anciens et modernes.

Outils

Le CNRTL réunit et documente des outils logiciels libres d’accès pour le traitement automatique des langues. A terme, ces outils seront rendus compatibles entre eux et avec les lexiques par le développement d’interfaces standardisées.