Les applications développées par CELI France, basées sur le NLP, permettent de traduire et convertir de l’information issue de large volumes de textes électroniques (document Web, emails, etc. …) en données explicites et facilement exploitables soit par des opérateurs humains soit par des logiciels de « data mining ».

La Lemmatization est La technologie qui permet de retrouver la forme « canonique » des mots. Par exemple le mot « animaux » est transformé dans sa forme canonique « animal ». Le service de lemmatisation est également en mesure d’identifier les trait dits « morphologiques » du mot. Dans l’exemple précédent, le fait que il s’agit de la forme plurielle. Optionnellement le service peut désambiguïser le mots. Par exemple dans la phrase « il juge un dessin » et « le juge s’est rendu en ville » le service est capable de comprendre que dans le premier cas il s’agit d’un verbe (-> « juger ») et dans le deuxième s’agit d’un nom (->« juge »).
L’une des applications fondamentales est liée aux moteurs de recherche tels que Apache Lucene, ou elle permet une recherche plus pertinente.
Elle est également fondamentale pour tous les processus d’extraction de terminologies métier, d’analyse sémantique, d’apprentissage automatique, …
Lemmatisation sur wikipedia (fr)
Article sur l’importance de la lemmatisation (fr)
Accéder à la démo en ligne en cliquant sur le lien ci-dessous :
En cliquant sur ce lien vous aurez accès à une démonstration des fonctions de lemmatization.
12-14, rue Claude Genin 38000 Grenoble +334 76 24 23 80 info@celi-france.com