Les applications développées par CELI France, basées sur le NLP, permettent de traduire et convertir de l’information issue de large volumes de textes électroniques (document Web, emails, etc. …) en données explicites et facilement exploitables soit par des opérateurs humains soit par des logiciels de « data mining ».

Il s’agit d’un service qui détecte les références à des personne, lieux, entreprises, dates, etc. qui sont contenues dans un texte. Par exemple : « Les deux offres retenues ont été déposées lundi : l’une par le trio d’hommes d’affaires [PERSON Pigasse-Bergé-Niel], l’autre par [PERSON Claude Perdriel] ([COMPANY Le Nouvel Obs]) associé à [COMPANY Orange] ([COMPANY France Télécom]) et à l’Espagnol [COMPANY Prisa] ([COMPANY El Pais]). »
Les techniques mises en œuvre sont basées sur des méthodes hybride combinant approches symbolique et approches statistiques (apprentissage automatique). Elles permettent de comprendre que dans une phrase comme « Orange n’est pas cotée en bourse » "Orange" réfère à une entreprise, alors que dans « Notre voyage à Orange c’est bien terminé », "Orange" réfère à la ville et que dans « J’ai fait de la confiture à l’orange », "Orange" réfère au fruit et non pas à une entité nommée comme dans les deux précedent.
La reconnaissance d’entités nommés est cruciale pour toutes les applications qui nécessitent de compréhension sémantique du texte. Ça peut aller de l’indexation sémantique pour les moteur de recherche, à l’anonymisation de documents, à la business intelligence (ou Informatique décisionnelle ) appliqué au textes, aux renseignement de sources ouvertes (ou renseignement d’origine source ouverte ou Open source intelligence) etc.
12-14, rue Claude Genin 38000 Grenoble +334 76 24 23 80 info@celi-france.com