Natural Language Processing

Les applications développées par CELI France, basées sur le NLP, permettent de traduire et convertir de l’information issue de large volumes de textes électroniques (document Web, emails, etc. …) en données explicites et facilement exploitables soit par des opérateurs humains soit par des logiciels de « data mining ».

Extraction d’entités

Il s’agit d’un service qui détecte les références à des personne, lieux, entreprises, dates, etc. qui sont contenues dans un texte. Par exemple : « Les deux offres retenues ont été déposées lundi : l’une par le trio d’hommes d’affaires [PERSON Pigasse-Bergé-Niel], l’autre par [PERSON Claude Perdriel] ([COMPANY Le Nouvel Obs]) associé à [COMPANY Orange] ([COMPANY France Télécom]) et à l’Espagnol [COMPANY Prisa] ([COMPANY El Pais]). »

Les techniques mises en œuvre sont basées sur des méthodes hybride combinant approches symbolique et approches statistiques (apprentissage automatique). Elles permettent de comprendre que dans une phrase comme « Orange n’est pas cotée en bourse » "Orange" réfère à une entreprise, alors que dans « Notre voyage à Orange c’est bien terminé », "Orange" réfère à la ville et que dans « J’ai fait de la confiture à l’orange », "Orange" réfère au fruit et non pas à une entité nommée comme dans les deux précedent.

A quoi ça sert ?

La reconnaissance d’entités nommés est cruciale pour toutes les applications qui nécessitent de compréhension sémantique du texte. Ça peut aller de l’indexation sémantique pour les moteur de recherche, à l’anonymisation de documents, à la business intelligence (ou Informatique décisionnelle ) appliqué au textes, aux renseignement de sources ouvertes (ou renseignement d’origine source ouverte ou Open source intelligence) etc.

Pour aller plus loin
Tester la demo
En cliquant sur ce lien vous aurez accès à une démonstration des fonctions d’extraction d’entité nommées. Dans cette même page vous pourrez également télécharger le "client" pour vous connecter au service et intégrer les fonctions de détection sémantique dans votre application. Accéder à la démo en ligne en cliquant sur le lien ci-dessous :

Voir la démo

Solution personnalisée
CELI-France peut vous fournir un accès dédié à un service d’extraction d’entités nommeés paramétré selon vos exigences. La parametrisation peut concerner soit l’identification d’entité nommés qui ne sont pas inclues dans le service de base (par exemple produits, marques, entité géographiques spécifiques, rôle des personnes dans les organisations, etc.) soit l’extraction d’entités dans des textes particuliers, tels que les SMS, les blogs, les textes structurés comme bilans, factures, etc.
- Demo en ligne -

En cliquant sur ce lien vous aurez accès à une démonstration d’ extraction d’entités.

Voir la démo

12-14, rue Claude Genin 38000 Grenoble +334 76 24 23 80 info@celi-france.com

Plan du siteCréditsMentions légales