Natural Language Processing

Les applications développées par CELI France, basées sur le NLP, permettent de traduire et convertir de l’information issue de large volumes de textes électroniques (document Web, emails, etc. …) en données explicites et facilement exploitables soit par des opérateurs humains soit par des logiciels de « data mining ».

Extraction de concepts

Il s’agit d’un service permet d’extraire d’un texte tous les concepts qui le caractérisent. Par exemple à partir de cet l’article le service extraira des concept tel que : Google , Street View, cartographie, enquête officielle, photographie, réseaux Wi-Fi, données, garde-fous, M. Blumenthal.

Le service est capable d’extraire les phrases qui caractérisent le mieux le contenu de l’article. Il peut s’agir de mots simples (« cartographie »), d’expressions normalisées (« enquête officielle ») ou d’entités nommées (« M. Blumenthal »). Grâce à l’intervention de l’analyse linguistique symbolique le service est capable de filtrer tous les association de mots qui, bien que statistiquement significatives, ne constituent pas un concept bien formé (par exemple « plus sensibles », « responsable de » )

A quoi ça sert ?
L’Extraction de concepts est fondamentale dans toutes les applications d’indexation et stockage sémantique. Elle peut être aussi utilisée pour donner à l’utilisateur, un première aperçu de ce que est l’argument du texte (summarisation). Grâce à l’extraction de concept on peut facilement créer des application composites ou « mashup » reliant plusieurs sources d’information (par exemple les concepts extraits et des articles de wikipedia).
Pour aller plus loin

Grâce à ses nombreux travaux de recherche , CELI France a mis à point une technologie hybride d’extraction de concepts. Cette technologie est basée sur l’interaction entre algorithmes d’apprentissage automatique et un analyseur fonctionnel de la langue française basé sur grammaires écrites par nos linguistes. Ces grammaires interviennent en même temps dans la phase précèdent l’analyse du texte par les algorithmes d’apprentissage (pour nettoyer le texte et identifié les segments significatif) et après cette phase (pour sélectionner le bon candidats et identifier les phrases que sont sémantiquement équivalent).

Concept mining sur wikipedia (en)

Extraction terminologique sur wikipedia (fr)

Extraction terminologique sur wikipedia (fr)

Terminology extraction sur wikipedia (en)

Tester la demo
En cliquant sur ce lien vous aurez accès a une démonstration des fonctions d’extraction de concepts. Il s’agit d’un démo générique que peut être améliorée en pratiquant de l’apprentissage automatique sur des textes plus spécifiques. Dans cette même page vous pourrez également télécharger le client pour vous connecter au service et intégrer les fonctions d’extraction de concepts dans votre application.

Accéder à la démo en ligne en cliquant sur le lien ci-dessous :

Voir la démo

Solution personnalisée
CELI-France peut vous fournir en accès dédié à un service d’extraction de concepts paramétré selon vos exigences en termes de domaine métier et application spécifique. CELI-France peut aussi fournir un système personnalisé de « matching » entre les termes extraites et un thésaurus tel que Eurovoc, MESH, Wordnet etc.
- Démo en ligne -

En cliquant sur ce lien vous auriez accès a une démonstration des fonctions d’extraction de concepts.

Voir la démo

12-14, rue Claude Genin 38000 Grenoble +334 76 24 23 80 info@celi-france.com

Plan du siteCréditsMentions légales