Natural Language Processing

Les applications développées par CELI France, basées sur le NLP, permettent de traduire et convertir de l’information issue de large volumes de textes électroniques (document Web, emails, etc. …) en données explicites et facilement exploitables soit par des opérateurs humains soit par des logiciels de « data mining ».

Classification de documents

Il s’agit d’un service qui catégorise automatiquement un document selon un ensemble de catégories données. Par exemple, le service est capable de comprendre que un article qui parle de l’approbation de la lois des finances doit entrer dans la catégorie « politique ». La classification (ou catégorisation) des document s’appuie principalement sur de techniques statistiques (apprentissage automatique) mais bénéficie largement de la couche d’analyse grammaticale et d’extraction d’entité nommées mise en place par CELI France.

A quoi ça sert ?

La classification automatique des documents ou catégorisation automatique des documents représente un passage fondamentale pour toute gestion des contenues éditorial, qu’il s’agit de news, d’articles technique ou de blog. En dehors des contenues en ligne elle est primordiale dans toutes les activité « knowledge intensive », ou la quantité de matériel textuel produit nécessite un archivage automatique. Tel est le cas, par exemple, des tickets dans le domaine du CRM, des verbatim dans les analyses marketing, des CVs dans les opérations de recrutement, les metadonnés dans les bibliothèques électroniques, etc.

Pour aller plus loin
Tester la demo
En cliquant sur ce lien vous aurez accès a une démonstration des fonctions de catégorisation de documents. Telle démo se base sur l’ontologie de DBPedia (voir aussi ici pour une représentation graphique). Dans cette même page vous pourrez également télécharger le "client" pour vous connecter au service et intégrer les fonctions de classification automatique dans votre application.

Accéder à la démo en ligne en cliquant sur le lien ci-dessous :

Voir la démo

Solution personnalisée
Bien que le service permette déjà un haut niveau de parametrisation en donnant la possibilité d’indiquer le corpus d’apprentissage, CELI France peut réaliser un service dédié en configurant les paramètres d’apprentissage en fonction de vos exigences. En plus, nos ingénieurs peuvent intégrer des ressource sémantiques, telles que thésaurus et ontologies à fin de rendre le système encore plus performant.
- Démo en ligne -

En cliquant sur ce lien vous auriez acces a une démonstration des fonctions de catégorisation de documents. Telle démo se base sur l’ontologie de DBPedia

Voir la démo

12-14, rue Claude Genin 38000 Grenoble +334 76 24 23 80 info@celi-france.com

Plan du siteCréditsMentions légales