Natural Language Processing

Les applications développées par CELI France, basées sur le NLP, permettent de traduire et convertir de l’information issue de large volumes de textes électroniques (document Web, emails, etc. …) en données explicites et facilement exploitables soit par des opérateurs humains soit par des logiciels de « data mining ».

Clustering

Dans les taches de gestion de l’information on a parfois parfois la nécessité de grouper des documents sans trop bien savoir quel sont les critère de classification. Le web service de clustering permet de résoudre ce problème en analysant automatiquement un ensemble de document et en proposant des groupement naturels, c’est à dire basé sur le contenu même des textes. Par exemple face aux 5 documents suivant

1) Problème sur la ligne téléphonique.

2) Le wifi ne marche pas comme il faut.

3) J’ai n’entend aucune bruit quand je soulève le téléphone.

4) Internet de mon portable ne fonctionne pas

5) Je n’arrive pas à voir la télévision.

L’algorithme de clustering proposera 3 groupes, c’est à dire téléphonie=[1,3], wifi :[2,4], télévision[5]

A quoi ça sert ?
Le clustering permet de gérer tous les cas qui comportent un ensemble de documents qui ne sont pas classifiable dans en schéma prédéfinie ou pour le quels le schéma varie en continuation. Par exemple il peut être utilisé pour grouper des commentaire faites par des usager, des lettre clients, des documents pour le quelle on à pas encore décidé un systeme de classification précis.

Un effet, le clustering peut être aussi conçu comme une méthode pour faciliter le design d’un système de classification (arborescence) a partir d’un ensemble de documents pre-existant.

Il faut enfin mentionner le fait que même dans les systèmes qui sont basé sur un arborescence définie le clustering peut s’avérer utile pour détecter des « trends » qui n’ont pas été prévus. Par exemple dans un call center d’une administration publique il peut s’avérer que un certain jour un groupe significatif d’appels concernait les sujet du crédit impôts recherche, même si telle catégorie n’est pas prévu dans l’arborescence du call center.

CELI-France se spécialise sur le clustering de type textuel : le caractéristiques de groupement de documents sont donc basées sur l’analyse linguistique et sémantique du texte. Telles caractéristiques sont après analysées par un algorithme inspiré des Topic Models

Pour aller plus loin
Tester la demo
En cliquant sur ce lien vous aurez accès a une démonstration des fonctions de clustering. La page montre de façon graphique le résultats de clustering d’un certain nombre d’articles de la wikipedia française. Dans cette même page vous pourrez également télécharger le "client" pour vous connecter au service et intégrer les fonctions de clustering dans votre application.

Accéder à la démo en ligne en cliquant sur le lien ci-dessous :

Voir la démo

Solution personnalisée
CELI-France peut vous fournir en accès dédié à un service de clusterisation paramétré selon votre exigence en termes de domaines métiers et application spécifique.

12-14, rue Claude Genin 38000 Grenoble +334 76 24 23 80 info@celi-france.com

Plan du siteCréditsMentions légales