Analyse sémantique : les notions de base
Tous les ans, vous envoyez une enquête de satisfaction à l’ensemble de vos clients. Dans cette enquête, vous avez la bonne idée d’inclure des questions ouvertes. Vous récupérez ainsi de nombreuses réponses, souvent très détaillées (remerciez vos clients pour cela, c’est une mine d’or). Vous avez même décidé d’extraire et d’afficher certains verbatim remarquables dans le bureau de votre service client. Ces petits mots, humoristiques le plus souvent, motivent et font sourire vos équipes.
Ou alors, vous opérez un support client par email et téléphone et recevez des centaines d’appels ou de messages chaque jour. Vos agents gèrent les conversations, mais vous voudriez avoir un aperçu de haut niveau des thématiques récurrentes et des opinions exprimées à leur sujets. Dans certains cas, vous voudriez être averti(e) rapidement, par exemple lorsqu’un email mentionne un risque de résiliation ou de plainte. Les signaux à risque de ce type requièrent une réaction rapide, et ne doivent pas se perdre dans la masse.
Dans les deux cas, la quantité de données et le désir d’une approche systématique et sans biais limitent les possibilités de l’analyse humaine. Heureusement, dans beaucoup de cas, cette analyse peut être réalisée par une intelligence artificielle, grâce à ce que l’on appelle l’analyse sémantique.
La sémantique est l’étude du sens des unités linguistiques et de leurs combinaisons. Selon Dictanova, “l’analyse sémantique d’un texte consiste à établir sa signification en utilisant le sens des éléments du texte ; a contrario, les analyses lexicales ou grammaticales ne font que décomposer le message à l’aide d’un lexique (dictionnaire) ou d’une grammaire“. On parle ainsi beaucoup d’analyse sémantique des discours politiques, ou d’analyse sémantique des textes religieux. L’analyse sémantique analyse donc le sens de phrases entières (au contraire de l’analyse lexicale qui analyse uniquement des mots).
Les principaux types d’éléments pour une analyse sémantique sont :
- Les verbatim
- Les concepts
- Les catégories
- Les sentiments
Par exemple, si on analyse le verbatim suivant : “Le cadre du restaurant était magnifique, mais les plats étaient mauvais et l’addition trop élevée“, on a un verbatim, et plusieurs concepts, catégories et sentiments.
- Sentiment 1 : le cadre du restaurant était magnifique
- Sentiment 2 : les plats étaient mauvais
- Sentiment 3 : l’addition trop élevée
Quelle différence entre verbatim, concept, catégorie et sentiment ?
Pour détailler plus facilement chaque élément, nous allons partir d’un exemple concret.
Voici ce qu’on appelle un verbatim : « La formation était intéressante mais la durée était inappropriée ».
Un verbatim est une phrase ou un ensemble de phrases que l’on veut analyser : par exemple, une réponse à un questionnaire, le contenu d’un email, un texte issu d’un CRM, une transcription d’un appel téléphonique, etc. Ce verbatim pourrait donc être issu d’une enquête d’évaluation à chaud d’une formation, envoyée par un organisme de formation par exemple.
Le verbatim suivant contient deux concepts : « La formation était intéressante mais la durée était inappropriée ».
Un concept est un mot ou groupe de mots normalisé qui caractérise un verbatim. Il n’y a pas de distinction entre singulier et pluriel, masculin et féminin. Le nombre de concepts n’est a priori pas limité, il peut y en avoir autant qu’il y a de mots dans le verbatim.
Une catégorie, en revanche, est une thématique d’intérêt définie en accord avec le client. Elle aussi est calculée sur la base des mots présents dans le verbatim. Dans notre exemple, on retrouve donc les catégories “Formation” et “Organisation session“. Les catégories sont en nombre limité, choisies pour leur pertinence, afin de donner une vision globale du corpus et permettre de classer les verbatims.
Un sentiment est une opinion qui transparaît à travers une expression. Deux parties composent un sentiment : l’objet du sentiment, et l’avis exprimé sur cet objet, qui peut être positif ou négatif. Exemple : “cette chaussure est confortable“.
Enfin, en bonus, une cinquième notion. Une alerte est un signal négatif particulier qui requiert une intervention rapide par le service client. Par exemple, pour un opérateur téléphonique une phrase comme « Je me renseigne pour changer d’opérateur » pourrait déclencher une alerte « risque de résiliation ». Ou alors « ma patience vient d’atteindre ses limites, bande de malpropres » pourrait déclencher une alerte « colère », et « cela fait plusieurs fois que je vous écris » déclencherait une alerte « contacts multiples. »
Vous savez désormais distinguer les différences entre ces composants incontournables de l’analyse sémantique. Un logiciel d’analyse sémantique vous aidera ensuite à catégoriser l’ensemble de vos verbatim. Si vous ne savez pas du tout par où commencer, la mise en place d’un POC analyse sémantique peut-être une bonne option pour tester et valider ou non un concept.
[…] analyse semantique permet de traiter des millions de verbatim (suivez ce lien pour un rappel des notions de base de l’ analyse semantique) afin de détecter les éléments interdits tels que la religion les informations de santé, […]
[…] l’article précédent , nous avons évoqué les différents concepts de l’analyse sémantique. Mais comment faire une […]