Langage Naturel & Reco Vocale, les menus DTMF sont-ils en perte de vitesse ?7 min read

4 novembre 2019 | Relation Client

Portées par les dernières technologies du vocal, et en particulier par les géants de la nouvelle économie comme Google, Amazon, Microsoft ou Apple, les interactions vocales en langage naturel ou en reconnaissance vocale ont le vent en poupe.

La relation client par téléphone est bien évidemment concernée également. Les consommateurs se voient proposer de plus en plus des dialogues vocaux en plus des interactions DTMF (menus, saisie de code), lorsqu’ils appellent certains services clients.

En effet, de nombreuses entreprises font évoluer leur serveur vocal interactif en intégrant des nouvelles technologies, qui permettent de proposer des interactions vocales aux appelants. Au point peut-être de remplacer les interactions plus classiques en appui-touche.

Alors, devant la montée en puissance des dialogues vocaux, les menus DTMF sont-ils en perte de vitesse dans les services vocaux ?

Quelle différence entre langage naturel & reconnaissance vocale ?

Le langage naturel consiste à proposer une conversation entre un humain et un système informatique où le système détecte ce que l’on appelle des intentions. A partir de ces intentions, le SVI va proposer différentes possibilités pour traiter les appels (routage, intégration, qualification complémentaire, etc). Et c’est le langage naturel est qui utilisé pour les Callbots.

Lorsque l’on parle de langage naturel, on utilise souvent les abréviations NLP (pour Natural Langage Processing qui se traduit par « traitement automatique du langage naturel »), NLU (pour Naturel Langage Understanding qui se traduit par « compréhension du langage naturel »). C’est le NLP qui permet aux humains et aux machines de converser « naturellement ».

D’autre part, la reconnaissance vocale consiste essentiellement à reconnaître une proposition énoncée par l’appelant, puis à traiter l’appel en fonction de ce qui aura été reconnu par le système. En matière de reconnaissance vocale, il faut distinguer la reconnaissance de mots-clés et la reconnaissance d’expressions complètes.

La reconnaissance de mots-clés consiste simplement à détecter la présence d’un mot précis alors que la reconnaissance d’une expression consiste à détecter une combinaison de mots. Cela peut paraître surprenant, mais la reconnaissance d’une expression est plus fiable que la reconnaissance d’un mot-clé car la combinaison de plusieurs mots (expression) est plus exclusive, et donc plus efficace.

Toutes ces interactions en langage naturel ou en reconnaissance vocale avec un service vocal correspondent à ce qu’on peut appeler des dialogues vocaux.

Les dialogues vocaux apportent de nouvelles opportunités pour la relation client

En matière de service client par téléphone, les dialogues vocaux permettent aux marques de répondre à certaines attentes des consommateurs, dont certaines sont de plus en plus importantes.

Les dialogues vocaux permettent notamment de fluidifier et réduire la phase d’identification des appelants et de qualification de leurs motifs d’appel. L’interaction vocale est plus naturelle pour l’appelant, et donc l’expérience de contact est plus fluide. Nous estimons que le temps passé par un appelant dans un SVI est divisé en moyenne par deux. Il n’est plus nécessaire d’enchaîner les menus DTMF, et le gain de temps est significatif pour les clients qui veulent parler à un agent le plus rapidement possible.

Par exemple, dans le cas de l’accueil téléphonique d’un assureur, la simple commande « je souhaite déclarer un sinistre sur mon véhicule » permet de remplacer les menus « Si vous appelez pour votre assurance auto, tapez 1. Si vous appelez pour votre assurance habitation, tapez 2. Pour tout autre motif, tapez 3. » puis lorsque l’appelant a tapé sur la touche 1, « Pour assurer un nouveau véhicule, tapez 1. Pour déclarer un sinistre, tapez 2. Pour toute autre demande, tapez 3. »

Les dialogues vocaux permettent également d’apporter plus de personnalisation dans la phase d’accueil, grâce à l’intégration avec le SI ou le CRM de l’entreprise, qui va reconnaître les numéros appelants et proposer un parcours personnalisé dans le service vocal. Par rapport aux possibilités offertes par les menus DTMF, l’accueil téléphonique évolue pour être davantage en phase avec les attentes des consommateurs en matière de relation client.

Par exemple, l’application vocale peut récupérer de nombreuses informations sur l’appelant comme sa langue, ses prénom et nom, son statut (premium, standard) ou ses derniers achats. Dès le début de l’appel, le service vocal peut donc énoncer en synthèse vocale « Bonjour M. Dupont, comment puis-je vous aider aujourd’hui ? ». Même si le numéro de téléphone est commun à tous les appelants, le service vocal témoigne de la volonté de l’entreprise à apporter une expérience de contact personnalisée à ses clients.

Les menus DTMF & les dialogues vocaux sont plutôt complémentaires

Les technologies vocales de langage naturel et de reconnaissance sont encore jeunes et ne sont pas toujours totalement matures pour identifier les intentions des appelants, et les mots-clés ou expressions qu’ils énoncent.

Il est honnête de dire que le taux de fiabilité des dialogues vocaux est en moyenne compris entre 75 et 90%. Autrement dit, entre 1 appel sur 4 et 1 appel sur 6 ne permet pas d’identifier correctement ce que voulait dire les appelants. A l’inverse, le taux de fiabilité des menus DTMF en appui touche est supérieur à 99%.

Les menus DTMF sont donc plutôt complémentaires aux dialogues vocaux et représentent une alternative efficace pour certains cas précis. Par exemple, lorsque le dialogue vocal ne permet pas à l’application de déterminer l’intention de l’appel, un menu DTMF peut être proposé à l’appelant. Cela lui permet d’indiquer le motif de son appel, afin d’être mis en relation avec le groupe d’agents le plus compétent pour répondre à sa demande.

Autre cas d’usage potentiellement intéressant, qui est de proposer la saisie de code DTMF pour rentrer un numéro client. Lorsque ce type de demande est proposé par un dialogue vocal, compte tenu de la fiabilité de la technologie, il faut épeler chaque lettre ou chaque chiffre du numéro client en ayant une confirmation explicite du système.

Par exemple, le service vocal demande à l’appelant son numéro client et l’appelant répond « un – six – neuf – huit – neuf – deux – quatre ». Puis le service vocal (dont le taux de fiabilité est autour de 80%) de demander la confirmation « votre numéro client est bien le 1698924 ? ». Et l’appelant de confirmer « oui » avant de passer à l’étape suivante. En définitive, la saisie de code DTMF est plus rapide, plus efficace et surtout plus rassurante pour l’appelant.

***

Finalement, nous assistons donc à un rééquilibrage de la qualification entre dialogues vocaux en langage naturel ou interactions en reconnaissance vocale, et menus DTMF en appui-touche, plutôt qu’à une perte de vitesse. Les bénéfices des deux modes d’interaction sont réels et complémentaires pour proposer une expérience de contact de qualité aux clients.

Néanmoins, le sens de l’histoire – sous réserve que la technologie nécessaire devienne encore plus fiable – est que l’utilisation des dialogues vocaux dans les SVI, pour identifier les appelants et qualifier les motifs de leurs appels, prendra de plus en plus d’ampleur.

En effet, les attentes des clients en termes de réactivité, de simplicité et de personnalisation dans la relation avec les entreprises représentent une véritable tendance de fond. Et les dialogues vocaux s’inscrivent davantage dans cette dynamique que les menus DTMF.

À bon entendeur, sans mauvais jeu de mots !