Lancement

Évaluer et traiter les entretiens

Évaluer et traiter les entretiens

Pour les lecteurs pressés

  • La transcription transforme les mots parlés en texte écrit. Ce texte peut ensuite être utilisé de diverses manières dans le contexte de l'entreprise. C'est ce que nous appelons l'automatisation linguistique.
  • Les résumés de conversations, les vidéoconférences ou les vidéos YouTube sont les cas d'application les plus connus. Cependant, l'IA permet de créer de nombreux autres rapports spécifiques aux applications et de déclencher des automatisations plus poussées.
  • La condition préalable est d'identifier clairement les interlocuteurs dans l'enregistrement et de leur attribuer correctement et précisément les textes. Ce procédé s'appelle la diarization ("tenue d'un journal").
  • Diarization permet d'interpréter les contenus et de les utiliser en fonction du locuteur. Elle sert de base à la création automatique de lettres de médecins, d'entretiens avocat-client, de documentation de commandes dans le secteur bancaire et des assurances, et bien plus encore.
  • En outre, des processus consécutifs peuvent être déclenchés automatiquement, par exemple lorsqu'un supérieur hiérarchique approuve une intervention lors d'un entretien, ce qui déclenche ensuite un processus d'approbation dans le système ERP et le clôt en conséquence.

Conseil pour essayer

Ceux qui utilisent ChatGPT devraient jeter un coup d'oeil au nouveau guide d'invite d'OpenAI. Le fabricant de ChatGPT a publié son propreguide de création d'invites , qui explique à quoi doit ressembler une invite de qualité et pertinente dans ChatGPT - et aussi via l'API - pour que le résultat soit de la meilleure qualité possible. Il faut souligner qu'OpenAI rédige en général une documentation très compréhensible, de sorte que même les non-informaticiens peuvent tirer le meilleur parti de ChatGPT, DALL-E et Whisper.

Les actions demandent de la précision

Si la transcription doit aller au-delà de la simple reconnaissance vocale et de la traduction de mots et de phrases prononcés, il est nécessaire d'attribuer clairement ce qui est dit aux différents locuteurs.

Les fabricants de vidéoconférences tels que Microsoft Teams, Zoom, Google Meet, GoToMeeting ou Cisco WebEx peuvent déjà identifier chaque intervenant dans leurs produits et attribuer précisément ses propos, car chaque participant à la vidéoconférence utilise son propre canal. Cela fonctionne en principe de manière fiable, si l'on fait abstraction de petites erreurs d'attribution lors d'interruptions (par ex. lors de la "prise de parole entre les deux").

Si l'on souhaite par exemple créer automatiquement une documentation médicale sur la base d'un ou de plusieurs entretiens entre le médecin et le patient et l'intégrer automatiquement dans le système d'information de l'hôpital ou du cabinet médical à des fins de documentation, l'utilisation des systèmes de vidéoconférence susmentionnés n'est souvent pas appropriée. Il est vrai que le médecin peut s'en sortir en parlant dans son smartphone pendant ou après le rendez-vous et qu'un processus de transcription automatique s'effectue à partir de là.

Diarization

Les plateformes de transcription basées sur l'IA, telles que OpenAI Whisper Modell , peuvent certes convertir des fichiers audio entiers en fichiers texte - et les rendre ainsi accessibles à un traitement ultérieur -, mais elles n'offrent pas la possibilité d'identifier les différents locuteurs, ce qui entraîne des interprétations erronées du modèle d'IA, par exemple lorsque les plaintes doivent être mentionnées séparément au début du rapport d'admission de l'hôpital.

D'autres modèles d'IA sont donc utilisés pour identifier les locuteurs (p. ex. médecin, patient, soignant, proche, etc.). Ils sont appelés modèles de diarization et renvoient une liste d'entrées indiquant quel locuteur a dit quelque chose, de quelle seconde à quelle seconde.

Avec cette information, l'enregistrement est ensuite traité en texte via des modèles de transcription, de sorte que l'information sur qui a dit quoi peut être utilisée lors de l'analyse de texte suivante, également basée sur l'IA. C'est important pour la différenciation des contenus. Par exemple, la plainte vient du patient, alors que la proposition de traitement vient du médecin. Si la différenciation vocale fait défaut - comme c'est le cas pour le texte - aucun ordinateur ne peut attribuer clairement ce qui a été dit. Les erreurs d'interprétation se multiplieraient, ce que nous devons éviter, notamment dans les domaines critiques.

Cas d'utilisation

Cette combinaison de plusieurs modèles d'IA permet d'automatiser des cas d'utilisation spécifiques à un secteur.

Les avocats et les conseillers fiscaux peuvent consigner dans le dossier numérique les résultats de leurs entretiens de conseil et les prochaines étapes convenues avec leur client, les banques et les assurances peuvent non seulement suivre les ordres et les interactions avec les clients, mais aussi déclencher immédiatement des actions automatisées, comme par exemple des ordres d'achat ou de vente ou l'envoi d'une police.

Les Customer Service Desks et les Helpdesks peuvent enregistrer des réservations avec des détails concrets communiqués par le client lors de la conversation ou faire activer ou désactiver des licences pour l'interlocuteur.

Tous les cas d'application ont en commun le fait que l'intelligence artificielle est capable d'interpréter le sens de la conversation et de la replacer dans son contexte grâce à l'attribution à l'interlocuteur. Il est ainsi possible de déclencher des processus d'automatisation supplémentaires sans action humaine explicite dans les systèmes suivants. La communication humaine sert à résoudre les problèmes, la mise en œuvre est effectuée automatiquement grâce à l'IA.

La transcription avec Diarization offre aux entreprises de tous les secteurs de nouvelles possibilités d'automatiser leurs activités quotidiennes afin d'augmenter leur propre productivité, de renforcer leur avantage concurrentiel et d'améliorer la satisfaction de leurs employés en éliminant les tâches monotones.

En bref : des paroles aux actes.

À propos de Business Automatica GmbH :

Business Automatica réduit les coûts de processus en automatisant les activités manuelles, améliore la qualité de l'échange de données dans des architectures de systèmes complexes et relie les systèmes sur site aux architectures modernes de cloud et SaaS. L'intelligence artificielle appliquée à l'entreprise en fait partie intégrante. En outre, Business Automatica propose des solutions d'automatisation axées sur la cybersécurité à partir du cloud.