Έναρξη

Αξιολόγηση και επεξεργασία συνομιλιών

Αξιολόγηση και επεξεργασία συνομιλιών

Για βιαστικούς αναγνώστες

  • Η μεταγραφή μετατρέπει τις προφορικές λέξεις σε γραπτό κείμενο. Αυτό το κείμενο μπορεί στη συνέχεια να χρησιμοποιηθεί με διάφορους τρόπους στο εταιρικό πλαίσιο. Αυτό το ονομάζουμε αυτοματοποίηση ομιλίας.
  • Οι περιλήψεις συνομιλιών, οι βιντεοδιασκέψεις ή τα βίντεο στο YouTube είναι οι πιο γνωστές περιπτώσεις χρήσης. Ωστόσο, η τεχνητή νοημοσύνη μπορεί να χρησιμοποιηθεί για τη δημιουργία πολυάριθμων άλλων αναφορών ειδικών εφαρμογών και να προκαλέσει περαιτέρω αυτοματοποίηση.
  • Απαραίτητη προϋπόθεση είναι η σαφής αναγνώριση των συνεντευξιαζόμενων στην ηχογράφηση και η σωστή και ακριβής αντιστοίχιση των κειμένων σε αυτούς. Η διαδικασία αυτή ονομάζεται diarisation ("ημερολογιοποίηση").
  • Η ημερολογιοποίηση επιτρέπει την ερμηνεία του περιεχομένου και τη χρήση του από τον εκάστοτε ομιλητή. Αποτελεί τη βάση για αυτόματα παραγόμενες ιατρικές επιστολές, συζητήσεις μεταξύ δικηγόρων και πελατών, έγγραφα εντολών στον τραπεζικό και ασφαλιστικό τομέα και πολλά άλλα.
  • Επιπλέον, οι διαδικασίες παρακολούθησης μπορούν να ενεργοποιηθούν αυτόματα εάν, για παράδειγμα, ένας προϊστάμενος εγκρίνει ένα μέτρο κατά τη διάρκεια μιας συνεδρίασης, η οποία στη συνέχεια ξεκινά και ολοκληρώνει μια διαδικασία έγκρισης στο σύστημα ERP.

Συμβουλή για να δοκιμάσετε

Όποιος χρησιμοποιεί το ChatGPT θα πρέπει να ρίξει μια ματιά στον νέο οδηγό προτροπής από το OpenAI. Ο κατασκευαστής του ChatGPT δημοσίευσε τον δικό τουοδηγό δημιουργίας προτροπών , ο οποίος εξηγεί πώς πρέπει να είναι μια καλή και ουσιαστική προτροπή στο ChatGPT - αλλά και μέσω του API - έτσι ώστε το αποτέλεσμα να είναι της υψηλότερης δυνατής ποιότητας. Θα πρέπει να τονιστεί ότι η OpenAI γράφει γενικά πολύ κατανοητή τεκμηρίωση, έτσι ώστε ακόμη και μη ειδικοί της πληροφορικής να μπορούν να αξιοποιήσουν στο έπακρο το ChatGPT, το DALL-E και το Whisper.

Οι δράσεις απαιτούν ακρίβεια

Εάν η μεταγραφή πρόκειται να προχωρήσει πέρα από την καθαρή αναγνώριση ομιλίας και τη μετάφραση των προφορικών λέξεων και προτάσεων, είναι απαραίτητο να αποδοθεί με σαφήνεια αυτό που έχει ειπωθεί σε μεμονωμένους ομιλητές.

Οι κατασκευαστές συστημάτων τηλεδιάσκεψης, όπως το Microsoft Teams, το Zoom, το Google Meet, το GoToMeeting ή το Cisco WebEx, μπορούν ήδη να αναγνωρίζουν κάθε ομιλητή στα προϊόντα τους και να αντιστοιχίζουν με ακρίβεια τις εκφωνήσεις τους, καθώς κάθε συμμετέχων σε τηλεδιάσκεψη χρησιμοποιεί το δικό του κανάλι. Αυτό ουσιαστικά λειτουργεί αξιόπιστα, αν αγνοήσουμε τα μικρά σφάλματα ανάθεσης κατά τη διάρκεια των διακοπών (π.χ. κατά τη "διακοπή").

Εάν, για παράδειγμα, η ιατρική τεκμηρίωση πρέπει να δημιουργείται αυτόματα βάσει μιας ή περισσοτέρων διαβουλεύσεων γιατρού-ασθενούς και να εισάγεται αυτόματα στο σύστημα πληροφοριών του νοσοκομείου ή στο σύστημα ιατρείου για σκοπούς τεκμηρίωσης, συχνά δεν είναι πρακτικό να χρησιμοποιούνται τα προαναφερθέντα συστήματα τηλεδιάσκεψης. Παρόλο που ο γιατρός μπορεί να βοηθήσει τον εαυτό του μιλώντας τις βασικές πληροφορίες στο smartphone του κατά τη διάρκεια ή μετά το ραντεβού και από εκεί και πέρα πραγματοποιείται μια αυτόματη διαδικασία απομαγνητοφώνησης, είναι κατανοητή η επιθυμία να διεκπεραιωθεί άμεσα η κανονική διαβούλευση γιατρού-ασθενούς, ώστε να δοθεί πλήρης προσοχή στον ασθενή.

Ημερολόγιο

Οι πλατφόρμες μεταγραφής με βάση την ΤΝ, όπως τομοντέλο OpenAI Whisper , μπορούν να μετατρέψουν ολόκληρα αρχεία ήχου σε αρχεία κειμένου - και έτσι να τα καταστήσουν προσβάσιμα για περαιτέρω επεξεργασία - αλλά δεν προσφέρουν τη δυνατότητα αναγνώρισης των μεμονωμένων ομιλητών, γεγονός που οδηγεί σε παρερμηνείες του μοντέλου ΤΝ, εάν, για παράδειγμα, τα παράπονα στην αρχή της έκθεσης εισαγωγής στο νοσοκομείο πρέπει να αναφερθούν ξεχωριστά.

Συνεπώς, χρησιμοποιούνται άλλα μοντέλα τεχνητής νοημοσύνης για την αναγνώριση των ομιλητών (π.χ. γιατρός, ασθενής, φροντιστής, συγγενής κ.λπ.). Ονομάζονται μοντέλα ημερολογιοποίησης και επιστρέφουν έναν κατάλογο καταχωρήσεων που δείχνει ποιος ομιλητής έχει πει κάτι από ποιο δευτερόλεπτο σε ποιο δευτερόλεπτο.

Οι πληροφορίες αυτές χρησιμοποιούνται στη συνέχεια για την επεξεργασία της ηχογράφησης σε κείμενο με τη χρήση μοντέλων μεταγραφής, έτσι ώστε οι πληροφορίες σχετικά με το ποιος είπε τι μπορούν να χρησιμοποιηθούν στις επακόλουθες αναλύσεις κειμένου, οι οποίες βασίζονται επίσης στην ΤΝ. Αυτό είναι σημαντικό κατά τη διαφοροποίηση του περιεχομένου. Για παράδειγμα, το παράπονο προέρχεται από τον ασθενή, ενώ η πρόταση θεραπείας προέρχεται από τον γιατρό. Εάν δεν υπάρχει φωνητική διαφοροποίηση - όπως συμβαίνει με το κείμενο - κανένας υπολογιστής δεν μπορεί να κατηγοριοποιήσει με σαφήνεια τι έχει ειπωθεί. Οι παρερμηνείες θα παρεισφρέουν όλο και περισσότερο, κάτι που πρέπει να αποφύγουμε, ιδίως σε κρίσιμους τομείς.

Περιπτώσεις χρήσης

Αυτός ο συνδυασμός διαφόρων μοντέλων ΤΝ επιτρέπει την αυτοματοποίηση περιπτώσεων χρήσης συγκεκριμένων κλάδων.

Αυτό σημαίνει ότι οι ιατρικές επιστολές και οι εκθέσεις περίθαλψης μπορούν να παράγονται αυτόματα και να παραδίδονται στον επιθυμητό παραλήπτη, οι δικηγόροι και οι φορολογικοί σύμβουλοι μπορούν να καταγράφουν τα αποτελέσματα των διαβουλεύσεών τους και τα επόμενα βήματα που συμφωνήθηκαν με τους πελάτες τους στον ψηφιακό φάκελο, οι τράπεζες και οι ασφαλιστικές εταιρείες μπορούν όχι μόνο να παρακολουθούν τις παραγγελίες και τις αλληλεπιδράσεις με τους πελάτες αλλά και να δρομολογούν άμεσα αυτοματοποιημένες ενέργειες, όπως εντολές αγοράς ή πώλησης ή την αποστολή ενός συμβολαίου.

Τα γραφεία εξυπηρέτησης πελατών και τα γραφεία βοήθειας μπορούν να καταγράφουν κρατήσεις με συγκεκριμένα στοιχεία που παρέχονται από τον πελάτη κατά τη διάρκεια της κλήσης ή να ενεργοποιούν ή να απενεργοποιούν άδειες χρήσης για τον συνεργάτη της κλήσης.

Όλες οι περιπτώσεις χρήσης έχουν κοινά σημεία και βασίζονται στο γεγονός ότι η τεχνητή νοημοσύνη μπορεί να ερμηνεύσει το νόημα της συνομιλίας και να το πλαισιώσει χάρη στην ανάθεση στον συνομιλητή. Αυτό επιτρέπει την έναρξη περαιτέρω διαδικασιών αυτοματοποίησης σε επόμενα συστήματα χωρίς ρητή ανθρώπινη ενέργεια. Η ανθρώπινη επικοινωνία χρησιμοποιείται για την επίλυση προβλημάτων, ενώ η υλοποίηση πραγματοποιείται αυτόματα χάρη στην τεχνητή νοημοσύνη.

Η μεταγραφή με Diarisation ανοίγει εντελώς νέες δυνατότητες για τις εταιρείες κάθε κλάδου να αυτοματοποιήσουν την καθημερινή τους δραστηριότητα, προκειμένου να αυξήσουν την παραγωγικότητά τους, να διευρύνουν το ανταγωνιστικό τους πλεονέκτημα και να αυξήσουν την ικανοποίηση των υπαλλήλων τους εξαλείφοντας τις μονότονες εργασίες.

Εν ολίγοις: τα λόγια ακολουθούνται από πράξεις.

Σχετικά με την Business Automatica GmbH:

Το Business Automatica μειώνει το κόστος των διαδικασιών με την αυτοματοποίηση των χειροκίνητων δραστηριοτήτων, αυξάνει την ποιότητα της ανταλλαγής δεδομένων σε πολύπλοκες αρχιτεκτονικές συστημάτων και συνδέει τα συστήματα που βρίσκονται σε τοπικό επίπεδο με σύγχρονες αρχιτεκτονικές cloud και SaaS. Η εφαρμοσμένη τεχνητή νοημοσύνη στην εταιρεία αποτελεί αναπόσπαστο μέρος αυτού. Η Business Automatica προσφέρει επίσης λύσεις αυτοματοποίησης από το cloud που είναι προσανατολισμένες στην ασφάλεια στον κυβερνοχώρο.