Τώρα, ερευνητές στην Ολλανδία ανέπτυξαν ένα μοντέλο τεχνητής νοημοσύνης που μπορεί να καταλάβει τον σαρκασμό με μεγάλη ακρίβεια, στο πλαίσιο μελέτηςμελέτης που εστιάζει στην αλληλεπίδραση ανθρώπου-υπολογιστή. Η ομάδα από το εργαστήριο τεχνολογίας ομιλίας στο Πανεπιστήμιο του Groningen ανέπτυξε έναν «πολυτροπικό αλγόριθμο», τον οποίο εκπαίδευσε σε σκηνές από δημοφιλείς τηλεοπτικές σειρές, όπως «Τα Φιλαράκια» και το "The Big Bang Theory".
«Όταν ξεκινάς να μελετάς τον σαρκασμό, συνειδητοποιείς πόσο πολύ τον χρησιμοποιούμε ως μέρος του συνήθους τρόπου επικοινωνίας μας», δήλωσε ο Ματ Κόλερ, ένας από τους συγγραφείς της μελέτης.
«Αλλά πρέπει να μιλάμε στις συσκευές μας με πολύ κυριολεκτικό τρόπο, σαν να μιλάμε σε ένα ρομπότ, γιατί αυτό κάνουμε. Δε χρειάζεται όμως να είναι έτσι τα πράγματα» πρόσθεσε.
Η ομάδα χρησιμοποίησε μια βάση δεδομένων που ονομάζεται Multimodal Sarcasm Detection Dataset (MUStARD), την οποία ερευνητές από τις ΗΠΑ και τη Σιγκαπούρη είχαν δημιουργήσει στο πλαίσιο παρόμοιας μελέτης. Οι προηγούμενοι αλγόριθμοι ανίχνευσης σαρκασμού βασίζονταν σε ένα μόνο σημείο δεδομένων, συνήθως την ανάλυση κειμένου. Οι ερευνητές της νέας μελέτης χρησιμοποίησαν δύο συμπληρωματικές μεθόδους: την ανάλυση συναισθήματος στον προφορικό λόγο και την αναγνώριση συναισθημάτων σε ηχητικά αποσπάσματα από τις εν λόγω τηλεοπτικές σειρές.
Αφού το εκπαίδευσαν στα σχετικά δεδομένα, το μοντέλο τεχνητής νοημοσύνης μπόρεσε να ανιχνεύσει τον σαρκασμό σχεδόν στο 75% των περιπτώσεων. Η μετέπειτα εργασία στο εργαστήριο με χρήση συνθετικών δεδομένων βελτίωσε ακόμη περισσότερο αυτό το επίπεδο ακρίβειας.
Η ομάδα σκοπεύει να βελτιώσει περαιτέρω το μοντέλο της συμπεριλαμβάνοντας διάφορες εκφράσεις και χειρονομίες, καθώς ο σαρκασμός μπορεί να διαφέρει ανάλογα με την κουλτούρα και το πλαίσιο.
«Επιπλέον, θα θέλαμε να συμπεριλάβουμε περισσότερες γλώσσες και να υιοθετήσουμε την ανάπτυξη τεχνικών αναγνώρισης σαρκασμού», δήλωσαν.
Οι ερευνητές πιστεύουν ότι αυτή η πολυτροπική προσέγγιση θα έχει ευρείες εφαρμογές σε διάφορους τομείς.
Η μελέτη παρουσιάστηκε σε εκδήλωση της Ακουστικής Εταιρείας της Αμερικής και της Καναδικής Ακουστικής Ένωσης στην Οττάβα του Καναδά.
«Αλλά πρέπει να μιλάμε στις συσκευές μας με πολύ κυριολεκτικό τρόπο, σαν να μιλάμε σε ένα ρομπότ, γιατί αυτό κάνουμε. Δε χρειάζεται όμως να είναι έτσι τα πράγματα» πρόσθεσε.
Η ομάδα χρησιμοποίησε μια βάση δεδομένων που ονομάζεται Multimodal Sarcasm Detection Dataset (MUStARD), την οποία ερευνητές από τις ΗΠΑ και τη Σιγκαπούρη είχαν δημιουργήσει στο πλαίσιο παρόμοιας μελέτης. Οι προηγούμενοι αλγόριθμοι ανίχνευσης σαρκασμού βασίζονταν σε ένα μόνο σημείο δεδομένων, συνήθως την ανάλυση κειμένου. Οι ερευνητές της νέας μελέτης χρησιμοποίησαν δύο συμπληρωματικές μεθόδους: την ανάλυση συναισθήματος στον προφορικό λόγο και την αναγνώριση συναισθημάτων σε ηχητικά αποσπάσματα από τις εν λόγω τηλεοπτικές σειρές.
Αφού το εκπαίδευσαν στα σχετικά δεδομένα, το μοντέλο τεχνητής νοημοσύνης μπόρεσε να ανιχνεύσει τον σαρκασμό σχεδόν στο 75% των περιπτώσεων. Η μετέπειτα εργασία στο εργαστήριο με χρήση συνθετικών δεδομένων βελτίωσε ακόμη περισσότερο αυτό το επίπεδο ακρίβειας.
Η ομάδα σκοπεύει να βελτιώσει περαιτέρω το μοντέλο της συμπεριλαμβάνοντας διάφορες εκφράσεις και χειρονομίες, καθώς ο σαρκασμός μπορεί να διαφέρει ανάλογα με την κουλτούρα και το πλαίσιο.
«Επιπλέον, θα θέλαμε να συμπεριλάβουμε περισσότερες γλώσσες και να υιοθετήσουμε την ανάπτυξη τεχνικών αναγνώρισης σαρκασμού», δήλωσαν.
Οι ερευνητές πιστεύουν ότι αυτή η πολυτροπική προσέγγιση θα έχει ευρείες εφαρμογές σε διάφορους τομείς.
Η μελέτη παρουσιάστηκε σε εκδήλωση της Ακουστικής Εταιρείας της Αμερικής και της Καναδικής Ακουστικής Ένωσης στην Οττάβα του Καναδά.
Πηγή: ertnews.gr - interestingengineering.com - ClopYPastE.gr - ClopYandPastE.gr - ClopYandPastE.blogspot.com
0 comments
Δημοσίευση σχολίου
Παρακαλώ, τα σχόλιά σας να μην περιέχουν βωμολοχίες, να μην είναι γραμμένα σε greeklish και με κεφαλαία γράμματα και να μην περιέχουν οποιοδήποτε διαφημιστικό περιεχόμενο. Σε διαφορετική περίπτωση δε θα δημοσιεύονται. Για οποιαδήποτε απορία ανατρέξτε στους όρους χρήσης του ιστολογίου.