Το Siri μπορεί να γίνει πιο έξυπνο μαθαίνοντας από τα λάθη του

Ο φωνητικός βοηθός της Apple, Siri.



ποσοστό επιτυχίας γονιδιακής θεραπείας

Δοκιμάστε να κάνετε έστω και μια σύντομη συνομιλία με τη Siri, την Cortana ή την Alexa και μπορεί να καταλήξετε να χτυπάτε το κεφάλι σας στον πλησιέστερο τοίχο με απογοήτευση.

Οι βοηθοί φωνής είναι συχνά καλοί στην ανταπόκριση σε απλά ερωτήματα, αλλά δυσκολεύονται με πολύπλοκα αιτήματα ή οποιοδήποτε είδος μπρος-πίσω. Αυτό θα μπορούσε να αρχίσει να αλλάζει, ωστόσο, καθώς οι νέες τεχνικές μηχανικής μάθησης εφαρμόζονται στην πρόκληση του διαλόγου ανθρώπου-μηχανής τα επόμενα χρόνια.





Μιλώντας σε ένα σημαντικό συνέδριο AI την περασμένη εβδομάδα, Στηβ Γιανγκ , καθηγητής στο Πανεπιστήμιο του Κέιμπριτζ που εργάζεται επίσης με μερική απασχόληση στην ομάδα Siri της Apple, μίλησε για το πώς οι πρόσφατες εξελίξεις αρχίζουν να βελτιώνουν τα συστήματα διαλόγου. Ο Young δεν σχολίασε τη δουλειά του στην Apple, αλλά περιέγραψε την ακαδημαϊκή του έρευνα.

Οι πρώτοι βοηθοί φωνής, συμπεριλαμβανομένου του Siri, χρησιμοποιούσαν μηχανική εκμάθηση για αναγνώριση φωνής, αλλά ανταποκρίνονταν στη γλώσσα σύμφωνα με σκληρούς κανόνες. Αυτό αλλάζει ολοένα και περισσότερο καθώς οι τεχνικές μηχανικής μάθησης εφαρμόζονται στη γλώσσα ανάλυσης (βλ. Πρόβλημα γλώσσας AI).

Ο Young είπε συγκεκριμένα ότι η ενισχυτική μάθηση, η τεχνική που χρησιμοποίησε το DeepMind για να δημιουργήσει ένα πρόγραμμα ικανό να κερδίσει έναν από τους καλύτερους παίκτες Go στον κόσμο, θα μπορούσε να βοηθήσει σημαντικά στην προώθηση της τελευταίας τεχνολογίας. Ενώ το AlphaGo έμαθε παίζοντας χιλιάδες παιχνίδια εναντίον του και λάμβανε θετική ενίσχυση με κάθε νίκη, οι συνομιλητές μπορούσαν να διαφοροποιήσουν τις απαντήσεις τους και να λάβουν θετικά (ή αρνητικά) σχόλια με τη μορφή των ενεργειών των χρηστών.

Νομίζω ότι πρέπει να είναι μεγάλο πράγμα, είπε ο Young για την ενίσχυση της μάθησης όταν του μίλησα μετά την ομιλία του. Το πιο ισχυρό πλεονέκτημα που έχετε είναι ο χρήστης.

Ο Young είπε ότι οι βοηθοί φωνής δεν θα χρειαστεί να αλλάξουν δραματικά τη συμπεριφορά τους για να έχει αποτέλεσμα. Μπορεί απλώς να προσπαθήσουν να εκτελέσουν μια ενέργεια με λίγο διαφορετικό τρόπο. Μπορείτε να το κάνετε με πολύ ελεγχόμενο τρόπο, είπε. Δεν χρειάζεται να κάνετε παράλογα πράγματα.

Κατά τη διάρκεια της ομιλίας του, ο Young εξήγησε γιατί η ανάλυση της γλώσσας είναι τόσο δύσκολη για τις μηχανές. Σε αντίθεση με την αναγνώριση εικόνας, για παράδειγμα, η γλώσσα είναι συνθετική, που σημαίνει ότι τα ίδια στοιχεία μπορούν να αναδιαταχθούν για να παράγουν πολύ διαφορετικές έννοιες. Μια άλλη βασική πρόκληση με τη γλώσσα είναι ότι προσφέρει μόνο μια ελλιπή ματιά του τι σκέφτεται ένα άλλο άτομο, επομένως είναι συχνά απαραίτητο να κάνουμε εικασίες για το τι σημαίνει μια φράση ή πρόταση. Σε πρακτικό επίπεδο, καθώς ένα προφορικό ερώτημα μεγαλώνει, η ερμηνεία του απαιτεί συχνά συγχώνευση γνώσεων από διαφορετικούς τομείς. Για παράδειγμα, μια περίπλοκη ερώτηση σχετικά με ένα εστιατόριο μπορεί να απαιτεί κατανόηση του χρόνου, της τοποθεσίας και του φαγητού.

Ωστόσο, ο Young πιστεύει ότι είναι η κατάλληλη στιγμή για τους βοηθούς συνομιλίας να γίνουν πολύ καλύτεροι. Η εμπορική ζήτηση υπάρχει και η τεχνολογία υπάρχει, λέει. Νομίζω ότι τα επόμενα πέντε χρόνια θα δείτε πραγματικά σημαντική πρόοδο.

Ο Young εντάχθηκε στην Apple αφότου η εταιρεία εξαγόρασε τη startup του, VocalIQ, το 2015. Η Apple έχει κατηγορηθεί ότι υστερεί έναντι των ανταγωνιστών της στον αγώνα εκμετάλλευσης της τεχνολογίας που βασίζεται στην πρόοδο στη μηχανική μάθηση και την τεχνητή νοημοσύνη, αλλά η δουλειά του Young υποδηλώνει ότι αυτό δεν είναι αλήθεια. Και η εταιρεία καταβάλλει επίσης προσπάθειες για να ανοίξει την έρευνά της για την τεχνητή νοημοσύνη προκειμένου να προσελκύσει κορυφαία ταλέντα. Η εταιρεία προσέλαβε πρόσφατα τον Ruslan Salakhutdinov, καθηγητή από το Πανεπιστήμιο Carnegie Mellon, για να υπηρετήσει ως πρώτος διευθυντής της τεχνητής νοημοσύνης και οι ερευνητές της άρχισαν να παρουσιάζουν και να δημοσιεύουν εργασίες για πρώτη φορά (βλ. Apple Gets Its First Director of AI ).

Η Apple δεν είναι η μόνη εταιρεία που ενδιαφέρεται για την τεχνολογία συνομιλίας, φυσικά. Η Alexa της Amazon - μια συσκευή για το σπίτι που βασίζεται εξ ολοκλήρου στον φωνητικό έλεγχο - έχει γίνει επιτυχία και άλλες εταιρείες έσπευσαν να αναπτύξουν παρόμοιους οικιακούς βοηθούς. Η προσφορά της Google, που ονομάζεται Google Home, χρησιμοποιεί ιδιαίτερα προηγμένες τεχνικές ανάλυσης γλωσσών (βλ. Βοηθός Google είναι πιο φιλόδοξος από το Siri και την Alexa ).

μίλια μέχρι τον άλφα Κενταύριο

Ερευνητές της IBM, σε συνεργασία με μια ομάδα από το Πανεπιστήμιο του Μίσιγκαν, πειραματίζονται επίσης με συστήματα συνομιλίας που εκμεταλλεύονται την ενισχυτική μάθηση. Satinder Baveja , καθηγητής στο Πανεπιστήμιο του Μίσιγκαν που ασχολείται με αυτό το έργο, λέει ότι η ενισχυτική μάθηση προσφέρει έναν ισχυρό νέο τρόπο εκπαίδευσης συστημάτων διαλόγου, αλλά δεν πιστεύει ότι ο Siri αποκτά πραγματικά ανθρώπινες δεξιότητες επικοινωνίας στη διάρκεια της ζωής του.

Αυτά τα συστήματα θα αρχίσουν να χρησιμοποιούν πλουσιότερο πλαίσιο, λέει. Αν και πιστεύω ότι θα παραμείνουν περιορισμένης εμβέλειας, αντιμετωπίζοντας συγκεκριμένες εργασίες όπως κρατήσεις εστιατορίων, ταξίδια, τεχνική υποστήριξη κ.λπ.

κρύβω

Πραγματικές Τεχνολογίες

Κατηγορία

Χωρίς Κατηγοριοποίηση

Τεχνολογία

Βιοτεχνολογία

Τεχνική Πολιτική

Την Αλλαγή Του Κλίματος

Άνθρωποι Και Τεχνολογία

Silicon Valley

Χρήση Υπολογιστή

Περιοδικό Mit News

Τεχνητή Νοημοσύνη

Χώρος

Έξυπνες Πόλεις

Blockchain

Feature Story

Προφίλ Αποφοίτων

Σύνδεση Αποφοίτων

Δυνατότητα Ειδήσεων Mit

1865

Η Θέα Μου

77 Mass Ave

Γνωρίστε Τον Συγγραφέα

Προφίλ Στη Γενναιοδωρία

Βλέπεται Στην Πανεπιστημιούπολη

Επιστολές Αποφοίτων

Νέα

Εκλογές 2020

Με Ευρετήριο

Κάτω Από Τον Θόλο

Πυροσβεστική Μάνικα

Άπειρες Ιστορίες

Πανδημικό Τεχνολογικό Έργο

Από Τον Πρόεδρο

Θέμα Εξώφυλλου

Φωτογραφίες

Συνιστάται