Ο αλγόριθμος Machine-Vision μαθαίνει να κρίνει τους ανθρώπους από τα πρόσωπά τους

Οι κοινωνικοί ψυχολόγοι γνωρίζουν εδώ και καιρό ότι οι άνθρωποι κάνουν άμεσες κρίσεις ο ένας για τον άλλον βασιζόμενοι σε τίποτα περισσότερο από τον τρόπο εμφάνισης και, ειδικότερα, το πρόσωπό μας. Χρησιμοποιούμε αυτές τις κρίσεις για να προσδιορίσουμε εάν μια νέα γνωριμία είναι αξιόπιστη ή έξυπνη ή κυρίαρχη ή κοινωνική ή χιουμοριστική και ούτω καθεξής.



Αυτές οι αποφάσεις μπορεί να είναι ή να μην είναι σωστές και σε καμία περίπτωση δεν είναι αντικειμενικές, αλλά είναι συνεπείς. Δεδομένου του ίδιου προσώπου στις ίδιες συνθήκες, οι άνθρωποι τείνουν να το κρίνουν με τον ίδιο τρόπο.

ποιος είναι ο εγκέφαλος του υπολογιστή

Και αυτό δημιουργεί μια ενδιαφέρουσα πιθανότητα. Οι ραγδαίες πρόοδοι στη μηχανική όραση και την αναγνώριση προσώπου έχουν καταστήσει εύκολο για τους υπολογιστές να αναγνωρίζουν ένα ευρύ φάσμα εκφράσεων του ανθρώπινου προσώπου και ακόμη και να αξιολογούν τα πρόσωπα με βάση την ελκυστικότητα. Είναι λοιπόν δυνατόν μια μηχανή να κοιτάξει ένα πρόσωπο και να πάρει τις ίδιες πρώτες εντυπώσεις που κάνουν οι άνθρωποι;





Σήμερα, λαμβάνουμε μια απάντηση χάρη στη δουλειά του Mel McCurrie στο Πανεπιστήμιο της Notre Dame και σε μερικούς φίλους. Έχουν εκπαιδεύσει έναν αλγόριθμο μηχανικής μάθησης για να αποφασίσουν εάν ένα πρόσωπο είναι αξιόπιστο ή κυρίαρχο με τον ίδιο τρόπο που κάνουν οι άνθρωποι.

Η μέθοδός τους είναι απλή. Το πρώτο βήμα σε οποιαδήποτε διαδικασία μηχανικής μάθησης είναι η δημιουργία ενός συνόλου δεδομένων από το οποίο μπορεί να μάθει ο αλγόριθμος. Αυτό σημαίνει ένα σύνολο εικόνων προσώπων με επισήμανση με τον τρόπο που τα κρίνουν οι άνθρωποι—είτε είναι αξιόπιστα, κυρίαρχα, έξυπνα κ.λπ.

Ο McCurrie και οι συνεργάτες του το δημιουργούν χρησιμοποιώντας έναν ιστότοπο που ονομάζεται TestMyBrain.org, ένα είδος επιστημονικού έργου πολιτών που μετρά διάφορα ψυχολογικά χαρακτηριστικά των ανθρώπων που επισκέπτονται. Ο ιστότοπος είναι ένας από τους πιο δημοφιλείς ιστότοπους για τεστ εγκεφάλου στον Ιστό, με περισσότερους από 1,6 εκατομμύρια συμμετέχοντες.



Η ομάδα ζήτησε από τους συμμετέχοντες να βαθμολογήσουν 6.300 ασπρόμαυρες φωτογραφίες προσώπων. Κάθε πρόσωπο βαθμολογήθηκε από 32 διαφορετικά άτομα για την αξιοπιστία και την κυριαρχία και από 15 άτομα για το IQ και την ηλικία.

Ένα ενδιαφέρον χαρακτηριστικό αυτών των αξιολογήσεων είναι ότι δεν υπάρχει αντικειμενική απάντηση — το τεστ καταγράφει απλώς τη γνώμη του αξιολογητή. Φυσικά, είναι δυνατό να μετρήσουμε το IQ και την ηλικία και να υπολογίσουμε πόσο καλά μπορούν οι άνθρωποι να μαντέψουν αυτές τις τιμές. Αλλά ο McCurrie και οι συνεργάτες του δεν ενδιαφέρονται για αυτό. Το μόνο που θέλουν να μετρήσουν είναι το εύρος των εντυπώσεων των ανθρώπων και στη συνέχεια να εκπαιδεύσουν ένα μηχάνημα για να αναπαράγει τα ίδια αποτελέσματα.

Έχοντας συγκεντρώσει αυτά τα δεδομένα, η ομάδα χρησιμοποίησε 6.000 από τις εικόνες για να εκπαιδεύσει τον αλγόριθμο μηχανικής όρασης. Χρησιμοποιούν άλλες 200 εικόνες για να προσαρμόσουν τις παραμέτρους της μηχανικής όρασης. Όλα αυτά εκπαιδεύουν τη μηχανή να κρίνει πρόσωπα με τον ίδιο τρόπο που κάνουν οι άνθρωποι.

Ο McCurrie και οι συνεργάτες του αποθηκεύουν τις τελευταίες 100 εικόνες για να δοκιμάσουν τον αλγόριθμο μηχανικής όρασης — με άλλα λόγια, για να δουν εάν καταλήγει στα ίδια συμπεράσματα που κάνουν οι άνθρωποι.



Τα αποτελέσματα δημιουργούν ενδιαφέρουσα ανάγνωση. Φυσικά, το μηχάνημα αναπαράγει την ίδια συμπεριφορά που έχει μάθει από τους ανθρώπους. Όταν παρουσιάζεται με ένα πρόσωπο, το μηχάνημα δίνει λίγο πολύ τις ίδιες τιμές για την αξιοπιστία, την κυριαρχία, την ηλικία και το IQ που θα έκανε ένας άνθρωπος.

Ο McCurrie και οι συνεργάτες του είναι σε θέση να ξεχωρίσουν πώς το κάνει αυτό το μηχάνημα. Για παράδειγμα, μπορούν να πουν ποια μέρη του προσώπου χρησιμοποιεί το μηχάνημα για να κάνει τις κρίσεις του.

Η ομάδα το κάνει αυτό καλύπτοντας διαφορετικά μέρη ενός προσώπου και ζητώντας από το μηχάνημα να κάνει την κρίση του. Εάν το αποτέλεσμα διαφέρει σημαντικά από τη συνηθισμένη τιμή, υποθέτουν ότι αυτό το μέρος του προσώπου πρέπει να είναι σημαντικό. Με αυτόν τον τρόπο, μπορούν να πουν σε ποια μέρη του προσώπου βασίζεται περισσότερο το μηχάνημα όταν κάνει την κρίση του.

Περιέργως, αυτά αποδεικνύονται παρόμοια με τα μέρη του προσώπου στα οποία βασίζονται οι άνθρωποι. Οι κοινωνικοί ψυχολόγοι γνωρίζουν ότι οι άνθρωποι τείνουν να κοιτάζουν το στόμα όταν αξιολογούν την αξιοπιστία και ότι ένα χαμηλωμένο φρύδι συχνά συνδέεται με κυριαρχία.

Και αυτοί είναι ακριβώς οι τομείς που μαθαίνει να εξετάζει ο αλγόριθμος μηχανικής όρασης από τα δεδομένα εκπαίδευσης. Αυτές οι παρατηρήσεις υποδεικνύουν ότι τα μοντέλα μας έχουν μάθει να κοιτάζουν στα ίδια μέρη που κάνουν οι άνθρωποι, αναπαράγοντας τον τρόπο που κρίνουμε χαρακτηριστικά υψηλού επιπέδου ο ένας στον άλλον, λένε οι McCurrie και συνεργάτες.

Αυτό οδηγεί σε μια σειρά από ενδιαφέρουσες εφαρμογές. Ο McCurrie και οι συνεργάτες του το εφαρμόζουν πρώτα στην υποκριτική. Χρησιμοποιούν το μηχάνημα για να αξιολογήσουν την αξιοπιστία και την κυριαρχία του Έντουαρντ Σνόουντεν και του Τζούλιαν Ασάνζ από φωτογραφίες των προσώπων τους. Στη συνέχεια, χρησιμοποιούν το μηχάνημα για να κάνουν την ίδια αξιολόγηση των ηθοποιών που τους υποδύονται σε δύο πρόσφατες κινήσεις—Τζόζεφ Γκόρντον-Λέβιτ και Μπένεντικτ Κάμπερμπατς, αντίστοιχα.

Στην πραγματικότητα, αυτό προβλέπει πώς ένα πλήθος μπορεί να αξιολογήσει την ομοιότητα μεταξύ ενός ηθοποιού και του ατόμου που υποδύεται.

Τα αποτελέσματα είναι ξεκάθαρα. Αποδεικνύεται ότι το μηχάνημα βαθμολογεί και τους δύο ηθοποιούς με παρόμοιο τρόπο με τους ανθρώπους που απεικονίζουν—για παράδειγμα, όλοι έχουν κακή βαθμολογία αξιοπιστίας. Τα μοντέλα μας παράγουν εντυπωσιακά παρόμοιες προβλέψεις μεταξύ των υποκειμένων και των ηθοποιών τους, επιβεβαιώνοντας την ακρίβεια των απεικονίσεων στις ταινίες, λένε οι McCurrie και συνεργάτες.

Αλλά η ομάδα μπορεί να πάει παραπέρα. Εφαρμόζουν τον αλγόριθμο μηχανικής όρασης σε κάθε καρέ μιας ταινίας, που τους επιτρέπει να δουν πώς αλλάζουν οι βαθμολογίες με την πάροδο του χρόνου. Αυτό παρέχει ένα μέτρο του τρόπου με τον οποίο οι αντιλήψεις των ανθρώπων μπορεί να αλλάξουν με την πάροδο του χρόνου. Και αυτό είναι κάτι που θα μπορούσε να χρησιμοποιηθεί στην έρευνα, το μάρκετινγκ, την πολιτική εκστρατεία κ.λπ.

Η εργασία προτείνει επίσης μελλοντικές οδούς προς επιδίωξη. Μια δυνατότητα είναι να ελέγξετε πώς αλλάζουν οι πρώτες εντυπώσεις μεταξύ πολιτιστικών ή δημογραφικών ομάδων.

Όλα αυτά καθιστούν δυνατό να αρχίσουμε να πειράζουμε τους παράγοντες που συμβάλλουν στις προκαταλήψεις μας, οι οποίες συχνά εξαρτώνται από λεπτές κοινωνικές ενδείξεις. Μπορεί επίσης να επιτρέψει στα ρομπότ να τα προβλέψουν και να τα επαναλάβουν.

Ένα συναρπαστικό συμπέρασμα σε αυτό είναι το πώς αυτό το είδος έρευνας θα μπορούσε να επηρεάσει την ανθρώπινη συμπεριφορά. Αν κάποιος ανακάλυπτε ότι το πρόσωπό του θεωρείται αναξιόπιστο, πώς θα μπορούσε να αντιδράσει; Μήπως είναι δυνατόν να μάθουμε πώς να αλλάξουμε αυτή την αντίληψη, ίσως αλλάζοντας τις εκφράσεις του προσώπου; Ενδιαφέρουσα δουλειά!

Αναφ.: arxiv.org/abs/1610.08119 : Πρόβλεψη πρώτων εντυπώσεων με τη βαθιά μάθηση

κρύβω

Πραγματικές Τεχνολογίες

Κατηγορία

Χωρίς Κατηγοριοποίηση

Τεχνολογία

Βιοτεχνολογία

Τεχνική Πολιτική

Την Αλλαγή Του Κλίματος

Άνθρωποι Και Τεχνολογία

Silicon Valley

Χρήση Υπολογιστή

Περιοδικό Mit News

Τεχνητή Νοημοσύνη

Χώρος

Έξυπνες Πόλεις

Blockchain

Feature Story

Προφίλ Αποφοίτων

Σύνδεση Αποφοίτων

Δυνατότητα Ειδήσεων Mit

1865

Η Θέα Μου

77 Mass Ave

Γνωρίστε Τον Συγγραφέα

Προφίλ Στη Γενναιοδωρία

Βλέπεται Στην Πανεπιστημιούπολη

Επιστολές Αποφοίτων

Νέα

Εκλογές 2020

Με Ευρετήριο

Κάτω Από Τον Θόλο

Πυροσβεστική Μάνικα

Άπειρες Ιστορίες

Πανδημικό Τεχνολογικό Έργο

Από Τον Πρόεδρο

Θέμα Εξώφυλλου

Φωτογραφίες

Συνιστάται