Το Deep Neural Network μαθαίνει να κρίνει τα βιβλία από τα εξώφυλλά τους

Το ιδίωμα ποτέ δεν κρίνει ένα βιβλίο από το εξώφυλλό του προειδοποιεί να μην αξιολογήσουμε κάτι καθαρά από τον τρόπο που φαίνεται. Και όμως τα εξώφυλλα βιβλίων έχουν σχεδιαστεί για να δίνουν στους αναγνώστες μια ιδέα για το περιεχόμενο, για να τους κάνουν να θέλουν να πάρουν ένα βιβλίο και να το διαβάσουν. Τα καλά εξώφυλλα βιβλίων έχουν σχεδιαστεί για να κρίνονται.



Και οι άνθρωποι είναι πολύ καλοί σε αυτό. Είναι σχετικά απλό να διαλέξετε ένα βιβλίο μαγειρικής ή μια βιογραφία ή έναν ταξιδιωτικό οδηγό κοιτάζοντας απλώς το εξώφυλλο.

Και αυτό εγείρει ένα ενδιαφέρον ερώτημα: μπορούν οι μηχανές να κρίνουν τα βιβλία και από τα εξώφυλλά τους; Γνωρίζουμε ήδη ότι κρίνουν τους ανθρώπους από τα πρόσωπά τους.





Σήμερα παίρνουμε μια απάντηση χάρη στη δουλειά των Brian Kenji Iwana και Seiichi Uchida στο Πανεπιστήμιο Kyushu στην Ιαπωνία. Αυτοί οι τύποι έχουν εκπαιδεύσει ένα βαθύ νευρωνικό δίκτυο για να μελετά εξώφυλλα βιβλίων και να προσδιορίζει την κατηγορία των βιβλίων από την οποία προέρχονται.

Περισσότερα για τη μηχανική μάθηση

  • Με το νέο του φίλτρο φωτογραφιών, το Facebook ανακοινώνει το σχέδιό του να εισβάλει το AI στο τηλέφωνό σας

    Το εργαλείο είναι διασκεδαστικό, αλλά είναι επίσης μια δήλωση αποστολής για τον γίγαντα των κοινωνικών δικτύων.

  • Το StarCraft θα γίνει η επόμενη μεγάλη παιδική χαρά για την τεχνητή νοημοσύνη

    Η τεχνητή νοημοσύνη θα απαιτήσει σημαντικές προόδους για να παίξετε ένα βιντεοπαιχνίδι γεμάτο με προγραμματισμό, εικασίες και μπλόφα.



  • Οι μηχανές μπορούν τώρα να αναγνωρίσουν κάτι αφού το δουν μια φορά

    Οι αλγόριθμοι χρειάζονται συνήθως χιλιάδες παραδείγματα για να μάθουν κάτι. Οι ερευνητές στο Google DeepMind βρήκαν έναν τρόπο να το αντιμετωπίσουν.

  • Η σημερινή τεχνητή νοημοσύνη δεν δικαιολογεί το βασικό εισόδημα

    Ακόμη και οι πιο απλές δουλειές απαιτούν δεξιότητες -όπως η δημιουργική επίλυση προβλημάτων- που τα συστήματα τεχνητής νοημοσύνης δεν μπορούν ακόμη να αποδώσουν σωστά.

  • Πρόβλημα γλώσσας AI

    Οι μηχανές που καταλαβαίνουν πραγματικά τη γλώσσα θα ήταν απίστευτα χρήσιμες. Αλλά δεν ξέρουμε πώς να τα φτιάξουμε.

Η μέθοδός τους είναι απλή. Η Iwana και ο Uchida κατέβασαν 137.788 μοναδικά εξώφυλλα βιβλίων από το Amazon.com μαζί με το είδος του βιβλίου. Υπάρχουν 20 πιθανά είδη, αλλά όταν ένα βιβλίο περιλαμβανόταν σε περισσότερες από μία κατηγορίες, οι ερευνητές χρησιμοποίησαν μόνο το πρώτο.



Στη συνέχεια, το ζευγάρι χρησιμοποίησε το 80 τοις εκατό του συνόλου δεδομένων για να εκπαιδεύσει ένα νευρωνικό δίκτυο ώστε να αναγνωρίζει το είδος κοιτάζοντας την εικόνα του εξωφύλλου. Το νευρωνικό τους δίκτυο έχει τέσσερα επίπεδα, το καθένα με έως και 512 νευρώνες, τα οποία μαζί μαθαίνουν να αναγνωρίζουν τη συσχέτιση μεταξύ σχεδίασης εξωφύλλου και είδους. Το ζεύγος χρησιμοποίησε ένα επιπλέον 10 τοις εκατό του συνόλου δεδομένων για να επικυρώσει το μοντέλο και στη συνέχεια δοκίμασε το νευρωνικό δίκτυο στο τελευταίο 10 τοις εκατό για να δει πόσο καλά κατηγοριοποιεί τα εξώφυλλα που δεν έχει δει ποτέ.

Τα αποτελέσματα δημιουργούν ενδιαφέρουσα ανάγνωση. Ο αλγόριθμος απαρίθμησε το σωστό είδος στις 3 κορυφαίες επιλογές του πάνω από το 40 τοις εκατό του χρόνου και βρήκε το ακριβές είδος περισσότερο από το 20 τοις εκατό των περιπτώσεων. Αυτό είναι πολύ καλύτερο από την τύχη. Αυτό δείχνει ότι η ταξινόμηση των σχεδίων εξωφύλλων βιβλίων είναι δυνατή, αν και είναι πολύ δύσκολο έργο, λένε οι Iwana και Uchida.

Ορισμένες κατηγορίες αποδεικνύεται ότι είναι πιο εύκολο να αναγνωριστούν από άλλες. Για παράδειγμα, τα ταξιδιωτικά βιβλία και τα βιβλία σχετικά με τον υπολογιστή και την τεχνολογία είναι σχετικά εύκολο να εντοπιστούν από το νευρωνικό δίκτυο, επειδή οι σχεδιαστές βιβλίων χρησιμοποιούν με συνέπεια παρόμοιες εικόνες και σχέδια για αυτά τα είδη.

πώς μαθαίνουν τα ρομπότ να κάνουν πράγματα

Το νευρωνικό δίκτυο διαπίστωσε επίσης ότι τα βιβλία μαγειρικής ήταν εύκολο να αναγνωριστούν αν χρησιμοποιούσαν εικόνες φαγητού, αλλά ήταν εντελώς διφορούμενα εάν χρησιμοποιούσαν διαφορετικό σχέδιο, όπως μια εικόνα του σεφ.

Οι βιογραφίες και τα απομνημονεύματα ήταν επίσης προβληματικά με τον αλγόριθμο να επιλέγει συχνά την ιστορία ως κατηγορία. Είναι ενδιαφέρον ότι για πολλά από αυτά τα βιβλία, η ιστορία είναι το δευτερεύον είδος που αναφέρεται στο Amazon, γεγονός που υποδηλώνει ότι ο αλγόριθμος δεν ήταν εντελώς μπερδεμένος.

Ο αλγόριθμος μπέρδεψε επίσης τα παιδικά βιβλία με κόμικς και graphic novel, καθώς και ιατρικά βιβλία και επιστημονικά βιβλία. Ίσως αυτό είναι επίσης κατανοητό δεδομένων των ομοιοτήτων μεταξύ αυτών των κατηγοριών.

Υπάρχει ένα μειονέκτημα σε αυτό το έργο. Οι Iwana και Uchida δεν έχουν συγκρίνει την απόδοση του νευρωνικού τους δικτύου με την ικανότητα των ανθρώπων να αναγνωρίζουν είδη βιβλίων από τα εξώφυλλά τους. Αυτό θα ήταν ένα ενδιαφέρον πείραμα και θα ήταν σχετικά απλό να γίνει με μια διαδικτυακή υπηρεσία crowdsourcing όπως η Mechanical Turk της Amazon.

Μέχρι να ολοκληρωθεί αυτή η εργασία, δεν υπάρχει τρόπος να γνωρίζουμε εάν οι μηχανές είναι καλύτερες σε αυτό το έργο από τους ανθρώπους. Αν και, ανεξάρτητα από το πόσο καλοί είναι οι άνθρωποι σε αυτό το έργο, είναι σίγουρα θέμα χρόνου να τους ξεπεράσουν οι μηχανές.

Ωστόσο, αυτή είναι μια ενδιαφέρουσα δουλειά που θα μπορούσε να βοηθήσει τους σχεδιαστές να βελτιώσουν τις δεξιότητές τους όσον αφορά τα εξώφυλλα βιβλίων. Ένα πιο πιθανό αποτέλεσμα, ωστόσο, είναι ότι θα μπορούσε να χρησιμοποιηθεί για την εκπαίδευση μηχανών να σχεδιάζουν εξώφυλλα βιβλίων χωρίς την ανάγκη ανθρώπινης συμβολής. Και αυτό σημαίνει ότι ο σχεδιασμός του εξωφύλλου του βιβλίου είναι απλώς μια άλλη δουλειά που πρόκειται να παραδοθεί στα βιβλία ιστορίας.

Αναφ.: arxiv.org/abs/1610.09204 : Κρίνοντας ένα βιβλίο από το εξώφυλλό του

κρύβω

Πραγματικές Τεχνολογίες

Κατηγορία

Χωρίς Κατηγοριοποίηση

Τεχνολογία

Βιοτεχνολογία

Τεχνική Πολιτική

Την Αλλαγή Του Κλίματος

Άνθρωποι Και Τεχνολογία

Silicon Valley

Χρήση Υπολογιστή

Περιοδικό Mit News

Τεχνητή Νοημοσύνη

Χώρος

Έξυπνες Πόλεις

Blockchain

Feature Story

Προφίλ Αποφοίτων

Σύνδεση Αποφοίτων

Δυνατότητα Ειδήσεων Mit

1865

Η Θέα Μου

77 Mass Ave

Γνωρίστε Τον Συγγραφέα

Προφίλ Στη Γενναιοδωρία

Βλέπεται Στην Πανεπιστημιούπολη

Επιστολές Αποφοίτων

Νέα

Εκλογές 2020

Με Ευρετήριο

Κάτω Από Τον Θόλο

Πυροσβεστική Μάνικα

Άπειρες Ιστορίες

Πανδημικό Τεχνολογικό Έργο

Από Τον Πρόεδρο

Θέμα Εξώφυλλου

Φωτογραφίες

Συνιστάται