Το πόκερ είναι το πιο πρόσφατο παιχνίδι ενάντια στην τεχνητή νοημοσύνη

Σε ένα επίτευγμα ορόσημο για την τεχνητή νοημοσύνη, ένα ρομπότ πόκερ που αναπτύχθηκε από ερευνητές στον Καναδά και την Τσεχική Δημοκρατία έχει νικήσει αρκετούς επαγγελματίες παίκτες σε παιχνίδια one-on-one χωρίς περιορισμό Texas hold'em poker.



Ίσως το πιο ενδιαφέρον είναι ότι οι ακαδημαϊκοί πίσω από το έργο λένε ότι το πρόγραμμά τους ξεπέρασε τους ανθρώπινους αντιπάλους του χρησιμοποιώντας μια προσέγγιση προσέγγισης που συγκρίνουν με την αίσθηση του εντέρου.

Εάν είναι σωστό, αυτό είναι πράγματι μια σημαντική πρόοδος στην τεχνητή νοημοσύνη που παίζει παιχνίδια, λέει Μάικλ Γουέλμαν , καθηγητής στο Πανεπιστήμιο του Μίσιγκαν που ειδικεύεται στη θεωρία παιγνίων και την τεχνητή νοημοσύνη. Πρώτον, επιτυγχάνει ένα σημαντικό ορόσημο (νικώντας επαγγελματίες του πόκερ) σε ένα παιχνίδι εξέχοντος ενδιαφέροντος. Δεύτερον, συγκεντρώνει πολλές καινοτόμες ιδέες, οι οποίες μαζί υποστηρίζουν μια συναρπαστική προσέγγιση για παιχνίδια ατελούς πληροφόρησης.





Το γράφημα του ραβδιού χόκεϋ απομυθοποιήθηκε

Αργότερα αυτή την εβδομάδα, ένα τουρνουά σε ένα καζίνο του Πίτσμπουργκ θα δει πολλούς παίκτες πόκερ παγκόσμιας κλάσης να παίζουν την ίδια έκδοση πόκερ έναντι ενός προγράμματος που αναπτύχθηκε στο CMU. Tuomas Sandholm , καθηγητής επιστήμης υπολογιστών στο CMU που ηγείται της προσπάθειας, λέει ότι οι ανθρώπινοι παίκτες που συμμετέχουν είναι πολύ πιο δυνατοί από αυτούς που δοκιμάστηκαν από τους ερευνητές της Αλμπέρτα και ότι 120.000 χέρια θα παιχτούν σε 20 ημέρες, παρέχοντας μεγαλύτερη στατιστική σημασία στα αποτελέσματα. Το τουρνουά θα μπορούσε να επιβεβαιώσει ότι η τεχνητή νοημοσύνη έχει πράγματι κατακτήσει ένα παιχνίδι που από καιρό φαινόταν πολύ περίπλοκο και λεπτό για τους υπολογιστές.

Το DeepStack, το λογισμικό παιχνιδιού πόκερ που έχει ήδη κερδίσει ορισμένους επαγγελματίες παίκτες, αναπτύχθηκε από μια ομάδα με επικεφαλής τον Μάικλ Μπόουλινγκ , καθηγητής επιστήμης υπολογιστών στο Πανεπιστήμιο της Αλμπέρτα, στο οποίο συμμετείχαν ερευνητές από το Πανεπιστήμιο του Καρόλου και το Τσεχικό Τεχνικό Πανεπιστήμιο της Τσεχίας. Σε μια έρευνα χαρτί που δημοσιεύτηκε στο διαδίκτυο αλλά δεν έχουν ακόμη αξιολογηθεί από ομοτίμους, οι ερευνητές λένε ότι το DeepStack έπαιξε σχεδόν 45.000 χέρια πόκερ εναντίον αρκετών παικτών, κερδίζοντας τους εύκολα.

ζωή έξω από το ηλιακό μας σύστημα

Το πόκερ είναι πιο περίπλοκο από πολλά άλλα παιχνίδια που έχουν βάλει τους ανθρώπους ενάντια στην τεχνητή νοημοσύνη. Και είναι χαρακτηριστικό ότι περιέχει επίπεδα αβεβαιότητας, όπως το πότε ένας αντίπαλος μπορεί να μπλοφάρει, που βρίσκονται σε πολλές πραγματικές καταστάσεις που η τεχνητή νοημοσύνη δεν έχει ακόμη κατακτήσει. Οι παίκτες πόκερ δεν μπορούν να δουν τα χέρια των αντιπάλων τους, πράγμα που σημαίνει ότι, σε αντίθεση με το πούλι, το σκάκι ή το Go, δεν είναι διαθέσιμες όλες οι πληροφορίες που περιέχονται στο παιχνίδι. Ερευνητές από την DeepMind, μια θυγατρική της Alphabet με έδρα το Ηνωμένο Βασίλειο, έγιναν πρωτοσέλιδα πέρυσι αφού δημιούργησαν ένα πρόγραμμα ικανό να κερδίσει έναν από τους καλύτερους παίκτες Go στον κόσμο (βλ. το AI της Google Masters the Game of Go μια δεκαετία νωρίτερα από το αναμενόμενο).

Το Heads-up no-limit Texas hold'em είναι μια έκδοση του παιχνιδιού που παίζεται μεταξύ δύο ατόμων που μπορούν να στοιχηματίσουν όσες μάρκες έχουν. Αυτή η παραλλαγή για μεγάλο χρονικό διάστημα αποδείχτηκε πολύ δύσκολη για τις μηχανές να παίξουν έμπειρα. Υπάρχουν 10160 (10 ακολουθούμενες από 160 μηδενικά) πιθανές διαδρομές παιχνιδιού για κάθε χέρι στο heads-up no-limit Texas hold'em.

Το DeepStack έμαθε να παίζει πόκερ παίζοντας χέρια ενάντια στον εαυτό του. Μετά από κάθε παιχνίδι, επανεξετάζει και βελτιώνει τη στρατηγική του, με αποτέλεσμα μια πιο βελτιστοποιημένη προσέγγιση. Λόγω της πολυπλοκότητας του πόκερ χωρίς όρια, αυτή η προσέγγιση συνήθως περιλαμβάνει εξάσκηση με μια πιο περιορισμένη έκδοση του παιχνιδιού. Η ομάδα του DeepStack αντιμετώπισε αυτή την πολυπλοκότητα εφαρμόζοντας μια τεχνική γρήγορης προσέγγισης την οποία βελτίωσε τροφοδοτώντας προηγούμενες καταστάσεις πόκερ σε έναν αλγόριθμο βαθιάς μάθησης.

Αυτό που είναι πραγματικά νέο για ένα τόσο περίπλοκο παιχνίδι είναι να μπορεί κανείς να υπολογίσει αποτελεσματικά τη δράση που πρέπει να λάβει κανείς σε κάθε κατάσταση όπως αντιμετωπίζεται, αντί να χρειάζεται να εργαστεί μέσω μιας απλοποιημένης μορφής ολόκληρου του δέντρου δυνατοτήτων παιχνιδιού εκτός σύνδεσης, λέει ο Wellman του University of Μίσιγκαν.

Οι ερευνητές συγκρίνουν την τεχνική προσέγγισης του DeepStack με το ένστικτο ενός ανθρώπινου παίκτη όταν ένας αντίπαλος μπλοφάρει ή κρατά ένα νικητήριο χέρι, αν και το μηχάνημα πρέπει να βασίσει την αξιολόγησή του στα μοτίβα στοιχηματισμού του αντιπάλου και όχι στη γλώσσα του σώματός του. Αυτή η εκτίμηση μπορεί να θεωρηθεί ως η διαίσθηση του DeepStack, γράφουν. Μια ενστικτώδης αίσθηση της αξίας του να κρατάς τυχόν ιδιωτικά φύλλα σε οποιαδήποτε πιθανή κατάσταση πόκερ.

Είναι δυνατό να μετρήσετε την απόδοση ενός παίκτη πόκερ κοιτάζοντας το ποσό που κέρδισε, σε σχέση με το ποσό που στοιχηματίστηκε στο τραπέζι του, σε πολλά παιχνίδια. Το DeepStack είχε ποσοστό νίκης περίπου εννέα φορές καλύτερο από αυτό που θα θεωρούνταν καλό για έναν επαγγελματία παίκτη.

Το 2015, ο Bowling και οι συνεργάτες του στο Πανεπιστήμιο της Αλμπέρτα έλυσαν την πιο περιορισμένη έκδοση του heats up hold'em με ανάπτυξη ενός bot πόκερ μπορεί να παίξει τέλεια το παιχνίδι.

πώς λειτουργεί μια κλεψύδρα

Το ρομπότ πόκερ που συμμετέχει στο τουρνουά του Πίτσμπουργκ, που ονομάζεται Libratus, αναπτύχθηκε από τον Sandholm και έναν από τους μεταπτυχιακούς φοιτητές του, Νόαμ Μπράουν . Το ζευγάρι δεν έχει ακόμη αποκαλύψει λεπτομέρειες για το πώς το πρόγραμμά τους προσεγγίζει το παιχνίδι, αλλά ο Μπράουν λέει ότι ουσιαστικά προσπαθεί να «λύσει» το παιχνίδι —ή να καταλάβει κάθε πιθανό σενάριο— νωρίτερα κατά τη διάρκεια του παιχνιδιού από ό,τι ήταν προηγουμένως δυνατό. Το Libratus λειτουργεί με εξαιρετικά ισχυρό υλικό στο Κέντρο Υπερυπολογιστών Πίτσμπουργκ , μια εγκατάσταση που λειτουργεί από κοινού από το CMU και το Πανεπιστήμιο του Πίτσμπουργκ.

κρύβω

Πραγματικές Τεχνολογίες

Κατηγορία

Χωρίς Κατηγοριοποίηση

Τεχνολογία

Βιοτεχνολογία

Τεχνική Πολιτική

Την Αλλαγή Του Κλίματος

Άνθρωποι Και Τεχνολογία

Silicon Valley

Χρήση Υπολογιστή

Περιοδικό Mit News

Τεχνητή Νοημοσύνη

Χώρος

Έξυπνες Πόλεις

Blockchain

Feature Story

Προφίλ Αποφοίτων

Σύνδεση Αποφοίτων

Δυνατότητα Ειδήσεων Mit

1865

Η Θέα Μου

77 Mass Ave

Γνωρίστε Τον Συγγραφέα

Προφίλ Στη Γενναιοδωρία

Βλέπεται Στην Πανεπιστημιούπολη

Επιστολές Αποφοίτων

Νέα

Εκλογές 2020

Με Ευρετήριο

Κάτω Από Τον Θόλο

Πυροσβεστική Μάνικα

Άπειρες Ιστορίες

Πανδημικό Τεχνολογικό Έργο

Από Τον Πρόεδρο

Θέμα Εξώφυλλου

Φωτογραφίες

Συνιστάται