Γιατί το πόκερ είναι μεγάλη υπόθεση για την τεχνητή νοημοσύνη



Όπως είπε κάποτε ο σπουδαίος Kenny Rogers, ένας καλός παίκτης πρέπει να ξέρει πότε να τα κρατάει και να ξέρει πότε να τα κάνει πάσο. Στο Καζίνο Rivers στο Πίτσμπουργκ αυτή την εβδομάδα, ένα πρόγραμμα υπολογιστή που ονομάζεται Libratus μπορεί τελικά να αποδείξει ότι οι υπολογιστές μπορούν να το κάνουν αυτό καλύτερα από οποιονδήποτε παίκτη καρτών.

Το Libratus παίζει χιλιάδες παιχνίδια heads-up, ή δύο παικτών, χωρίς περιορισμούς Texas hold'em ενάντια σε αρκετούς ειδικούς επαγγελματίες παίκτες πόκερ. Τώρα, λίγο περισσότερο από τα μισά του διαγωνισμού των 20 ημερών, το Libratus έχει κερδίσει σχεδόν 800.000 $ έναντι των ανθρώπων του αντιπάλου του. Έτσι, η νίκη, αν και απέχει πολύ από την εξασφάλιση, μπορεί κάλλιστα να είναι στα χαρτιά.





Μια νίκη για το Libratus θα ήταν ένα τεράστιο επίτευγμα στην τεχνητή νοημοσύνη. Το πόκερ απαιτεί λογική και ευφυΐα που έχει αποδειχθεί δύσκολο να μιμηθούν οι μηχανές. Είναι θεμελιωδώς διαφορετικό από το πούλι, το σκάκι ή το Go, επειδή το χέρι του αντιπάλου παραμένει κρυμμένο από το οπτικό πεδίο κατά τη διάρκεια του παιχνιδιού. Σε παιχνίδια ατελούς πληροφόρησης, είναι εξαιρετικά περίπλοκο να βρεις την ιδανική στρατηγική δεδομένης κάθε πιθανής προσέγγισης που μπορεί να ακολουθήσει ο αντίπαλός σου. Και το no-limit Texas hold'em είναι ιδιαίτερα δύσκολο γιατί ένας αντίπαλος θα μπορούσε ουσιαστικά να ποντάρει οποιοδήποτε ποσό.

Το πόκερ ήταν ένα από τα πιο δύσκολα παιχνίδια για την τεχνητή νοημοσύνη, λέει Andrew Ng , επικεφαλής επιστήμονας στο Baidu. Δεν υπάρχει ενιαία βέλτιστη κίνηση, αλλά αντ' αυτού ένας παίκτης AI πρέπει να τυχαιοποιήσει τις ενέργειές του έτσι ώστε να κάνει τους αντιπάλους αβέβαιους πότε μπλοφάρει.

Το Libratus δημιουργήθηκε από Tuomas Sandholm , καθηγητής στο τμήμα πληροφορικής στο CMU και μεταπτυχιακός φοιτητής του Νόαμ Μπράουν . Ο Sandholm, ειδικός στη θεωρία παιγνίων και την τεχνητή νοημοσύνη που μετανάστευσε από τη Φινλανδία για το διδακτορικό του, λέει ότι είναι εκπληκτικό το γεγονός ότι οι άνθρωποι μπόρεσαν να ξεπεράσουν τους υπολογιστές για τόσο καιρό. Απλώς με τρελαίνει το πόσο καλοί είναι αυτοί οι κορυφαίοι επαγγελματίες», λέει. «Από όλα αυτά τα παιχνίδια που έχει αντιμετωπίσει η τεχνητή νοημοσύνη, το [πόκερ] είναι το μόνο όπου η τεχνητή νοημοσύνη δεν έχει φτάσει σε υπεράνθρωπες επιδόσεις.

Οι ερευνητές της τεχνητής νοημοσύνης χρησιμοποιούν τη θεωρία παιγνίων, ή τα μαθηματικά της στρατηγικής λήψης αποφάσεων, για να βρουν την καλύτερη στρατηγική με δεδομένες διάφορες αβεβαιότητες, γνωστή ως ισορροπία. Επειδή οι δυνατότητες είναι τόσο τεράστιες, αυτό συνήθως περιλαμβάνει κάποια μορφή προσέγγισης.

Το αν μια κίνηση είναι καλή ή όχι εξαρτάται από πράγματα που δεν μπορείτε να παρατηρήσετε, λέει Vincent Conitzer , καθηγητής στο Πανεπιστήμιο Duke που διδάσκει AI και θεωρία παιγνίων. Αυτό έχει επίσης ως αποτέλεσμα την ανάγκη να είσαι απρόβλεπτος. Αν δεν μπλοφάρεις ποτέ, δεν είσαι καλός παίκτης. Αν πάντα μπλοφάρεις, δεν είσαι καλός παίκτης. Η θεωρία παιγνίων σάς λέει πώς να τυχαιοποιήσετε το παιχνίδι σας με τρόπο που είναι, κατά μία έννοια, ο βέλτιστος.

Πέρυσι, ο Sandholm ηγήθηκε της ανάπτυξης ενός προηγούμενου προγράμματος παιχνιδιού πόκερ, που ονομαζόταν Claudico, το οποίο ηττήθηκε καλά σε έναν αγώνα ενάντια σε πολλούς επαγγελματίες παίκτες πόκερ. Εξηγεί ότι το Libratus χρησιμοποιεί αρκετές νέες προόδους για να επιτύχει ένα τόσο υψηλό επίπεδο παιχνιδιού. Αυτό περιλαμβάνει μια νέα τεχνική προσέγγισης ισορροπίας, λέει ο Sandholm, καθώς και αρκετές νέες μεθόδους για την ανάλυση πιθανών αποτελεσμάτων καθώς οι κάρτες αποκαλύπτονται σε μεταγενέστερα στάδια ενός παιχνιδιού. Αυτή η ανάλυση τέλους παιχνιδιού είναι υπολογιστικά πολύ δύσκολη και εκτελείται κατά τη διάρκεια κάθε παιχνιδιού στο Κέντρο Υπερυπολογιστών του Πίτσμπουργκ, μια εγκατάσταση που λειτουργεί από την CMU και το Πανεπιστήμιο του Πίτσμπουργκ.

Οι πρόοδοι στη μηχανική μάθηση και την τεχνητή νοημοσύνη έχουν δει μια σειρά από προγράμματα υπερανθρώπινων παιχνιδιών που εμφανίζονται πρόσφατα. Πέρυσι, ερευνητές της DeepMind, θυγατρικής της Alphabet, ανέπτυξαν ένα πρόγραμμα ικανό να κερδίσει έναν από τους καλύτερους παίκτες Go στον κόσμο. Αυτό το επίτευγμα ήταν τόσο θεαματικό επειδή το Go είναι εξαιρετικά περίπλοκο και επειδή είναι δύσκολο να μετρηθεί η πρόοδος μέσα στο παιχνίδι (δείτε το AI Masters της Google να πάει μια δεκαετία νωρίτερα από το αναμενόμενο).

Μερικές διαφορετικές ερευνητικές ομάδες επικεντρώνονται στην αντιμετώπιση του πόκερ. Μια άλλη ακαδημαϊκή ομάδα, από το Πανεπιστήμιο της Αλμπέρτα στον Καναδά, και το Πανεπιστήμιο του Καρόλου και το Τσεχικό Τεχνικό Πανεπιστήμιο στην Τσεχική Δημοκρατία, ανέπτυξε πρόσφατα ένα πρόγραμμα, που ονομάζεται DeepStack , που έχει ήδη κερδίσει αρκετούς επαγγελματίες παίκτες στο heads-up no limit Texas hold’em (δείτε το Poker Is the Latest Game to Fold Against AI ). Ωστόσο, λέει ο Sandholm, οι παίκτες που συμμετέχουν στον αγώνα με τη Libratus είναι πολύ πιο δυνατοί και παίζουν πολύ περισσότερα χέρια ενάντια στη μηχανή, κάτι που θα πρέπει να παρέχει μεγαλύτερη στατιστική σημασία στο αποτέλεσμα.

αφιλτράριστη μηχανή αναζήτησης 2018

Οι τεχνικές που χρησιμοποιούνται για την κατασκευή ενός πιο έξυπνου ρομπότ πόκερ θα μπορούσαν να έχουν πολλές εφαρμογές στον πραγματικό κόσμο. Η θεωρία παιχνιδιών έχει ήδη εφαρμοστεί στην έρευνα σχετικά με τις επιθέσεις παρεμβολών και την ασφάλεια στον κυβερνοχώρο, την αυτοματοποιημένη καθοδήγηση για υπηρεσίες ταξί και τον σχεδιασμό ρομπότ, λέει Σαμ Γκάνζφριντ , ο οποίος ασχολήθηκε με την ανάπτυξη του Claudico και τώρα είναι επίκουρος καθηγητής στο Διεθνές Πανεπιστήμιο της Φλόριντα στο Μαϊάμι.

Ωστόσο, ακόμα κι αν ο Libratus θριαμβεύσει αυτή την εβδομάδα, αυτό δεν σημαίνει ότι οι άνθρωποι δεν αξίζουν πλέον μια θέση στο τραπέζι. Η έκδοση για πολλούς παίκτες του no-limit Texas hold'em δεν μπορεί να κατακτηθεί χρησιμοποιώντας τις τεχνικές που χρησιμοποιεί το Libratus.

κρύβω

Πραγματικές Τεχνολογίες

Κατηγορία

Χωρίς Κατηγοριοποίηση

Τεχνολογία

Βιοτεχνολογία

Τεχνική Πολιτική

Την Αλλαγή Του Κλίματος

Άνθρωποι Και Τεχνολογία

Silicon Valley

Χρήση Υπολογιστή

Περιοδικό Mit News

Τεχνητή Νοημοσύνη

Χώρος

Έξυπνες Πόλεις

Blockchain

Feature Story

Προφίλ Αποφοίτων

Σύνδεση Αποφοίτων

Δυνατότητα Ειδήσεων Mit

1865

Η Θέα Μου

77 Mass Ave

Γνωρίστε Τον Συγγραφέα

Προφίλ Στη Γενναιοδωρία

Βλέπεται Στην Πανεπιστημιούπολη

Επιστολές Αποφοίτων

Νέα

Εκλογές 2020

Με Ευρετήριο

Κάτω Από Τον Θόλο

Πυροσβεστική Μάνικα

Άπειρες Ιστορίες

Πανδημικό Τεχνολογικό Έργο

Από Τον Πρόεδρο

Θέμα Εξώφυλλου

Φωτογραφίες

Συνιστάται