Poker AI – Bisakah Kecerdasan Buatan Mengalahkan Manusia di Poker?

Gambar Robot Sederhana Dengan Latar Belakang Bertema Poker

Gambar Robot Sederhana Dengan Latar Belakang Bertema Poker

Tanda terbaru bahwa Skynet akan on-line dan robotic akan mengambil alih datang kepada kita tidak melalui militer atau perawatan kesehatan. Tidak, kali ini, robotic telah datang untuk poker kami.

Untuk sementara waktu sekarang, analitik knowledge (mis. Komputer) telah menghitung angka-angka tentang poker. Dari analitik komputer, kami telah menemukan cara optimum untuk bermain poker dalam situasi satu lawan satu, kami memiliki teori permainan, dan kami memiliki lebih banyak alat untuk menganalisis pesaing kami.

Kemudian orang-orang di Carnegie Mellon datang dan membangun AI yang, tampaknya, tidak bisa dikalahkan. Dalam skenario yang mengingatkan kembali ketika Gary Kasparov kalah dari Deep Blue, sekarang ada AI di luar sana yang bisa memainkan poker yang tidak ada duanya. Lebih buruk lagi, AI poker juga telah ditempatkan di sarang poker paling jahat di dunia – Fb – dan sedang mengumpulkan kemenangan.

Bagaimana AI-nya terbentuk? Apa artinya ini bagi dunia poker? Hanya waktu yang akan menjawab, tetapi saya setidaknya bisa mengintip ke masa depan dan membuat beberapa tebakan yang terpelajar.

Katakan halo kepada Pluribus

Ketika Skynet on-line, namanya akan menjadi Pluribus.

Oke, itu benar-benar hanya hype, tetapi nama robotic Carnegie Mellon (dibangun di atas Fb AI) sebenarnya adalah Pluribus. Itu ditemukan oleh Angel Jordan, Profesor Ilmu Komputer, Tuomas Sandholm dan Noam Brown, seorang mahasiswa Ph.D di Carnegie Mellon yang juga bekerja di Fb AI.

Semua lelucon tentang komputer mengambil alih dunia, Sandholm dan Brown mengumpulkan komputer yang sangat rumit. Pluribus adalah salah satu AI pertama yang mampu menang dalam recreation multi-pemain.

Sampai saat ini, banyak AI poker berbasis komputer hanya diberi peringkat untuk bermain dalam satu lawan satu. Bermain head-to-head, sementara tidak pernah mudah, adalah masalah yang lebih sederhana untuk dipecahkan untuk komputer karena ada banyak variabel yang lebih sedikit untuk dipertimbangkan dan dihitung.

Ini termasuk Libratus, AI Sandholm lain, yang mampu mengalahkan banyak poker uang nyata pemain dalam recreation dua pemain.

Poker Hand dan Chips Terserak

Pluribus, di sisi lain, bermain ribuan pertandingan melawan lima lawan lainnya dan mampu secara konsisten mengalahkan para profesional. Yang lebih penting lagi, persaingan yang Pluribus lawan tidak perlu bersin. Dalam satu kasus, Pluribus bermain dan mengalahkan tiga belas pemain yang menghasilkan lebih dari satu juta dolar (bermain dalam recreation enam.)

Namun, hal yang sangat menakjubkan adalah seberapa efisien Pluribus. Menurut situs net Carnegie Mellon, Libratus membutuhkan 1.400 core (sekitar 350 prosesor serupa dengan yang ada di komputer pribadi) dan lebih dari lima belas juta jam inti untuk menang. Dan itu untuk permainan satu lawan satu.

Pluribus hanya membutuhkan 28 jam (kira-kira 7 prosesor) dan hanya membutuhkan 12.400 jam inti untuk menang. Itu peningkatan dramatis dalam efisiensi, terutama mengingat berapa banyak variabel yang diperlukan untuk menghitung.

Bagaimana Pluribus Menang

Saya bisa menemukan ilmu komputer di balik kemenangan Pluribus, tetapi saya tidak akan melakukannya.

Yang penting untuk diingat adalah bahwa ketika Pluribus mulai bermain, ia bermain di enam meja sekaligus. Itu dimulai dengan enam salinan dirinya dengan strategi untuk putaran pertama.

Setelah itu, mulai menggunakan apa yang ditemukan untuk melatih dirinya untuk bermain lebih baik. Setiap putaran berikutnya, ia kemudian menggunakan informasi dari recreation sebelumnya untuk meningkatkan permainannya. Ini juga berarti bahwa, di ujung tangan, mungkin ada enam versi berbeda dari algoritma yang kemudian dapat digabungkan oleh tim untuk mendefinisikan yang lebih lengkap. strategi taruhan.

Apa yang mungkin paling menarik tentang permainan Pluribus adalah fakta bahwa ia menggunakan pencarian "pencarian terbatas" untuk memainkan seluruh permainan.

Itulah yang dilakukan manusia.

Pikirkan ketika Anda berada di meja. Anda berpikir sendiri "Jika saya bertaruh X, maka lawan itu akan melakukan Y dan kemudian orang itu akan melakukan Z dan kemudian saya akan menjawab dengan A." Pluribus dapat melakukan semua itu.

Pada dasarnya, kunci kemenangan Pluribus adalah dapat memainkan permainan saat ini dan membuat keputusan dengan memainkan apa yang mungkin terjadi di masa depan. Situs Carnegie Mellon dengan hati-hati mencatat bahwa Pluribus tidak dapat mensimulasikan seluruh permainan (terlalu banyak variabel), tetapi dapat mensimulasikan apa yang akan terjadi selanjutnya.

Kemungkinan besar, Pluribus akan dapat mensimulasikan beberapa hasil yang berbeda dengan sangat cepat sebelum memutuskan langkah selanjutnya yang tepat. Sebagai contoh, Pluribus dapat mensimulasikan apa yang akan terjadi jika memeriksa, melipat, bertaruh dalam jumlah besar, bertaruh dalam jumlah kecil, dll. Dan kemudian membuat keputusan berdasarkan dari permainan yang disimulasikan.

Itu keren sekali.

Menjadi Tidak Terduga Juga Keren

Apakah saya menyebutkan bahwa Pluribus juga dirancang agar tidak dapat diprediksi?

Sandholm dan Brown menyadari bahwa Pluribus dapat jatuh ke dalam perangkap melakukan hal yang sama. Lagi pula, ini komputer, dan sebagian besar AI akan memutuskan strategi sebagai "optimum" dan terus melakukan itu.

Bukan Pluribus. Pluribus tidak hanya dapat mensimulasikan gerakan terbaik apa dalam situasi itu, tetapi juga menyadari apa yang mungkin dilakukan dalam situasi apa pun. Kemudian ia akan berpikir tentang apa yang mungkin dilakukan dan kemudian memiliki algoritma sehingga dapat memutuskan untuk melakukan sesuatu yang lain.

Ini membuat para pemain lain menebak-nebak strategi Pluribus yang sebenarnya.

Ini juga menghadirkan tingkat ketidakpastian yang bahkan tidak dapat dicapai oleh manusia. Pada akhirnya, manusia adalah makhluk kebiasaan yang melakukan apa yang mereka ketahui. Mereka memiliki kecenderungan.

Pluribus sangat menyadari kecenderungannya sendiri dan dapat bertindak melawan mereka semata-mata untuk tujuan penipuan.

Itu keren sekali.

Mengapa Pluribus 'Menang Materi

Pertama, dalam beberapa hal, Pluribus mewakili yang paling dalam lawan poker. (Sekarang aku terdengar seperti penjahat ilmuwan di setiap movie fiksi ilmiah kiamat.) Namun, Pluribus mampu menghitung banyak skenario bagaimana-jika. Ia tahu kecenderungannya sendiri dan dapat membuat layar asap di sekitarnya.

Lebih buruk lagi, Pluribus tidak pernah menderita kemiringan. Ini akan secara bebas mengevaluasi tebing dan taruhan dan bereaksi sesuai itu.

Juga, Pluribus menggunakan strategi yang jarang dilakukan manusia. Pertama, menurut profesional poker Darren Elias, salah satu alasan Pluribus sukses adalah karena itu sebenarnya bisa mencampurkan strategi. Manusia mencoba memadukan strategi, tetapi seperti saya katakan, kita jatuh ke dalam pola.

Keripik Poker dan Uang Tunai di Meja Poker Rumah

Komputer tidak melakukannya karena ia dapat mengenali polanya sendiri dan menangkalnya.

Yang lebih aneh lagi, Pluribus menggunakan strategi yang umumnya dianggap manusia lemah. Menurut situs net Carnegie Mellon, salah satunya adalah taruhan "donk" di mana pemain mengakhiri putaran dengan panggilan dan kemudian memulai putaran berikutnya dengan taruhan.

Ini taruhan aneh dan jarang menjadi taktik yang tepat. Dalam banyak kasus, lebih baik untuk menilai taruhan atau mendapatkan uang dari pemain lain dengan taruhan kecil.

Namun, menurut Carnegie Mellon, Pluribus jauh lebih mungkin untuk bertaruh daripada manusia mana pun yang dikalahkannya. Jika tanpa alasan lain, eksperimen ini menjadi jauh lebih menarik karena dapat mengajari kita cara-cara baru untuk bermain.

Langkah selanjutnya

Untuk saat ini, tidak ada yang benar-benar perlu khawatir tentang Pluribus mengambil alih. Baik Sandholm dan Brown dapat mengambil kode dan melakukannya sesuka mereka, meskipun keduanya sepakat untuk tidak menggunakan kode untuk tujuan pertahanan.

Jadi, itu berarti tidak ada Skynet, setidaknya Terminator 2: Hari Penghakiman Versi: kapan.

Namun, ini bukan langkah terakhir dalam AI poker. Saya, secara pribadi, ingin melihat AI menggunakan teknologi Google yang sudah ada untuk mengenali gerakan tubuh dan komunikasi nonverbal untuk mulai mengenali gertakan dan memberi tahu.

Saya tidak ingin bermain melawan bot itu, tetapi itu akan menjadi percobaan yang sangat menarik untuk diamati.

Juga, saya pikir setiap profesional poker yang serius harus mempelajari apa yang dilakukan Pluribus. Sudah waktunya untuk meninjau kembali efektivitas donk dengan lebih baik. Sudah waktunya bagi manusia untuk melihat apa yang dilakukan robotic dan meningkatkan permainan kami secara keseluruhan.

Saya tidak mengatakan itu karena saya takut dengan robotic. Saya hanya tidak ingin melihat banyak pembelajaran menjadi sia-sia dan saya pribadi percaya para pemain poker dapat mengambil strategi poker yang baik dengan melihat apa yang dilakukan robotic untuk menang.

Maka beberapa pemain perlu menggunakan strategi baru itu untuk memutar ulang Pluribus dan mencari tahu bagaimana jawabannya. Kemudian para pemain dapat terus mengembangkan apa yang mereka lakukan dan seterusnya.

Kesimpulan

Semoga semua lelucon Terminator tidak ditanggapi dengan serius. Poker AI khusus tidak akan mengambil alih dunia dan, selama tidak ada yang bisa mengubahnya menjadi bot di situs poker, bahkan tidak akan merusak dompet kami.

Dengan itu, itu tidak berarti bahwa AI tidak terlalu keren dengan sendirinya. Ilmu yang mengambil keputusan adalah sesuatu yang dapat dipelajari manusia (memainkan semua skenario bagaimana-jika) dan strategi yang digunakan adalah hal-hal yang harus dipertimbangkan pemain untuk membuat permainan mereka sendiri lebih baik saat bermain poker.