Poker ReBel Baru Fb AI Mencetak Skor Lebih Tinggi dari Pluribus

ReBel Poker AI dari Facebook
ReBel Poker AI dari Facebook
Fb telah mengembangkan sistem AI baru yang disebut ReBel yang berkinerja lebih baik daripada bot poker sebelumnya, Pluribus.

Hanya satu tahun setelah mengembangkan Pluribus (yang mengumpulkan complete $ 1.000 per jam ketika bersaing dengan professional manusia), para peneliti Fb telah menciptakan ReBel. Ini baru Sistem AI yang mempelajari poker dengan cara baru dan lebih efisien, dan telah mencapai skor agregat yang lebih tinggi daripada Pluribus.

Cara Kerja Pemberontak AI

ReBel AI didasarkan pada mannequin umum pembelajaran penguatan yang memungkinkannya untuk belajar recreation dengan cepat dari awal. Apa yang membedakan sistem ini dari AI lain adalah bahwa ada dua mannequin yang dimainkan, satu mewakili nilai dan satu lagi mewakili nilai.

Ini menciptakan sesuatu yang disebut "negara kepercayaan publik" yang memungkinkan AI untuk merancang probabilitas berdasarkan semua aspek yang relevan dalam permainan. Ini termasuk pot keseluruhan dan berbagai kemungkinan hasil dari tangan. Karena ReBel menggunakan standing kepercayaan publik alih-alih “pengetahuan area spesifik” yang digunakan oleh program AI lainnya, ia memiliki aplikasi yang lebih umum.

Hal yang paling menarik tentang ReBel bukanlah kemungkinan itu bisa mengalahkan beberapa pemain poker terbaik di dunia. Sebenarnya, AI inilah yang awalnya dikembangkan untuk menyelesaikan permainan poker memiliki aplikasi lain dari yang dirasakan – dalam pengembangan mobil self-driving dan tindakan pencegahan cybersecurity. Bahkan, satu bot poker sebenarnya disewa oleh Pentagon untuk membantu perencanaan militer!

Taking part in Towards Poker Professional

Untuk menguji keberhasilan ReBel AI, sistem bersaing melawan Dong Kim yang dikenal luas sebagai salah satu pemain terbaik di komunitas poker. Tiga pemain prime lainnya bermain melawan ReBel, dan hasilnya sangat menarik lebih dari 7.500 tangan.

Dapatkan $ 20 Gratis di Global Poker

ReBel berhasil bermain dengan kecepatan yang jauh lebih cepat daripada para pemain manusia, membutuhkan waktu kurang dari lima detik untuk mengambil keputusan. Selama persidangan, AI mendarat skor agregat 165 sementara skor Kim adalah 136. Sebagai referensi, bot poker pertama Fb, skor Pluribus 147.

Haruskah Pemain Peduli?

Fb telah menyatakan hal itu tidak akan merilis foundation kode Pemberontak. Jadi pemain poker on-line dapat yakin bahwa mereka tidak akan pernah menemukan bot AI pemecah recreation ini di dunia nyata.

Namun, ini membawa kita ke masalah bot poker yang lebih umum yang dapat ditemukan di dunia recreation on-line. Banyak pemain bertanya-tanya apakah peretas akan dapat menciptakan kembali jenis AI tingkat atas dalam jenis bot yang berhasil memasuki permainan poker on-line.

Untuk mengembangkan AI seperti Pluribus dan ReBel, penelitian yang luas harus dilakukan. Bahkan, Pluribus diciptakan bersama dengan para peneliti di Universitas Carnegie Mellon. Peneliti-peneliti ilmiah ini telah berupaya keras untuk mengembangkan perangkat lunak jenis ini sementara para peneliti Fb kemungkinan akan dibayar sangat mahal untuk melakukan hal yang sama. Sangat tidak mungkin bahwa orang yang sama mengembangkan bot poker on-line di ruang bawah tanah mereka memiliki waktu dan uang yang sama untuk dimasukkan ke dalam proyek jenis ini.

Ada juga fakta yang dimiliki oleh banyak situs poker on-line seluruh tim berkomitmen untuk mengidentifikasi bot. Jadi, bahkan jika AI poker yang sangat canggih dilepaskan ke alam liar, ada proses di sebagian besar ruang poker untuk mematikannya segera.

Main Sekarang di Global Poker