Pluribus, o Inteligență Artificială, învinge 12 jucători de poker profesioniști

vineri, 21 februarie 2020

Inteligența Artificială a întrecut în mod cert omul la încă unul dintre jocurile noastre preferate. Un bot de poker, conceput de cercetătorii laboratorului de inteligență artificială al Facebook și de cei de la Universitatea Carnegie Mellon, a reușit să-i învingă pe unii dintre cei mai buni jucători din lume într-o serie de jocuri de poker Texas Hold’em fără precedent, cu șase persoane la masă.

În mai bine de 12 zile și 10.000 de mâini, sistemul dotat cu Inteligență Artificială, numit Pluribus, s-a confruntat cu 12 profesioniști în două moduri diferite. Într-unul, IA a jucat contra a cinci jucători umani, iar în celălalt, cinci versiuni de IA au jucat contra unui singur jucător uman (programele de calculator nu au putut colabora în acest scenariu). Pluribus a câștigat în medie 5 dolari la fiecare mână, acumulând câștiguri orare de aproximativ 1.000 de dolari – o „marjă decisivă de câștig”, potrivit cercetătorilor.

Într-o lucrare publicată în Science, oamenii de știință din spatele Pluribus susțin că victoria este o etapă semnificativă în cercetarea inteligenței artificiale. Deși învățarea automată a atins deja niveluri supraumane în ceea ce ține de jocurile de masă precum șahul sau Go și jocurile pe calculator precum Starcraft II și Dota, Texas Hold ’em în șase persoane reprezintă, potrivit unor măsurători, un reper de dificultate mai ridicat.

În 2015, un sistem de învățare automată a învins calitățile umane la jocul Texas Hold ’em în doi jucători, însă, creșterea numărului de adversari la cinci, crește semnificativ complexitatea. Pentru a crea un program capabil să depășească această provocare, Brown și colegul său Tuomas Sandholm, profesor la CMU, au implementat câteva strategii cruciale.

În primul rând, l-au învățat pe Pluribus să joace poker, punându-l să joace împotriva propriilor copii – un proces cunoscut sub numele de self-play. Aceasta este o tehnică comună pentru antrenamentul IA, cu un sistem capabil să învețe jocul prin încercare și eroare; jucând sute de mii de mâini împotriva lui însuși. Acest proces de instruire a fost, de asemenea, extrem de eficient: Pluribus a fost creat în doar opt zile folosind un server cu 64 de nuclee echipat cu mai puțin de 512 GB RAM. Instruirea acestui program pe serverele cloud ar costa doar 150 de dolari, ceea ce îl face avantajos, comparativ cu prețul de sute de mii de dolari pentru alte sisteme de ultimă generație.

Pluribus s-a dovedit foarte bun în a-și blufa adversarii, luând în calcul profesioniștii care au jucat împotriva lui, lăudând „consecvența sa neobosită” și modul în care a scos profiturile din mâinile relativ slabe. Era bulversant de imprevizibil: o calitate fantastică la un jucător de poker. Și a făcut-o doar jucând cărți; nu există niciun element al viziunii automate sau recunoașterii faciale încorporate în Pluribus.

Sursa: theverge.com

Author: Editor

Share This Post On

Submit a Comment

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *