"Perfekt" poker?

#1| 0

Et teoretisk spørgsmål: Er det muligt at skrive et computerprogram, der spiller "perfekt" poker?

Med "perfekt" poker mener jeg at ingen modstander(e) vil kunne vinde over programmet i længden uden at være heldig - højst spille lige op (collusion er selvfølgelig forbudt).

Programmet har lov til at bruge al tilgængelig statistik om sine modstandere, og det må gerne være randomiseret (så at det f.eks. nogle gange c-better med toppar og andre gange lader være).

Kan svaret skifte alt efter hvilken pokervariant vi taler om?

07-05-2010 20:54 #2| 0

EDIT: Mit link var åbenbart "dirty" - beklager

07-05-2010 20:58 #3| 0

Sådan et program kan ikke laves, men til gengæld er der noget du selv kan gøre for at blive uovervindelig uden at læse en eneste analyse eller teoribog:

www.youtube.com/watch?v=GZyNBK6M6BQ

07-05-2010 20:59 #4| 0

Nice job at poste et link med en trojan..

07-05-2010 21:02 #5| 0

Ban Mr_K

07-05-2010 21:07 #6| 0
OP
PN...

Hensigten med mit spørgsmål var ikke at blive mangemillionær overnight, men mere en forholdsvis uskyldig teoretisk pokerinteresse. Hvis folk ikke kan lide tanken om pokerbots, kan de bare erstatte "computerprogram" med "strategi".
07-05-2010 21:09 #7| 0
OP

Der findes (mindst) to mulige svar slags på mit spørgsmål:

1. Ja, teoretisk set findes der en mængde af "perfekte" programmer. Lad os bare sige at der er 3 programmer, og lad os kalde dem A, B og C. Så vinder A, B og C altså over ethvert andet program, og de spiller lige op mod hinanden.

2. Nej, der findes ikke et enkelt "perfekt" program. Som før har vi 3 programmer A, B og C, der vinder over alle de andre. Men A slår B, B slår C, og C slår A, så der er ikke nogen enkelt verdensmester.

I et spil som skak er det IMHO oplagt at det er mulighed 1 som er "sandheden"; men hvad med poker?

07-05-2010 21:18 #8| 0

Det er ikke muligt nej. Et menneske er ret random.

07-05-2010 21:28 #9| 0

Under forudsætning af at spillet er rakefri, så er svaret ja. Jeg tror ikke svaret afhænger af varianten af poker, men er ikke 100% sikker.

Jørn

07-05-2010 21:45 #10| 0

Alle almindelige varianter af poker er for komplekse til at der i dag kan udformes spilteoretiske optimale strategier (strategier der ikke kan tabe i længden). Dette udelukker selvfølgelig ikke at det kan ske i fremtiden.

Heads up limit holdem er så vidt jeg ved tilstrækkeligt simpelt til at der findes strategier der kommer tæt på 0 EV (og som derfor vil vinde over de fleste).

@K_B_B

Selv om mennesker agerer tilfældigt, er det ikke svært fremlægge en optimal strategi for f.eks. "kryds og bolle", der aldrig vil tabe, uanset hvor tilfældigt modstanderen spiller.

07-05-2010 22:27 #11| 0

Hvis du spiller heads up uden rake, så er der tale om et nul-sums spil med to spillere, og i teorien kan man finde en optimal løsning på sådan et spil (http://scienceblogs.com/goodmath/2008/07/back_to_math_solving_zerosum_g.php).

Problemet er at antallet af forskellige strategier hver spiller kan vælge er astronomisk stort, da det indebærer at du forud beslutter dig for hvad du vil gøre i alle tænkelige situationer hele vejen igennem hånden, allerede inden du har fået kort. Det bliver ikke nemmere når vi snakker om et no limit spil, for der skal du også forudbestemme hvad du vil gøre ved forskellige bet størrelser, hvilket bidrager med en ekstra dimension i vektorrummet af mulige strategier.

Når vi så snakker om spil med flere modstandere og vi medregner rake, så har vi et ikke-nul sum spil med flere deltagere, og der er vi udenfor hvad matematikerne i dag anser for at være universelt "løseligt".

Så en god spiller vil forsøge at få de hænder han gerne vil spille heads up, så han kommer ind i et matematisk domæne hvor han kan komme tæt på en optimal løsning. En MEGET god spiller vil ikke være nær så bange for at komme multi way, fordi han mener at han er så meget bedre end sine modstander til at spille meget komplicerede spil at han i længden vinder mere ved det end at spille heads up med andre gode spillere der også spiller tæt på optimalt.

Det er klart at siden der er et endeligt, om end astronomisk stort, antal strategier i ethvert poker spil, så må en af dem matematisk set være optimal, men at finde den løsning, er som at finde en nål i en milliard høstakke.

Hvis du vil vide mere om spilteori, så kan du blive meget klogere her: faculty.lebow.drexel.edu/McCainR//top/eco/game/game.html

07-05-2010 23:45 #12| 0

@Congo
Hvis du kan definere "perfekt poker" og udelukke bluff, så vil jeg sige ja. Det er vel efterhånden et faktum at der er ret vindende pokerbotter rundt omkring. I starten på limit poker, nu også på no limit og højere stakes. Nu kan det aldrig bevises, men jeg vil da blive meget overrasket hvis jeg ikke selv har løbet ind i mange forskellige botter i min tid ved online bordene.

Du kan jo så også spørge dig selv om det ikke netop er dette der sker med pokerspilleren der støtter sig for meget til sine trackere og stats. Nogle gør det, andre gør det ikke, og jeg tror godt at du mellem linierne kan læse min holdning. Jeg synes personligt at det tager charmen af spillet, og så sidder de 10 mand rundt om et bord og forsøger at gøre det samme. De folk er i mine øjne gode til at læse tal og justere efter det, og det er jo (desværre) sådan poker er blevet i dag. Men i den verden kan du vel godt programmere et eller andet der gør det for dig.

08-05-2010 00:41 #13| 0
Under forudsætning af at spillet er rakefri, så er svaret ja. Jeg tror ikke svaret afhænger af varianten af poker, men er ikke 100% sikker.

Jørn


Da al slags poker er symetriske nulsums spil findes der mindst en Nash ligevægt i enhver slags poker. Spiller man ligevægts strategien kan man ikke tabe (på lang sigt og uden rake). Pr defintion er ligevægts strategien i et symetrisk nulsums spil uslåelig.

Fx i sten, saks, papir: Mix mellem sten, saks og papir med 33% ssh og du kan ikke slås.

Poker er bare avanceret sten, saks, papir. Nogen kan vinde fordi andre vælger papir for tit ;)

Lisa: Poor predictable Bart, always picks rock.

Bart: Good old rock. Nothing beats that!


08-05-2010 00:54 #14| 0

@HolchKnudsen

Hvis du spiller "perfekt" papir, saks og sten, så kan du ikke slås på den lange bane, men du kan heller ikke slå nogen andre, selv om de ikke spiller optimalt. Selv i det mest ekstreme tilfælde hvor modstanderen konsekvent vælger "sten" hver gang, vil du spille lige op, da du en tredjedel af gangene får uafgjort og en tredjedel vundet og en tredjedel tabt.

Men hvis du for eksempel opdager at din modstander har en aversion imod "saks" og ikke vælger den ofte nok, så kan du slå ham ved at vælge "papir" oftere.

Det vil sige at en optimal løsning ikke indebærer at være "uslåelig" hele tiden, men til gengæld at spille optimalt ud fra din statistiske viden om hvilken strategi modstanderen vælger.

08-05-2010 00:59 #15| 0

Steel Chicken

Helt sikkert. Jeg påstod vist heller ikke andet. Men prøvede at påpege din pointe ved mit Simpsons citat

Men god og vigtig pointe du kommer med: At spille Nash ligevægten, eller GTO som de kalder det for i Mathematics of Poker, er ikke i sig selv et mål.

Men det er en god ting at tænke over med henblik på at undgå at blive "exploitet" af andre gode regs. GTO er "unexploitable" og uslåelig. Hvis du kender GTO strategien og kan justere løbende mod dine modstanderes leaks så skal du sq ikke sidde ved mine borde!!

08-05-2010 05:33 #16| 0

Ja, på et tidspunkt...

Ligesom alt andet, bliver maskinerne bedre end menneskerne, ellers er man for naiv...

Det er selvfølgelig også deromkring online poker dør ud som fast inkomst... Det bliver umuligt pga. bots som bliver sat i gang rundt omkring på site'ne hele tiden...

08-05-2010 07:12 #17| 0

HolchKnudsen rammer hovedet på sømmet.

Ved at tage udgangpunkt i en GTO strategi, så er du selvsagt unexploitable. Dvs om du i et givet spot bluffer eller valuebetter, så er du totalt indifferent med hvad Villain gør, da han ikke kan exploite dig.

Imidlertid kan du afvige fra GTO strategien hvis Villain f.eks. folder for ofte eller kalder for ofte i et givent spot. I dette tilfælde justerer du din strategi, og øger din bluff vs valuebet fordeling (altså når Villain folder for meget).

I takt med at Villain måske opdager dette, og justerer hertil, så gør man selvfølgelig selv det samme, og justerer Villain helt perfekt, jamen så er vil bare tilbage i GTO strategi. Dvs Villain kan aldrig få et edge på dig.

Anyway, det var vist bare en omskrivning af hvad HK også skrev.

08-05-2010 15:01 #18| 0

Hvad hvis villain ved at han spiller exploitable og ved hvornår vi adjuster og selv adjuster på det tidspunkt?

08-05-2010 15:39 #19| 0

HK og Jensen +1

Dog kan man sagtens tjene penge ved at spille GTO i poker da villains kan vælge dominerede actions (simpelt eksempelt: ikke vb'e nuts i pos på river, openfolde KK preflop for 100bbs HU, etc.). I sten saks papir findes der ikke dominerede actions.

@Congo

I dit eksempel med A slår B, B slår C, C slår A kan du bare vælge at spille som A 1/3 af tiden, som B af 1/3 tiden og som C 1/3 af tiden forudsat at de slår hinanden lige stort.

08-05-2010 15:41 #20| 0

Og for the record anvender gto-strategien hverken stats, trackers eller anden analyse af modstanderens spil.

09-05-2010 15:56 #21| 0
OP

@Alle,

Jeg vil bare sige tak for de gode svar:-)

Bedste ønsker fra
Congo

09-05-2010 17:06 #22| 0

Skift til plo. Det lærer en bot ikke at slå ;)

09-05-2010 20:27 #23| 0

@NoPukNoFun

PLO kan faktisk være nemmere at løse end NLHE.

Jørn

← Gå til forumoversigtenGå til toppen ↑
Skriv et svar