Оптимальный колл

Тема в разделе "Математика покера", создана пользователем MrTwister, 8 июл 2013.

  1. MrTwister

    MrTwister Продвинутый

    0
    965
    +132 / -0
    В прошлой статье мы изучали оптимальную стратегию ставок, если соперник способен эксплуатировать наши слабости. Здесь мы будем разбирать оптимальную частоту колла.

    Когда ваш оппонент ставит, а вы не собираетесь повышать, то вам предстоит выбрать только между коллом и фолдом. Если в ваших действиях отсутствует баланс, например, на ривере вы отвечаете слишком часто, то соперник может использовать этот огрех, когда станет всегда (или никогда) делать ставку.

    Оптимальный-колл.jpg


    Обычно в такой ситуации перед принятием решения нам следует выполнить следующие операции:
    1. определить, с какими руками он будет ставить;
    2. вычислить, как часто он бьет нашу руку;
    3. посчитать ожидаемую выгоду колла.
    В данном примере мы уже сделали первый шаг, прикинув, что соперник окажется старше в 20% случаев. Сейчас мы можем перейти к следующим шагам, в частности, к пункту №2, а затем на этой основе оценить прибыльность своего колла.

    Однако здесь существует одна проблема. Данный подход сделает нашу стратегию довольно предсказуемой. Другими словами, с блафф-катчером на ривере в такой ситуации мы будем выбирать только между коллом и фолдом. Если оппонент это подметит, то сможет нас эксплуатировать, блефуя в таких случаях чаще или реже.

    Таким образом, суть данного вопроса в том, чтобы найти оптимальную частоту колла. Это в свою очередь позволит нам избежать эксплуатирования со стороны оппонента.

    Для достижения поставленной цели нам необходимо несколько скорректировать обозначенные шаги в изначальном плане:
    1. определить, с какими руками он будет ставить;
    2. вычислить, сколько рук нас бьют;
    3. подсчитать оптимальную частоту колла.
    Учитывая, что первые две операции уже выполнены, предлагаю разобраться с третьей. Во-первых, понятие «оптимальная» здесь подразумевает «неэксплуатируемую». В данной ситуации наше EV колла будет функцией в двух вариациях:

    1) Pflush - это вероятность, что оппонент нас бьет, и равна 20%;

    2) b - это частота блефа нашего соперника. Заметьте, что он явно всегда будет ставить с флешем, поэтому эта вероятность не отражает ситуаций, когда он соберет данную комбинацию.

    Учитывая то, что оппонент всегда будет ставить с флешем, используя теорему Байеса, для начала вычислим величину «Pr» – вероятность того, что у оппонента лучшая рука, когда он ставит:

    Вставив в уравнение известную нам величину Pфлеш, мы получаем:

    EV нашего колла сейчас равняется:

    Упростив эту формулу, мы получаем следующее выражение:

    Мы можем построить график данного уравнения:

    call-graf-1.jpg

    Мы понимаем, что если оппонент блефует меньше, чем в 12.5% случаев, то отвечать невыгодно, и, наоборот, если он блефует чаще, то колл становится прибыльным. К несчастью, мы не в курсе, как часто он блефует, а учитывая, что мы играем против соперника, который способен подстраиваться под нашу стратегию, нам придется использовать другой метод.

    Взглянув на график, мы замечаем, что в зависимости от частоты блефа оппонента мы вправе играть эксплуатируемо, всегда отвечая или всегда сбрасывая. Схожим образом, если мы станем отвечать определенный процент времени, то наш оппонент может использовать стратегию, по которой он либо никогда не будет блефовать, либо начнет ставить в 100% случаев.

    Например, если оппоненту выгодно блефовать в 10% случаев, то блефовать в 100% случаев будет еще прибыльнее, если в ответ на это мы не станем подстраивать свою стратегию. Учитывая, что нам нужно найти постоянную оптимальную стратегию, мы будем использовать известные нам параметры и для начала найдем EV оппонента в ситуациях, когда он никогда не блефует и когда блефует постоянно.

    Если оппонент никогда не блефует, а мы отвечаем в «c» % случаев, то EV оппонента будет выглядеть следующим образом:

    Прошу заметить, что мы умножаем на 0,2, потому что оппонент будет ставить только тогда, когда у него флеш, а это в данном примере будет происходить в 20% случаев. Если он не ставит, то не забирает банк.

    Если оппонент всегда блефует, то лучшая рука у него окажется лишь в 20% случаев. Теперь EV оппонента будет выглядеть следующим образом:

    Упростим до:


    Цель в том, чтобы наша стратегия стала неэксплуатируемой. Это означает, что оппонент не должен получать преимущество, используя ту или иную стратегию. Для этого нам необходимо решить следующее уравнение и найти значение «с»:

    Решив это простое линейное уравнение, мы получаем «с» = 0,5.



    Таким образом, оптимальная частота колла на ривере равняется 50%. Эта цифра будет правильной, если флеш у оппонента окажется в 20% случаев. В действительности, она останется правильной во всех случаях, когда вероятность флеша у оппонента ниже 67%. Если флеш у оппонента будет чаще, то оптимальной стратегией для нас станет постоянный фолд, так как в данном случае он не сможет достаточно часто блефовать, и мы будет вынуждены использовать этот подход.

    Кроме того, важно понимать, что это значение в 50% будет правильным только тогда, когда оппонент делает ставку размером в банк. Оптимальная частота колла будет меняться, в зависимости от размера ставки по отношению к банку. Чем меньше размер ставки, тем чаще вам следует отвечать, а чем больше размер ставки, тем чаще надо падать.

    Дэвид Склански в своей книге «Теория покера» объясняет второй путь для получения таких же результатов. Если оппонент получает шансы 1 к 1 на свой блеф (учитывая, что он делает ставку размером в банк), это и будет вашим соотношением колла и фолда. Именно поэтому в данном примере оптимальной стратегией будет колл в 50% случаев.

    Допустим, что в другом примере соперник ставит половину банка, и вы раздумываете над коллом или фолдом. Учитывая, что оппонент получает шансы 2 к 1, то это также будет вашим соотношением колла и фолда. Итак, здесь вам следует отвечать в 2/3 случаев.
    Каталог статей.png
     
    Последнее редактирование модератором: 13 ноя 2018
  2. Alexs635

    Alexs635 Прохожу мимо

    0
    22
    +0 / -0
    Ничего себе расчеты, а я думал, что покер попроще будет.