“GTO”とは何か

ポーカーを勉強している方は、どこかで一度は耳にするであろう概念”GTO”。
非常に複雑なものですが、ポーカーを強くなろうと思った場合、必ず有用になってくる概念です。
本記事では、その走りとして、「そもそもGTOってよく聞くけど何なの?」「なぜGTOが有用なの?」という大枠のお話をしていければと考えていますので、ぜひ最後までお読みください。

GTOとは?

GTOとは、”Game Theory Optimal”の略称で、日本語に直訳すれば「ゲーム理論最適」というような感じになるでしょうか。
すなわち、ゲーム理論に基づいた最適行動をとる戦略のことを、いわゆるGTO戦略として指すと言えますが、これをもう少しかみ砕いてみましょう。

ゲーム理論における最適行動をお互いが取った場合、お互いの一方が戦略を変えたところで、それ以上利益を上げることができない均衡状態となります。
つまり、誤解を恐れずにいうのであれば、その戦略を取っていれば、相手がどんな戦略を取ってきたとしても損をすることはないというのがGTO戦略となるわけです。

GTOの例

わかりやすく、じゃんけんのゲームでGTOを考えてみましょう。
じゃんけんのGTOは、グー・チョキ・パーすべての手を均等な割合で出すことです。
そうすると、相手はどう戦略を工夫して変えても、利益を産み出すことはできなくなりますね。

これをもし、グー50%・チョキ25%・パー25%という戦略をとった場合どうなるでしょうか?
その場合、相手が常にパーを出すという戦略を取ってくることで、相手に利益をあげられてしまい、GTOとは言えません。

GTOの限界

さて、ここまで聞くと、GTOというのは無敵の戦略のように思えるかもしれませんが、最大的な利益をあげるという意味では完全ではありません。

というのも、また同じくじゃんけんの例で考えてみましょう。
もし、必ずグーを100%の確率で出す相手とじゃんけんをするケースを考えてみます。

ここでの最適な戦略は、当然”100%の頻度でパーを出す”ことで、それが最も利益を生む戦略です。
しかし、こういった相手に対してもGTO戦略をとったとすると、確かに一方的に損はしないですが、利益をあげることも全くできませんね。

これがGTOの限界で、相手側の戦略に何かしらのリークがある場合は、GTO戦略ではないつけ込み戦略を取るほうが、利益が最大化されることが往々にしてあります。

実践的には

一方で実践的には、特にUnknownな相手の場合、その相手が抱えるリークというのはすぐには発見できないでしょう。
そのような状況下でも、「恐らく相手はこういったリークがあるであろう」という想定のもと、搾取に走ることもでいないわけではありません。

ただ、それは一方でリスクも含みます。
じゃんけんの例でいうと、
「相手はグーを出す確率が高いから、こっちはずっとパーでいこう」
という戦略を取った時に、もしその読みが外れていて、相手がチョキを出す可能性が高かった場合には、搾取されるのはこちら側になります。

一方、GTO戦略というのは、こちら側が正しく実現できれば不利益を被らないことが保証されています。
そのため、例えば相手のレベルや弱点がわからない場合にはGTO戦略を用い、何かしらの弱点が想定できた場合はそこにつけこむ戦略へシフトする、といった戦い方が一つ想定されます。

本日のまとめ

・GTO戦略とは、ゲーム理論に基づく最適戦略のこと
・ただし、必ずしも最大利益が保証される戦略ではなく、リークが明確な相手にはGTO戦略からはなれたつけこみ戦略が有用となる
・一方でリークの明確でないunknownに対しては、GTO戦略をベースとした戦い方は有効なものとなりうる