仮想通貨の取引でまだ勝敗がついていない中、AIたちがまたポーカーテーブルに集まった

Bitget

ニュース

ForesightNews 速递2025/10/30 11:53

原文を表示

著者:ForesightNews 速递

市場との駆け引きではなく、今回はAIの対戦相手が別のAIになった。

市場との駆け引きと比べて、今回はAIの対戦相手が別のAIとなった。

執筆：Eric，Foresight News

NOF1 AIトレーディング大会の終了まで残り4日となり、現在DeepSeekと通義千問が依然として大きくリードしている。残りの4つのAIはいずれも単純にbitcoinを保有するよりも成績が振るわない。特に問題がなければDeepSeekが優勝を手にする見込みで、今後は残りのAIがいつbitcoin保有のリターンを上回るか、そして誰が最下位になるかが注目される。

AIによる仮想通貨トレードは変化し続ける市場を相手にしているものの、依然としてPvEゲームといえる。本当に「どのAIがより賢いか」を競うPvPゲームとして、ロシア人のMax Pavlovは9つのAIを集めてテキサスホールデムポーカーのテーブルを囲ませた。

LinkedInで公開されている情報によると、Max Pavlovは長年プロダクトマネージャーとして働いており、AIポーカープラットフォームの紹介でもディープラーニング、AI、ポーカーの愛好家であると述べている。なぜこのようなテストを行うのかについて、Max Pavlovはポーカー界で大規模言語モデルの推論の信頼性についていまだにコンセンサスが得られていないことを挙げ、この大会はこれらの大規模言語モデルが実際のゲームでどのように推論できるかを示すものだと語っている。

Grokが仮想通貨トレードで目立った成績を残せなかったからか、Elon Muskは昨日、Grokがポーカーで首位に立っているスクリーンショットをリツイートし、「面目躍如」を狙ったようだ。

AIたちの成績は？

今回のポーカートーナメントには9名の選手が招待された。私たちがよく知るGemini、ChatGPT、Claude Sonnet（Anthropicがリリース、かつてFTXから投資を受けた）、Grok、DeepSeek、Kimi（月之暗面傘下のAI）、Llamaのほか、ヨーロッパ市場と言語に特化したフランスのMistral AIがリリースしたMistral Magistral、そして中国で最も早く大規模言語モデル研究に取り組んだ北京智谱傘下のGLMが参加している。

執筆時点で、Gemini、ChatGPT、Claude Sonnet、Grok、DeepSeekの5選手がプラス収支、残り4選手はマイナス収支となっている。MetaのLlamaは最も成績が悪く、すでに半分以上を失っている。

このトーナメントは27日から始まり、31日に終了予定で、残り1日半を切っている。収益曲線を見ると、開始から1日余りの間はxAIのGrokが常にリードしていたが、Geminiに抜かれた後も長らく2位を維持していた。2540ハンドのうち、Grokは約2270ハンドでClaude Sonnetに抜かれ、2500ハンド付近でChatGPTに抜かれた。

水面付近のDeepSeek、Kimi、ヨーロッパのMistral Magistralは比較的安定している。Llamaは試行期間終了後の約740ハンド目から急激に成績が悪化し、最下位をキープ。GLMは約1440ハンド目から脱落し始めた。

収益率以外にも、技術統計データから各AI選手の異なる「性格」が見て取れる。

VPIP（Voluntarily Put $ In Pot、自発的にチップをポットに投入する割合）では、Llama選手が61%に達し、半数以上のラウンドでベットを選択している。比較的安定した3選手は出場回数も少なく、上位選手のVPIPは25%〜30%の範囲となっている。

PFR（Pre-Flop Raise、フロップ前レイズ）では、Llamaがやはり1位、収益トップのGeminiがそれに続く。このことから、MetaのLlamaは極端にアグレッシブかつ積極的な選手であり、Geminiも比較的アグレッシブだが適度な積極性を持ち、良いハンドのときにベットを敢行し、Llamaの無謀なプレイに遭遇したことで、両者の収益が両極端になった可能性がある。

さらに3-BetやC-Betのデータを総合すると、Grokは比較的堅実だが過度に受動的ではなく、フロップ前のプレッシャーが強い選手であることが分かる。このスタイルにより序盤はリードを保ったが、その後GeminiとChatGPTのアグレッシブな戦略、Llamaの無謀さが加わり、勇敢な者が逆転してトップに立った。

AIたちはどのように分析しているのか？

Max Pavlovはこの大会にいくつかの基本ルールを設定した。ブラインドは10/20ドル、アンティなし、ストラドルも不可。9選手が同時に4テーブルでプレイし、チップがビッグブラインドの100倍を下回ると自動的に100BBまで補充される。

また、すべてのAI選手は同じプロンプトを使用し、最大トークン数を設定して推論の長さを制限、応答が異常な場合は自動的にフォールドとなる。Max PavlovはAIがアクションを起こす際やハンド終了後に、その意思決定プロセスをAIに尋ねる設計をしている。

ここでは、執筆時に行われた1ハンドを例にAIプレイヤーたちの分析を見てみよう。

ClaudeとGeminiがスモールブラインドとビッグブラインドを分けた後、Llamaはスペード8とクラブQのハンドが「比較的強い」と判断し、ストレートやフラッシュを狙えるとして20でコールした。

DeepSeekはハートQ・2は自分のポジションでは弱すぎてコールに値しないと判断。GLMはミドルポジションで同じスートを持っているため、ルースなLlamaに対してポットを構築するためにレイズできると考え、80ドルでポットをコントロールしつつ十分なプレッシャーを与えられるとした。KimiはLlamaと同じ数字でスートが逆のハンドを持っていたが、ハンドが弱く、後続の3-Betのプレッシャーもあるためコールに値しないと判断した。

ここまでで、Llamaはデータやポジション分析をせず、ほぼ「無思考」でベットしているのに対し、後続の3名はポジションや過去のデータ分析に基づいて判断していることが分かる。

GPT o3がAを持って大胆に260でベットした後、GrokとMagistralはともにフォールドを選択。特にGrokはGPTがAKや自分より大きなペアを持っていると推測し、さらにLlamaの無謀なプレイも考慮してフォールドを選んだ。

その後、Gemini、Llama、GLMもフォールドを選択。GLMはGPTが高確率で大きなペアかAを持っていると判断し、Llamaはデータ分析をせず、単に自分のハンドが強いと感じたが260のベットにコールするほどではないと考えた。

Llamaの無謀さ、DeepSeekやKimiの慎重さ、GPTの大胆さがこのハンドで如実に表れ、結局フロップ前にGPTがポットを獲得した。この記事執筆中も上位4名の利益は拡大し続けており、順調にいけば優勝はこの4名の中から生まれるだろう。仮想通貨トレードで振るわなかったAIたちも、ポーカーでその実力を再証明した。

多くのラボが科学的な方法でAIの能力をテストしているが、ユーザーにとってはAIが自分の役に立つかどうかがより重要だ。ポーカーで成績が振るわないDeepSeekは優れたトレーダーであり、トレードで「養分」だったGeminiはポーカーテーブルで大活躍している。AIが異なるシーンに登場することで、私たちは理解できる行動や結果を通じて、それぞれのAIが得意とする分野を知ることができる。

もちろん、数日間のトレードやポーカーだけで、あるAIのこの分野での能力や将来的な進化を断定することはできない。AIの意思決定には感情的な要素がなく、そのプロセスはアルゴリズムの根本的なロジックに依存しているため、モデル開発者ですら自分のAIがどの分野に強いのか把握できていない場合もある。

このようなラボの外で行われるエンターテインメント性の高いテストを通じて、私たちはAIが日常的な事柄やゲームにどのようなロジックで対応するかを直感的に観察でき、逆に人間とAIの思考の境界をさらに広げることができる。

免責事項：本記事の内容はあくまでも筆者の意見を反映したものであり、いかなる立場においても当プラットフォームを代表するものではありません。また、本記事は投資判断の参考となることを目的としたものではありません。

PoolX: 資産をロックして新しいトークンをゲット

最大12%のAPR！エアドロップを継続的に獲得しましょう！

今すぐロック