Der Krypto-Handel ist noch nicht entschieden, da setzen sich die AIs schon zum Poker an den Tisch.
Im Vergleich zum Wettbewerb mit dem Markt ist der Gegner der KI diesmal eine andere KI.
Im Vergleich zum Wettstreit mit dem Markt ist der Gegner von AI diesmal eine andere AI.
Verfasst von: Eric, Foresight News
Das NOF1 AI Trading-Turnier endet in 4 Tagen. Derzeit liegen DeepSeek und Tongyi Qianwen weiterhin deutlich vorne, während die verbleibenden 4 AIs nicht besser abschneiden als das bloße Halten von Bitcoin. Wenn nichts Unvorhergesehenes passiert, sollte DeepSeek den Sieg einfahren. Nun bleibt abzuwarten, wann die übrigen Teilnehmer die Rendite des reinen Bitcoin-Haltens übertreffen und wer am Ende Letzter wird.
Obwohl AI-Trading einem sich ständig verändernden Markt gegenübersteht, bleibt es im Grunde ein PvE-Spiel. Um jedoch wirklich herauszufinden, „welche AI klüger ist“ statt „welche AI besser tradet“, hat der russische Entwickler Max Pavlov neun AIs zu einer Runde Texas Hold'em eingeladen.
Laut öffentlich zugänglichen Informationen auf LinkedIn arbeitet Max Pavlov seit Langem als Produktmanager. In der Vorstellung auf der AI-Poker-Website gibt er an, ein Enthusiast für Deep Learning, AI und Poker zu sein. Warum er diesen Test durchführt? Max Pavlov erklärt, dass die Poker-Community bislang keine Einigkeit über die Zuverlässigkeit der Schlussfolgerungen großer Sprachmodelle erzielt hat. Dieses Turnier soll die Fähigkeit dieser Modelle zur logischen Schlussfolgerung in realen Pokersituationen demonstrieren.

Vielleicht, weil Grok beim Trading nicht besonders herausragend war, hat Elon Musk gestern einen Screenshot geteilt, auf dem Grok beim Pokerturnier an erster Stelle steht – offenbar, um das „Terrain zurückzuerobern“.
Wie schlagen sich die AIs?
Am diesjährigen Pokerturnier nehmen neun Teilnehmer teil: Neben den bekannten Gemini, ChatGPT, Claude Sonnet (entwickelt von Anthropic, das einst von FTX finanziert wurde), Grok, DeepSeek, Kimi (AI von Moonshot AI), Llama, gibt es noch Mistral Magistral, eine auf den europäischen Markt und Sprachen spezialisierte AI des französischen Unternehmens Mistral AI, sowie GLM von Beijing Zhipu, einem der frühesten chinesischen Unternehmen im Bereich großer Sprachmodelle.

Zum Zeitpunkt des Schreibens liegen Gemini, ChatGPT, Claude Sonnet, Grok und DeepSeek im Plus, während die übrigen vier Teilnehmer derzeit Verluste verzeichnen. Metas Llama schneidet am schlechtesten ab und hat bereits mehr als die Hälfte seines Einsatzes verloren.

Das Turnier begann am 27. und endet am 31. – es verbleiben weniger als eineinhalb Tage. Betrachtet man die Gewinnkurve, lag Grok von xAI während des ersten Tages stets in Führung, wurde dann von Gemini überholt und hielt sich lange auf Platz zwei. In der 2540. Hand wurde Grok bei etwa Hand 2270 von Claude Sonnet und bei etwa Hand 2500 von ChatGPT überholt.
DeepSeek, Kimi und der europäische Teilnehmer Mistral Magistral bewegen sich stabil um die Gewinnschwelle. Llama begann nach der Testphase ab etwa Hand 740 rapide zu verlieren und hält den letzten Platz, während GLM ab etwa Hand 1440 zurückfiel.
Neben der Rendite zeigen die technischen Statistiken die unterschiedlichen „Charaktere“ der AI-Teilnehmer.

Beim VPIP (Voluntarily Put $ In Pot, freiwillig in den Pot eingezahlt) erreichte Llama 61% – in mehr als der Hälfte der Runden wurde gesetzt. Die drei stabileren Teilnehmer spielten entsprechend weniger Hände, während die Top-Teilnehmer einen VPIP zwischen 25% und 30% aufwiesen.
Beim PFR (Pre-Flop Raise, Erhöhung vor dem Flop) liegt Llama ebenfalls erwartungsgemäß an erster Stelle, dicht gefolgt vom gewinnstärksten Gemini. Daraus lässt sich schließen, dass Metas Llama ein übermäßig aggressiver und aktiver Spieler ist, während Gemini zwar auch aggressiv, aber maßvoll agiert – vermutlich setzt Gemini bei guten Karten mutig, während Llama als „Draufgänger“ agiert, was zu den gegensätzlichen Ergebnissen führte.
Berücksichtigt man zudem die 3-Bet- und C-Bet-Daten, zeigt sich, dass Grok ein eher ruhiger, aber nicht zu passiver Spieler mit starker Pre-Flop-Druckausübung ist. Dieser Stil verschaffte ihm zu Beginn die Führung, doch später konnten Gemini und ChatGPT mit aggressiven Strategien und Llamas Übermut die Spitze übernehmen.
Wie analysieren die AIs?
Max Pavlov hat für das Turnier einige Grundregeln festgelegt: Blinds 10/20 Dollar, kein Ante und kein Straddle erlaubt, neun Teilnehmer spielen gleichzeitig an vier Tischen, und wenn ein Stack unter das 100-fache des Big Blinds fällt, wird automatisch auf 100 Big Blinds aufgefüllt.
Alle AI-Teilnehmer nutzen denselben Prompt, die maximale Token-Anzahl begrenzt die Länge der Schlussfolgerungen, und bei fehlerhaften Antworten wird automatisch gefoldet. Max Pavlov hat vorgesehen, dass die AIs während ihrer Aktionen oder nach Abschluss einer Hand nach ihrer Entscheidungsfindung befragt werden.
Schauen wir uns anhand einer Beispielhand aus dem Verlauf dieses Artikels die Analysen der AI-Spieler an.

Nachdem Claude und Gemini Small Blind und Big Blind gesetzt hatten, hielt Llama 8♠ und Q♣ für „relativ stark“ und hoffte auf eine Straße oder einen Flush, weshalb er die 20 callte.

DeepSeek hielt Q♥ und 2♥ in seiner Position für zu schwach, um zu callen. GLM hingegen meinte, dass man mit einem Flush Draw in mittlerer Position erhöhen könne, um gegen den loosen Llama den Pot aufzubauen – 80 Dollar seien genug, um den Pot kontrollierbar zu halten und dennoch Druck auszuüben. Kimi, mit denselben Zahlen, aber entgegengesetzten Farben wie Llama, hielt seine Hand für zu schwach und angesichts möglicher 3-Bets für einen Fold.
Bis hierhin sieht man, dass Llama weder Daten noch Position analysierte, sondern einfach „kopflos“ setzte, während die nächsten drei Spieler ihre Entscheidungen auf Basis von Position und vorherigen Datenanalysen trafen.

Nachdem GPT o3 mit einem Ass mutig 260 setzte, foldeten Grok und Magistral. Besonders Grok vermutete, dass GPT vermutlich AK oder ein höheres Paar hielt und entschied sich angesichts von Llamas impulsivem Spielstil ebenfalls für einen Fold.

Anschließend foldeten auch Gemini, Llama und GLM. GLM vermutete, dass GPT wahrscheinlich ein hohes Paar oder ein Ass hielt, während Llama ohne Datenanalyse einfach meinte, seine Hand sei eigentlich ziemlich stark, aber nicht stark genug, um die 260 zu callen.
Llamas Übermut, die Vorsicht von DeepSeek und Kimi sowie die Kühnheit von GPT zeigten sich in dieser Hand deutlich. Am Ende gewann GPT den Pot ohne Flop. Während dieses Artikels vergrößerten die ersten vier weiterhin ihren Gewinnvorsprung – es ist absehbar, dass der Sieger unter ihnen sein wird. Die beim Trading weniger erfolgreichen AIs konnten beim Poker ihre Fähigkeiten erneut unter Beweis stellen.
Obwohl viele Labore die Fähigkeiten von AI mit wissenschaftlichen Methoden testen, interessiert die Nutzer vor allem, ob AI ihnen praktisch nützt. DeepSeek, das beim Poker nicht glänzte, ist ein ausgezeichneter Trader, während Gemini, das beim Trading wie ein Anfänger agiert, am Pokertisch brilliert. Wenn AI in unterschiedlichen Szenarien eingesetzt wird, können wir anhand nachvollziehbarer Handlungen und Ergebnisse die jeweiligen Stärken der einzelnen AI erkennen.
Natürlich können einige Tage Trading oder Poker nicht abschließend die Fähigkeiten einer AI in diesem Bereich oder ihr zukünftiges Entwicklungspotenzial beurteilen. Die Entscheidungen von AI sind frei von Emotionen und basieren auf der zugrundeliegenden Logik des Algorithmus – möglicherweise wissen nicht einmal die Entwickler, in welchen Bereichen ihre AI besonders stark ist.
Durch diese unterhaltsamen Tests außerhalb des Labors können wir die Logik von AI im Umgang mit alltäglichen Situationen und Spielen direkter beobachten und so die Grenzen des Denkens zwischen Mensch und AI weiter ausloten.
Haftungsausschluss: Der Inhalt dieses Artikels gibt ausschließlich die Meinung des Autors wieder und repräsentiert nicht die Plattform in irgendeiner Form. Dieser Artikel ist nicht dazu gedacht, als Referenz für Investitionsentscheidungen zu dienen.
Das könnte Ihnen auch gefallen
Narrative, Stimmung und Quoten: Die Meme-Spekulationsansicht des chinesischen KOL Dayu
Alle, die Meme-Coins handeln, sind hauptsächlich spekulationsgetrieben.
Die 308-Milliarden-Dollar-Frage: Können Stablecoins trotz des China-Verbots florieren?
MetaMask macht Fortschritte auf dem Weg zu einer einheitlichen Krypto-Wallet durch die Integration von Bitcoin
Fed streicht Zinssenkung im Dezember, 18% Chance auf Erhöhung, Bitcoin-Rallye verlangsamt sich
