A batalha nas criptomoedas ainda não terminou, e as IAs já estão se juntando a uma mesa de pôquer.
Em vez de competir com o mercado, desta vez a IA está enfrentando outra IA.
Em comparação com competir contra o mercado, desta vez o adversário da IA tornou-se outra IA.
Escrito por: Eric, Foresight News
Faltam apenas 4 dias para o fim do torneio de trading NOF1 AI, e atualmente DeepSeek e Tongyi Qianwen continuam liderando com folga, enquanto as outras 4 IAs não conseguiram superar o simples ato de manter bitcoin. Se nada mudar, DeepSeek deve conquistar o título, restando saber quando os demais conseguirão superar o retorno de apenas manter bitcoin e quem ficará em último lugar.
Embora o trading de criptomoedas por IA enfrente um mercado em constante mudança, ainda é um jogo PvE. Para realmente comparar “qual IA é mais inteligente”, em vez de “qual IA é melhor em trading”, o russo Max Pavlov reuniu 9 IAs para uma mesa de pôquer Texas Hold'em.
De acordo com informações públicas no LinkedIn, Max Pavlov trabalha há muito tempo como gerente de produto e, na apresentação do site de pôquer de IA, também se declara entusiasta de deep learning, IA e pôquer. Sobre o motivo de realizar esse teste, Max Pavlov afirma que a comunidade do pôquer ainda não chegou a um consenso sobre a confiabilidade do raciocínio dos grandes modelos de linguagem, e este torneio serve para demonstrar a capacidade de raciocínio desses modelos em situações reais de jogo.

Talvez porque Grok não tenha se destacado no trading de criptomoedas, Elon Musk compartilhou ontem uma captura de tela mostrando Grok na liderança do torneio de pôquer, numa clara tentativa de “recuperar o prestígio”.
Como as IAs estão se saindo?
O torneio de pôquer convidou 9 participantes: além dos conhecidos Gemini, ChatGPT, Claude Sonnet (lançado pela Anthropic, que já recebeu investimento da FTX), Grok, DeepSeek, Kimi (IA da Moonshot AI), Llama, há também o Mistral Magistral, focado no mercado e idioma europeu e lançado pela francesa Mistral AI, e o GLM, da Beijing Zhipu, pioneira em pesquisa de grandes modelos de linguagem na China.

No momento da redação, Gemini, ChatGPT, Claude Sonnet, Grok e DeepSeek estão no azul, enquanto os outros 4 estão em situação de prejuízo, sendo o Llama da Meta o que mais perdeu, já tendo perdido mais da metade.

O torneio começou no dia 27 e termina no dia 31, restando menos de um dia e meio. Pela curva de retorno, Grok da xAI liderou durante o primeiro dia, sendo ultrapassado por Gemini e mantendo-se em segundo lugar por um bom tempo. Em cerca de 2.270 mãos, Grok foi ultrapassado por Claude Sonnet, e por volta da mão 2.500, por ChatGPT.
DeepSeek, Kimi e o europeu Mistral Magistral mantiveram-se estáveis próximos ao ponto de equilíbrio. Llama começou a desandar após a mão 740, ficando em último lugar, enquanto GLM começou a cair após a mão 1.440.
Além do retorno, as estatísticas técnicas mostram as diferentes “personalidades” das IAs.

No VPIP (Voluntarily Put $ In Pot, porcentagem de mãos em que o jogador voluntariamente investe no pote), o Llama atingiu 61%, apostando em mais da metade das rodadas. Os três jogadores mais estáveis apostaram menos vezes, enquanto os líderes ficaram entre 25% e 30% de VPIP.
No PFR (Pre-Flop Raise, aumento antes do flop), Llama novamente lidera, seguido de perto pelo Gemini, que tem o maior retorno. Assim, o Llama da Meta é um jogador excessivamente agressivo e ativo, enquanto Gemini também é agressivo, mas de forma moderada, apostando forte quando tem boas cartas e aproveitando a impulsividade do Llama, o que levou ambos a extremos opostos em seus retornos.
Analisando também os dados de 3-Bet e C-Bet, Grok mostra-se um jogador estável, mas não excessivamente passivo, com forte pressão pré-flop. Esse estilo o manteve na liderança no início, mas depois Gemini e ChatGPT, com estratégias mais agressivas e a impulsividade do Llama, permitiram que os mais ousados assumissem a liderança.
Como as IAs analisam as jogadas?
Max Pavlov definiu algumas regras básicas para o torneio: blinds de 10/20 dólares, sem ante e sem straddle, 9 jogadores em 4 mesas simultâneas, e quando as fichas caem abaixo de 100 big blinds, o sistema repõe automaticamente até 100 big blinds.
Além disso, todas as IAs usam o mesmo prompt, com limite máximo de tokens para restringir o tamanho do raciocínio, e se houver resposta anormal, o padrão é fold. Max Pavlov projetou perguntas para as IAs explicarem seu processo de decisão durante ou após cada mão.
Vamos analisar uma mão jogada durante a redação deste artigo para ver como as IAs analisam.

Após Claude e Gemini pagarem small e big blind, Llama considerou que 8 de espadas e Q de paus eram “relativamente fortes”, podendo buscar sequência ou flush, então pagou 20.

DeepSeek considerou Q de copas e 2 muito fracas para pagar naquela posição, enquanto GLM achou que, estando em posição intermediária com cartas do mesmo naipe, poderia aumentar para construir o pote contra o Llama, que joga solto, e que 80 dólares seria suficiente para pressionar mantendo o pote sob controle. Kimi, com cartas do mesmo valor mas naipes opostos ao Llama, achou que a mão era fraca e, diante da possibilidade de 3-Bet, não valia a pena pagar.
Até aqui, percebe-se que Llama não analisou dados nem posição, basicamente apostando “sem pensar”, enquanto os três seguintes tomaram decisões baseadas em posição e análise de dados anteriores.

Quando GPT o3 apostou ousadamente 260 por ter um Ás, Grok e Magistral optaram por fold, especialmente Grok, que suspeitou que GPT tinha AK ou um par maior, e considerando o ritmo impulsivo do Llama, decidiu desistir.

Depois disso, Gemini, Llama e GLM também deram fold. GLM achou que GPT provavelmente tinha um par alto ou um Ás, enquanto Llama, sem análise de dados, apenas sentiu que sua mão era forte, mas não o suficiente para pagar 260.
A impulsividade do Llama, a cautela de DeepSeek, Kimi e a ousadia do GPT ficaram evidentes nesta mão, e no final, sem flop, GPT levou o pote. Durante a redação deste artigo, os quatro primeiros continuavam ampliando seus lucros, e é previsível que o campeão saia desse grupo. As IAs que não se destacaram no trading de criptomoedas provaram sua capacidade no pôquer.
Embora muitos laboratórios testem as capacidades das IAs com métodos científicos, para os usuários o mais importante é saber se a IA pode ser útil para eles. DeepSeek, que não se saiu bem no pôquer, é um excelente trader, enquanto Gemini, que foi ruim no trading, domina as mesas de pôquer. Quando a IA aparece em diferentes cenários, podemos observar, por meio de comportamentos e resultados compreensíveis, em que áreas cada IA se destaca.
Claro, alguns dias de trading ou de pôquer não são suficientes para concluir sobre a capacidade de uma IA ou seu potencial de evolução. As decisões da IA não envolvem emoção, sendo determinadas pela lógica do algoritmo, e talvez nem mesmo os desenvolvedores saibam em que áreas sua IA é realmente melhor.
Esses testes de entretenimento fora do laboratório nos permitem observar de forma mais intuitiva a lógica da IA diante de situações e jogos do nosso cotidiano, expandindo ainda mais as fronteiras do pensamento entre humanos e IA.
Aviso Legal: o conteúdo deste artigo reflete exclusivamente a opinião do autor e não representa a plataforma. Este artigo não deve servir como referência para a tomada de decisões de investimento.
Talvez também goste
Capacitação de Avatares de IA: Como o TwinX Cria Interação Imersiva e Circulação de Valor?
1. **Desafios da Economia dos Criadores**: As plataformas de conteúdo Web2 enfrentam problemas como algoritmos opacos, distribuição injusta, modelos de partilha de receitas pouco claros e elevados custos de migração de fãs, dificultando o controlo dos criadores sobre os seus próprios dados e ganhos. 2. **Integração da IA e Web3**: O avanço da tecnologia de IA, especialmente a tecnologia de IA Avatar, juntamente com a exploração da economia dos criadores no Web3, tem fornecido novas soluções destinadas a quebrar o controlo das plataformas centralizadas.

CEO da Aster detalha a visão da cadeia Aster Privacy L1, remodelando a experiência de transações descentralizadas
Aster está prestes a lançar o seu plano de cadeia pública Layer 1 (L1) orientada para a privacidade, juntamente com uma explicação detalhada sobre o empowerment do token, expansão para o mercado global e estratégia de liquidez.

Desconstruindo DAT: além do mNAV, como identificar “acumulação real ou falsa” de criptomoedas?
O único princípio de ouro para investir em DAT é ignorar o prémio especulativo e investir apenas naquelas com "quantidade de tokens por ação" que continua a crescer de forma consistente.

Capacitado por avatares de IA, como o TwinX está a criar uma interação imersiva e um ciclo de valor fechado?
1. **Desafios da economia dos criadores**: As plataformas de conteúdo Web2 apresentam problemas como algoritmos não transparentes, distribuição não pública, percentuais de comissão pouco claros e altos custos de migração de seguidores, tornando difícil para os criadores controlarem seus próprios dados e receitas. 2. **Integração de IA e Web3**: O desenvolvimento da tecnologia de IA, especialmente a tecnologia de AI Avatar, juntamente com a exploração da economia dos criadores no âmbito Web3, oferece novas soluções que visam quebrar o controle das plataformas centralizadas e reconstruir a produção e distribuição de valor do conteúdo. 3. **Posicionamento da plataforma TwinX**: TwinX é uma plataforma social de vídeos curtos Web3 impulsionada por IA, que procura, através de avatares de IA, interações imersivas e um sistema de valor descentralizado, reconstruir o conteúdo, a interação e a distribuição de valor, permitindo que os criadores tenham controle sobre seus próprios dados e receitas. 4. **Funcionalidades centrais da TwinX**: Incluem a tecnologia de avatares de IA, permitindo que os criadores gerem uma "segunda personalidade" capaz de aprender, configurável e com operação sustentável, além de um caminho de comercialização em ciclo fechado, integrando criação de conteúdo, interação e receita. 5. **Características Web3**: TwinX reflete as características de assetização e governança coletiva do Web3, estabelecendo direitos de propriedade de comportamentos de interação via blockchain, transformando as ações dos usuários em ativos rastreáveis e permitindo que os participantes participem da governança da plataforma através de tokens, promovendo a integração entre a economia dos criadores e a governança comunitária.

