OpenAI vence Grok no xadrez. A partida de longa distância entre Musk e Altman

A final do Torneio de Exibição de Xadrez de IA foi encerrada ontem, quinta-feira, 7 de agosto de 2025. Este torneio de xadrez de IA, organizado pelo Google DeepMind, inaugura a nova plataforma de benchmarking Kaggle Game Arena, onde os melhores modelos de inteligência artificial de LLM competirão em diversos jogos para avaliar as capacidades estratégicas e de raciocínio complexo desenvolvidas até o momento. Os jogos, de fato, seriam benchmarks importantes para a avaliação de modelos e, até o momento, apenas alguns motores de busca como o Stockfish ou modelos como o AlphaZero são capazes de rodar em níveis ainda mais altos. Kate Olszewska e Meg Risdal, gerentes de produto do Google e da Kaggle, respectivamente, escrevem sobre o tema em um artigo publicado no blog do Google: "Os jogos oferecem um sinal claro e inequívoco de sucesso. Sua estrutura definida e resultados mensuráveis os tornam o ambiente de teste ideal para avaliar modelos e agentes. Eles forçam os modelos a demonstrar inúmeras habilidades, incluindo raciocínio estratégico, planejamento de longo prazo e adaptação dinâmica contra um oponente inteligente, fornecendo um indicador robusto de sua inteligência geral para resolução de problemas. O valor dos jogos como benchmarks é ainda mais reforçado por sua escalabilidade — a dificuldade aumenta com a inteligência do oponente — e pela capacidade de analisar e visualizar o raciocínio do modelo, oferecendo um vislumbre de seu processo de pensamento estratégico."

Modelos da Deepseek, Google, Anthropic e Moonshot AI também participaram da competição eliminatória, mas o confronto final viu a IA de Sam Altman derrotar o Grok 4 de Elon Musk por 4 a 0. Nas semifinais, o Grok derrotou o Gemini 2.5 Pro do Google no desempate, enquanto o o3 derrotou o mais ágil o4-mini por 4 a 0.
Obviamente, além da simples mensuração das capacidades dos dois modelos, o desafio assumiu um significado mais pessoal para Sam Altman e Elon Musk: dez anos atrás, de fato, os dois fundaram a OpenAI antes de Musk decidir seguir um caminho independente, criando a empresa concorrente xAI e iniciando uma ação judicial para impedir que a OpenAI se transformasse em uma organização com fins lucrativos, ao contrário do que foi estabelecido na fase de fundação.
No entanto, esse desafio entre inteligências artificiais representa um marco simbólico, e não técnico. Nenhum dos modelos envolvidos foi projetado para executar essas tarefas; na verdade, eles são projetados para escrever, gerar imagens, programar e responder até mesmo a perguntas complexas, mas falham em situações que exigem lógica rigorosa. No entanto, essa limitação demonstra que a inteligência artificial, por mais avançada que seja, ainda não atingiu o nível de inteligência que reconhecemos como verdadeiramente humana. O jogo de xadrez, com sua complexidade, representa, portanto, um teste que destaca as ambições daqueles que desenvolvem esses modelos, em vez da superioridade real das máquinas.
ilsole24ore