De Claude AI van Anthropic speelt Pokémon op Twitch — langzaam

Dinsdagmiddag lanceerde Anthropic Claude Plays Pokémon op Twitch, een livestream van Anthropics nieuwste AI-model, Claude 3.7 Sonnet , die een potje Pokémon Red speelt. Het is een fascinerend experiment geworden, dat de mogelijkheden van de huidige AI-technologie en de reacties van mensen daarop laat zien.
AI-onderzoekers hebben allerlei videogames gebruikt, van Street Fighter tot Pictionary , om nieuwe modellen te testen — vaak meer voor de lol dan voor het nut. Maar Anthropic zei dat Pokémon een nuttige benchmark bleek te zijn voor Claude 3.7 Sonnet, dat effectief kan "denken" door de soorten puzzels die de game bevat.
Net als OpenAI's o3-mini en DeepSeek's R1 kan Claude 3.7 Sonnet "redeneren" door moeilijke uitdagingen, zoals het spelen van een videogame die is ontworpen voor kinderen. Terwijl de niet-redenerende voorganger van het model, Claude 3.5 Sonnet , het begin van Pokémon Red niet doorstond — door het huis van de speler in Pallet Town te verlaten — wist Claude 3.7 Sonnet drie gym leader badges te winnen.

De nieuwste Claude komt echter nog steeds in de problemen. Uren in de Twitch-stream werd het model afgeschrikt door een rotswand, waar het niet doorheen kon lopen, hoe hard het ook probeerde.
Een Twitch-gebruiker vatte de situatie als volgt samen: "Wie zou winnen, een computer-AI die duizenden uren in de programmering heeft gestoken, of 1 rotswand?"
Uiteindelijk besefte Claude dat het dier om de muur heen kon navigeren.
Aan de ene kant is het frustrerend om te zien hoe Claude Pokémon Red doorkruist met de snelheid van een Slowpoke , en elke stap met pijnlijke overpeinzingen overdenkt. Maar het is ook vreemd genoeg meeslepend. De linkerkant van de stream toont Claude's "gedachteproces", terwijl de rechterkant realtime gameplay laat zien.
Op een gegeven moment probeerde Claude Professor Oak in zijn laboratorium te vinden, maar hij raakte in de war omdat er nog meer NPC's in de scène aanwezig waren.
"Ik zie dat er een nieuw personage onder mij is verschenen — een personage met zwart haar en wat lijkt op een witte jas op de coördinaten (2, 10)", schreef Claude. "Dit zou Professor Oak kunnen zijn! Laat me naar beneden gaan en met hem praten."
Claude ging vervolgens per ongeluk met een andere NPC praten dan de Processor — een NPC waarmee het model al meerdere keren eerder had gesproken. Sommige van de duizend-en-een mensen in de Twitch-chat begonnen ongeduldig te worden. Anderen, met name degenen die de stream al langer dan een paar minuten bekeken, maakten zich minder zorgen.
“Jongens, kalm aan,” schreef iemand in de chat. “Voordat we Oaks lab 10 keer uit- en ingingen voordat we begrepen hoe we verder moesten.”

Voor Twitch-gebruikers die al lang Twitch gebruiken, kan het format van Anthropic's stream nostalgisch aanvoelen. Meer dan tien jaar geleden probeerden miljoenen mensen tegelijk Pokémon Red te spelen in een uniek online sociaal experiment genaamd Twitch Plays Pokémon . Elke gebruiker kon het personage van de speler besturen via de Twitch-chat, wat resulteerde in een voorspelbaar chaotische gameplay.
Sommige AI-onderzoekers hebben Twitch Plays Pokémon genoemd als inspiratie voor hun werk. In oktober 2023 publiceerde software-engineer Peter Whidden uit Seattle een YouTube-video waarin hij uitlegde hoe hij een reinforcement learning-algoritme trainde om Pokémon te spelen. Zijn AI speelde meer dan 50.000 uur met het spel voordat hij leerde om er succesvol doorheen te navigeren. Een uitdaging was dat de AI liever naar het gepixelde landschap keek dan dat hij het spel daadwerkelijk speelde.
AI-aangedreven "reenactments" van Twitch Plays Pokémon zoals Whidden's en Anthropic's zijn vermakelijk, maar tegelijkertijd ook een beetje bitterzoet. De originele stream was zo'n cruciaal moment in de geschiedenis van Twitch omdat het mensen op een onverwachte manier samenbracht. Iedereen zat in hetzelfde team en werkte naar het doel toe om het personage van de speler te laten stoppen met rondjes rennen en daadwerkelijk door het spel te komen.
In 2025 lijken we geen teamgenoten meer te zijn, maar toeschouwers die een AI-model zien proberen een spel te spelen dat velen van ons onder de knie kregen toen we vijf jaar oud waren. Het is een door AI gemotiveerde microkosmos van een grotere trend: onze online ervaringen verschuiven van gedeelde, gemeenschappelijke activiteiten naar meer solitaire.
techcrunch