Het mysterieuze AI-paasei in Ari Asters 'Eddington'

De nieuwe film Eddington van horrorwonderkind Ari Aster heeft het publiek verdeeld en talloze online discussies aangewakkerd over wat de regisseur precies probeert te zeggen over onze collectieve relatie met technologie (hint: het is waarschijnlijk niet goed bedoeld). Het verhaal draait om een klein stadje in Texas dat tijdens de covid-19-pandemie in chaos vervalt door sociale media. Joaquin Phoenix speelt de rol van lokale sheriff Joe Cross, die het aan de stok krijgt met de burgemeester van het stadje, gespeeld door Pedro Pascal, terwijl de rest van de gemeenschap haar verstand verliest door diverse politieke en culturele conflicten.

Het verhaal van de film is ingewikkeld en vol subplots, maar een van de meest intrigerende verhaallijnen betreft de controversiële installatie van een nieuw datacenter nabij de stadsgrenzen. Het bedrijf achter de onheilspellende nieuwe faciliteit heeft een zeer merkwaardige naam: SolidGoldMagikarp. Deze naam blijkt te verwijzen naar een relatief obscuur concept in de ontwikkeling van kunstmatige intelligentie, bekend als "glitch tokens".

In de wereld van AI-training omvat het proces van 'tokenisatie' het vertalen van menselijke tekst naar numerieke data die door de LLM geïnterpreteerd kunnen worden. Om dit te doen, voeren onderzoekers enorme hoeveelheden menselijke tekst in softwareprogramma's in, zogenaamde 'tokenizers'. Tokenizers vertalen de ruwe data van iets dat mensen kunnen begrijpen naar geparseerde data die ontworpen zijn voor machinaal gebruik, ook wel 'tokens' genoemd. Tokens worden vervolgens ingevoerd in een taalmodel wanneer het wordt 'getraind'. Het trainingsproces omvat het leren van een algoritme om met een mens te communiceren – dit is de manier waarop chatbots zoals ChatGPT leren te reageren op de prompt van een mens en een output, oftewel een antwoord, produceren.

Tokenisatie kan een financieel voordeel opleveren voor bedrijven, omdat het de verwerking van grote hoeveelheden data efficiënter en goedkoper kan maken. Een tokenizer kan het beste worden vergeleken met een softwarecompiler die menselijke invoer vertaalt naar binaire code die een computer kan begrijpen.

Grote taalmodellen zijn gewoon voorspellende algoritmen die ontworpen zijn om taal te construeren op basis van menselijke aanwijzingen. Net als autocorrectie is ChatGPT ontworpen om woordreeksen te leren en deze vervolgens uit te spreken. "Dat is letterlijk alles wat ze doen", vertelde Jessica Rumbelow, CEO van AI-bedrijf Leap Labs, aan Gizmodo. "Dus je voert 1, 2, 3, 4 in, en het model is getraind om 5 te voorspellen", gaf ze als voorbeeld.

Tokens, die tijdens het AI-trainingsproces in LLM's worden ingevoerd, zijn een cruciaal onderdeel om een programma te leren communiceren met mensen. Er is echter een belangrijke uitzondering op deze regel: het fenomeen dat bekend staat als "glitch tokens". Rumbelow zei dat het tokensysteem "doorgaans heel goed werkt, behalve wanneer je tokens gebruikt die het model nog nooit eerder heeft gezien". Wanneer een LLM een token tegenkomt waarmee hij niet is getraind, kan hij heel vreemd gedrag in het programma vertonen.

SolidGoldMagikarp is zo'n "glitch token" die in het verleden bizar gedrag in LLM's heeft geïntroduceerd. Rumbelow kan het weten. Zij en haar onderzoekspartner, Matthew Watkins, ontdekten deze specifieke glitch token toen ze onderzoek deden naar het afwijkende tokenfenomeen. Rumbelow zegt dat toen de token in de LLM werd ingevoerd, deze bizarre resultaten opleverde. Het programma kan onzin uitkramen, vage, onheilspellende uitspraken en sentimenten uiten, of anderszins agressief en vijandig gedrag jegens de gebruiker vertonen.

"We denken dat dit gebeurt als het model die token niet heeft gezien tijdens het trainingsproces", aldus Rumbelow. De AI "weet niet wat hij met de input moet doen" omdat hij die nog nooit eerder heeft gezien, zei ze.

Waarschuwing: Spoilers volgen!

Kortom, zinnen als SolidGoldMagikarp zijn obscure uitingen die een AI-model tijdelijk gek kunnen maken. Hoe sluit SolidGoldMagikarp aan bij de thema's van Asters nieuwe film? Dat is een raadsel, maar er zijn gemakkelijk meerdere interpretaties mogelijk.

Het is opmerkelijk dat Asters films, ondanks al hun verscheidenheid, vrijwel allemaal hetzelfde einde hebben. Elke film eindigt met de krachten van de duisternis die zegevieren over de hoofdpersoon. In elk geval wordt het personage onderdeel van de samenzweringsplannen van de duistere macht. In Hereditary worden de Graham-familie hulpeloze pionnen in een demonische ceremonie van een coven. In Midsommar wordt Dani's onderdrukte woede door de Hårga ingezet als wapen tegen haar vriend. In Beau is Afraid ontsnapt het titelpersonage niet aan het verstikkende web van zijn moeder, en wordt zijn hele leven weinig meer dan de basis voor een Kafka-achtig ritueel van vernedering.

In Eddington – een film over onze problematische relatie met technologie – is de triomfantelijke duistere kracht het internet zelf, en de inwoners van het stadje – met name Joe – raken verstrikt in de datagedreven machinaties ervan. Het datacenter, de fysieke manifestatie van de dominantie van het internet over ons leven, is de echte winnaar van de film, en alle menselijke personages worden de afgezanten, pionnen of slachtoffers ervan. Asters beslissing om het datacenter te vernoemen naar een vreemd woord dat, door middel van een soort digitale bezwering, een verder gezond systeem op hol kan laten slaan, is mogelijk zijn manier om te verwijzen naar wat technologie ons allemaal lijkt aan te doen terwijl het ons leven overneemt, en het is waarschijnlijk een waarschuwing voor wat ons nog te wachten staat.