El misterioso Easter Egg de IA en el corazón de 'Eddington' de Ari Aster

La nueva película del prodigio del terror Ari Aster, Eddington, ha dividido al público y generado un amplio debate en línea sobre qué pretende decir el director sobre nuestra relación colectiva con la tecnología (pista: probablemente no sea buena). La historia se centra en un pequeño pueblo de Texas que se hunde en el caos provocado por las redes sociales durante la pandemia de COVID-19. La película está protagonizada por Joaquin Phoenix como el sheriff local Joe Cross, quien se enfrenta al alcalde del pueblo, interpretado por Pedro Pascal, mientras el resto de la comunidad pierde la cabeza por diversas disputas políticas y culturales.
La historia de la película es compleja y está llena de subtramas, pero uno de los hilos narrativos más intrigantes gira en torno a la controvertida instalación de un nuevo centro de datos cerca de los límites de la ciudad. La empresa responsable de esta siniestra instalación tiene un nombre muy peculiar: SolidGoldMagikarp. Resulta que este nombre parece hacer referencia a un concepto relativamente desconocido en el desarrollo de inteligencia artificial conocido como "glitch tokens".
En el mundo del entrenamiento de IA, el proceso de "tokenización" implica traducir texto humano a datos numéricos que el LLM pueda interpretar. Para ello, los investigadores introducen grandes cantidades de texto humano en programas de software llamados "tokenizadores". Los tokenizadores traducen los datos sin procesar, de algo comprensible para los humanos, a datos analizados diseñados para el consumo de máquinas, denominados "tokens". Los tokens se introducen en un modelo de lenguaje durante su "entrenamiento". El proceso de entrenamiento implica enseñar a un algoritmo a interactuar con un humano; así es como los chatbots como ChatGPT aprenden a responder a una solicitud humana y a generar un resultado o respuesta.
La tokenización puede tener un beneficio fiscal para las empresas, ya que puede hacer que el esfuerzo de procesar grandes cantidades de datos sea más eficiente y menos costoso, y un tokenizador podría compararse acertadamente con un compilador de software que traduce la entrada humana en código binario que una computadora puede entender.
Los modelos lingüísticos extensos son simplemente algoritmos predictivos diseñados para construir lenguaje a partir de indicaciones humanas. Al igual que el autocorrector, ChatGPT está diseñado para aprender secuencias de palabras y repetirlas. "Eso es literalmente todo lo que hacen", explicó Jessica Rumbelow, directora ejecutiva de la empresa de inteligencia artificial Leap Labs, a Gizmodo. "Por ejemplo, si introduces 1, 2, 3, 4, el modelo se entrena para predecir 5", ofreció como ejemplo.
Los tokens, introducidos en los LLM durante el proceso de entrenamiento de la IA, son fundamentales para enseñar a un programa a comunicarse con los humanos. Sin embargo, existe una excepción clave a esta regla: el fenómeno conocido como "tokens de fallo". Rumbelow afirmó que el sistema de tokens suele funcionar muy bien, excepto cuando se trata de tokens que el modelo nunca ha visto. Cuando un LLM encuentra un token con el que no fue entrenado, puede producir un comportamiento muy extraño en el programa.
SolidGoldMagikarp es uno de esos "tokens de falla" que, en el pasado, ha introducido comportamientos extraños en los LLM. Rumbelow lo sabría. Ella y su socio de investigación, Matthew Watkins, descubrieron este token de falla en particular cuando investigaban el fenómeno de los tokens anómalos. Rumbelow afirma que, al introducir el token en el LLM, se produjeron resultados extraños. El programa puede balbucear sinsentidos, emitir frases y sentimientos indirectos y ominosos, o mostrar un comportamiento agresivo y hostil hacia el usuario.
"Creemos que es lo que ocurre cuando el modelo no ha visto ese token durante su entrenamiento", dijo Rumbelow. La IA "no sabe qué hacer con la información" porque nunca la ha visto antes, añadió.
Advertencia: ¡Spoilers a continuación!En resumen, frases como SolidGoldMagikarp son expresiones confusas que pueden volver loco temporalmente a un modelo de IA. ¿Cómo se relaciona SolidGoldMagikarp con los temas de la nueva película de Aster? Nadie lo sabe, pero se podrían aventurar varias interpretaciones.
Cabe destacar que, a pesar de su variedad, las películas de Aster tienen prácticamente el mismo final. Cada película concluye con las fuerzas de la oscuridad triunfando sobre el protagonista de la historia. En cada caso, el personaje se convierte en parte de los planes conspirativos de la fuerza oscura. En Hereditary , la familia Graham se convierte en peones indefensos en una ceremonia demoníaca de un aquelarre. En Midsommar , la ira reprimida de Dani es utilizada como arma contra su novio por los Hårga. En Beau is Afraid , el personaje principal no logra escapar de la asfixiante red de su madre, y toda su vida se convierte en poco más que la base de un ritual de humillación kafkiano.
En Eddington, una película sobre nuestra problemática relación con la tecnología, la fuerza oscura triunfante es internet, y los habitantes del pueblo, en particular Joe, se ven atrapados en sus maquinaciones basadas en datos. El centro de datos, la manifestación física del dominio de internet sobre nuestras vidas, es el verdadero ganador de la película, y todos los personajes humanos se convierten en sus emisarios, peones o víctimas. La decisión de Aster de nombrar el centro de datos con una palabra pícara que, mediante una especie de conjuro digital, puede descontrolar un sistema por lo demás sensato, podría ser su forma de referirse a lo que la tecnología parece habernos hecho a todos al apoderarse de nuestras vidas, y probablemente sea una advertencia de lo que está por venir.
gizmodo