Las inteligencias artificiales están en todas partes, desde asistentes virtuales hasta sistemas complejos que debaten entre la ética y el futuro de la humanidad. Pero, ¿qué pasa cuando una IA se enfrenta a un videojuego clásico como Pokémon Rojo? Peter Whidden decidió averiguarlo y entrenó una IA para que completara el mítico juego. El resultado fue… inesperado, por decir lo menos.
Whidden sometió a la IA a un riguroso entrenamiento de 50.000 horas, en las que el algoritmo intentó aprender a jugar al clásico título de Game Freak. El método de aprendizaje automático permitió que la IA tomara decisiones basadas en las imágenes del juego y estableciera estrategias para avanzar. Sin embargo, lo curioso es que el viaje hacia la maestría en Pokémon se convirtió en una lección más sobre la naturaleza humana que sobre la IA misma.
MIRA: Cuatro mil ataques de contraseñas por segundo en el mundo: cómo el mal uso de la inteligencia artificial impulsa el auge de los ciberataques
Aprender a ser un entrenador Pokémon… a prueba y error
El objetivo era simple: que la IA pudiera completar Pokémon Rojo. Para guiarla, se diseñó un sistema de recompensas. Capturar un Pokémon daba un punto, ganar una batalla sumaba tres, y vencer a un Gimnasio añadía cinco. No obstante, la IA comenzó su aventura sin saber realmente qué hacer, guiándose solo por su curiosidad al observar las imágenes cambiantes del juego.
Al principio, la IA quedó atrapada en Pueblo Paleta, fascinada por los personajes que caminaban por allí. Estos cambios constantes en la escena confundían a la IA, que interpretaba la situación como una novedad digna de explorar. Esta distracción refleja, según Whidden, nuestra propia tendencia humana a la curiosidad y cómo muchas veces nos distraemos con lo que nos parece nuevo, aunque no nos lleve a ninguna parte.
Los obstáculos del mundo Pokémon
Tras algunos ajustes, la IA logró salir de Pueblo Paleta y llegar a Ciudad Verde, pero aquí surgió otro problema. Al enfrentarse a los combates, la IA prefería huir. La razón era simple: no obtenía recompensas por ganar las batallas. Para solucionarlo, Whidden modificó el sistema de puntuación, recompensando los niveles altos de los Pokémon y penalizando las derrotas. A partir de ahí, la IA comenzó a luchar y a capturar criaturas, incluso aprendió a permitir la evolución de sus Pokémon.
Sin embargo, a pesar de estos avances, la IA se negó a visitar los Centros Pokémon. ¿La razón? En una sesión, la IA, por error, depositó todos sus Pokémon en el PC del Centro, resultando en una enorme pérdida de puntos. Esta experiencia traumática quedó registrada en su “memoria”, y desde entonces evitó entrar a los Centros Pokémon a toda costa. Fue necesario ajustar nuevamente el sistema de recompensas para animarla a visitarlos.
La obsesión con Magikarp
Pero lo más sorprendente llegó cuando la IA llegó al Centro Pokémon antes del Monte Moon. Allí, se encontró con el vendedor que ofrece un Magikarp por 500 Pokécuartos. Para la IA, el Magikarp era una gran oportunidad: tenía cinco niveles más que sus otros Pokémon, así que lo compró. No una, ni dos, sino más de 10.000 veces en las pruebas realizadas. La IA no comprendió que estaba siendo “estafada”, sino que se centró en el simple hecho de aumentar sus niveles.
Este comportamiento es un reflejo de nuestros propios hábitos. Así como la IA insistía en comprar Magikarp para aumentar su poder, los humanos también tienden a repetir acciones que parecen beneficiosas a corto plazo, incluso si son perjudiciales a largo plazo, como consumir comida rápida.
MIRA: El CEO de Nvidia revela que tiene un tutor de IA y piensa que todos deberían tener uno
El final del camino
A pesar de todos los ajustes, la IA se encontró con un callejón sin salida en el Monte Moon. El pasillo era demasiado uniforme, y la IA no podía obtener ninguna recompensa de exploración. Después de 50.000 horas de intentos, no pudo avanzar más allá de esa cueva oscura. Sin embargo, Whidden descubrió patrones interesantes: la IA tendía a explorar en el sentido contrario a las agujas del reloj y siempre por las esquinas.
Curiosamente, también aprendió a capturar Pokémon con un solo lanzamiento de Pokéball, replicando un truco conocido entre los jugadores como “RNG Abuse”. Un logro impresionante que la IA desarrolló por sí misma sin ayuda.
Al final, el experimento no solo mostró los límites actuales de las IA en videojuegos, sino que también nos dio una oportunidad para reflexionar. Como dice Whidden, la IA es un espejo de nuestras propias decisiones y comportamientos. Y, aunque la aventura de esta inteligencia artificial llegó a su fin, su viaje nos deja con la pregunta: ¿cuántas veces, como ella, insistimos en comprar nuestro propio “Magikarp”?