viernes, 10 octubre, 2025
viernes, 10 octubre, 2025

Venezuela pide reunión del Consejo de Seguridad de ONU por despliegue militar de EEUU

El horóscopo de hoy, viernes 10 de octubre de 2025: predicciones diarias con la Luna en Géminis favorable para Aries

https://elcomercio.pe/luces/musica/jerry-rivera-vuelve-a-la-musica-con-su-album-llegue-yo-tras-15-anos-ultimas-noticia/

Violinista excelso James Ehnes llega a Lima: “Cada noche puede ser especial” | LUCES

«Regresan a casa», celebran israelíes en Tel Aviv tras dos años en vilo por los rehenes en Gaza

“Quienes crecimos sin tanta tecnología disfrutamos más del mundo real”: La Mosca Tse Tse habla sobre el concierto de Fito Páez en Lima | Hermanos Yaipén | Aniversario | LUCES

Agua Marina sufre atentado: Hermanos Quiroga fuera de peligro tras ataque en concierto | TVMAS

El Congreso argentino limita la capacidad de Milei de gobernar por decreto

La persecución política crece en Venezuela, declara la relatora de la CIDH

vape cigarro “El cáncer de pulmón no es una enfermedad solo de fumadores”: médico patólogo explica por qué es la primera causa de muerte oncológica | BIENESTAR


Las inteligencias artificiales están en todas partes, desde asistentes virtuales hasta sistemas complejos que debaten entre la ética y el futuro de la humanidad. Pero, ¿qué pasa cuando una IA se enfrenta a un videojuego clásico como Pokémon Rojo? Peter Whidden decidió averiguarlo y entrenó una IA para que completara el mítico juego. El resultado fue… inesperado, por decir lo menos.

Whidden sometió a la IA a un riguroso entrenamiento de 50.000 horas, en las que el algoritmo intentó aprender a jugar al clásico título de Game Freak. El método de aprendizaje automático permitió que la IA tomara decisiones basadas en las imágenes del juego y estableciera estrategias para avanzar. Sin embargo, lo curioso es que el viaje hacia la maestría en Pokémon se convirtió en una lección más sobre la naturaleza humana que sobre la IA misma.

MIRA: Cuatro mil ataques de contraseñas por segundo en el mundo: cómo el mal uso de la inteligencia artificial impulsa el auge de los ciberataques

Aprender a ser un entrenador Pokémon… a prueba y error

El objetivo era simple: que la IA pudiera completar Pokémon Rojo. Para guiarla, se diseñó un sistema de recompensas. Capturar un Pokémon daba un punto, ganar una batalla sumaba tres, y vencer a un Gimnasio añadía cinco. No obstante, la IA comenzó su aventura sin saber realmente qué hacer, guiándose solo por su curiosidad al observar las imágenes cambiantes del juego.

Al principio, la IA quedó atrapada en Pueblo Paleta, fascinada por los personajes que caminaban por allí. Estos cambios constantes en la escena confundían a la IA, que interpretaba la situación como una novedad digna de explorar. Esta distracción refleja, según Whidden, nuestra propia tendencia humana a la curiosidad y cómo muchas veces nos distraemos con lo que nos parece nuevo, aunque no nos lleve a ninguna parte.

Los obstáculos del mundo Pokémon

Tras algunos ajustes, la IA logró salir de Pueblo Paleta y llegar a Ciudad Verde, pero aquí surgió otro problema. Al enfrentarse a los combates, la IA prefería huir. La razón era simple: no obtenía recompensas por ganar las batallas. Para solucionarlo, Whidden modificó el sistema de puntuación, recompensando los niveles altos de los Pokémon y penalizando las derrotas. A partir de ahí, la IA comenzó a luchar y a capturar criaturas, incluso aprendió a permitir la evolución de sus Pokémon.

Sin embargo, a pesar de estos avances, la IA se negó a visitar los Centros Pokémon. ¿La razón? En una sesión, la IA, por error, depositó todos sus Pokémon en el PC del Centro, resultando en una enorme pérdida de puntos. Esta experiencia traumática quedó registrada en su “memoria”, y desde entonces evitó entrar a los Centros Pokémon a toda costa. Fue necesario ajustar nuevamente el sistema de recompensas para animarla a visitarlos.

La obsesión con Magikarp

Pero lo más sorprendente llegó cuando la IA llegó al Centro Pokémon antes del Monte Moon. Allí, se encontró con el vendedor que ofrece un Magikarp por 500 Pokécuartos. Para la IA, el Magikarp era una gran oportunidad: tenía cinco niveles más que sus otros Pokémon, así que lo compró. No una, ni dos, sino más de 10.000 veces en las pruebas realizadas. La IA no comprendió que estaba siendo “estafada”, sino que se centró en el simple hecho de aumentar sus niveles.

Este comportamiento es un reflejo de nuestros propios hábitos. Así como la IA insistía en comprar Magikarp para aumentar su poder, los humanos también tienden a repetir acciones que parecen beneficiosas a corto plazo, incluso si son perjudiciales a largo plazo, como consumir comida rápida.

MIRA: El CEO de Nvidia revela que tiene un tutor de IA y piensa que todos deberían tener uno

El final del camino

A pesar de todos los ajustes, la IA se encontró con un callejón sin salida en el Monte Moon. El pasillo era demasiado uniforme, y la IA no podía obtener ninguna recompensa de exploración. Después de 50.000 horas de intentos, no pudo avanzar más allá de esa cueva oscura. Sin embargo, Whidden descubrió patrones interesantes: la IA tendía a explorar en el sentido contrario a las agujas del reloj y siempre por las esquinas.

Curiosamente, también aprendió a capturar Pokémon con un solo lanzamiento de Pokéball, replicando un truco conocido entre los jugadores como “RNG Abuse”. Un logro impresionante que la IA desarrolló por sí misma sin ayuda.

Al final, el experimento no solo mostró los límites actuales de las IA en videojuegos, sino que también nos dio una oportunidad para reflexionar. Como dice Whidden, la IA es un espejo de nuestras propias decisiones y comportamientos. Y, aunque la aventura de esta inteligencia artificial llegó a su fin, su viaje nos deja con la pregunta: ¿cuántas veces, como ella, insistimos en comprar nuestro propio “Magikarp”?



Source link