El desarrollo de DeepNash por DeepMind, una empresa del Reino Unido adquirida por Google en 2014, ha marcado un hito en la inteligencia artificial (IA) al dominar el juego de Stratego, conocido por su complejidad y la incertidumbre inherente, algo publicado en la revista Science. A diferencia de juegos completamente visibles como el ajedrez o el Go, el Stratego exige estrategias que manejen información oculta, similar al póker, donde los jugadores solo conocen sus propias cartas.

Para enfrentar este desafío, el equipo detrás de DeepNash implementó una combinación del algoritmo de aprendizaje por refuerzo R-NaD con redes neuronales profundas, creando un programa capaz de competir y vencer a los bots más avanzados de Stratego y alcanzar un nivel de juego equiparable al de los expertos humanos en Gravon, el mayor sitio de juego en línea de Stratego.

“En Stratego, la planificación es casi imposible, dada la cantidad de incertidumbre sobre la que los jugadores tienen que razonar. En este trabajo, tomamos otro camino y aprendimos directamente una estrategia para cada situación dada del tablero, usando una combinación de teoría de juegos y aprendizaje de refuerzo profundo”, explica a SINC Julien Perolat, coautor principal del estudio e investigador de DeepMind.

El interés en emplear IA para analizar juegos va más allá de la mera competencia; se trata de experimentar con nuevos métodos aplicables a problemas reales. Los juegos ofrecen un campo de pruebas ideal para algoritmos de IA, promoviendo el desarrollo de sistemas más sofisticados y versátiles, con feedback inmediato a través de las puntuaciones obtenidas. Aunque aún hay juegos como el bridge que la IA no ha dominado completamente, el avance con DeepNash abre el camino para aplicaciones prácticas de la IA en situaciones del mundo real donde prevalece la información imperfecta, como en la optimización del tráfico, mejorando la eficiencia del transporte y reduciendo emisiones.

El programa se probó contra varios bots Stratego de última generación y contra jugadores humanos expertos. Ganó contra todos los bots y logró un nivel de juego altamente competitivo contra jugadores humanos con nivel de experto en Gravon, la plataforma en línea más grande de jugadores de Stratego.

Según Karl Tuyls, coautor del estudio y investigador en DeepMind, DeepNash sugiere un futuro prometedor para la aplicación de sistemas de IA en entornos reales marcados por la incertidumbre, al gestionar eficazmente grandes volúmenes de información imprecisa, un enfoque hasta ahora inexplorado.

Los juegos son el entorno perfecto para estudiar los sistemas avanzados de inteligencia artificial. Permiten desarrollar y probar algoritmos de IA más inteligentes y flexibles de manera rápida y eficiente, y también ofrecen comentarios instantáneos sobre cómo lo estamos haciendo a través de las puntuaciones”, explica Perolat.

Para concluir, DeepNash ha comprobado la efectividad del aprendizaje por refuerzo para abordar desafíos complejos en contextos de juegos donde la información es parcial y los posibles escenarios son extensos. Su logro en Stratego marca un avance significativo en la inteligencia artificial, abriendo la puerta a su aplicación en áreas fuera del ámbito lúdico, como en la simulación de comportamientos de multitudes, la creación de sistemas de subasta y la gestión de dilemas de mercado. A medida que el aprendizaje por refuerzo continúa desarrollándose, resulta estimulante contemplar el futuro de la IA en la solución de tanto juegos como problemas reales.

Open chat
GEN.iality
¡Bienvenido a GENIALITY!

¿Necesitas información?