La victoria de AlphaZero contra Stockfish ha causado un terremoto en el mundo del ajedrez y la Inteligencia Artificial.
Las partidas de estos dos motores de ajedrez se han jugado con un control de tiempo de 1 minuto por movimiento. AlphaZero comenzó desde cero y no tenía conocimiento previo sobre el juego, excepto las reglas. A diferencia de los motores de ajedrez normales, no tenía libros de apertura, tablas de finales y heurística. Ni siquiera tenía una base de datos de las partidas que se han jugado en el pasado. Es interesante ver cómo AlphaZero ha sido capaz de jugar las aperturas de ajedrez más comunes por sí mismo.
El algoritmo solo jugó contra sí mismo durante 4 horas y fue capaz de demoler a Stockfish con un margen de 64:36 sin perder ni una sola partida.
Durante el entrenamiento, AlphaGo tuvo acceso a "5,000 TPU de primera generación para generar partidas de autoaprendizaje y 64 TPUs de 2da generación para entrenar las redes neuronales". El algoritmo entrenado, mientras tanto, se ejecutó en una sola máquina con cuatro TPU, y DeepMind enfatizó la eficiencia de su enfoque, con AlphaZero buscando solo 80,000 posiciones por segundo en comparación con 70 millones para Stockfish. AlphaZero compensa el menor número de evaluaciones al usar su red neuronal profunda para enfocarse mucho más selectivamente en las variaciones más prometedoras, posiblemente un enfoque de búsqueda más "humano".
Es probable que algunas de estas técnicas puedan mejorar aún más el rendimiento de AlphaZero; sin embargo, nos hemos centrado en un enfoque de aprendizaje de refuerzo de autoaprendizaje puro y dejamos estas extensiones para futuras investigaciones.
Los jugadores de ajedrez definitivamente intentarán aprovecharlo para ayudar a mejorar sus juegos. Pero, ¿estará disponible para su uso pronto? Es la pregunta.
Los programadores de ajedrez tradicionales tienen que reflexionar si la investigación sobre los motores de ajedrez normales
debería continuarse o si se debe desarrollar una IA basada en aprendizaje profundo que pueda aprender por sí misma. Todo esto necesita ser pensado.
Fuente: Chess24
No hay comentarios:
Write comentarios