marcsanz_dev
? Documentación de Machine Learning (Reinforcement Learning).Estudio del algoritmo Q-Learning en entornos estocásticos (GridWorld y Ajedrez).Puntos clave:Ajuste de hiperparámetros: Tasa de aprendizaje ($\alpha$) y factor de descuento ($\gamma$).Estrategia