MEMORIA-PRACTICA-3-IA-Aprendizaje-por-Refuerzo-Q-Learning.pdf

marcsanz_dev

? Documentación de Machine Learning (Reinforcement Learning).Estudio del algoritmo Q-Learning en entornos estocásticos (GridWorld y Ajedrez).Puntos clave:Ajuste de hiperparámetros: Tasa de aprendizaje ($\alpha$) y factor de descuento ($\gamma$).Estrategia