marcsanz_dev
? Implementación de un Agente de Aprendizaje por Refuerzo. Script en Python para entrenar un agente mediante Q-Learning. Gestión de estados, acciones y recompensas (Rewards). Actualización de la Q-Table. Simulaciones de entrenamiento y validación.