En este trabajo vamos a aplicar técnicas de programación dinámica para obtener una política óptima en el problema de administrar un negocio de alquiler de autos. En particular vamos a utilizar el algoritmo de Iteración de Politica. Nos basamos principalmente en el capítulo 4 de Sutton, R. S., & Barto, A. G. (2018). Reinforcement learning: An introduction (2nd ed.).
In this work we are going to apply dynamic programming techniques to obtain an optimal policy in the problem of managing a car rental business. In particular we are going to use the Policy Iteration algorithm. We draw mainly on chapter 4 of Sutton, R. S., & Barto, A. G. (2018). Reinforcement learning: An introduction (2nd ed.).