viernes, 24 de marzo de 2017

Vídeo Nº 161: IA Grafos - Procesos de Decisión de Markov 02

Definición de un Porceso de Decisión de Markov, en especial el modelo de transición basado en probabilidades, la función recompensa que permitirá calcular la utilidad, y la política, que es el objetivo de todo MDP, una relación entre cada estado y la mejor acción que podemos ejecutar en él. También se comentará cómo definir recompensas y qué diferencias hay entre los diferentes tipos de recompensas que existen.



No hay comentarios:

Publicar un comentario