miércoles, 29 de marzo de 2017

Vídeo Nº 163: IA Grafos - Procesos de Decisión de Markov 04

Explicación del algortirmo Iteración de Valores para calcular la política óptima en los Procesos de Decisión de Markov. A partir de la Ecuación de Bellman, se explicará, paso a paso y con ejemplos, cómo ir calculando los q-valores. Al final, se mostrará el pseudocódigo.



2 comentarios:

  1. Quiero destacar que es un tema muy importante, y la me pareció un muy buen blog. La historia de la IA es la que yo considero mas importante pues de ahí nacieron las bases de lo que ahora ya es una realidad.

    ResponderEliminar
  2. Me gusto la parte de la historia de inteligencia artificial(IA)

    ResponderEliminar