viernes, 12 de mayo de 2017

Vídeo Nº 172: IA Grafos - Aprendizaje por Refuerzo 04 (Activo Aproximado)

Último vídeo de aprendizaje por refuerzo en el que mejorará lo visto en el vídeo anterior sobre Q-Learning, permitiendo usarlo cuando hay muchos estados y acciones y acelerando además el proceso de aprendizaje. Para ello, en vez de basarse en estados y acciones nos basaremos en propiedades o características inveriantes, definidas mediante funciones de evaluación que se usarán, mediante una suma ponderada, para actualizar los q-valores.



3 comentarios:

  1. Muchas gracias, tus videos me ha servido para asentar conceptos que tenía un poco entremezclados. ¡Ánimo con la serie!.

    ResponderEliminar
  2. muy interesante y muy buena explicación. excelente

    ResponderEliminar
  3. Considero que es un excelente video, muy buena información.

    ResponderEliminar