Sumario: | Se compara el desempeño de dos métodos diferentes para controlar los estados de un sistema simulado de un tanque,utilizando los conceptos de Programación Dinámica Heurística. El desempeño es medido en términos de su capacidadde aprendizaje, tiempo de entrenamiento y manejo del ruido. El objetivo de los algoritmos es hacer que la temperaturadel tanque siga una referencia dada. Para esta tarea, el Enfoque Estocástico aprende a controlar el sistema máságilmente; sin embargo, el Enfoque Determinístico maneja mejor el ruido en la salida del sistema. Más aún, si la señalde referencia está constantemente variando, el Enfoque Determinístico controla mejor el sistema.
|