APRENDIZAJE REFORZADO
En 1952 se desarrolla el aprendizaje reforzado con la primera
máquina llamada Teseo, no fue sino para el año 2013 en la revolución de los
video juegos como el Atari o en el Alfago en el cual se dedicaban a vencer un
juego de mesa por medio de una maquina la cual tiene la capacidad de imitar y
aprender a través del proceso de prueba y error.
Esta programación se da por tres funciones la primera
llamada agente el cual entiendo lo que es el entorno, la segunda seria el
estado que el que va a tomar los movimientos de acción y la tercera por la
recompensa el cual sería un premio o un castigo. E agente aprenderá de su
entorno dependiendo del estado observado para tener una recompensa.
Tipos de aprendizaje reforzado:
Basado en modelos: Es cuando tenemos una información
detallada del entorno.
Basado en libre modelo: Este va a depender del programador el
cual decide la acción a tomar para evitar menos penalizaciones posibles.
Para entrenar nuestro agente es necesario tomar en cuenta dos herramientas que son las Políticas degradiente las registra periódicamente el algoritmo o las Q-learning las cuales calculan la máxima recompensa y acciones para culminar de manera exitosa el agente de acuerdo como el agente se mueven su entorno este busca la manera más corta para darle una solución mas conveniente.
De esta manera se crean redes neuronales las cuales combinadas
con los aprendizajes reforzados profundo superan las capacidades del ser humano,
también hace que el robot tenga la capacidad de estar y manipularse en un
ambiente hostil.
No hay comentarios.:
Publicar un comentario