Please use this identifier to cite or link to this item:
http://hdl.handle.net/10174/4526
|
Title: | NXT e Aprendizagem por Reforço |
Authors: | Coelho, João Gonçalves, Teresa |
Editors: | Rato, Luís Gonçalves, Teresa |
Keywords: | Aprendizagem por Reforço NXT Mindstorms |
Issue Date: | Nov-2011 |
Abstract: | A aprendizagem por reforço é uma aprendizagem por tentativa e erro, onde o agente, através da interacção com o ambiente, aprende a realizar uma tarefa com base em recompensas positivas e negativas.
Este artigo pretende analisar o comportamento de um robô implementado com um sistema de aprendizagem por reforço cujo objectivo consiste em seguir uma linha. Para tal foi utilizado o robô educacional criado pela Lego, o NXT Mindstorms, implementado com o algoritmo Q-learning.
Realizaram-se experiências com o propósito de determinar quais os valores óptimos das variáveis principais do algoritmo Q-learning (taxa de aprendizagem, o factor de desconto e a taxa de exploração), para que o robô tivesse um bom desempenho.
Conclui-se que um robô implementado com um sistema de aprendizagem por reforço consegue aprender uma determinada tarefa em poucas iterações (passos). |
URI: | http://hdl.handle.net/10174/4526 |
ISBN: | 978-989-97060-2-6 |
Type: | article |
Appears in Collections: | INF - Artigos em Livros de Actas/Proceedings
|
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
|