Repositório Digital de Publicações Científicas: NXT e Aprendizagem por Reforço

Please use this identifier to cite or link to this item: http://hdl.handle.net/10174/4526

Title:	NXT e Aprendizagem por Reforço
Authors:	Coelho, João Gonçalves, Teresa
Editors:	Rato, Luís Gonçalves, Teresa
Keywords:	Aprendizagem por Reforço NXT Mindstorms
Issue Date:	Nov-2011
Abstract:	A aprendizagem por reforço é uma aprendizagem por tentativa e erro, onde o agente, através da interacção com o ambiente, aprende a realizar uma tarefa com base em recompensas positivas e negativas. Este artigo pretende analisar o comportamento de um robô implementado com um sistema de aprendizagem por reforço cujo objectivo consiste em seguir uma linha. Para tal foi utilizado o robô educacional criado pela Lego, o NXT Mindstorms, implementado com o algoritmo Q-learning. Realizaram-se experiências com o propósito de determinar quais os valores óptimos das variáveis principais do algoritmo Q-learning (taxa de aprendizagem, o factor de desconto e a taxa de exploração), para que o robô tivesse um bom desempenho. Conclui-se que um robô implementado com um sistema de aprendizagem por reforço consegue aprender uma determinada tarefa em poucas iterações (passos).
URI:	http://hdl.handle.net/10174/4526
ISBN:	978-989-97060-2-6
Type:	article
Appears in Collections:	INF - Artigos em Livros de Actas/Proceedings

Files in This Item:

File	Description	Size	Format
tcg11g-nxt.pdf		258.95 kB	Adobe PDF	View/Open