Show simple item record

Uma Avaliação da Utilização de Aprendizado por Reforço para o Controle de Sistemas de Tempo Contínuo Não Lineares

dc.contributor.advisorSoares, Lucas de Assis
dc.contributor.authorPessotti, Larson Recla
dc.date.accessioned2022-07-21T15:43:01Z
dc.date.available2022-07-21T15:43:01Z
dc.date.issued2022-06-30
dc.identifier.citationPESSOTTI, Larson Recla. Uma Avaliação da Utilização de Aprendizado por Reforço para o Controle de Sistemas de Tempo Contínuo Não Lineares. 2022. 70 f. Trabalho de Conclusão de Curso (Engenharia de Controle e Automação) - Instituto Federal do Espírito Santo, Linhares, 2022.pt_BR
dc.identifier.urihttps://repositorio.ifes.edu.br/handle/123456789/2131
dc.description.abstractEste trabalho tem como objetivo avaliar a aplicação da aprendizagem por reforço para controlar sistemas não lineares. Os problemas não lineares são naturalmente complexos para se controlar. A vantagem da utilização da aprendizagem por reforço é que dispensa a modelagem matemática do sistema, isso faz com que a dificuldade em modelar matematicamente o comportamento do sistema não linear complexo, não impeça o aprendizado e a obtenção de um controlador. A aplicação neste trabalho está restrita a um ambiente de simulação, o pêndulo invertido, porém, a metodologia utilizada pode ser replicada a outros sistemas de comportamento não-linear. É importante ressaltar que as ferramentas utilizadas simulam possíveis problemas ou interferências que possam acontecer em situações reais, isso confere robustez e confiabilidade aos resultados. A simulação foi implementada utilizando a linguagem Python, a biblioteca PyTorch e um ambiente de simulação desenvolvido com PyGame. Como resultado deste trabalho, destaca-se a implementação da influência da variável de controle no desempenho de seguir a referência, fazendo descontos nas recompensas obtidas pelo agente e a expansão da rede neural com o objetivo de variar a ação do agente (controlador) e suavizar a ação de controle.pt_BR
dc.format.extent70 f.pt_BR
dc.languagept_BRpt_BR
dc.rightsacesso_abertopt_BR
dc.subjectAprendizado por reforçopt_BR
dc.subjectControle Automáticopt_BR
dc.subjectAprendizado de Máquinaspt_BR
dc.titleUma Avaliação da Utilização de Aprendizado por Reforço para o Controle de Sistemas de Tempo Contínuo Não Linearespt_BR
dc.typetccpt_BR
ifes.campusCampus_Linharespt_BR
dc.contributor.memberSantana, Lucas Vago
dc.contributor.memberPereira, Alysson Augusto


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record