Um sistema de chatterbot baseado em pesquisa a base de documentos do Ifes

Carvalho, Hellesandro Gonzaga de (2022-02-15)

tcc

RESUMO: Agentes conversacionais se popularizaram nos últimos anos ao reproduzir linguagem natural e em alguns casos também prestar serviços. Esse movimento foi importante para aproximar as pessoas dos sistemas de informação e também fornecer novos recursos para instituições que agora podem realocar esforços para tarefas não automatizáveis. Inspirado nessa dinâmica, este trabalho propõe um protótipo de chatterbot baseado em pesquisa a base de documentos institucionais não estruturados do Ifes Campus Serra, capaz de responder as principais perguntas que circundam o processo seletivo cujas respostas existem em algum documento. Para desenvolvê-lo, utilizou-se os word embeddings pré-treinados do NILC (Núcleo Interinstitucional de Linguística Computacional) para operações de similaridade entre palavras e a biblioteca Keras como auxílio ao desenvolvimento de RNAs. Com um corpus de 9 documentos institucionais de processos seletivos do Ifes, foram processadas 13 perguntas frequentes das quais 69,23% - 9 perguntas - foram consideradas respostas corretas, 23,07% - 3 perguntas - foram consideradas respostas incorretas mas com margem para se tornarem acertos, e 7,69% - 1 pergunta - foi considerada completamente errada. Desse modo, conclui-se que é possível responder as principais perguntas relacionadas aos processos seletivos do Ifes Campus Serra através de um chatterbot, desde que a taxa de acerto atual seja aceitável ou as melhorias apresentadas neste trabalho sejam implementadas.

ABSTRACT: Conversational agents popularized in the past years through reproducing natural language and - in some cases - perform useful tasks to users. This usage growth was crucial to bring people closer to information systems and provide new resources to institutions, whom now may reallocate efforts for non-automatable tasks. Inspired by this trend, this paper proposes a chatterbot prototype that is oriented to unstructured institutional documents from Ifes - Campus Serra, capable of answering the main questions that concern the selection process when its answer is within some document. To develop it, pre-trained word embeddings from NILC (Núcleo Interinstitucional de Linguística Computacional) were used for word similarities operations and Keras library helped the development of RNAs (Redes Neurais Artificiais). Using a corpus with 9 institutional documents about Ifes’ selection processes, 13 questions were processed, from which 69.23% (9 questions) were considered correct, 23.07% (3 questions) were considered wrong - but could be fixed with ease - and 7.69% (1 question) were considered completely wrong. Thus, it’s concluded that it is possible to answer the main questions related to selection process on Ifes - Campus Serra through a chatterbot, provided that the current correctness rate is acceptable or the improvements presented in this paper are applied.