Investigação da generalização de pipeline para o problema da previsão do consumo de gás no processo de pelotização através de séries temporais multivariadas
dissertacao_mestrado
RESUMO O consumo de gás é parte crítica no processo de pelotização, pois reflete diretamente nos custos operacionais e no impacto ambiental decorrente de sua queima. A previsão desse consumo é uma alternativa relevante para subsidiar decisões que otimizem seu uso. Este trabalho investigou a generalização de um pipeline baseado em aprendizado de máquina para prever o consumo de gás em plantas industriais de pelotização, utilizando séries temporais multivariadas. Dados operacionais coletados ao longo de 90 dias em uma planta foram utilizados na construção de modelos preditivos que indicaram também o subconjunto de dados mais promissor para a investigação. Os resultados desses modelos foram comparados aos obtidos por um método estatístico clássico, que serviu como linha de base, e a técnicas modernas de aprendizado de máquina. A avaliação foi realizada por meio da métrica raiz quadrada do erro médio (RMSE, do inglês Root Mean Squared Error). O estudo concluiu que o pipeline empregado apresentou resultados satisfatórios e evidências de generalização. Em particular, o método de AutoML DEAP combinado com a rede neural LSTM obteve um RMSE de 0,33, reforçando a viabilidade de aplicação do pipeline na planta industrial estudada. Palavras-chave: Consumo de Gás, Pelotização, Séries Temporais Multivariadas, Redes Neurais, Seleção de características, AutoML
ABSTRACT Gas consumption is a critical part of the pelletizing process, as it directly impacts operational costs and the environmental effects resulting from its combustion. Predicting this consumption is a relevant alternative to support decisions that optimize its use. This study investigated the generalization of a machine learning-based pipeline to predict gas consumption in industrial pelletizing plants, using multivariate time series. Operational data collected over 90 days from a plant were used to construct predictive models, which also identified the most promising data subset for the analysis. The results of these models were compared with those obtained using a classical statistical method, which served as the baseline, and with modern machine learning techniques. The evaluation was conducted using the Root Mean Squared Error (RMSE) metric. The study concluded that the employed pipeline delivered satisfactory results and evidence of generalization. In particular, the AutoML DEAP method combined with the LSTM neural network achieved an RMSE of 0.33, reinforcing the feasibility of applying the pipeline to the studied industrial plant. Keywords: Gas Consumption, Pelletizing, Multivariate Time Series, Neural Networks, Feature Selection, AutoML.
Redes Sociais