Predição da temperatura de domo em um regenerador utilizando algoritmos de aprendizado supervisionado
dissertacao_mestrado
Este trabalho realiza estudo comparativo de técnicas de aprendizado de máquina e analisa a aplicação de diversos modelos de aprendizado de maquina na predição da temperatura do domo de regeneradores durante os ciclos de on-gas e on-blast em uma usina siderúrgica integrada, visto que o consumo de gases durante o período de queima (on-blast) e aquecimento dos tijolos refratários (on-gas), não apenas impacta diretamente nos custos operacionais, mas também acarreta significativas implicações ambientais, e a predição de temperatura do domo de um regenerador permitirá atualizar adequadamente o plano de ação, reajustando as variáveis para atingir a temperatura de domo alvo com maior eficiência energética. O modelo utiliza os valores das variáveis de entrada, definidos pelos operadores e coletadas pelos sensores, para prever a temperatura do domo após 36 minutos, dado osetup atual. Diferentemente de todos os trabalhos encontrados na literatura, as temperatura de domo do passado registrada na base de dados nesta investigação não permitem predizer a temperatura do domo no futuro, o que impossibilita o uso de algoritmos especializados que consideram essa característica. Utilizando uma base de dados fornecida por uma siderúrgica no Brasil, inicialmente foi realizada uma pré-seleção de atributos por meio de entrevistas com especialistas, seguida do uso do método de Análise de Componentes Principais (PCA). O pré-processamento incluiu a remoção de registros duplicados e de outliers usando o Intervalo Interquartil (IRQ) e a imputação de valores faltantes com a média móvel de uma janela fixa que considerou as 24 amostras anteriores, a técnica Min-Max Scaling foi aplicada para normalizar os valores, transformando as variáveis do conjunto para a escala. Para o treinamento dos modelos, foi utilizado o método de validação cruzada, dividindo a base em 80% dos dados para treino e 20% para teste. Os modelos foram avaliados com métricas como R2 e RMSE, após ajustes de hiperparâmetros via Grid Search CV e k-fold de 5. O LightGBM e o XGBoost apresentaram, respectivamente, os melhores resultados para R2 de 0, 87040695 e 0, 83274270 e RMSE de 3, 0538916 e 3, 2550260. Os resultados indicam uma eficácia significativa dos modelos, com uma ligeira vantagem do LightGBM.
ABSTRACT This work conducts a comparative study of machine learning techniques and analyzes the application of various machine learning models in predicting the dome temperature of regenerators during the on-gas and on-blast cycles in an integrated steel plant. Unlike studies found in the literature, the data used in this investigation do not exhibit time series behavior, which precludes the use of specialized algorithms that consider this characteristic. Using a dataset provided by a steel plant in Brazil, an initial attribute pre-selection was conducted through interviews with experts, followed by the use of the Principal Component Analysis (PCA) method. The preprocessing included the removal of duplicate records and outliers using the Interquartile Range (IQR) and the imputation of missing values with a moving average of a fixed window that considered the previous 24 samples. The Min-Max Scaling technique was applied to normalize the values, transforming the variables to the same scale. For model training, cross-validation was used, dividing the dataset into 80% for training and 20% for testing. The models were evaluated using metrics such as R2 and RMSE, after hyperparameter tuning via GridSearchCV and 5-fold cross-validation. The LightGBM and XGBoost models showed the best results, with R2 values of 0.87040695 and 0.83274270, and RMSE values of 3.0538916 and 3.2550260, respectively. The results indicate significant model efficacy, with a slight advantage for LightGBM. Keywords: Hot Blast Stove. HBS. Random Forests. Gradient Boosted. LightGBM. XGBoost. KNN.
Redes Sociais