Detecção de obstrução em máquinas de lingotamento contínuo pela análise de séries temporais multivariadas
dissertacao_mestrado
RESUMO: Obstruções das válvulas submersas no processo de lingotamento contínuo aumentam a frequência de interrupções na operação, seja para troca de válvulas, de distribuidores ou até mesmo provocando uma parada completa da máquina. Estas transições extras elevam o custo operacional, reduzem a produtividade da planta e podem provocar uma variedade de problemas de qualidade. A ausência de conjuntos de dados rotulados para as obstruções tem restringido a aplicação de métodos de aprendizado de máquina para predição desta anomalia no processo. Este trabalho buscou desenvolver técnicas semiautomáticas de rotulação de conjuntos de dados de referência. Para identificação do problema foram extraídas características de séries temporais multivariadas que poderiam caracterizar o fenômeno. Tais características foram utilizadas em sequências de clusterizações, combinadas em diferentes espaços dimensionais, fazendo uso do algoritmo DBSCAN (Density Based Spatial Clustering of Applications with Noise). Os clusters gerados foram usados como sementes para um processo semi-supervisionado de propagação de rótulos. Este processo gerou uma base de dados que foi validada por especialistas e 100% dos dados rotulados como obstruções foram considerados corretamente rotulados. No contexto de aprendizado de máquina, a inexistência de rótulos nos dados implica no uso de técnicas não supervisionadas, com poucos exemplos de rótulos os métodos semi-supervisionados são aplicáveis, já com o conjunto de dados tendo os rótulos devidamente validados permite-se o uso de algoritmos preditores supervisionados (classificadores ou regressores). Sendo assim, foi possível em sequência desenvolver um modelo classificador multiclasse que pudesse identificar situações de operação normal, obstruções e outras anomalias em tempo de lingotamento.
ABSTRACT: Clogging of submerged entry nozzles (SEN) in the continuous casting process increase the frequency of operational interruptions, whether for changing valves, tundish or even causing a complete machine shutdown.These extra transictions drive up the cost, reduce productivity and can cause a variety of quality issues.The absence of data sets labeled for clogging has restricted the application of machine learning methods for predicting this anomaly. This work sought to develop semiautomatic techniques for labeling reference data sets. To identify the problem were extracted features of multivariate time series that could identify the phenomenon. These features were used in clustering sequences, in different dimensional spaces, using the Density Based Spatial Clustering of Applications with Noise Algorithm (DBSCAN). The generated clusters were used as seeds for a semi-supervised label propagation process. This process generated a database that was validated by specialists and 100% of the data labeled as obstructions were considered correctly labeled. In machine learning the lack of labels in the data implies the use of unsupervised techniques, with just a few examples of labels the semi-supervised methods are applicable, on the other hand, with the data set having the labels properly validated, the use of supervised algorithms (classifiers or regressors) became allowed. Therefore, it was possible to develop a multiclass classifier model that could identify situations of normal operation, clogging and other process anomalies during the casting time.
Redes Sociais