Análise do viés de similaridade em diversas bases de sinais de vibração para diagnóstico de falhas em rolamentos

Venturim, Lúcio Antônio Stange (2021)

dissertacao_mestrado

RESUMO: O viés de similaridade é um fenômeno que pode ocorrer em bases de dados com amostras originadas da mesma aquisição ou coletadas em equipamentos com condições similares. Esse fenômeno pode levar a estimativas superotimistas de algoritmos de aprendizado de máquina. Tais estimativas possivelmente não serão refletidas pelos modelos gerados quando utilizados na prática. O objetivo deste trabalho é analisar o viés de similaridade em bases de sinais de vibração para detecção de falhas em rolamentos. As bases utilizadas são a CWRU, a Paderborn, a MFPT e a de Ottawa. Para cada base, um ou mais métodos são propostos para mitigar o viés de similaridade, que pode ocorrer na estimativa de performance do diagnóstico de falhas. Os métodos consistem na definição da separação adequada dos dados para treinamento, validação e testes. Experimentos foram realizados com diferentes modelos de classificação e os resultados mostram que as propostas são eficazes para mitigar o viés de similaridade.

ABSTRACT: The similarity bias is a phenomenon that might happen in a data set when samples are originated from the same acquisition or are collected from similar equipment settings. This phenomenon may lead to overoptimistic estimations of machine learning algorithms. That overoptimistic estimation probably will not be reflected when models generated by these algorithms are put on production. The purpose of this work is to analise the similarity bias on vibration signals data sets for bearing fault detection. The used data sets are CWRU, Paderborn, MFPT and Ottawa. One or more method to mitigate the similarity bias for bearing fault diagnosis performance estimation are proposed for each data set. The methods consist on defining the proper data splits for training, validation and testing. Experiments were performed with different classification models and the results show that the proposed methods are effective to mitigate the similarity bias.


Collections: