Generalization of a few-shot model for gear fault diagnosis

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

Perustieteiden korkeakoulu | Master's thesis

Date

2023-03-20

Department

Major/Subject

Machine Learning, Data Science and Artificial Intelligence

Mcode

SCI3044

Degree programme

Master’s Programme in Computer, Communication and Information Sciences

Language

en

Pages

65 + 0

Series

Abstract

Automated fault diagnosis can significantly reduce the workload of condition monitor- ing personnel. Deep learning based methods are one way to automate fault diagnosis. These methods can be used to infer machine faults from vibration data. However, deep learning methods based on standard supervised learning are very sensitive to changes in data distribution between training and testing. For fault diagnosis, they require fault data from all potential operating conditions. Because of this, the required amount of training data can become too extensive. Therefore, standard supervised learning based fault diagnosis models are rarely deployed in applications with variable speed and load conditions, such as ship thruster. Few-shot learning can be used to overcome the data gathering challenges of standard supervised learning methods. Few-shot learning is a sub-field of deep learning, which is defined by tasks with very few labelled samples. Few-shot models are pretrained with domain adjacent data in such a way, that they can learn to classify the final classes from as little as one example per class. The advantage of few-shot learning is that it can be used to learn new classes with the use of existing similar data without having to gather a full new dataset. This thesis expands previous research related to few-shot models for rotating machine fault diagnosis. A prototypical network based few-shot learning model was developed to diagnose gear faults from a powertrain. The generalization ability of the model was tested over changes in operating speed and sensor placement. In addition, model training was further optimized for rotating machine fault diagnosis with fast Fourier transform and a novel method of operating speed batching. The results suggest that the developed few-shot learning model generalizes well to changes in operating speed and sensor placement, given just one sample from the new operating conditions. The results can be considered novel since previous research does not contain such large changes in operating conditions as this study and because of the combination of changes to the training algorithm. This study could have industrial relevance as it shows that few-shot models can significantly reduce the amount of data needed to perform deep learning fault diagnosis in changing operating conditions.

Automaattiset vikadiagnostiikkamenetelmät voivat merkittävästi vähentää kunnon- valvontahenkilöstön työmäärää. Syväoppimiseen perustuvat menetelmät ovat yksi tapa automatisoida vikadiagnostiikkaa. Näitä menetelmiä voidaan käyttää tunnistamaan erilaisia vikoja koneen värähtelystä. Perinteiseen ohjattuun oppimiseen perustuvat syväoppimismenetelmät ovat kuitenkin hyvin herkkiä datan jakauman muutoksille koulutuksen ja testaamisen välillä. Käytännön vikadiagnostiikkaa varten ne tarvitsevat esimerkkidataa kaikista mahdollisista käyttöolosuhteista, jolloin tarvittavan koulutusdatan määrä voi kasvaa epäkäytännöllisen suureksi. Tämän lisäksi kaikki muutokset koneen antureiden sijoitteluun vaativat syväoppimismallin täyden uudelleenkoulutuksen. Muutamasta esimerkistä oppimista voidaan käyttää vähentämään tarvittavan koulutusdatan määrää perinteiseen ohjattuun oppimiseen verrattuna. Muutamasta esimerkistä oppiminen on syväoppimisen osa-alue, joka keskittyy ongelmiin, joista on hyvin vähän esimerkkejä. Muutaman esimerkin mallit esikoulutetaan lopullista dataa muistuttavalla datalla siten, että ne voivat oppia lopulliset luokat hyvin vähästä määrästä esimerkkejä. Muutamasta esimerkistä oppimisen etuna on, että sitä voidaan käyttää uusien luokkien oppimiseen hyödyntämällä olemassa olevaa samanlaista dataa. Tämä opinnäytetyö laajentaa aikaisempaa tutkimusta muutaman esimerkin mallien käyttöön pyörivien koneiden vikadiagnostiikassa. Tässä työssä kehitettiin proto- tyyppisiin verkkoihin perustuva muutaman esimerkin malli vaihteistovikojen diagnosoimiseen voimansiirrossa. Mallin yleistymiskykyä testattiin muutoksilla koneen pyörimisnopeuteen ja anturien sijoitteluun. Lisäksi mallin koulutusta pyörivien koneiden vikadiagnostiikkaan kehitettiin nopealla Fourier-muunnoksella ja uudella pyörimisnopeuksien erottelumenetelmällä. Työn tulokset näyttävät, että kehitetty malli yleistyy hyvin pyörimisnopeuksien ja anturien paikkojen vaihteluihin, kun mallille annetaan yksi uusi esimerkki kustakin uudesta käyttöolosuhteesta. Tuloksia voidaan pitää uusina, koska aikaisempi tutkimus ei ole sisältänyt yhtä suuria muutoksia tutkittuihin käyttöolosuhteisiin ja koska koulutusmenetelmään tehtyjä muutoksia ei ole käytetty yhdessä aiemmin.

Description

Supervisor

Viitala, Raine

Thesis advisor

Miettinen, Jesse

Keywords

few-shot learning, deep learning, gear fault diagnosis, vibration

Other note

Citation