Synthesising rotating machine faults into vibration data with generative adversarial networks

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Insinööritieteiden korkeakoulu | Master's thesis
Date
2024-01-22
Department
Major/Subject
Mechanical Engineering
Mcode
Degree programme
Master's Programme in Mechanical Engineering (MEC)
Language
en
Pages
58
Series
Abstract
Effective condition monitoring is vital for maintaining the reliability of complex systems. One of the most laborious aspects of training deep learning models for fault diagnosis in condition monitoring lies in data acquisition. Large volumes of data are often required for training, testing, and validation to achieve optimal model performance. However, creating a balanced dataset can be a challenging task, as the available data may be unbalanced, with fewer samples from faulty conditions than from healthy ones. Researchers have explored various techniques, including data augmentation and resampling, to enlarge the dataset and enhance model performance. It is important to acknowledge that while these approaches can offer advantages, they may also present challenges, such as the potential introduction of new elements to the data distribution from which the model attempts to learn the underlying function. Ensuring generalisation of the solution to different operating conditions is crucial. This thesis explores the use of Generative Adversarial Networks (GANs) to synthesise labelled fault data for fault diagnosis. GANs consist of a generator and discriminator network, where the generator produces synthetic faults embedded into healthy samples, and the discriminator distinguishes real signals from synthesised ones. GANs, in principle, have the capacity to enrich the data distribution, potentially bringing additional benefits for optimisation and, for instance, mitigating overfitting. By utilizing GAN synthesised data to balance the training dataset, the accuracy of DL-based fault diagnosis algorithms can be enhanced. However, the quality of synthesised data plays a vital role, necessitating its evaluation for representativeness and impact on model performance. This thesis addresses the research questions regarding better performing model architectures and practices for fault data synthesis, accuracy of fault synthesis, the effect of synthesised data on model performance, and generalisation of the fault synthesiser network across diverse operating conditions. Solving the data imbalance problem while preserving generalisation is critical for successful DL-based fault diagnosis systems in practice.

Tehokas kunnonvalvonta on tärkeää monimutkaisten järjestelmien luotettavuuden ylläpitämiseksi. Tiedonkeruu on yksi työläimpiä tehtäviä kunnonvalvonnan vikadiagnostiikkaan käytettävien syväoppimismallien koulutuksessa. Näiden mallien koulutukseen, testaukseen ja validointiin tarvitaan usein suuria määriä vikaesimerkkejä hyvän suorituskyvyn saavuttamiseksi. Tasapainotetun vikanäyteaineiston luominen on kuitenkin haastava tehtävä, koska saatavilla olevia esimerkkejä on usein epätasapainoisesti, jolloin aineistossa esiintyy näytteitä virheellisistä olosuhteista harvemmin kuin terveistä olosuhteista. Erilaisia tekniikoita epätasapainon ratkaisemiseen on tutkittu, kuten näytteiden augmentointi sekä uudelleennäytteistäminen, joilla pyritään laajentamaan aineistoa ja parantamaan mallin suorituskykyä. On hyvä huomioida, että vaikka nämä lähestymistavat voivat tarjota etuja, ne voivat myös tuoda haasteita, kuten mahdollisesti luokittelua häiritsevien ominaisuuksien lisäyksen aineistoon, josta malli yrittää oppia luokittelulle oleellisia piirteitä. Mallin yleistäminen erilaisiin käyttöolosuhteisiin on tärkeää. Tämä opinnäytetyö tutkii generatiivisien kilpailevien verkkojen (GAN) käyttöä vikanäytteiden syntetisoimiseksi vikadiagnoostiikkaa varten. GAN:it koostuvat generaattori- ja erotinverkosta, jossa generaattori tuottaa synteettisiä vikoja upotettuna terveisiin näytteisiin ja erottelija erottaa todelliset signaalit syntetisoiduista. GAN:illa on kyky laajentaa aineistoa, mikä saattaa tuoda lisäetuja optimointiin ja se voi esimerkiksi vähentää mallin ylisovitusta. Hyödyntämällä GAN-syntetisoitua näytteitä harjoitusaineiston tasapainottamiseen, syväoppivien vianmääritysalgoritmien tarkkuutta voidaan parantaa. Syntetisoitujen näytteiden laadulla on kuitenkin keskeinen rooli, minkä vuoksi sen samanlaisuutta oikeisiin vikoihin sekä vaikutusta mallin suorituskykyyn on arvioitava. Tämä opinnäytetyö käsittelee tutkimuskysymyksiä toimivista malliarkkitehtuureista ja vikanäytteiden synteesin käytännöistä, vikasynteesin tarkkuudesta, syntetisoidun datan vaikutuksesta mallin suorituskykyyn ja vikasyntetisaattoriverkon yleistämiseen erilaisissa käyttöolosuhteissa. Aineiston epätasapaino-ongelman ratkaiseminen on tärkeää syväoppivien vianmääritysjärjestelmien tarkkuudelle.
Description
Supervisor
Viitala, Raine
Thesis advisor
Hämäläinen, Aleksanteri
Keywords
WGAN-GP, data synthesis, deep learning, intelligent fault diagnosis, condition monitoring
Other note
Citation