Learning Centre

A Deep Learning Model for Filtering Unusable Visual Data

 |  Login

Show simple item record

dc.contributor Aalto-yliopisto fi
dc.contributor Aalto University en
dc.contributor.advisor Havimo, Mikko
dc.contributor.author Saastamoinen, Severi
dc.date.accessioned 2023-01-29T18:17:11Z
dc.date.available 2023-01-29T18:17:11Z
dc.date.issued 2023-01-24
dc.identifier.uri https://aaltodoc.aalto.fi/handle/123456789/119475
dc.description.abstract In this Master's Thesis, we study the creation of a classification model using deep learning neural networks for visual data. The purpose of the Thesis was to automatically filter out unusable pictures in defect recognition at a steel plant in order to streamline daily operations. The model was created as a classification model which tags entire pictures into three categories: "DimPictures", "ReflectionPictures" and "GoodQualityPictures". The data was downloaded from company databases and tagged manually to belong into one of the categories. Thus it was possible to create the model as a supervised machine learning model. The model performs well against the testing data with a 96% accuracy and performs fast enough to handle incoming datastreams on a batch-by-batch basis without getting overwhelmed. The more layers the underlying neural network had, the faster the model became. It is questionable whether the original training data is enough to account for all real-world pictures, but this can be improved by adding manually misclassified pictures as training data for the model. This implies that the model performs adequately in handling incoming data on a batch-by-batch basis. The model could benefit from further tweaks to its neural network making it have a more complex layered structure. The model could also use more training data to prevent it from having a potential over-fit indicated by the discrepancy between the training and testing loss functions. However, more training data will become available from running the model on production data and this should address the over-fit issue. en
dc.description.abstract Tässä diplomityössä luodaan luokittelumalli kuvien lajitteluun. Malli luotiin käyttäen apuna syväoppimisneuroverkkoja. Työn tavoitteena oli kehittää malli, joka automaattisesti seuloo käyttökelvottomia kuvia käyttökelpoisten joukosta työajan säästämiseksi terästehtaalla. Malli rakennettiin luokittelumallina, joka lajittelee kokonaisia kuvia kolmeen kategoriaan: ”DimPictures”, ”ReflectionPictures” ja ”GoodQualityPictures”. Koulutukseen käytetty data ladattiin yhtiön tietokannoista ja lajiteltiin manuaalisesti kuva kerrallaan yhteen näistä kolmesta tietokannasta. Täten datan pohjalta oli mahdollista kehittää valvottu koneoppimismalli. Malli suoriutui hyvin testausdatasta 96 %:n tarkkuudella. Se käsittelee dataa riittävän nopeasti selviytyäkseen tuotannon päivittäisestä datavirrasta satseittain käsitellen dataa nopeammin kuin mitä sitä tulee. Mitä enemmän kerroksia neuroverkossa oli, sitä nopeammaksi laskenta muuttui. On kyseenalaista, riittääkö alkuperäinen koulutusdata ottamaan huomioon todellisen tuotantoympäristön vaihtelun kuvien välillä. Tämä tulee kuitenkin parantumaan, kun mallin väärin luokittelemia kuvia tullaan lisäämän mallin koulutusdataan mallia ajettaessa. Kaikesta päätellen malli kykenee käsittelemään sille tulevaa dataa riittävän hyvin. Mallia voitaisiin kehittää hyödyntämällä monimutkaisempaa neuroverkon rakennetta ja suurempaa määrää koulutusdataa, joka estäisi mahdollista ylisovitusta, johon ero koulutuksen ja testauksen tappiofunktioiden välillä vihjaa. Koulutusdataa tullaan kuitenkin saamaan lisää mallia ajettaessa, jonka pitäisi ratkaista ylisovitusongelmat. fi
dc.format.extent 42
dc.format.mimetype application/pdf en
dc.language.iso en en
dc.title A Deep Learning Model for Filtering Unusable Visual Data en
dc.title Syväoppimismalli käyttökelvottoman kuvadatan suodattamiseksi fi
dc.type G2 Pro gradu, diplomityö fi
dc.contributor.school Perustieteiden korkeakoulu fi
dc.subject.keyword classification model en
dc.subject.keyword deep learning en
dc.subject.keyword machine vision en
dc.subject.keyword digitalization en
dc.subject.keyword supervised machine learning en
dc.subject.keyword sample quality en
dc.identifier.urn URN:NBN:fi:aalto-202301291825
dc.programme.major Systems and Operations Research fi
dc.programme.mcode SCI3055 fi
dc.type.ontasot Master's thesis en
dc.type.ontasot Diplomityö fi
dc.contributor.supervisor Salo, Ahti
dc.programme Master’s Programme in Mathematics and Operations Research fi
local.aalto.electroniconly yes
local.aalto.openaccess yes


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search archive


Advanced Search

article-iconSubmit a publication

Browse

Statistics