Remote surface contaminant detection using hyperspectral imaging and machine learning
No Thumbnail Available
URL
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu |
Master's thesis
Authors
Date
2023-05-16
Department
Major/Subject
Materials Physics and Quantum Technology
Mcode
SCI3107
Degree programme
Master’s Programme in Engineering Physics
Language
en
Pages
65
Series
Abstract
This work sets out to detect organic residue (OR) from a glass surface remotely by imaging the surface with a hyperspectral imaging system and then using a machine learning (ML) classifier to automatically analyze the data to identify whether the surface is contaminated with OR. The specific type of ML classifier used in this work is called a multilayer perceptron (MLP) classifier. Hyperspectral imaging is a technique, where a continuous spectrum of electromagnetic radiation (ER) is recorded from the imaged scene at each pixel. This is in contrast to e.g. black and white imaging, where a single wide band of ER in the visible spectrum is recorded, or to traditional color imaging, where red, green, and blue bands of ER are recorded. The accurate and continuous spectrum of ER recorded from the imaged scene can be used to accurately analyze the materials in the image. Supervised machine learning methods are algorithms that can be used to fit a mathematical model on currently available and labeled training dataset. This fitted model can then be used to make accurate predictions on new data points. Machine learning methods allow computers to 'learn' relevant patterns from the training dataset, without the need for humans to explicitly program how the data should be analyzed. On top of being able to detect the OR from the glass surface, an additional goal of this work is to gain insight into what kind of patterns the MLP classifier is actually learning to detect from the hyperspectral data. This understanding could help in improving the methods used in this work in the future. 56 hyperspectral images from the glass surface are taken for the training and testing of the MLP classifiers. In half of the images, the surface is contaminated with OR, while in the rest the surface is clean. In total, 3740 MLP classifiers are trained, tested, and compared. Out of these, the best-performing classifiers reach an accuracy of over 80\% on a test dataset, separate from the training dataset. While no clear-cut answer to what the MLP classifiers learn from the hyperspectral data is found from their comparison, many new possible avenues for improvement are identified.Tämän työn tavoitteena on kyetä havaitsemaan orgaanisia jäämiä lasipinnalta etäältä. Tämä tehdään kuvaamalla pintaa hyperspektrikuvantamisjärjestelmällä, ja analysoimalla näin saatu data koneoppimisluokittelijalla. Näin voidaan analysoida automaattisesti, onko pinnalla orgaanisia jäämiä vaiko ei. Koneoppimis luokittelija, jota tässä työssä käytetään, on nimeltään monikerroksinen perseptroniverkko (MLP). Hyperspektrikuvantaminen on tekniikka, jossa mitataan kuvattavan kohteen jatkuva sähkömagneettinen spektri jokaisessa kuvan kuvapisteessä. Tämä eroaa esimerkiksi mustavalkokuvauksesta, jossa mitataan yksi leveä kaista sähkömagneettista säteilyä näkyvien aallonpituuksien alueella, sekä värikuvauksesta, jossa mitataan kolme sähkömagneettisen säteilyn kaistaa punaisen, vihreän, sekä sinisen valon aallonpituuksilla. Tätä tarkkaa sekä jatkuvaa spektriä voidaan käyttää kuvassa näkyvien materiaalien tarkkaan analysointiin. Ohjatut koneoppimismenetelmät ovat algoritmeja, joilla voidaan sovittaa matemaattinen malli saatavilla olevaan koulutustietoaineistoon. Koulutustietoaineisto sisältää jokaiselle datapisteelle piirteet, joiden perusteella ennustuksia tehdään, sekä näihin liittyvät oikeat vastaukset. Sovitetulla mallilla voidaan ennustaa vastauksia uusille datapisteille niiden piirteiden perusteella. Koneoppimis menetelmiä hyödyntäen tietokoneet voivat 'oppia' datasta mitkä asiat ovat tärkeitä ja hyödyllisiä ennustuksien tekemiseen ilman, että ihmisen täytyy eksplisiittisesti ohjelmoida, miten data tulisi analysoida. Toinen tämän työn tavoite on saada selvyyttä siihen, mitä MLP luokittelija oikeastaan oppii havaitsemaan hyperspektridatasta. Tämä tieto voisi auttaa kehittämään käytettyjä menetelmiä tulevaisuudessa. Työssä otetaan 56 hyperspektrikuvaa lasipinnasta MLP luokittelijoiden koulutusta ja testaamista varten. Puolissa näistä kuvista lasipinnalla esiintyy orgaanisia jäämiä, ja lopuissa kuvissa lasipinta on puhdas. Yhteensä 3740 MLP luokittelijaa koulutetaan, testataan, ja verrataan. Näistä parhaat luokittelijat saavuttavat yli 80\% tarkkuuden testitietoaineistossa, joka on täysin erillinen koulutustietoaineistosta. Eri luokittelijoiden vertailusta ei saada selvää vastausta siihen, mitä MLP luokittelijat oppivat, mutta useita uusia mahdollisuuksia parantaa tarkkuutta löydetään.Description
Supervisor
Alava, MikkoThesis advisor
Koivisto, JuhaKeywords
hyperspectral imaging, machine learning, multilayer perceptron, surface cleanliness, remote sensing