Remote surface contaminant detection using hyperspectral imaging and machine learning

No Thumbnail Available

URL

Journal Title

Journal ISSN

Volume Title

Perustieteiden korkeakoulu | Master's thesis

Date

2023-05-16

Department

Major/Subject

Materials Physics and Quantum Technology

Mcode

SCI3107

Degree programme

Master’s Programme in Engineering Physics

Language

en

Pages

65

Series

Abstract

This work sets out to detect organic residue (OR) from a glass surface remotely by imaging the surface with a hyperspectral imaging system and then using a machine learning (ML) classifier to automatically analyze the data to identify whether the surface is contaminated with OR. The specific type of ML classifier used in this work is called a multilayer perceptron (MLP) classifier. Hyperspectral imaging is a technique, where a continuous spectrum of electromagnetic radiation (ER) is recorded from the imaged scene at each pixel. This is in contrast to e.g. black and white imaging, where a single wide band of ER in the visible spectrum is recorded, or to traditional color imaging, where red, green, and blue bands of ER are recorded. The accurate and continuous spectrum of ER recorded from the imaged scene can be used to accurately analyze the materials in the image. Supervised machine learning methods are algorithms that can be used to fit a mathematical model on currently available and labeled training dataset. This fitted model can then be used to make accurate predictions on new data points. Machine learning methods allow computers to 'learn' relevant patterns from the training dataset, without the need for humans to explicitly program how the data should be analyzed. On top of being able to detect the OR from the glass surface, an additional goal of this work is to gain insight into what kind of patterns the MLP classifier is actually learning to detect from the hyperspectral data. This understanding could help in improving the methods used in this work in the future. 56 hyperspectral images from the glass surface are taken for the training and testing of the MLP classifiers. In half of the images, the surface is contaminated with OR, while in the rest the surface is clean. In total, 3740 MLP classifiers are trained, tested, and compared. Out of these, the best-performing classifiers reach an accuracy of over 80\% on a test dataset, separate from the training dataset. While no clear-cut answer to what the MLP classifiers learn from the hyperspectral data is found from their comparison, many new possible avenues for improvement are identified.

Tämän työn tavoitteena on kyetä havaitsemaan orgaanisia jäämiä lasipinnalta etäältä. Tämä tehdään kuvaamalla pintaa hyperspektrikuvantamisjärjestelmällä, ja analysoimalla näin saatu data koneoppimisluokittelijalla. Näin voidaan analysoida automaattisesti, onko pinnalla orgaanisia jäämiä vaiko ei. Koneoppimis luokittelija, jota tässä työssä käytetään, on nimeltään monikerroksinen perseptroniverkko (MLP). Hyperspektrikuvantaminen on tekniikka, jossa mitataan kuvattavan kohteen jatkuva sähkömagneettinen spektri jokaisessa kuvan kuvapisteessä. Tämä eroaa esimerkiksi mustavalkokuvauksesta, jossa mitataan yksi leveä kaista sähkömagneettista säteilyä näkyvien aallonpituuksien alueella, sekä värikuvauksesta, jossa mitataan kolme sähkömagneettisen säteilyn kaistaa punaisen, vihreän, sekä sinisen valon aallonpituuksilla. Tätä tarkkaa sekä jatkuvaa spektriä voidaan käyttää kuvassa näkyvien materiaalien tarkkaan analysointiin. Ohjatut koneoppimismenetelmät ovat algoritmeja, joilla voidaan sovittaa matemaattinen malli saatavilla olevaan koulutustietoaineistoon. Koulutustietoaineisto sisältää jokaiselle datapisteelle piirteet, joiden perusteella ennustuksia tehdään, sekä näihin liittyvät oikeat vastaukset. Sovitetulla mallilla voidaan ennustaa vastauksia uusille datapisteille niiden piirteiden perusteella. Koneoppimis menetelmiä hyödyntäen tietokoneet voivat 'oppia' datasta mitkä asiat ovat tärkeitä ja hyödyllisiä ennustuksien tekemiseen ilman, että ihmisen täytyy eksplisiittisesti ohjelmoida, miten data tulisi analysoida. Toinen tämän työn tavoite on saada selvyyttä siihen, mitä MLP luokittelija oikeastaan oppii havaitsemaan hyperspektridatasta. Tämä tieto voisi auttaa kehittämään käytettyjä menetelmiä tulevaisuudessa. Työssä otetaan 56 hyperspektrikuvaa lasipinnasta MLP luokittelijoiden koulutusta ja testaamista varten. Puolissa näistä kuvista lasipinnalla esiintyy orgaanisia jäämiä, ja lopuissa kuvissa lasipinta on puhdas. Yhteensä 3740 MLP luokittelijaa koulutetaan, testataan, ja verrataan. Näistä parhaat luokittelijat saavuttavat yli 80\% tarkkuuden testitietoaineistossa, joka on täysin erillinen koulutustietoaineistosta. Eri luokittelijoiden vertailusta ei saada selvää vastausta siihen, mitä MLP luokittelijat oppivat, mutta useita uusia mahdollisuuksia parantaa tarkkuutta löydetään.

Description

Supervisor

Alava, Mikko

Thesis advisor

Koivisto, Juha

Keywords

hyperspectral imaging, machine learning, multilayer perceptron, surface cleanliness, remote sensing

Other note

Citation