Laser Diffraction Mono-Photogrammetric Depth Inference Uncertainty And Error Prediction With Mixed-Data Neural Network
Loading...
URL
Journal Title
Journal ISSN
Volume Title
Sähkötekniikan korkeakoulu |
Master's thesis
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Authors
Date
2020-10-19
Department
Major/Subject
Control, Robotics, And Autonomous Systems
Mcode
ELEC3025
Degree programme
AEE - Master’s Programme in Automation and Electrical Engineering (TS2013)
Language
en
Pages
50 + 1
Series
Abstract
Computer vision is a common requirement for many automation applications, such as robotics, quality assurance, or logistics. Computer vision includes often 3D reconstruction of the seen environment. Lase r diffraction mono-photogrammetry is a 3D reconstruction method capable to form precise point clouds in real-time from the prevailing scene. However, the laser diffraction mono-photogrammetric measurements are unreliable in some special cases. The unreliable measurements distort the 3D reconstruction, especially in the depth dimension. Because of this, the unreliable measurements are filtered. However, unreliable measurements are difficult to foresee, which makes the filtering inefficient. This thesis introduces an error predictive regression model to predict the 3D reconstruction error in the depth dimension for laser diffraction mono-photogrammetric measurements. With the error predictions, error-prone measurements can be filtered efficiently before the final 3D reconstruction. Furthermore, the model provides aleatoric uncertainty for the measurements, which helps to identify problematic measurements with an unusual error variance. The error predictive model was composed of an artificial neural network combining visual and numerical data from the measurements. The model was trained and tested with synthetic training data. The testing included simple filtering with a $1cm$ depth error and $0.5$ error variance thresholds. As a result, a $0.987$ probability of correctly filtering error-prone measurements was achieved.Konenäkö on yleinen edellytys monelle automaatiosovellutuksille, kuten robotiikkaan, laadunvalvontaan tai logistiikkaan. Usein konenäössä edellytetään näkymän kolmiulotteista mallintamista. Laserdiffraktiomono-fotogrammetria on 3D-mallintamismetodi, jolla pystytään muodostamaan tarkka pistepilvi ympäristöstä reaaliaikaisesti. Laserdiffraktiomono-fotogrammetriset mittaukset ovat kuitenkin epäluotettavia joissakin erikoisissa tilanteissa. Epäluotettavat mittaukset aiheuttavat kolmiulotteiseen mallintamiseen virheitä erityisesti syvyysulottuvuudessa. Tästä syystä epäluotettavia mittauksia pyritään suodattamaan, mutta epäluotettavien mittausten tunnistaminen etukäteen on vaikeaa. Tässä työssä esitellään syvyysvirheen ennustava regressiomalli laserdiffraktiomono-fotogrammetrisia mittauksia varten. Virhe-ennustuksilla voidaan helpottaa epäluotettavien mittausten tunnistamista ja sitä myötä helpottaa niiden suodattamista. Lisäksi regressiomalli ennustaa mittausten aleatorisen epävarmuuden, jolla pystytään tunnistamaan ongelmallisia mittauksia, joilla on poikkeuksellisen suuri virhe varianssi. Virheen ennustava regressiomalli kehitettiin syväopitulla neuroverkolla, joka hyödynsi visuaalista ja numeerista tietoa mittauksista. Regressiomalli koulutettiin ja testattiin synteettisellä harjoitteludatalla. Testaukseen kuului myös yksinkertaisen suodatus, jonka tarkoitus oli suodattaa kaikki mittaukset, joille ennustettiin yli $1cm$ virhettä tai $0.5$ virhevarianssia. Lopputuloksena suodattimelle mitattiin $0.987$ todennäköisyys suodattaa epäluotettava mittaus.Description
Supervisor
Kyrki, VilleThesis advisor
Savolainen, TuomasKeywords
deep learning, computer vision, 3D reconstruction, regression