Feature Space Density Estimation on Foundation Model Predictions
No Thumbnail Available
Files
Vesala_Emmi-Lotta_2024.pdf (2.97 MB) (opens in new window)
Aalto login required (access for Aalto Staff only).
URL
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu |
Bachelor's thesis
Electronic archive copy is available locally at the Harald Herlin Learning Centre. The staff of Aalto University has access to the electronic bachelor's theses by logging into Aaltodoc with their personal Aalto user ID. Read more about the availability of the bachelor's theses.
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Authors
Date
2024-06-28
Department
Major/Subject
Matematiikka ja systeemitieteet
Mcode
SCI3029
Degree programme
Teknistieteellinen kandidaattiohjelma
Language
en
Pages
18
Series
Abstract
In this work, a method requiring a relatively low amount of manually processed data is studied for producing bilberry yield estimates from image data. The method consist of three stages: first, the images are segmented using Segment Anything Model. The segments are then encoded into features, and lastly, Gaussian mixture model is used for separating bilberry segments from other segments. Additionally, we perform post-processing to further improve the classification accuracy. The model is trained using a relatively small number of manually selected bilberry segments, the number of which is increased by means of data augmentation. The performance of the model is evaluated by calculating true berry counts for 154 images and comparing the predictions of the model to those by using linear regression. A clear positive correlation is observed between the predictions of the model and the true berry counts with Pearson correlation coefficient 0.9. This signifies that the model performs relatively well in producing predictions.Tässä työssä tutkitaan pienellä määrällä käsintuotettua dataa koulutettavaa menetelmää mustikkasatoennusteiden luomiseksi kuvadatasta. Menetelmä koostuu kolmesta vaiheesta: ensin kuvat segmentoidaan käyttäen Segment Anything -mallia. Tämän jälkeen segmenteille muodostetaan piirrevektorit, ja lopuksi segmentit luokitellaan käyttäen Gaussin sekoitemallia. Lisäksi saadut ennusteet jälkikäsitellään luokittelutarkkuuden parantamiseksi. Malli koulutetaan käyttäen suhteellisen pientä määrää käsin valikoituja mustikkasegmenttejä ja lisäämällä koulutusdataa keinotekoisesti. Mallin suoriutumista arvioidaan laskemalla ennusteet marjamääristä 154 kuvalle, ja mallin antamia ennusteita verrataan todellisiin kuvista laskettuihin marjamääriin lineaarisen regression avulla. Mallin antamien ennusteiden ja todellisten marjamäärien välillä havaitaan selkeä positiivinen korrelaatio, jolle lasketun Pearsonin korrelaatiokertoimen arvo 0,9 kertoo mallin suorituvan suhteellisen hyvin ennusteiden tuottamisesta.Description
Supervisor
Hannukainen, AnttiThesis advisor
Taher, JosefKeywords
density estimation, Gaussian mixture model, yield estimation, bilberry