Machine learning as a tool to investigate complex microbial consortia
No Thumbnail Available
URL
Journal Title
Journal ISSN
Volume Title
Kemian tekniikan korkeakoulu |
Master's thesis
Authors
Date
2021-08-24
Department
Major/Subject
Biotechnology
Mcode
CHEM3022
Degree programme
Master's Programme in Chemical, Biochemical and Materials Engineering
Language
en
Pages
106 + 7
Series
Abstract
Complex fermentation cultures are important area of research in food science. Many fermented foods and beverages are produced by using complex cultures. This thesis presents a convolutional neural network (CNN) -based model as a tool to study complex fermentation cultures. For model training, microscopy images of pure cultures of four types of microbes were prepared and used as training data. The pure cultures contained microbes of lactic acid bacteria (LAB), acetic acid bacteria (AAB), yeasts (Yeast) and yeast-like Geotrichum sp. (Geo). Hyperparameters such as model complexity, training iterations, scale invariant detection and image augmentation were altered to find the optimal values for the model training. First, experiments of a two-class model for the well distinguishable classes, LAB and Yeast, were performed. The experiments studied the impact of model complexity and training iterations, amount of training data, weight decay, class balance and imbalance in training data, scale invariant detection and image augmentation. Based on the experiment results of two-class models, the hyperparameters of four-class model experiments were selected. Results showed that a trained model with optimal hyperparameters can detect objects well on similar but unseen data. A four-class model with the best validation performance was obtained with the total training object error of 2.99 % and the total validation object error of 6.57 %. Using scale invariant detection improved the model training significantly. Testing phase was conducted for the three best four-class models based on total validation performance. Testing data consisted of microscopy images from mixed fermentation cultures. The smallest testing object error was obtained with an extra complex network, a weight decay of 0.001 and using scale invariant detection in model training. For this model, the total testing object error was 29.89 %. All models resulted in poor detection of the classes LAB and AAB (34.01 % and 61.20 %, respectively) which deteriorated the testing results. The class Geo was detected better (27.71 %) than the classes LAB and AAB, but the smallest testing object error was obtained for the class Yeast, 9.77 %. The inferior testing results were likely due to morphological differences between the microbes in pure and mixed cultures. The CNN-based model used in the study is a useful tool for cell counting. For practical use, microscopy images of mixed fermentation cultures could be added to the training data to possibly achieve better testing results.Kompleksiset fermentaatiokasvatukset ovat tärkeä ruokatieteiden tutkimusalue. Monet fermentoidut ruuat ja juomat valmistetaan hyödyntäen kompleksisia kasvatuksia. Tässä diplomityössä tutkitaan konvoluutioneuroverkko (CNN) -pohjaista mallia kompleksisissa kasvatuksissa esiintyvän neljän eri mikrobityypin tunnistuksessa kuvadatasta. Mallin opetuksessa käytettävä data koostui puhdasviljelmistä otetuista mikroskooppikuvista, jotka sisälsivät maitohappobakteereja (LAB), etikkahappobakteereja (AAB), hiivoja (Yeast) ja hiivankaltaisia mikrobeja, Geotrichum sp. (Geo). CNN-pohjaisen mallin eri hyperparametreja testattiin optimaalisen yhdistelmän saavuttamiseksi aluksi kahden luokan malleilla, joissa oli mukana kaksi toisistaan selkeästi erotettavaa luokkaa, LAB ja Yeast. Hyperparametreja olivat muun muassa mallin kompleksisuus, treenausiteraatioiden määrä, objektien skaalauksen ja kuvadatan keinotekoinen lisääminen. Kokeissa selvitettiin lisäksi treenausdatan määrän ja luokkakohtaisen datan tasapainon ja epätasapainon vaikutusta mallin generalisaatiokykyyn. Lisäksi selvitettiin regularisaation ja scale invariant detection -menetelmän vaikutusta. Kahden luokan kokeiden tuloksia hyödynnettiin neljän luokan kokeissa. Tulosten perusteella voidaan sanoa, että optimaalisten hyperparametrien ja asetusten käyttö parantaa mallin toimintaa ja kykyä tunnistaa objekteja uudesta samantyyppisestä datasta. Validaation perusteella parhaan neljän luokan mallin objektien tunnistusvirhe treenauksessa oli 2.99 % ja validaatiossa 6.57 %. Scale invariant detection -menetelmän käyttö paransi tuloksia merkittävästi. Kolme parasta mallia valittiin testausvaiheeseen. Testausdata koostui kompleksisten kasvatusten mikroskooppikuvista. Paras malli, jolla oli pienin testauksen objektien tunnistusvirhe, oli ekstrakompleksinen malli optimeilla hyperparametreilla ja regularisaatiolla. Tälle mallille testausvirhe oli 29.89 %. Luokkien LAB ja AAB objektien tunnistus oli heikkoa kaikilla malleilla. Pienimmät virheet näille luokille olivat vastaavasti 34.01 % ja 61.20 %. Näiden luokkien tunnistus vaikutti mallien suuriin testauksen kokonaisvirheisiin. Luokka Geo tunnistettiin paremmin (27.71 %) kuin luokat LAB ja AAB. Pienin tunnistusvirhe oli luokalle Yeast (9.77 %). Suurempi testausdatan tunnistusvirhe johtui todennäköisesti mikrobien morfologisista eroista puhdas- ja kompleksisten kasvatusten välillä. Työssä käytetyllä mallilla on potentiaalia solulaskennan työkaluna. Kompleksisten kasvatusten tutkimisessa treenausdataan voisi lisätä mikroskooppikuvia kompleksisista kasvatuksissa mahdollisesti mallin generalisaatiokyvyn parantamiseksi.Description
Supervisor
Frey, AlexanderThesis advisor
Juvonen, RiikkaKeywords
machine learning, convolutional neural network, object detection, cell counting, complex culture, microscopy