Human-in-the-loop Applications in Bayesian Optimization for Materials Science
Loading...
URL
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu |
Master's thesis
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Authors
Date
2024-06-19
Department
Major/Subject
Materials Physics and Quantum Technology
Mcode
SCI3107
Degree programme
Master’s Programme in Engineering Physics
Language
en
Pages
33+8
Series
Abstract
Bayesian optimization (BO) is a machine learning method for finding the optima of unknown functions in the fewest number of iterations. In materials science, BO can be used for optimizing material compositions for a target property, such as the environmental stability of a perovskite material for perovskite solar cells. In this use BO can accelerate the development of next-generation energy solutions. However, machine learning methods generally struggle to meet the human ability to adapt to anomalies such as varying sample quality, which limits the use cases in automated materials optimization. This issue can be addressed by adding humans into the machine learning loop (HITL) as an additional data source for \textit{e.g.} commenting on sample quality during the BO cycle. This work consists of a literature review on HITL and its applications in materials science, as well as a computational implementation of HITL in simulated optimization of perovskite stability. The HITL was implemented with multitask BO using perovskite stability as the primary target and human opinion on the sample quality as a secondary source. Existing experimental results were used as ground truth for the perovskite stability while human expert opinion was simulated with a corresponding sample quality landscape developed based on experiments. The performance of the HITL approach was benchmarked against a traditional single task BO that does not use humans as a data source. The HITL method increases trust in the BO results by showing certain samples to humans during the BO loop. The number of samples shown depends on the task cost parameter set by the user and the noise level of the optimization target, with larger noise levels corresponding to an increased number of human queries. The HITL method performs similarly to the single task BO and neither accelerated nor slowed down the convergence.Bayesilainen optimointi (BO) on koneoppimismenetelmä, joka mahdollistaa tuntemattomien funktioiden optimiarvojen löytämisen mahdollisimman pienellä määrällä iteraatioita. Materiaalitieteen tarkoituksissa BO:ta voidaan käyttää optimoimaan materiaalin koostumus tiettyä kohdeominaisuutta varten, kuten esimerkiksi perovskiitin vakautta ympäristötekijöitä vastaan perovskiittiaurinkokennoja varten. Tässä käytössä BO voi kiihdyttää seuraavan sukupolven energiaratkaisujen kehittämistä. Koneoppimismenetelmät ovat kuitenkin taipuvaisia sopeutumaan ihmisiä huonommin poikkeustilanteisiin, kuten näytteiden laadun vaihteluun, mikä rajoittaa niiden hyödyntämistä automatisoidussa materiaalioptimoinnissa. Tätä ongelmaa voidaan korjata lisäämällä ihminen osaksi koneoppimissilmukkaa (human-in-the-loop, HITL) esimerkiksi uutena datalähteenä kommentoimaan näytteiden laatua BO:n aikana. Työ sisältää kirjallisuuskatsauksen HITL -menetelmistä koneoppimiskirjallisuudessa sekä sen sovelluksista materiaalitieteen tarkoituksissa. Toteutan HITL-lähestymistavalla perovskiitin stabiiliuden optimointiin tarkoitetun BO-simulaation. HITL toteutetaan monitavoite-BOn kautta käyttämällä perovskiitin stabiiliutta ensisijaisena optimointikohteena ja ihmistä toissijaisena datalähteenä. Olemassa olevia tuloksia kokeellisesta perovksiitin optimoinnista käytetään pohjatotuutena stabiiliudelle. Ihmisasiantuntijan mielipidettä simuloidaan vastaavalla mallilla joka tarjoaa arvioita näytteiden laadusta ennen stabiiliuden mittausta. HITL-menetelmän suoriutumista verrataan perinteiseen yhden tehtävän BOn tuloksiin. HITL-menetelmä lisää luottamusta BO:n tuloksiin näyttämällä osan näytteistä ihmisille optimoinnin aikana. Näytettyjen näytteiden määrä riippuu käyttäjän asettamasta task cost -parametrista sekä optimointikohteen kohinan tasosta siten, että korkeampi kohinataso johtaa suurempaan määrään ihmiselle näytettäviä näytteitä. Lopputuloksena ihmisen lisääminen ei auta ohjaamaan optimin etsintää oikeaan kohteeseen eikä kiihdyttämään oikean optimin löytämistä.Description
Supervisor
Rinke, PatrickThesis advisor
Tiihonen, ArmiKeywords
Bayesian optimization, human-in-the-loop, perovskites, materials science