Materials Informatics - Augmenting Materials Research with Data-driven Design and Machine Learning
Loading...
Journal Title
Journal ISSN
Volume Title
School of Science |
Doctoral thesis (article-based)
| Defence date: 2020-02-27
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Author
Date
2020
Major/Subject
Mcode
Degree programme
Language
en
Pages
94 + app. 73
Series
Aalto University publication series DOCTORAL DISSERTATIONS, 26/2020
Abstract
Materials science is the systematic study and development of materials and their properties. Materials informatics and data-driven materials science are umbrella terms for the scientific practice of systematically extracting knowledge from data produced in materials science. This practice differs from traditional scientific approaches in materials research by the volume of processed data and the more automated way information is extracted. This data-driven approach — sometimes referred to as the 4th paradigm of science — is largely driven by the use of modern hardware and software for data production and storage, the Open Science movement and the methodological developments in data mining and machine learning. This dissertation reviews how materials informatics can be effectively applied to accelerate materials science, focusing on computational, atomistic materials modelling. The topic is divided into two different areas: how the data-driven design and tools are being used to re-imagine the life-cycle of materials data and how machine learning, in particular, can be used to complement existing research methodologies in materials science. These topics are explored by investigating the historical development of materials informatics and by highlighting the modern tools and techniques. This discussion provides a guide for anyone interested in deploying these methods in their research and also covers some of the key challenges that the field of materials informatics still faces. After this overview, the original materials informatics research performed during the studies is summarized. First, the open-source software libraries developed for materials informatics are introduced. These libraries deal specifically with tasks related to the automated structural classification of complex atomistic geometries and the efficient description of materials for machine learning. Next, the studies related to materials discovery using data mining and machine learning are discussed. The first study leverages materials databases in the search for optimal coating materials for perovskite-based photovoltaics while the second study focuses on using machine learning for identifying catalytically active sites on nanoclusters.Materiaalitiede pyrkii ymmärtämään ja mallintamaan materiaalien ominaisuuksia ja valjastamaan näitä ominaisuuksia erilaisiin sovelluksiin. Materiaali-informatiikka ja datalähtöinen materiaalitiede ovat yläkäsitteitä käytännöille, joissa olemassaolevia tietomassoja hyödynnetään tehokkaasti materiaalituntemuksen edistämiseksi. Tämä eroaa perinteisistä tieteellisistä lähestymistavoista, sillä prosessoidun tiedon määrä on suurempi vaatien lähes täysin automatisoituja menetelmiä. Tätä datalähtöistä lähestymistapaa on myös kutsuttu tieteen neljänneksi paradigmaksi. Se syntyyn ovat vaikuttaneet kyky tuottaa ja tallentaa suuria tietomääriä modernin tietokonelaitteiston ja -ohjelmiston avulla, avoimen tieteen periaatteiden käyttöönotto sekä tiedon louhintaan ja koneoppimiseen käytettyjen menetelmien kehitys. Tässä väitöskirjassa tarkastellaan kuinka materiaali-informatiikkaa voidaan tehokkaasti soveltaa materiaalitieteen nopeuttamiseen keskittyen laskennalliseen, atomistiseen materiaalien mallintamiseen. Aihe on jaettu kahteen eri osa-alueeseen: miten datalähtöistä suunnittelua ja siihen liittyviä työkaluja käytetään materiaalitiedon elinkaaren uudelleenjärjestämiseen ja kuinka erityisesti koneoppimista voidaan käyttää olemassa olevien tutkimusmenetelmien täydentämiseksi. Näitä aiheita lähestytään tutkimalla materiaali-informatiikan historiallista kehitystä ja nostamalla esiin nykyaikaisia työkaluja ja tekniikoita. Tämä yhteenveto tarjoaa oppaan kaikille, jotka ovat kiinnostuneita näiden menetelmien käyttöönotosta tutkimuksessaan tuoden samalla esiin materiaali-informatiikan keskeisimpiä haasteita.Tämän yleiskatsauksen jälkeen esitellään opintojen aikana suoritettu alkuperäinen materiaalitutkimus. Aluksi käydään läpi materiaali-informaatiikkaa varten kehitetyt avoimen lähdekoodin ohjelmistokirjastot. Nämä kirjastot käsittelevät monimutkaisten atomististen geometrioiden automaattista rakenteellista luokittelua ja materiaaleja kuvaavan syötteen tehokasta muodostamista koneoppimista varten. Seuraavaksi esitellään tutkimukset, joissa tiedon louhintaa ja koneoppista käytetään uusien materiaalien etsimiseen kahdessa eri sovelluskohteessa. Ensimmäisessä tutkimuksessa hyödynnetään materiaalitietokantoja etsittäessä optimaalisia pinnoitemateriaaleja perovskiittipohjaisille aurinkokennoille, kun taas toisessa tutkimuksessa käytetään koneoppimista katalyyttisesti aktiivisten sijaintien tunnistamiseen nanoklustereissa.Description
Supervising professor
Rinke, Patrick, Prof., Aalto University, Department of Applied Physics, FinlandThesis advisor
Foster, Adam Stuart, Prof., Aalto University, Department of Applied Physics, FinlandKeywords
materials informatics, materials science, machine learning, data-driven science, materiaali-informatiikka, materiaalitiede, koneoppiminen, datalähtöinen tiede
Other note
Parts
-
[Publication 1]: Marc O.J. Jäger, Eiaki V. Morooka, Filippo Federici Canova, Lauri Himanen, Adam S. Foster. Machine learning hydrogen adsorption on nanoclusters through structural descriptors. npj Computational Materials, 2018, Volume 4, Number 37, 8 pages.
Full text in Acris/Aaltodoc: http://urn.fi/URN:NBN:fi:aalto-201808214689DOI: 10.1038/s41524-018-0096-5 View at publisher
-
[Publication 2]: Lauri Himanen, Patrick Rinke, Adam S. Foster. Materials structure genealogy and high-throughput topological classification of surfaces and 2D materials. npj Computational Materials, 2018, Volume 4, Number 52, 10 pages.
Full text in Acris/Aaltodoc: http://urn.fi/URN:NBN:fi:aalto-201810165390.DOI:
-
[Publication 3]: Azimatu Seidu, Lauri Himanen, Jingrui Li, Patrick Rinke. Database-driven high-throughput study of coating materials for hybrid perovskites. New Journal of Physics, 2019, Volume 1, Number 8, 6 pages.
Full text in Acris/Aaltodoc: http://urn.fi/URN:NBN:fi:aalto-201909205355DOI: 10.1088/1367-2630/ab34f0 View at publisher
-
[Publication 4]: Lauri Himanen, Amber Geurts, Adam S. Foster, Patrick Rinke. Data-driven materials science: status, challenges and perspectives. Advanced Science, 2019, Volume 6, Number 21, 23 pages.
DOI: 10.1002/advs.201900808 View at publisher
-
[Publication 5]: Lauri Himanen, Marc O. J. Jäger, Eiaki V. Morooka, Filippo Federici Canova, Yashasvi S. Ranawat, David Z. Gao, Patrick Rinke, Adam S. Foster. DScribe: Library of Descriptors for Machine Learning inMaterials Science. Computer Physics Communications, 2019, Volume 247, Article number 106949, 12 pages.
Full text in Acris/Aaltodoc: http://urn.fi/URN:NBN:fi:aalto-201911076187DOI: 10.1016/j.cpc.2019.106949 View at publisher