On complicated dependency structures

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
School of Science | Doctoral thesis (article-based) | Defence date: 2023-10-13
Date
2023
Major/Subject
Mcode
Degree programme
Language
en
Pages
38 + app. 84
Series
Aalto University publication series DOCTORAL THESES, 150/2023
Abstract
Today, we collect enormous amount of data and the data comes in many forms. Modern models are able to capture complex dependencies and interactions. At the same time, parts of the data may be missing or contaminated. Analysts may be required to handle high dimensional or functional data, analyse complicated dependencies within the data, and possibly predict missing data at the same time. In this dissertation, we consider dependency structures from different theoretical and applied perspectives. Firstly, we develop a new data driven method, based on Gaussian processes, to optimally predict missing data in the context of functional observations. Secondly, we analyse the rate of convergence of discretization of certain stochastic integrals involving Gaussian processes that possess non-trivial dependency structure. Finally, we analyse dependency structures in the context of applications by modelling cancer mortality and cost effectiveness of breast cancer screening under different screening policies.

Tänä päivänä keräämme runsaasti monessa erilaisessa muodossa olevia aineistoja. Nykyaikaiset menetelmät kykenevät mallintamaan monimutkaisia riippuvuussuhteita. Samaan aikaan osa aineistosta saattaa puuttua tai olla vioittunutta. Tämän vuoksi analyytikko voi joutua samanaikaisesti käsittelemään suuri- tai ääretönulotteista aineistoa, analysoimaan monimutkaisia aineiston sisäisiä riippuvuuksia, ja mahdollisesti ennustamaan puuttuvia havaintoja. Tässä työssä tarkastelemme riippuvuusrakenteita sekä teoreettisesti että sovellusten näkökulmasta. Työssä kehitetään uusi Gaussisiin prosesseihin pohjaava menetelmä, jolla voidaan laskea optimaalisia ennusteita funktionaalisten havaintojen puuttuville osille. Lisäksi työssä analysoidaan tiettyjen stokastisten integraalien diskretointien suppenemisnopeutta. Nämä integraalit sisältävät Gaussisia prosesseja, joiden riippuvuusrakenne poikkeaa tavanomaisesta. Työn soveltavassa osassa analysoidaan rintasyöpäkuolleisuutta ja rintasyöpäseulontojen kustannustehokkuutta eri seulontastrategioilla.
Description
Supervising professor
Ilmonen, Pauliina, Prof., Aalto University, Department of Mathematics and Systems Analysis, Finland
Thesis advisor
Viitasaari, Lauri, Prof., Uppsala University, Sweden
Heinävaara, Sirpa, Dr., Finnish Cancer Registry, Finland
Keywords
missing data, dependency structure, Gaussian processes, breast cancer screening, puuttuvat havainnot, riippuvuusrakenne, Gaussiset prosessit, rintasyöpäseulonta
Other note
Parts
  • [Publication 1]: N. Shafik., P. Ilmonen, T. Sottinen, G. Van Bever and L. Viitasaari. On optimal prediction of missing functional data with memory. Submitted for publication, available at arXiv:2208.09925, August 2022
  • [Publication 2]: N. Shafik, E. Azmoodeh, P. Ilmonen, T. Sottinen and L. Viitasaari. On sharp rate of convergence for discretisation of integrals driven by fractional Brownian motions and related processes with discontinuous integrands. Journal of Theoretical Probability, July 2023.
    DOI: 10.1007/s10959-023-01272-7 View at publisher
  • [Publication 3]: N. Shafik, P. Ilmonen, L. Viitasaari, T. Sarkeala and S. Heinävaara. Flexible transition model for assessing cost effectiveness of breast cancer screening in Finland. PLOS ONE, 18(6), June 2023.
    DOI: 10.1371/journal.pone.0287486 View at publisher
Citation