Censored Regression Models with Autoregressive Errors for Improved Time Series Estimation and Forecasting
Loading...
URL
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu |
Master's thesis
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Authors
Date
2024-05-21
Department
Major/Subject
Systems and Operations Research
Mcode
SCI3055
Degree programme
Master’s Programme in Mathematics and Operations Research
Language
en
Pages
52
Series
Abstract
In time series analysis, it is common to encounter censored data, where observations are only partially observed due to a detection limit. This thesis specifically addresses the case of censoring in the context of data traffic demand in radio access networks. In areas of the network with high user density and insufficient infrastructure, a discrepancy between the actual delivered data traffic and the theoretical demand arises, leading to the censoring of the theoretical data traffic demand. The primary objective of this thesis is to generate accurate estimations for the time series observations of censored data traffic demand. We propose a Censored Linear Regression model with autoregressive errors, a novel approach designed to estimate censored time series observations. A key component of our approach is the Gaussian imputation method which is grounded on the premise that fully observed time series data can be interpreted as a realization of a multivariate normal distribution. We apply our methodology to historical time series data from a cellular Radio Access Network comprising an entire country. The censored observations were imputed using the model developed for this thesis. We evaluate the performance of our model by forecasting future observations, both with and without the imputation process, and subsequently comparing their forecast accuracy. The findings indicate that while our model is successful at estimating censored observations, its application in improving forecast accuracy for censored network areas is not uniformly effective. Consequently, it remains challenging to assert with certainty, the advantage of the developed method in estimating censored time series observations.Aikasarja-analyysissa on yleistä kohdata sensuroitua dataa, jossa havainnot ovat vain osittain havaittavissa havaitsemisrajan vuoksi. Tämä diplomityö käsittelee sensurointia radioliityntäverkon dataliikenteen kysynnän yhteydessä. Verkon alueilla, joissa on suuri käyttäjätiheys ja riittämätön infrastruktuuri, syntyy ero todellisen toimitetun dataliikenteen ja teoreettisen kysynnän välille, joka johtaa teoreettisen kysynnän sensurointiin. Tämän diplomityön ensisijainen tavoite on tuottaa tarkkoja estimointeja sensuroidun dataliikenteen kysynnän aikasarjahavainnoista. Ehdotamme tämän ongelman ratkaisemiseksi sensuroitua lineaarista regressiomallia, jossa on autoregressiivisiä virheitä. Tämä on uusi lähestymistapa sensuroitujen aikasarjahavaintojen estimoimiseen. Keskeinen osa lähestymistapaamme on Gaussin imputointimenetelmä, joka perustuu oletukseen, että täysin havaittu aikasarjadata voidaan tulkita monimuuttujanormaalijakauman toteutumana. Sovellamme menetelmäämme historialliseen aikasarjadataan, joka koostuu koko maan kattavasta radioliityntäverkosta. Sensuroidut havainnot imputoidaan tässä diplomityössä kehitetyllä menetelmällä. Arvioimme mallimme suorituskykyä ennustamalla aikasarjan tulevia havaintoja sekä imputointiprosessin kanssa että ilman, ja vertaamalla molempien ennustetarkkuutta. Havainnot osoittavat, että vaikka mallimme onnistuu arvioimaan sensuroituja havaintoja, sen soveltaminen ennustetarkkuuden parantamiseen sensuroiduilla verkon alueilla ei ole aina hyödyllistä. Tämän seurauksena on haastavaa varmuudella määritellä kehitetyn menetelmän etua sensuroitujen aikasarjahavaintojen estimoinnissa.Description
Supervisor
Kohonen, JukkaThesis advisor
Kohonen, JukkaKeywords
censored data, autoregressive models, time series forecasting, estimation, Gaussian imputation method, Time Series Analysis