Censored Regression Models with Autoregressive Errors for Improved Time Series Estimation and Forecasting

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

Perustieteiden korkeakoulu | Master's thesis

Date

2024-05-21

Department

Major/Subject

Systems and Operations Research

Mcode

SCI3055

Degree programme

Master’s Programme in Mathematics and Operations Research

Language

en

Pages

52

Series

Abstract

In time series analysis, it is common to encounter censored data, where observations are only partially observed due to a detection limit. This thesis specifically addresses the case of censoring in the context of data traffic demand in radio access networks. In areas of the network with high user density and insufficient infrastructure, a discrepancy between the actual delivered data traffic and the theoretical demand arises, leading to the censoring of the theoretical data traffic demand. The primary objective of this thesis is to generate accurate estimations for the time series observations of censored data traffic demand. We propose a Censored Linear Regression model with autoregressive errors, a novel approach designed to estimate censored time series observations. A key component of our approach is the Gaussian imputation method which is grounded on the premise that fully observed time series data can be interpreted as a realization of a multivariate normal distribution. We apply our methodology to historical time series data from a cellular Radio Access Network comprising an entire country. The censored observations were imputed using the model developed for this thesis. We evaluate the performance of our model by forecasting future observations, both with and without the imputation process, and subsequently comparing their forecast accuracy. The findings indicate that while our model is successful at estimating censored observations, its application in improving forecast accuracy for censored network areas is not uniformly effective. Consequently, it remains challenging to assert with certainty, the advantage of the developed method in estimating censored time series observations.

Aikasarja-analyysissa on yleistä kohdata sensuroitua dataa, jossa havainnot ovat vain osittain havaittavissa havaitsemisrajan vuoksi. Tämä diplomityö käsittelee sensurointia radioliityntäverkon dataliikenteen kysynnän yhteydessä. Verkon alueilla, joissa on suuri käyttäjätiheys ja riittämätön infrastruktuuri, syntyy ero todellisen toimitetun dataliikenteen ja teoreettisen kysynnän välille, joka johtaa teoreettisen kysynnän sensurointiin. Tämän diplomityön ensisijainen tavoite on tuottaa tarkkoja estimointeja sensuroidun dataliikenteen kysynnän aikasarjahavainnoista. Ehdotamme tämän ongelman ratkaisemiseksi sensuroitua lineaarista regressiomallia, jossa on autoregressiivisiä virheitä. Tämä on uusi lähestymistapa sensuroitujen aikasarjahavaintojen estimoimiseen. Keskeinen osa lähestymistapaamme on Gaussin imputointimenetelmä, joka perustuu oletukseen, että täysin havaittu aikasarjadata voidaan tulkita monimuuttujanormaalijakauman toteutumana. Sovellamme menetelmäämme historialliseen aikasarjadataan, joka koostuu koko maan kattavasta radioliityntäverkosta. Sensuroidut havainnot imputoidaan tässä diplomityössä kehitetyllä menetelmällä. Arvioimme mallimme suorituskykyä ennustamalla aikasarjan tulevia havaintoja sekä imputointiprosessin kanssa että ilman, ja vertaamalla molempien ennustetarkkuutta. Havainnot osoittavat, että vaikka mallimme onnistuu arvioimaan sensuroituja havaintoja, sen soveltaminen ennustetarkkuuden parantamiseen sensuroiduilla verkon alueilla ei ole aina hyödyllistä. Tämän seurauksena on haastavaa varmuudella määritellä kehitetyn menetelmän etua sensuroitujen aikasarjahavaintojen estimoinnissa.

Description

Supervisor

Kohonen, Jukka

Thesis advisor

Kohonen, Jukka

Keywords

censored data, autoregressive models, time series forecasting, estimation, Gaussian imputation method, Time Series Analysis

Other note

Citation