Regression modelling of train energy consumption

No Thumbnail Available
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu | Master's thesis
Date
2018-11-06
Department
Major/Subject
Mathematics
Mcode
SCI3054
Degree programme
Master’s Programme in Mathematics and Operations Research
Language
en
Pages
95+16
Series
Abstract
The energy consumption of train is directly connected to the costs of a train operator, and therefore estimation of the energy consumption has an important role when pricing the railway traffic. The aim of this thesis is to create models for estimating and predicting the energy consumption of trains. The energy measurements are obtained from four different types of traction units, and the analysis is done separately for each of them.Possible variables for the models are analysed through a test case in addition to the primary data. The primary data is heavily processed in order to make it consistent and applicable for the models. Out of the analysed variables mass and the purpose of the train, and the relief and the distance between the departure and arrival stations seem to have a major effect on the energy consumption. These variables are used as a base for the models, and thus models with both continuous and categorical variables are assessed. The modelling is done using linear regression. Two least squares estimation methods, ordinary and weighted, are considered, and due to heteroskedasticity weighted least squares estimation method is preferred. Furthermore, the heteroskedasticity is taken into account in the implementation of the diagnostic methods. Both the estimations and diagnostics are based on non-parametric methods, and are done without traditional normality assumptions. Several models are fitted to our primary data and compared relying on the results of the used diagnostic methods. The cargo trains seem to have slightly higher variation and error rates compared to the other types of trains. Furthermore, some evidence of non-linearity can be found in some of the passenger train models. However, the rest of the passenger train models seem satisfying, and in general it can be concluded that all of the models seem promising and applicable.

Junien energiankulutus on suoraan yhteydessä rautatieoperaattorin kuluihin, minkä takia energiankulutuksen arvioiminen on tärkeä osa junaliikenteen hinnoittelua. Tämän työn tavoitteena on mallintaa junien energiankulutusta, ja käyttää näitä malleja sen ennustamiseen ja arvioimiseen. Energiamittaukset sisältävät aineistoa neljästä erilaisesta sähkötoimisesta vetokalustotyypistä, ja kalustotyyppien energiankulutusta on käsitelty omina kokonaisuuksinaan. Malleissa mahdollisesti käytettäviä muuttujia on analysoitu erillisen koeotoksen avulla ensisijaisen aineiston lisäksi. Ensisijaista aineistoa on käsitelty, jotta siitä saataisiin yhdenmukaisempaa ja käyttökelpoisempaa. Kaikista tutkituista muuttujista junien energiankulutukseen näyttävät vaikuttavan eniten junan massa ja käyttötarkoitus sekä lähtö- ja tuloasemien välinen etäisyys ja korkeusero. Nämä muuttujat toimivatkin sovitettavien mallien perustana, ja näin ollen sekä jatkuvia että kategorisia muuttujia käsitellään mallinnuksessa. Mallien sovittamisessa käytetään lineaarista regressiota ja hyödynnetään kahta pienimmän neliösumman estimointimenetelmää: tavallista ja painotettua. Aineiston heteroskedastisuudesta johtuen painotettua pienimmän neliösumman menetelmää käytetään ensisijaisena estimointimenetelmänä. Heteroskedastisuus vaikuttaa myös estimointi- ja diagnostiikkamenetelmien valintaan ja työssä painotutaan epäparametrisiin menetelmiin, eikä tarkkoja jakaumaoletuksia tehdä. Mallinnuksen tuloksena, ja diagnostiikan tuloksiin nojaten, saadaan ensisijaiselle datalle sovitettua suurimmilta osin hyvin toimivat mallit. Tavarajunilla varianssi ja virhetasot ovat hieman korkeampia kuin muilla junatyypeillä. Lisäksi joitakin todisteita epälineaarisesta käytöksestä havaitaan osassa matkustajajunien malleista. Kuitenkin muut käsitellyt matkustajajunien mallit ovat tyydyttäviä, ja suuressa mittakaavassa voidaankin todeta kaikkien mallien vaikuttavan lupaavilta ja käyttökelpoisilta.
Description
Supervisor
Ilmonen, Pauliina
Thesis advisor
Lam, Riikka
Viitasaari, Lauri
Keywords
train, energy consumption, linear regression, least squares, heteroskedasticity, permutation test
Other note
Citation