Creating a frame for a machine learning-based pricing tool for life cycle schools

No Thumbnail Available

URL

Journal Title

Journal ISSN

Volume Title

Insinööritieteiden korkeakoulu | Master's thesis

Date

2021-08-23

Department

Major/Subject

Sustainable Energy in Buildings and Built Environment

Mcode

ENG3068

Degree programme

Master's Programme in Advanced Energy Solutions (AAE)

Language

en

Pages

128 + 0

Series

Abstract

Machine learning provides interesting alternatives to enable accurate cost prediction of life cycle schools based on key parameters at an early stage of the tender. A variety of different machine learning methods could be used to comprehensively utilize the data of previous projects. However, the data must first be prepared by commensuration and removal of disturbances, and the key parameters must be identified. The parameters and costs of building services engineering systems and maintenance are first standardized and unified by analysing the larger cost entities. Data of projects and costs that deviate fundamentally from the overall data are removed to ensure commensurability. Second, different cost categories are further analysed, and installed building services engineering systems are sorted into standard and auxiliary. Third, the key parameters for predicting the various standardized costs are obtained through correlation-based feature selection. Finally, the results of the feature selection are discussed, while also reflecting on the impact of possible auxiliary systems. Potential solutions for the future machine learning application are also provided. The analysis concludes that the standardization of the cost categories contributes to the most significant increase in prediction accuracy and reduction of the error margin in most of the categories. The obtained key parameters further improve the estimates in most categories. For the few categories that still have unpredictable costs after the analysis, alternative predictive approaches are suggested. Overall, the analysis generates promising results for either conducting further research on this data or creating a pricing tool based on machine learning.

Maskininlärning erbjuder intressanta alternativ för noggranna kostnads-uppskattningar baserade på nyckelparametrar för livscykelskolor i ett tidigt skede av anbudsförfarandet. Olika maskininlärningsmetoder kan tillämpas för att utnyttja samlade data från tidigare projekt på ett omfattande vis. Innan tillämpning måste projektdata förberedas genom standardisering och borttagning av störningar. Därtill måste nyckelparametrarna identifieras. Parametrarna och kostnaderna av installerad husteknik och uppehåll är först standardiserade och förenhetligade genom att analysera kostnaderna som omfattande helheter. Projekt- och kostnadsdata som avviker betydligt från övriga data avlägsnas för att försäkra likvärdighet mellan all data. I nästa fas analyseras specifika kostnadskategorier och tillhörande hustekniksystem delas upp i standard och extra. Nyckelparametrarna för uppskattning av de standardiserade kostnaderna identifieras sedan genom korrelationsbaserat urval av attribut. Till sist diskuteras resultaten av urvalet och inverkan av eventuella extra system. Tillika erbjuds möjliga lösningar för den framtida maskininlärningsapplikationen. I analysen dras slutsatsen att standardiseringen av kostnadskategorierna bidrar märkvärdigast för att förbättra noggrannheten av kostnads-uppskattningen och förminska felmarginalen. De identifierade nyckelparametrarna bidrar därpå till ytterligare förbättringar. Alternativa metoder av kostnadsuppskattning föreslås för kategorier som förblir oförutsägbara även efter analysen. På det hela taget producerar analysen lovande resultat för att antingen utföra fortsatt forskning med dessa data eller för att skapa ett maskininlärningsbaserat prissättningsverktyg.

Description

Supervisor

Virtanen, Markku

Thesis advisor

Alanne, Kari
Hänninen, Antti

Keywords

building life cycle, cost prediction, machine learning, feature selection, data preparation

Other note

Citation