Predicting residential property prices with decision tree models

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

Perustieteiden korkeakoulu | Master's thesis

Date

2022-01-25

Department

Major/Subject

Systems and Operations Research

Mcode

SCI3055

Degree programme

Master’s Programme in Mathematics and Operations Research

Language

en

Pages

68+0

Series

Abstract

The price of a residential property is determined by diverse attributes, such as the size, condition, or location of a property. Research suggests that some attributes are significant property price determinants, albeit the price dynamics of apartment markets vary in different locations. Typically, residential property prices have been estimated with hedonic price models. However, the popularity of machine learning methods has increased, and they provide an effective alternative approach for property price prediction. This thesis develops a machine learning framework for predicting residential property prices. The implemented algorithms are random forests, gradient boosting machine, and XGBoost. Property prices are predicted utilising real-life data from apartment transactions with information on location-specific attributes and specific housing features. The results indicate that the decision tree models can predict residential property prices accurately. XGBoost and gradient boosting machine outperform random forests in prediction accuracy, and XGBoost produces the best computational performance. The derived framework is tested on an experimental setup in Kera, a district in the city of Espoo. Comparison of two hypothetical future scenarios reveals that a larger apartment and service construction volume leads to higher price growth in the area. In particular, a new tram line results in distinct price growth. Furthermore, analysis of the age of buildings reveals a nonlinear relationship between the age and price of apartments, suggesting that both new and old properties have a higher value. The developed framework can be used for forecasting the price level of individual apartment buildings or entire city districts. It can improve understanding of the formation of residential property value and thus be used as a tool for decision making by different operators, such as real estate investors, urban planners, home buyers, or politicians.

Asuinkiinteistön hinta määräytyy erilaisten ominaisuuksien, kuten asunnon koon, kunnon tai sijainnin mukaan. Tutkimusten perusteella tietyt ominaisuudet ovat merkittäviä asunnon hinnan määräytymisen kannalta, vaikka asuntomarkkinoiden hintadynamiikka vaihteleekin alueittain. Asuinkiinteistöjen hintoja on tyypillisesti estimoitu hedonisen hintamallin avulla. Koneoppimismenetelmien suosio on kuitenkin kasvanut, ja ne tarjoavat tehokkaan vaihtoehdon asuntojen hinnan ennustamiselle. Tässä diplomityössä kehitetään koneoppimiskehys asuinkiinteistöjen hintaennustamiseen. Mallinnuksessa käytetään random forests, gradient boosting machine ja XGBoost algoritmeja. Hintaennustamisessa käytetään dataa toteutuneista asuntokaupoista sekä asunnon sijaintia ja rakenteellisia ominaisuuksia kuvaavia muuttujia. Tulosten perusteella päätöspuumallit onnistuvat ennustamaan asuinkiinteistöjen hintaa tarkasti. Malleista XGBoost ja gradient boosting machine saavuttavat parhaimman tarkkuuden, ja XGBoost parhaan laskentatehokkuuden. Kehitettyä koneoppimiskehystä testataan valitulla tutkimusalueella Espoon Kerassa. Kahden hypoteettisen tulevaisuudensuunnitelman vertailu osoittaa, että voimakkaampi asunto- ja palvelurakentaminen johtaa korkeampaan hinnannousuun alueella. Erityisesti suunniteltu raitiovaunulinja nostaa alueen keskihintaa selkeästi. Asunnon iän analysointi paljastaa epälineaarisen riippuvuussuhteen asunnon iän ja hinnan välillä viitaten siihen, että sekä uudet että vanhat asunnot ovat arvokkaampia. Kehitetyllä koneoppimismallilla voidaan ennustaa niin yksittäisten asuntojen hintaa kuin kokonaisen asuinalueen arvoa. Mallilla voidaan parantaa ymmärrystä asuinkiinteistöjen arvon muodostumisesta, ja se voi toimia esimerkiksi kiinteistösijoittajien, kaupunkisuunnittelijoiden, asunnonostajien tai poliitikoiden päätöksenteon tukena.

Description

Supervisor

Leskelä, Lasse

Thesis advisor

Nevalainen, Jani

Keywords

property price prediction, machine learning, decision trees, XGBoost, random forests, gradient boosting

Other note

Citation