Predicting residential property prices with decision tree models
Loading...
URL
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu |
Master's thesis
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Authors
Date
2022-01-25
Department
Major/Subject
Systems and Operations Research
Mcode
SCI3055
Degree programme
Master’s Programme in Mathematics and Operations Research
Language
en
Pages
68+0
Series
Abstract
The price of a residential property is determined by diverse attributes, such as the size, condition, or location of a property. Research suggests that some attributes are significant property price determinants, albeit the price dynamics of apartment markets vary in different locations. Typically, residential property prices have been estimated with hedonic price models. However, the popularity of machine learning methods has increased, and they provide an effective alternative approach for property price prediction. This thesis develops a machine learning framework for predicting residential property prices. The implemented algorithms are random forests, gradient boosting machine, and XGBoost. Property prices are predicted utilising real-life data from apartment transactions with information on location-specific attributes and specific housing features. The results indicate that the decision tree models can predict residential property prices accurately. XGBoost and gradient boosting machine outperform random forests in prediction accuracy, and XGBoost produces the best computational performance. The derived framework is tested on an experimental setup in Kera, a district in the city of Espoo. Comparison of two hypothetical future scenarios reveals that a larger apartment and service construction volume leads to higher price growth in the area. In particular, a new tram line results in distinct price growth. Furthermore, analysis of the age of buildings reveals a nonlinear relationship between the age and price of apartments, suggesting that both new and old properties have a higher value. The developed framework can be used for forecasting the price level of individual apartment buildings or entire city districts. It can improve understanding of the formation of residential property value and thus be used as a tool for decision making by different operators, such as real estate investors, urban planners, home buyers, or politicians.Asuinkiinteistön hinta määräytyy erilaisten ominaisuuksien, kuten asunnon koon, kunnon tai sijainnin mukaan. Tutkimusten perusteella tietyt ominaisuudet ovat merkittäviä asunnon hinnan määräytymisen kannalta, vaikka asuntomarkkinoiden hintadynamiikka vaihteleekin alueittain. Asuinkiinteistöjen hintoja on tyypillisesti estimoitu hedonisen hintamallin avulla. Koneoppimismenetelmien suosio on kuitenkin kasvanut, ja ne tarjoavat tehokkaan vaihtoehdon asuntojen hinnan ennustamiselle. Tässä diplomityössä kehitetään koneoppimiskehys asuinkiinteistöjen hintaennustamiseen. Mallinnuksessa käytetään random forests, gradient boosting machine ja XGBoost algoritmeja. Hintaennustamisessa käytetään dataa toteutuneista asuntokaupoista sekä asunnon sijaintia ja rakenteellisia ominaisuuksia kuvaavia muuttujia. Tulosten perusteella päätöspuumallit onnistuvat ennustamaan asuinkiinteistöjen hintaa tarkasti. Malleista XGBoost ja gradient boosting machine saavuttavat parhaimman tarkkuuden, ja XGBoost parhaan laskentatehokkuuden. Kehitettyä koneoppimiskehystä testataan valitulla tutkimusalueella Espoon Kerassa. Kahden hypoteettisen tulevaisuudensuunnitelman vertailu osoittaa, että voimakkaampi asunto- ja palvelurakentaminen johtaa korkeampaan hinnannousuun alueella. Erityisesti suunniteltu raitiovaunulinja nostaa alueen keskihintaa selkeästi. Asunnon iän analysointi paljastaa epälineaarisen riippuvuussuhteen asunnon iän ja hinnan välillä viitaten siihen, että sekä uudet että vanhat asunnot ovat arvokkaampia. Kehitetyllä koneoppimismallilla voidaan ennustaa niin yksittäisten asuntojen hintaa kuin kokonaisen asuinalueen arvoa. Mallilla voidaan parantaa ymmärrystä asuinkiinteistöjen arvon muodostumisesta, ja se voi toimia esimerkiksi kiinteistösijoittajien, kaupunkisuunnittelijoiden, asunnonostajien tai poliitikoiden päätöksenteon tukena.Description
Supervisor
Leskelä, LasseThesis advisor
Nevalainen, JaniKeywords
property price prediction, machine learning, decision trees, XGBoost, random forests, gradient boosting