Feasibility of building a profitable data-driven betting system on horse races
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu |
Master's thesis
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Computer Science
Degree programme
Master’s Programme in Computer, Communication and Information Sciences
This thesis examines the feasibility of building a profitable betting system that bets on horse races, using historical racing data between 2010 and early 2018. Historical precedent for profitable, data-driven betting systems exist in literature but they mostly focus on pre-2000 data. We combine two datasets sourced from Betwise.co.uk and Betfair to produce a diverse set of features and train a Plackett-Luce-based model to obtain accurate estimations of probabilities that a horse will win in a race. We also perform automatic feature analysis on our engineered features in order to understand what factors are important in the task of predicting horse race results. We find that a model that is designed to be combined with publicly posted betting odds can theoretically achieve meager positive returns. Our results also suggest that empirical testing of the betting system in this thesis would require over 6 months of betting before it could be confidently judged profitable.Tämä diplomityö tutkii, onko tuottoa tekevä raviurheiluun kohdistuva vedonlyöntijärjestelmä käytännössä toteuttamiskelpoinen. Työssä käytetään ravidataa vuosien 2010 ja 2018 väliltä. On olemassa edeltäviä tutkimuksia, joissa tuottoisia vedonlyöntijärjestelmiä on toteutettu mutta niissä käytetty data koskee pääosin aikaa ennen vuosilukua 2000. Tässä työssä yhdistetään dataa kahdesta eri lähteestä: Betwise.co.uk sivustolta ja Betfair -vedonlyöntiyhtiöltä ja tämä data muutetaan laajaksi ja monimuotoiseksi joukoksi syötteitä. Syötteitä käytetään Plackett-Luce pohjaisessa mallissa, joka tuottaa tarkat arviot todennäköisyyksistä siitä, että eri hevoset voittavat ravin. Työssä tehdään myös automaattinen syötteiden arviointi siitä, mitkä syötteet ovat tärkeimpiä ravien tuloksien ennustamisen kannalta. Parhain työssä luotu malli on teoreettisesti niukasti tuottoisa, jos se yhdistetään julkisten vedonlyöntikertoimien kanssa. Tuloksissa havaitaan myös, että empiirinen kokeilu vedonlyöntijärjestelmän kanssa vaatii yli 6 kuukautta vedonlyöntiä, ennen kuin tuloksiin voi luottaa.Description
Gionis, AristidesThesis advisor
Gionis, AristidesKeywords
sports betting, learning to rank, plackett-luce, gambling