Feasibility of a Reinforcement Learning Based Market Maker without Using Limit Order Book Data

dc.contributorAalto-yliopistofi
dc.contributorAalto Universityen
dc.contributor.advisorSalo, Ahti
dc.contributor.authorSavela, Joona
dc.contributor.schoolPerustieteiden korkeakoulufi
dc.contributor.supervisorSalo, Ahti
dc.date.accessioned2023-08-27T17:03:40Z
dc.date.available2023-08-27T17:03:40Z
dc.date.issued2023-08-22
dc.description.abstractThis thesis investigates the performance of a deep reinforcement learning (DRL) based market maker trained solely on features calculated from realized trades, without using limit order book (LOB) data. A simulated exchange environment is developed to facilitate the training and evaluation of DRL-based market making agents. Historical trade data from the Binance exchange is used to train the agents, and their performance is assessed based on out-of-sample cumulative profit and loss (PnL) and mean absolute position (MAP). The results demonstrate that the agents are able to learn profitable strategies while maintaining relatively low inventory levels. However, the strategies may exploit implementation details of the environment, leading to potentially unrealistic behavior. The thesis points to the need for improvements in the environment to better reflect real trading conditions and to provide a more accurate assessment of DRL-based market maker performance without LOB data.en
dc.description.abstractTässä diplomityössä tutkitaan syvään vahvistusoppimiseen (DRL) pohjautuvan markkinatakaajan suorituskykyä, kun se on koulutettu toteutuneista kaupoista laskettujen ominaisuuksien avulla käyttämättä rajahintatoimeksiantokirjan (LOB) tietoja. Simuloitu pörssiympäristö on kehitetty helpottamaan DRL-pohjaisten markkinatakaajien koulutusta ja arviointia. Binance-pörssin historiallisia kauppatietoja käytetään agenttien kouluttamiseen, ja niiden suorituskyky arvioidaan kumulatiivisen voiton ja tappion (PnL) sekä keskimääräisen absoluuttisen positioinnin (MAP) perusteella. Tulokset osoittavat, että agentit kykenevät oppimaan kannattavia strategioita pitäen omistustasot suhteellisen matalina. Strategiat saattavat kuitenkin hyödyntää ympäristön toteutusyksityiskohtia, mikä voi johtaa epärealistiseen käyttäytymiseen. Työn osoittamana kehitystarpeena on pörssiympäristön parantaminen, jotta tämä heijastaisi paremmin todellisen kaupankäynnin olosuhteita ja tarjoaisi tarkemman arvion DRL-pohjaisten markkinatakaajien suorituskyvystä ilman LOB- tietoja.fi
dc.format.extent78 + 1
dc.identifier.urihttps://aaltodoc.aalto.fi/handle/123456789/122768
dc.identifier.urnURN:NBN:fi:aalto-202308275109
dc.language.isoenen
dc.programmeMaster’s Programme in Mathematics and Operations Researchfi
dc.programme.majorApplied Mathematicsfi
dc.programme.mcodeSCI3053fi
dc.subject.keywordmarket makingen
dc.subject.keywordreinforcement learningen
dc.subject.keyworddeep learningen
dc.subject.keywordlimit order booken
dc.titleFeasibility of a Reinforcement Learning Based Market Maker without Using Limit Order Book Dataen
dc.titleVahvistusoppimiseen perustuvan markkinatakaajan käyttökelpoisuus käyttämättä rajahintatoimeksiantokirjan tietojafi
dc.typeG2 Pro gradu, diplomityöfi
dc.type.ontasotMaster's thesisen
dc.type.ontasotDiplomityöfi
local.aalto.electroniconlyyes
local.aalto.openaccessno

Files