Forecasting stock index in Argentina with machine learning

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

School of Business | Master's thesis

Department

Major/Subject

Mcode

Language

en

Pages

81

Series

Abstract

This thesis focuses on examining the potential of machine learning models to predict the direction of movement of stock price index for the Argentine stock market. The machine learning models used for the predictions are Support Vector Machine (SVM) and Artificial Neural Network (ANN), with logistic regression serving as the benchmark model. Furthermore, this thesis aims to identify stock technical indicators that influence the predictive performance of the machine learning models. McNemar test is used to compare the prediction behaviour of the machine learning models. SHAP values are computed to determine the importance of the technical indicators. This study uses 11 years of historical price and trading data from 2013 to 2024 for S&P Merval, the main index of the Buenos Aires Stock Exchange. Ten technical indicators derived from the historical index price and trading data are used as input variables across two distinct approaches. The first approach uses the continuous values of the ten technical indicators as inputs, while the second approach uses discrete trend deterministic representations of the same variables. The findings of this study suggest that when predicting the next day index closing price, logistic regression, SVM and ANN produce predictions that are essentially close to random guessing. The results also indicate that the form of the inputs influences both the magnitude of the impact and the types of technical indicators that contribute meaningfully to the predictions. On a more theoretical level, this thesis provides further support for the Efficient Market Hypothesis (EMH).

Tämä opinnäytetyö tutkii koneoppimismallien potentiaalia osakeindeksin hinnan kehityksen suunnan ennustamisessa Argentiinan osakemarkkinoilla. Ennustamiseen käytetyt koneoppimismallit ovat tukivektorikone ja keinotekoinen neuroverkko. Lisäksi logistinen regressio toimii vertailumallina. Opinnäytetyön tavoitteena on lisäksi tunnistaa tekniset indikaattorit, jotka vaikuttavat koneoppimismallien ennustustarkkuuteen. Koneoppimismallien ennustuskäyttäytymistä verrataan McNemar-testillä. Teknisten indikaattorien vaikutusta mallien ennusteisiin analysoidaan SHAP-arvojen avulla. Tutkimuksessa käytetään Buenos Airesin pörssin keskeisimmän osakeindeksi S&P Mervalin historiallista hinta- ja kaupankäyntidataa 11 vuoden ajalta vuosilta 2013–2024. Tästä hinta- ja kaupankäyntidatasta johdetut 10 teknistä indikaattoria toimivat syötemuuttujina kahdella eri menetelmällä. Ensimmäinen menetelmä käyttää teknisten indikaattorien jatkuvia arvoja syötteinä. Toinen menetelmä käyttää samoista indikaattoreista johdettuja diskreettejä trendipohjaisia versioita. Tutkimustulokset osoittavat, että tutkimuksessa käytetyt ennustusmallit tuottavat ennusteita, jotka ovat tarkkuudeltaan lähellä teoreettista satunnaista arvausta. Tulokset teknisten indikaattorien osalta viittaavat siihen, että syötteiden muoto vaikuttaa siihen, mitkä indikaattorit vaikuttavat ennusteisiin, sekä vaikutusten suuruuteen. Teoreettisella tasolla tämä opinnäytetyö tarjoaa lisätukea tehokkaiden markkinoiden hypoteesille.

Description

Supervisor

Viitasaari, Lauri

Other note

Citation