Predicting venture capital backed start-up success with machine learning

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu | Master's thesis
Date
2023-06-14
Department
Major/Subject
Strategy
Mcode
SCI3109
Degree programme
Master’s Programme in Industrial Engineering and Management
Language
en
Pages
60 + 5
Series
Abstract
Start-up success prediction is a subject of significant interest both to industry practitioners and academic researchers due to start-ups’ impact on the economy and profitability of venture capital investing. The academic research on the topic is vast and diverse covering different features, target variables and predictive models, but sometimes includes look-ahead-bias and lacks comparison of a broad set of features and models. This study aims to construct a national level high-performing predictive classification model for predicting whether or not a start-up is able to raise future equity financing after the initial seed round. The study uses and compares multiple machine learning models on data that would be available to the investor during the decision making moment. In addition, a literature review is conducted for exploring the related prior academic research and its findings are utilised for constructing the models and features, and also for benchmarking the obtained results. From the implemented models, the decision tree classifier is found to be the best performing model. The features included in the analysis include key financial metrics, funding information and start-up founding team information. The feature importance analysis indicates that the employee count, founding team’s experience and education, time to seed funding, funding amount and the company’s revenue and profitability metrics are highly important features in early-stage start-up success prediction. This study demonstrates that venture capital practitioners can utilise more advanced quantitative methodologies in their investment decision making process on top of the existing qualitative assessments even with limited amounts of observations. In addition, these types of predictive models can help start-up founders to improve their probability of success in acquiring external equity financing from venture capital investors by providing insightful information on how to position themselves better for success.

Start-up yritysten menestyksen ennustaminen on saanut merkittävästi huomiota akatemialta ja alan toimijoilta start-up yritysten suuresta taloudellisesta vaikutuksesta ja riskisijoittamisen kannattavuudesta johtuen. Aiheen akateeminen tutkimus on laajaa ja monipuolista sisältäen eri kohdemuuttujia, selittäviä muuttujia ja koneälymalleja. Aihealueen tutkimus on myös joskus syyllistynyt käyttämään tietoa, joka ei olisi ollut päätöksentekijän saatavilla ennakointihetkellä, sekä käyttänyt usein selittäviä tekijöitä pelkästään muutamasta osa-alueesta ja vertaillut vain muutamia ennustamiseen käytettyjä koneälymalleja. Tämän tutkimuksen tavoitteena on kehittää maanlaajuinen tarkka ja luotettava malli start-upin jatkorahoituskierrosten ennustamiselle siemenrahoituskierroksen jälkeen. Tutkimuksessa käytetään ja verrataan useita eri koneoppimismalleja ja hyödynnetään vain tietoa, joka olisi ollut sijoittajan saatavilla päätöksentekohetkellä. Lisäksi tutkimus sisältää kirjallisuuskatsauksen aikaisemmin tehtyyn akateemiseen tutkimukseen, jonka tuloksia hyödynnetään koneälymallien ja selittävien tekijöiden valikoinnissa. Aikaisempaa tutkimusta käytetään myös vertailun lähtökohtana. Käytetyistä malleista ”Decision trees”-malli osoittautui parhaaksi. Muuttujien tärkeydestä tehdyn analyysin perusteella start-up yrityksen tulevaisuuden menestykselle tärkeimpiä muuttujia ovat perustajien kokemus ja koulutus, kerätyn rahoituksen määrä ja sen keräämiseen mennyt aika, sekä yrityksen henkilöstömäärä, liikevaihto ja kannattavuus. Tämä tutkimus osoittaa, että riskipääomasijoittajat voivat hyödyntää kehittyneempiä kvantitatiivisia menetelmiä sijoituspäätöksenteossa olemassa olevien työkalujen lisäksi jopa kansallisella tasolla ja rajallisella määrällä dataa. Lisäksi tämän tyyppiset ennustemallit voivat auttaa start-up perustajia parantamaan todennäköisyyttään päästä seuraavalle rahoituskierrokselle auttamalla heitä keskittymään tärkeimpiin tekijöihin.
Description
Supervisor
Maula, Markku
Thesis advisor
Hakamo, Henri
Keywords
venture capital, machine learning, start-up, success
Other note
Citation