Estimating private company financial figures in early-phase M&A: A machine learning approach
Loading...
URL
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu |
Master's thesis
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Authors
Date
2024-01-24
Department
Major/Subject
Strategy
Mcode
SCI3109
Degree programme
Master’s Programme in Industrial Engineering and Management
Language
en
Pages
76+7
Series
Abstract
The global corporate landscape is significantly influenced by merger and acquisition (M&A) activities and companies often engage in M&A to achieve growth, strengthen market position, or diversify. This thesis primarily addresses the early stages of M&A process, focusing on the identification and due diligence phases for private market companies, which typically do not publicly report their financials in North American markets. The traditional target identification process involves manually searching for potential acquisition targets based on certain criteria, a process that can be tedious and time-consuming. Given the recent advancements in machine learning (ML) and its increased application in the M&A domain, this study explores the potential of ML in predicting financial figures of private companies based on their publicly available characteristics. The thesis aims to research how ML is used in relation to M&A in the past literature, and to develop a regression machine learning model for predicting private company revenue of US based companies. A literature review is conducted for exploring the related scientific and public literature and their findings are utilized in building the models and benchmarking the results. The study utilizes general, funding, and social media information of 2245 private companies with data collected from Orbis, Crunchbase, and LinkedIn, and compares 12 different regression models on four different combinations of these features. Furthermore, a practical revenue category model is developed. Literature review points to the fact that the focal problem is rarely researched, and past research in the M&A space focuses more on subjects like start-up success prediction. From the implemented models, the decision tree-based machine learning models, gradient boosting, random forest, and CatBoost, stood out as the most effective models for the focal problem. The feature importance analysis indicates that the employee count, number of subsidiaries, LinkedIn follower and employee count, as well as the total amount of funding and last funding amount are highly important features when predicting continuous revenue. This thesis builds on M&A ML literature and shows that M&A practitioners can utilize advanced quantitative methodologies to aid their target identification process. The emerging model could be used by Inven to add categories of predicted revenue to their software.Yrityskaupat ja fuusiot (M&A) vaikuttavat globaaliin yritysmaailmaan huomattavasti. Yritykset osallistuvat usein M&A-toimintaan tavoitteenaan saavuttaa kasvua, vahvistaa markkina-asemaansa tai monipuolistaa toimintaansa. Tämä opinnäytetyö keskittyy pääasiassa M&A:n alkuvaiheisiin ja keskittyy yksityisten yritysten tunnistamisvaiheisiin. Yksityiset yritykset eivät yleensä raportoi julkisesti taloustietojaan Pohjois-Amerikan markkinoilla. Perinteinen kohteen tunnistusprosessi sisältää potentiaalisten yritysostokohteiden manuaalisen etsimisen tietyillä kriteereillä, mikä voi olla työlästä ja aikaa vievää. Ottaen huomioon koneoppimisen (ML) viimeaikaiset edistykset ja sen lisääntyneen soveltamisen M&A-alaan, tämä tutkimus tutkii ML:n mahdollisuuksia ennustaa yksityisten yritysten liikevaihtoa niiden julkisesti saatavilla olevien ominaisuuksien perusteella. Tämä tutkielma pyrkii kehittämään regressiokoneoppimismallin yhdysvaltalaisten yksityisten yritysten liikevaihdon ennustamiseksi. Ensiksisuoritetaan kirjallisuuskatsaus tieteellisen ja julkisen kirjallisuuden tutkimiseksi, ja niiden tuloksia hyödynnetään mallien rakentamiseen ja tulosten vertailuun.Tutkimus käyttää ja vertailee 12 erilaista regressiomallia neljässä erilaisessa yhdistelmässä yrityksen ominaisuuksia. Mallien käytössä olevat ominaisuudet vaihtelevat perustiedoista sosiaalisen median tietoihin ja rahoitustietoihin ja ovat peräisin Orbiksesta, Crunchbasesta, ja LinkedIn:stä. Toteutettujen mallien perusteella päätöspuupohjaiset koneoppimismallit, erityisesti gradienttivahvistus, satunnainen metsä ja CatBoost, osoittautuivat tehokkaimmiksi malleiksi keskeiseen ongelmaan. Ominaisuuden tärkeyttä koskeva analyysi osoittaa, että työntekijöiden määrä, tytäryhtiöiden lukumäärä, LinkedIn-seuraajien ja -työntekijöiden määrä sekä kokonaisrahoitusmäärä ja viimeisin rahoitusmäärä ovat erittäin tärkeitä ominaisuuksia liikevaihdon ennustamisessa. Tämä tutkielma osoittaa, että M&A-asiantuntijat voivat hyödyntää edistyneitä kvantitatiivisia menetelmiä kuten koneoppimista auttaakseen kohteen tunnistamisprosessissaan. Kehitettyä mallia voitaisiin käyttää Invenin toimesta ennustetun liikevaihdon luokkien lisäämiseksi heidän ohjelmistoonsa.Description
Supervisor
Maula, MarkkuThesis advisor
Maula, MarkkuKeywords
fuusiot ja yrityskaupat, M&A, koneoppiminen, tekoäly, liikevaihto, regressio