Utilizing machine learning in purchase invoice posting

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu | Master's thesis
Date
2020-10-19
Department
Major/Subject
Complex Systems
Mcode
SCI3060
Degree programme
Master’s Programme in Life Science Technologies
Language
en
Pages
52+6
Series
Abstract
Invoice management is often the most time consuming procedure in a finance department. Hence, it has been a desired target of automation during the last decades. One step in the process is purchase invoice posting, where the correct posting information, such as account, cost center and tax code, are attached to the invoice before sending it to the acceptor chain and finally to payment. The purpose of this study is to utilize machine learning in order to automatically predict the posting fields for invoices of the target company. For a start, the invoices are preprocessed and vectorized before feeding them to machine learning models. For each invoice, the predictions consist of four and five labels for credit and debit sides, respectively, except for invoices requiring more than one posting row, which are managed separately. In addition, the acceptor chain, which consists of an inspector and an acceptor, is predicted for each invoice. In this multiclass classification task numerous machine learning techniques are applied and compared. The most challenging part turned out to be posting the invoices requiring more than one posting row, which formed a little over 10 % of the invoices. These were managed by first filtering them according to the repetitiveness of their posting information and then choosing only those requiring sufficiently few posting rows. With correct parameter combination, this strategy lead to prediction of 30-40 % of the invoices that require multiple posting rows with satisfying accuracy. Among the chosen machine learning approaches, the best performance is shown by Multilayer Perceptron. Other top perfomers are Decision Tree, Random Forest and Support Vector Machine. Overall, the accuracies are satisfying and the work of this study can be exploited in real life, reducing the need of manual work in the purchase invoice process.

Laskujen käsittely on usein taloushallinnon aikaavievin prosessi, minkä vuoksi se on automaation näkökulmasta kiinnostava kohde. Yksi prosessin vaiheista on ostolaskujen tiliöinti, jossa ostolaskuun liitetään oikeat tiliöintitiedot kuten tili, kustannuspaikka ja verokoodi. Tämän jälkeen lasku lähetetään hyväksymiskiertoon ja lopulta maksuun. Tämän työn tarkoituksena on ennustaa kohdeyrityksen ostolaskuille tiliöintitiedot koneoppimisen avulla. Laskut vaativat esikäsittelyn ennen kuin ne voidaan syöttää koneoppimisalgoritmeille. Jokaiselle laskulle ennustetaan neljä tiliöintikenttää kredit-puolelle sekä viisi kenttää debit-puolelle. Poikkeuksena ovat useamman tiliöintirivin vaativat laskut, jotka käsitellään erikseen. Lisäksi joka laskulle ennustetaan hyväksyjäketju, johon kuuluvat tarkastaja ja hyväksyjä. Tässä luokittelutehtävässä sovelletaan ja vertaillaan useita eri koneoppimismenetelmiä. Haastavimmaksi osuudeksi osoittautui useamman tiliöintirivin omaavat laskut, joita oli vähän yli 10 % kaikista laskuista. Nämä käsiteltiin karsimalla osa tiliöintitietojen toistuvuuden sekä tiliöintirivien lukumäärien perusteella. Tällä menetelmällä 30-40 % näistä useamman tiliöintirivin vaativista laskuista onnistuttiin tiliöimään tyydyttävällä tarkkuudella. Valituista koneoppimismenetelmistä parhaaksi osoittautui Monikerroksinen Perseptroni-verkko. Seuraavaksi parhaisiin luokittelijoihin kuuluivat Päätöspuu, Satunnainen Metsä sekä Tukivektorikone. Kaiken kaikkiaan tulokset olivat tarkkoja ja malleja voidaan jatkossa soveltaa oikeissa tapauksissa tiliöintitietojen ennustamiseen, mikä nopeuttaa laskujen käsittelyprosessia sekä vähentää ihmisen tekemän työn tarvetta.
Description
Supervisor
Saramäki, Jari
Thesis advisor
Mattila, Terhi
Keywords
machine learning, multilayer perceptron, neural network, purchase invoice, posting
Other note
Citation