aalto1 untyped-item.component.html
Information extraction from procurement contracts
Loading...
URL
Journal Title
Journal ISSN
Volume Title
School of Business |
Master's thesis
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Authors
Date
Department
Major/Subject
Mcode
Degree programme
Language
en
Pages
64 + 3
Series
Abstract
The increasing amount of text data produced by companies demands automating the extraction of key information from contracts. It removes the manual step of inserting contract metadata into contract management software. This improves the efficiency and meaningfulness of work for procurement professionals as they will have growing amount of time in more creative and value-creating tasks.
Previous information extraction research has considered many fields but left a gap in complete procurement contract documents. This study aimed to contribute to filling that gap by experimenting methods of extracting contract metadata from multi-paged non-standard documents. The best methods for extracting contracting parties, effective dates, payment terms, liabilities, and contracting periods were investigated. The automation can be done utilizing methods of natural language processing. A tool for automatic extraction was created applying named-entity recognition algorithms and hand-crafted rules. Quantitative results were obtained from the tool. These results were discussed in semi-structured interviews with professionals from the case company Sievo Oy.
A key finding of this study was that the combination of methods used in the extraction performs well with contracting parties, while with other items more work needs to be done. Despite the varying results from the extraction, the interviews exposed an alternative way of easing the work of finding key information from contracts. It was suggested that instead of completely automating the task, the software could act as an assistant for its users. How this possibility is utilized and what is the reception of the users remains to be seen.
Yritykset tuottavat kasvavassa määrin tekstidataa. Tähän kehitykseen vastaamaan tarvitaan automaattista avaintietojen eristämistä sopimustiedostoista. Automatisointi poistaa aikaa vievän työvaiheen, jossa sopimuksen metatietoja syötetään käsin sopimustenhallintajärjestelmiin. Tällä tavoin voidaan parantaa hankintatoimen tehokkuutta ja työntekijöiden kokemaa työn merkityksellisyyttä, kun työaikaa voidaan käyttää luoviin ja arvoa tuottaviin tehtäviin.
Aiemmassa tiedon eristämistä koskevassa tutkimuksessa on käsitelty monenlaisia tekstityyppejä, mutta kokonaiset hankintasopimukset ovat jääneet vaille huomiota. Tämän tutkimuksen tarkoituksena oli olla täyttämässä tätä aukkoa etsimällä menetelmiä, joilla voidaan eristää metatietoja monisivuisista epästandardeista sopimuksista. Parhaiksi todettuja menetelmiä tiedon eristämiseen sovellettiin sopijaosapuoliin, voimaantulopäivään, maksuehtoihin, vastuisiin ja sopimuksen kestoon. Automaatiossa hyödynnettiin luonnollisen kielen käsittelyn menetelmiä. Kehitetyssä ohjelmassa käytettiin nimentunnistuksen algoritmeja ja käsin määriteltyjä sääntöjä. Ohjelma tuotti määrällisiä tuloksia, joista keskusteltiin case-yritys Sievo Oy:n asiantuntijoiden kanssa puolistrukturoiduissa haastatteluissa.
Tutkimuksen keskeisten löydösten pohjalta sopivaksi valikoitunut menetelmien yhdistelmä toimi hyvin sopijaosapuolten kohdalla. Muiden eristettävien nimikkeiden kohdalla työtä on vielä edessä. Vaihtelevista tuloksista huolimatta haastatteluissa keskeiseksi teemaksi nousi vaihtoehtoinen toimintatapa, joka helpottaisi avaintietojen eristämistä sopimuksista. Haastateltavat nostivat esiin mahdollisuuden käyttää ohjelmistoa avustajana täyden automatisoinnin sijaan. Nähtäväksi jää, miten tätä mahdollisuutta hyödynnetään, ja millaisen vastaanoton se saa käyttäjiltä.
Description
Thesis advisor
Malo, PekkaSammalkorpi, Sammeli