Work disability risk prediction with machine learning

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

Sähkötekniikan korkeakoulu | Master's thesis

Date

2020-06-15

Department

Major/Subject

Control, Robotics and Autonomous Systems

Mcode

ELEC3025

Degree programme

AEE - Master’s Programme in Automation and Electrical Engineering (TS2013)

Language

en

Pages

57

Series

Abstract

Changing age structure of society has increased the need for longer careers. Simultaneously, the decline of work disabilities has stopped. The reason behind this development is an increase in mental health problems of the young population at the beginning of their work-lives. Prevention of work disabilities requires more effective screening methods that can identify disability risk early. Machine learning has achieved remarkable success in many fields. The potential of machine learning has increased due to developments in new methods such as natural language processing and neural networks. However, current approaches to work disability risk management do not utilize machine learning. This thesis examines the possibilities of identifying the risk of work disabilities with machine learning making predictions from patient texts of occupational health care. The thesis created a machine learning model capable of processing Finnish texts and assessing risk related to them. The model was capable of separating people with disability risk from those without the risk with an accuracy of 72 \%. This separation ability is on par with the current screening methods. The further development is concerned with researching the transferability of the model. Additionally, improving the results with the addition of structural data is of great interest.

Yhteiskunnassa tapahtuvat ikärakenteelliset muutokset ovat lisänneet painetta työurien pidentämiseksi. Samanaikaisesti pitkään jatkunut työkyvyttömyyksien väheminen on loppunut. Muutokseen ovat vaikuttaneet erityisesti nuorten työelämässä aloittelevien kasvaneet mielenterveyshäiriöt. Työkyvyttömyyksien estämiseksi tarvitaan nykyistä tehokkaampia seulontamenetelmiä, joilla työkykyriski voidaan tunnistaa ajoissa. Koneoppimisella on saavutettu monilla aloilla merkittäviä tehostuksia toimintaan. Kehitys neuroverkoissa sekä luonnollisen kielen prosessoinnissa ovat lisänneet mahdollisuuksia entisestään. Koneoppimista ei kuitenkaan hyödynnetä nykyisin työkykyriskin hallinnassa. Tämä työ tarkastelee mahdollisuuksia työkykyriskin tunnistamiseksi työterveyden potilasteksteistä käyttäen koneoppimista. Työkykyriskin tunnistamista varten työssä luotiin suomenkielisten tekstien prosessointiin kykenevä kielimalli ja luokittelija. Luotu malli pystyi erottelemaan riskittömät ja riskin omaavat henkilöt 72 \% tarkkuudella. Erottelukyky on samalla tasolla parhaiden tämänhetkisten seulontamenetelmien kanssa. Mallin jatkokehityksessä tutkimuskohteina ovat mallin siirrettävyys sekä tulosten parantaminen yhdistämällä malliin rakenteellista dataa.

Description

Supervisor

Marttinen, Pekka

Thesis advisor

Saarela, Katja

Keywords

work disability risk, work disability, machine learning, natural language processing, NLP, data-analytics

Other note

Citation