aalto1 untyped-item.component.html

Predicting student absenteeism using machine learning methods

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

School of Electrical Engineering | Master's thesis

Department

Mcode

Language

en

Pages

60

Series

Abstract

Students in Finnish comprehensive schools are increasingly absent from their lessons. Student absenteeism has been associated with several harmful consequences, such as a poorer academic performance and a higher risk of marginalization. Thus, a warning system for teachers that identifies students at risk of absenteeism and allows early intervention is essential. Such a system could utilize machine learning, which is well-suited for finding complex patterns in data. Statistical methods as well as machine learning methods were applied to data comprising categorical student information and lesson notes from the Wilma-system. Explanatory variables were constructed by aggregating the lesson notes over a 12-week period. The aggregated lesson notes, as well as the categorical student information, were used as predictors. The applied methods predicted the amount of absence that a student accumulated during the school year. Particularly with aggregated absence notes as predictors, the methods predicted absenteeism with acceptable accuracy. However, the predictive value of other types of lesson notes, as well as the categorical student information, appears limited and requires further investigation.

Suomalaisten peruskoulujen oppilaat ovat lisääntyvässä määrin poissa oppitunneiltaan. Poissaolojen on havaittu olevan yhteydessä useisiin haitallisiin seurauksiin, kuten heikompaan koulumenestykseen ja suurempaan syrjäytymisriskiin. Näiden haitallisten seurausten välttämiseksi tarvitaan järjestelmä, joka tunnistaa ja varoittaa opettajia poissaolovaarassa olevista oppilaista, mahdollistaen aikaisen puuttumisen tilanteeseen. Tämänkaltainen varoitusjärjestelmä voisi hyödyntää koneoppimista, joka soveltuu hyvin monimutkaisten kaavojen ja toimintatapojen tunnistamiseen datasta. Statistisia metodeja sekä koneoppimisen metodeja sovellettiin oppilasdataan, joka sisälsi Wilma-järjestelmän tuntimerkintöjä sekä kategorista tietoa oppilaista. Selittävät tekijät muodostettiin kategorisoimalla ja summaamalla oppilaan tuntimerkinnät 12 viikon ajalta. Sekä summattuja tuntimerkintöjä, että kategorista tietoa oppilaista käytettiin ennustajina. Sovelletut metodit ennustivat oppilaan yhden lukuvuoden aikana kerääntyneiden poissaolojen määrää. Koneoppimismallit ennustivat lukuvuoden poissaoloja hyväksyttävällä tarkkuudella, kun selittävänä tekijänä hyödynnettiin 12 viikon poissaolomerkintöjen summaa. Muiden tuntimerkintätyyppien sekä kategorisen oppilastiedon arvo poissaoloa selittävinä tekijöinä vaikuttaa vähäiseltä ja tarvitsee lisätutkimusta.

Description

Supervisor

Ollila, Esa

Thesis advisor

Rautiainen, Elina
Lempinen, Lotta

Other note

Citation

Endorsement

Review

Supplemented By

Referenced By