aalto1 untyped-item.component.html
Predicting student absenteeism using machine learning methods
Loading...
URL
Journal Title
Journal ISSN
Volume Title
School of Electrical Engineering |
Master's thesis
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Authors
Date
Department
Major/Subject
Mcode
Language
en
Pages
60
Series
Abstract
Students in Finnish comprehensive schools are increasingly absent from their lessons. Student absenteeism has been associated with several harmful consequences, such as a poorer academic performance and a higher risk of marginalization. Thus, a warning system for teachers that identifies students at risk of absenteeism and allows early intervention is essential. Such a system could utilize machine learning, which is well-suited for finding complex patterns in data. Statistical methods as well as machine learning methods were applied to data comprising categorical student information and lesson notes from the Wilma-system. Explanatory variables were constructed by aggregating the lesson notes over a 12-week period. The aggregated lesson notes, as well as the categorical student information, were used as predictors. The applied methods predicted the amount of absence that a student accumulated during the school year. Particularly with aggregated absence notes as predictors, the methods predicted absenteeism with acceptable accuracy. However, the predictive value of other types of lesson notes, as well as the categorical student information, appears limited and requires further investigation.
Suomalaisten peruskoulujen oppilaat ovat lisääntyvässä määrin poissa oppitunneiltaan. Poissaolojen on havaittu olevan yhteydessä useisiin haitallisiin seurauksiin, kuten heikompaan koulumenestykseen ja suurempaan syrjäytymisriskiin. Näiden haitallisten seurausten välttämiseksi tarvitaan järjestelmä, joka tunnistaa ja varoittaa opettajia poissaolovaarassa olevista oppilaista, mahdollistaen aikaisen puuttumisen tilanteeseen. Tämänkaltainen varoitusjärjestelmä voisi hyödyntää koneoppimista, joka soveltuu hyvin monimutkaisten kaavojen ja toimintatapojen tunnistamiseen datasta. Statistisia metodeja sekä koneoppimisen metodeja sovellettiin oppilasdataan, joka sisälsi Wilma-järjestelmän tuntimerkintöjä sekä kategorista tietoa oppilaista. Selittävät tekijät muodostettiin kategorisoimalla ja summaamalla oppilaan tuntimerkinnät 12 viikon ajalta. Sekä summattuja tuntimerkintöjä, että kategorista tietoa oppilaista käytettiin ennustajina. Sovelletut metodit ennustivat oppilaan yhden lukuvuoden aikana kerääntyneiden poissaolojen määrää. Koneoppimismallit ennustivat lukuvuoden poissaoloja hyväksyttävällä tarkkuudella, kun selittävänä tekijänä hyödynnettiin 12 viikon poissaolomerkintöjen summaa. Muiden tuntimerkintätyyppien sekä kategorisen oppilastiedon arvo poissaoloa selittävinä tekijöinä vaikuttaa vähäiseltä ja tarvitsee lisätutkimusta.
Description
Supervisor
Ollila, EsaThesis advisor
Rautiainen, ElinaLempinen, Lotta