Datan luokittelukustannusten vähentäminen aktiivisella oppimisella

No Thumbnail Available
Files
Lehmusvaara_Frans_2024.pdf (2.21 MB)
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu | Bachelor's thesis
Electronic archive copy is available locally at the Harald Herlin Learning Centre. The staff of Aalto University has access to the electronic bachelor's theses by logging into Aaltodoc with their personal Aalto user ID. Read more about the availability of the bachelor's theses.
Date
2024-05-07
Major/Subject
Mcode
SCI3027
Degree programme
Teknistieteellinen kandidaattiohjelma
Language
fi
Pages
33
Series
Abstract
Tässä kandidaatintyössä selvitetään, voidaanko aktiivisen oppimisen avulla todellisuudessa vähentää luokitellun opetusdatan määrää, ja voidaanko tällöin saavuttaa kustannussäästöjä. Aluksi tarkastellaan, mitä on aktiivinen oppiminen ja miten se toimii. Tutkimusmenetelmänä käytetään kirjallisuuskatsausta. Monet koneoppimismallit koulutetaan suorittamaan haluttuja tehtäviä esimerkkien avulla, ja laajat koneoppimismallit saattavat tarvita satoja miljoonia luokiteltuja datapisteitä esimerkeiksi. Datan luokittelusta aiheutuvat kustannukset ja työmäärä voivat olla merkittäviä, joten luokitellun datan määrää vähentäville ratkaisuille on kysyntää. Aktiivinen oppiminen on ohjatun koneoppimisen muunnelma, jossa algoritmit ovat mukana valitsemassa itselleen opetusmateriaalia. Tässä kandidaatintyössä käsitellyssä kirjallisuudessa on näytetty, että teoriassa aktiivisen oppimisen avulla voidaan vähentää opetusvaiheessa tarvittavan luokitellun datan määrää. Kirjallisuuskatsaus osoittaa myös, että aktiivisesta oppimisesta on olemassa kymmeniä empiirisiä tutkimuksia käytännön sovellutuksista, mutta monien tutkimusten tulokset eivät juurikaan ole yleistettävissä tutkimusasetelmien ulkopuolelle. Muutaman laajan tutkimuksen perusteella voidaan kuitenkin todeta, että aktiivinen oppiminen vähentää datan luokittelun tarvetta myös käytännön sovellutuksissa. Suoria tutkimuksia kustannusvaikutuksista on julkaistu vähän. Näitä tutkimuksia ja datan luokittelumääristä tehtyjä tutkimuksia hyödyntämällä voidaan kuitenkin todeta, että aktiivisella oppimisella pystytään vähentämään luokitteluun liittyviä kustannuksia. Kysymykseen siitä, kuinka paljon kustannuksia voidaan vähentää, ei kuitenkaan ole yksiselitteistä vastausta, vaan kustannussäästöt vaihtelevat muutamasta prosentista kymmeniin prosentteihin riippuen tilanteesta.
Description
Supervisor
Savioja, Lauri
Thesis advisor
Lähdesmäki, Harri
Keywords
koneoppiminen, aktiivinen oppiminen, luokittelukustannus, näytejoukko-otanta, epävarmuusotanta, komiteakysely
Other note
Citation