Luonnollisen kielen käsittelyn menetelmät lakiesitysten lausuntojen tunneanalyysissä

No Thumbnail Available
Files
Ikola_Matias_2024.pdf (804.74 KB)
Journal Title
Journal ISSN
Volume Title
Sähkötekniikan korkeakoulu | Bachelor's thesis
Electronic archive copy is available locally at the Harald Herlin Learning Centre. The staff of Aalto University has access to the electronic bachelor's theses by logging into Aaltodoc with their personal Aalto user ID. Read more about the availability of the bachelor's theses.
Date
2024-09-20
Department
Major/Subject
Bioinformaatioteknologia
Mcode
ELEC3016
Degree programme
Sähkötekniikan kandidaattiohjelma
Language
fi
Pages
37
Series
Abstract
Tämä työ käsittelee luonnollisen kielen käsittelyssä tehdyn tunneanalyysin menetelmiä ja niiden soveltuvuutta hallituksen lakiesitysten saamien lausuntojen analysoimisessa. Motivaatio työlle on kartoittaa tapoja hyödyntää luonnollisen kielen käsittelyä politiikassa esimerkiksi lausuntojen kaltaisten materiaalien tiivistämisessä, jolloin ne voisivat olla kansalaiselle lähestyttävämpiä. Työ koostuu kirjallisuuskatsauksesta ja soveltavasta osasta. Kirjallisuuskatsauksessa käydään läpi kaikkiaan seitsemän eri tunneanalyysin menetelmää: sanakirja- ja korpuspohjainen analyysi, tukivektorikone, naiivi Bayesin luokitin, konvoluutioneuroverkko, gated recurrent unit -neuroverkko, sekä suuret kielimallit. Näistä menetelmistä tukivektorikone ja suuri kielimalli GPT valikoituivat soveltavan osan vertailuun kirjallisuudessa saamiensa tulosten perusteella. Lopullisessa vertailussa tukivektorikone saavutti 68 \%:n ja GPT 78 \%:n tarkkuuden lausuntojen luokittelussa negatiivisiin, neutraaleihin ja positiivisiin. Soveltavasta osasta voidaan päätellä, että tukivektorikoneen ja GPT-kielimallin suoritusten ero on merkittävä, mutta molempia menetelmiä voidaan vielä parantaa merkittävästi. Tukivektorikoneelle annettavan datan esikäsittelyä voidaan vielä parantaa, ja molemmat menetelmät hyötyisivät laajemmasta opetusdatasta. Lisäksi sovelluksesta voitaisiin tehdä hienostuneempi käyttämällä eri luokkia tai tekemällä tunneanalyysin aspektikohtaisesti.
Description
Supervisor
Turunen, Markus
Thesis advisor
Laaksonen, Jorma
Keywords
luonnollisen kielen käsittely, tunneanalyysi, tukivektorikone, GPT, lakiesitysten lausunnot
Other note
Citation