Luonnollisen kielen käsittelyn menetelmät lakiesitysten lausuntojen tunneanalyysissä
No Thumbnail Available
Files
Aalto login required (access for Aalto Staff only).
Journal Title
Journal ISSN
Volume Title
Sähkötekniikan korkeakoulu |
Bachelor's thesis
Electronic archive copy is available locally at the Harald Herlin Learning Centre. The staff of Aalto University has access to the electronic bachelor's theses by logging into Aaltodoc with their personal Aalto user ID. Read more about the availability of the bachelor's theses.
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Author
Date
2024-09-20
Department
Major/Subject
Bioinformaatioteknologia
Mcode
ELEC3016
Degree programme
Sähkötekniikan kandidaattiohjelma
Language
fi
Pages
37
Series
Abstract
Tämä työ käsittelee luonnollisen kielen käsittelyssä tehdyn tunneanalyysin menetelmiä ja niiden soveltuvuutta hallituksen lakiesitysten saamien lausuntojen analysoimisessa. Motivaatio työlle on kartoittaa tapoja hyödyntää luonnollisen kielen käsittelyä politiikassa esimerkiksi lausuntojen kaltaisten materiaalien tiivistämisessä, jolloin ne voisivat olla kansalaiselle lähestyttävämpiä. Työ koostuu kirjallisuuskatsauksesta ja soveltavasta osasta. Kirjallisuuskatsauksessa käydään läpi kaikkiaan seitsemän eri tunneanalyysin menetelmää: sanakirja- ja korpuspohjainen analyysi, tukivektorikone, naiivi Bayesin luokitin, konvoluutioneuroverkko, gated recurrent unit -neuroverkko, sekä suuret kielimallit. Näistä menetelmistä tukivektorikone ja suuri kielimalli GPT valikoituivat soveltavan osan vertailuun kirjallisuudessa saamiensa tulosten perusteella. Lopullisessa vertailussa tukivektorikone saavutti 68 \%:n ja GPT 78 \%:n tarkkuuden lausuntojen luokittelussa negatiivisiin, neutraaleihin ja positiivisiin. Soveltavasta osasta voidaan päätellä, että tukivektorikoneen ja GPT-kielimallin suoritusten ero on merkittävä, mutta molempia menetelmiä voidaan vielä parantaa merkittävästi. Tukivektorikoneelle annettavan datan esikäsittelyä voidaan vielä parantaa, ja molemmat menetelmät hyötyisivät laajemmasta opetusdatasta. Lisäksi sovelluksesta voitaisiin tehdä hienostuneempi käyttämällä eri luokkia tai tekemällä tunneanalyysin aspektikohtaisesti.Description
Supervisor
Turunen, MarkusThesis advisor
Laaksonen, JormaKeywords
luonnollisen kielen käsittely, tunneanalyysi, tukivektorikone, GPT, lakiesitysten lausunnot