Tekijänoikeudet generatiivisten tekoälymallien opettamisessa ja käytössä

No Thumbnail Available
Files
Närhi_Lauri_2024.pdf (568.83 KB)
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu | Bachelor's thesis
Electronic archive copy is available locally at the Harald Herlin Learning Centre. The staff of Aalto University has access to the electronic bachelor's theses by logging into Aaltodoc with their personal Aalto user ID. Read more about the availability of the bachelor's theses.
Date
2024-01-23
Department
Major/Subject
Informaatioverkostot
Mcode
SCI3026
Degree programme
Teknistieteellinen kandidaattiohjelma
Language
fi
Pages
36
Series
Abstract
Generatiivisilla tekoälymalleilla voidaan nykyään luoda mediaa, kuten tekstiä, kuvia, ääntä ja ohjelmakoodia, jota on vaikea erottaa ihmisen tuotoksesta. Kyseiset mallit perustuvat syviin neuroverkkoihin, jotka oppivat monipuolisia säännönmukaisuuksia valtavasta määrästä ihmisten tuottamaa opetusdataa. Opittuja säännönmukaisuuksia sekä satunnaisuutta yhdistämällä mallit kykenevät luomaan täysin uutta mediaa, mutta mallien opettamiseen ja käyttöön liittyy merkittäviä tekijänoikeusongelmia, sillä opetusdatan pääasiallinen lähde on internet ja data koostetaan automatisoidusti. Tämä kandidaatintyö on kirjallisuuskatsaus, jossa tutkitaan millaisia tekijänoikeusongelmia generatiivisten tekoälymallien opettamiseen ja käyttöön liittyy. Työssä pyritään rajaamaan, mitä tarkalleen ottaen kyseiset tekijänoikeusongelmat ovat, minkälaisista teknologisista syistä ne johtuvat, sekä miten tämänhetkinen Yhdysvaltain ja EU:n tekijänoikeuslainsäädäntö on varautunut kyseisiin ongelmiin. Työn tärkeimpinä tuloksina havaittiin kolme seikkaa. Ensinnäkin tekijänoikeudella suojatun opetusdatan käyttöä ei ole määritelty riittävän selkeästi Yhdysvaltain ja EU:n lainsäädännössä. Toisekseen vaikka generatiivisten tekoälymallien rakenne sekä opetusmenetelmät tunnetaan hyvin, niiden oppimiskykyä sekä kykyä yhdistellä opittuja säännönmukaisuuksia ei ymmärretä tarpeeksi. Malleja käytetään ikään kuin valtavina mustina laatikoina, eikä tälle näy loppua, sillä uudemmat mallit ovat merkittävästi edeltäjiään suurempia. Kolmanneksi havaittiin, että lainsäädännön uudistukset ovat huomattavasti myöhässä, sillä merkittävät generatiiviset tekoälymallit julkaistiin jo vuosi sitten. Vaikuttaisi siltä, että sekä EU:ssa että Yhdysvalloissa joudutaan odottamaan vuosia, kunnes kehitteillä oleva lainsäädäntö astuu voimaan.
Description
Supervisor
Fagerholm, Fabian
Thesis advisor
Suoranta, Sanna
Keywords
generatiivinen tekoäly, tekijänoikeudet, fair use, text and data mining
Other note
Citation