Natural Language Inference for Hierarchical Zero-Shot Text Classification
dc.contributor | Aalto-yliopisto | fi |
dc.contributor | Aalto University | en |
dc.contributor.advisor | Kosenkov, Ilia | |
dc.contributor.author | Pirhonen, Anton | |
dc.contributor.school | Perustieteiden korkeakoulu | fi |
dc.contributor.supervisor | Marttinen, Pekka | |
dc.date.accessioned | 2024-03-17T18:17:42Z | |
dc.date.available | 2024-03-17T18:17:42Z | |
dc.date.issued | 2024-03-11 | |
dc.description.abstract | Text entailment classification has recently emerged as method of performing zero-shot text classification. The method allows classifying textual features to user defined labels, without requiring additional task-specific fine-tuning data. This study aims to investigate the utilization of text entailment classifiers for hierarchical zero-shot text classification. This study fine-tunes text entailment classifiers to perform both supervised and zero-shot hierarchical text classification on a hierarchical Amazon product data set. The experiment results indicate that hierarchical text classification can be transformed into a text entailment task, that the text entailment classifiers can be fine-tuned for hierarchical zero-shot classification on semantically related training data, and that the text entailment model output logits can be utilized for filtering the classifier predictions, improving classification quality. These findings suggest that text entailment classification is an effective method for performing hierarchical zero-shot text classification and demonstrate how the text entailment task can be adapted to hierarchical classification. | en |
dc.description.abstract | Tämä diplomityö tutkii hierarkista tekstin luokittelua "zero-shot"-tilanteessa, jossa tehtäväkohtaista luokiteltua dataa ei ole saatavilla luokittelijan kouluttamiseen. Tässä tilanteessa luokittelu voidaan toteuttaa tekstin ja luokkakuvausten semanttisen samankaltaisuuden perusteella. Tehtävään hyödynnetään valmiiksi koulutettuihin tekstin enkoodereihin perustuvaa loogisen seuraussuhteen luokittelijaa. Luokittelutehtävä muunnetaan hypoteeseiksi, joiden todenperäisyyttä luokittelija arvioi. Arvioiden perusteella luokittelija muodostaa todennäköisyysjakauman, jonka avulla kullekin tekstille valitaan luokka. Diplomityössä luokittelijaa jatkokoulutetaan hierarkiseen luokitteluun. Työn tutkimuksissa havaitaan, että hierarkinen tekstin luokittelu on mahdollista muuttaa loogisen seuraussuhteen luokitteluksi ja että loogisen seuraussuhteen luokittelijaa voidaan kouluttaa koulutusdatasta puuttuvien luokkien luokitteluun semanttisesti rinnasteisen datan avulla. Lisäksi tutkimuksissa havaitaan, että luokittelutuloksia voidaan rajata mallin luokittelutuloksille määrittämien todennäköisyyksien mukaan ja siten parantaa luokittelun laatua. | fi |
dc.format.extent | 70+13 | |
dc.format.mimetype | application/pdf | en |
dc.identifier.uri | https://aaltodoc.aalto.fi/handle/123456789/127163 | |
dc.identifier.urn | URN:NBN:fi:aalto-202403172801 | |
dc.language.iso | en | en |
dc.programme | Master’s Programme in Computer, Communication and Information Sciences | fi |
dc.programme.major | Computer Science | fi |
dc.programme.mcode | SCI3042 | fi |
dc.subject.keyword | zero-shot classification | en |
dc.subject.keyword | hierarchical text classification | en |
dc.subject.keyword | text entailment classification | en |
dc.subject.keyword | natural language inference | en |
dc.title | Natural Language Inference for Hierarchical Zero-Shot Text Classification | en |
dc.title | Tekstin hierarkinen zero-shot luokittelu luonnollisen kielen päättelyn avulla | fi |
dc.type | G2 Pro gradu, diplomityö | fi |
dc.type.ontasot | Master's thesis | en |
dc.type.ontasot | Diplomityö | fi |
local.aalto.electroniconly | yes | |
local.aalto.openaccess | yes |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- master_Pirhonen_Anton_2024.pdf
- Size:
- 2.28 MB
- Format:
- Adobe Portable Document Format