Natural Language Inference for Hierarchical Zero-Shot Text Classification

dc.contributorAalto-yliopistofi
dc.contributorAalto Universityen
dc.contributor.advisorKosenkov, Ilia
dc.contributor.authorPirhonen, Anton
dc.contributor.schoolPerustieteiden korkeakoulufi
dc.contributor.supervisorMarttinen, Pekka
dc.date.accessioned2024-03-17T18:17:42Z
dc.date.available2024-03-17T18:17:42Z
dc.date.issued2024-03-11
dc.description.abstractText entailment classification has recently emerged as method of performing zero-shot text classification. The method allows classifying textual features to user defined labels, without requiring additional task-specific fine-tuning data. This study aims to investigate the utilization of text entailment classifiers for hierarchical zero-shot text classification. This study fine-tunes text entailment classifiers to perform both supervised and zero-shot hierarchical text classification on a hierarchical Amazon product data set. The experiment results indicate that hierarchical text classification can be transformed into a text entailment task, that the text entailment classifiers can be fine-tuned for hierarchical zero-shot classification on semantically related training data, and that the text entailment model output logits can be utilized for filtering the classifier predictions, improving classification quality. These findings suggest that text entailment classification is an effective method for performing hierarchical zero-shot text classification and demonstrate how the text entailment task can be adapted to hierarchical classification.en
dc.description.abstractTämä diplomityö tutkii hierarkista tekstin luokittelua "zero-shot"-tilanteessa, jossa tehtäväkohtaista luokiteltua dataa ei ole saatavilla luokittelijan kouluttamiseen. Tässä tilanteessa luokittelu voidaan toteuttaa tekstin ja luokkakuvausten semanttisen samankaltaisuuden perusteella. Tehtävään hyödynnetään valmiiksi koulutettuihin tekstin enkoodereihin perustuvaa loogisen seuraussuhteen luokittelijaa. Luokittelutehtävä muunnetaan hypoteeseiksi, joiden todenperäisyyttä luokittelija arvioi. Arvioiden perusteella luokittelija muodostaa todennäköisyysjakauman, jonka avulla kullekin tekstille valitaan luokka. Diplomityössä luokittelijaa jatkokoulutetaan hierarkiseen luokitteluun. Työn tutkimuksissa havaitaan, että hierarkinen tekstin luokittelu on mahdollista muuttaa loogisen seuraussuhteen luokitteluksi ja että loogisen seuraussuhteen luokittelijaa voidaan kouluttaa koulutusdatasta puuttuvien luokkien luokitteluun semanttisesti rinnasteisen datan avulla. Lisäksi tutkimuksissa havaitaan, että luokittelutuloksia voidaan rajata mallin luokittelutuloksille määrittämien todennäköisyyksien mukaan ja siten parantaa luokittelun laatua.fi
dc.format.extent70+13
dc.format.mimetypeapplication/pdfen
dc.identifier.urihttps://aaltodoc.aalto.fi/handle/123456789/127163
dc.identifier.urnURN:NBN:fi:aalto-202403172801
dc.language.isoenen
dc.programmeMaster’s Programme in Computer, Communication and Information Sciencesfi
dc.programme.majorComputer Sciencefi
dc.programme.mcodeSCI3042fi
dc.subject.keywordzero-shot classificationen
dc.subject.keywordhierarchical text classificationen
dc.subject.keywordtext entailment classificationen
dc.subject.keywordnatural language inferenceen
dc.titleNatural Language Inference for Hierarchical Zero-Shot Text Classificationen
dc.titleTekstin hierarkinen zero-shot luokittelu luonnollisen kielen päättelyn avullafi
dc.typeG2 Pro gradu, diplomityöfi
dc.type.ontasotMaster's thesisen
dc.type.ontasotDiplomityöfi
local.aalto.electroniconlyyes
local.aalto.openaccessyes

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
master_Pirhonen_Anton_2024.pdf
Size:
2.28 MB
Format:
Adobe Portable Document Format