Data file classification using statistical analysis
No Thumbnail Available
URL
Journal Title
Journal ISSN
Volume Title
Helsinki University of Technology |
Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author
Instructions for the author
Authors
Date
2009
Department
Major/Subject
Tietämystekniikka
Mcode
T-93
Degree programme
Language
en
Pages
(12+) 70
Series
Abstract
Vertailen kolmea n-grammeihin pohjautuvaa tilastollista menetelmää, joilla pystytään luokittelemaan tiedostonäytteitä automatisoidusti ennaltamääriteltyihin ryhmiin havaittujen tilastollisten poikkeamien perusteella. Esittelen myös miten näitä menetelmiä pystytään soveltamaan perinteisten virus-tunnisteiden tapaan tunnistamaan saastuneita tiedostoja ja toimimaan osana yleistä tiedostonäytteiden hallintaprosessia näytteiden analysoinnin tukena luomassa tietoturvaa asiakkaalle. Käyn myös läpi muita yleisiä menetelmiä haittaohjelmien tunnistamiseen ja torjuntaan, sekä luon katsauksen tilastollisten menetelmien soveltuvuuteen laajemmin haittaohjelmien analysoinnin ja torjunnan näkökulmasta.Description
Supervisor
Syrjänen, MarkkuThesis advisor
Ståhlberg, MikaKeywords
n-gram, n-grammi, statistical analysis, tilastollinen analyysi, Bloom, Bloom, malware, haittaohjelma, signature, tunniste, detection, sormenjälki, fingerprint, virus, virus, tunnistamaton, zero-day, poikkeama, anomaly, automaattinen, automatic, Markov, Markov