Data file classification using statistical analysis

No Thumbnail Available

URL

Journal Title

Journal ISSN

Volume Title

Helsinki University of Technology | Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author

Date

2009

Major/Subject

Tietämystekniikka

Mcode

T-93

Degree programme

Language

en

Pages

(12+) 70

Series

Abstract

Vertailen kolmea n-grammeihin pohjautuvaa tilastollista menetelmää, joilla pystytään luokittelemaan tiedostonäytteitä automatisoidusti ennaltamääriteltyihin ryhmiin havaittujen tilastollisten poikkeamien perusteella. Esittelen myös miten näitä menetelmiä pystytään soveltamaan perinteisten virus-tunnisteiden tapaan tunnistamaan saastuneita tiedostoja ja toimimaan osana yleistä tiedostonäytteiden hallintaprosessia näytteiden analysoinnin tukena luomassa tietoturvaa asiakkaalle. Käyn myös läpi muita yleisiä menetelmiä haittaohjelmien tunnistamiseen ja torjuntaan, sekä luon katsauksen tilastollisten menetelmien soveltuvuuteen laajemmin haittaohjelmien analysoinnin ja torjunnan näkökulmasta.

Description

Supervisor

Syrjänen, Markku

Thesis advisor

Ståhlberg, Mika

Keywords

n-gram, n-grammi, statistical analysis, tilastollinen analyysi, Bloom, Bloom, malware, haittaohjelma, signature, tunniste, detection, sormenjälki, fingerprint, virus, virus, tunnistamaton, zero-day, poikkeama, anomaly, automaattinen, automatic, Markov, Markov

Other note

Citation