Ensuring the availability of an IT system - An investigation of the security risk of downtime causing errors and their root causes

No Thumbnail Available

URL

Journal Title

Journal ISSN

Volume Title

School of Science | Master's thesis
Checking the digitized thesis and permission for publishing
Instructions for the author

Date

2010

Major/Subject

Tietojenkäsittelyoppi

Mcode

T-76

Degree programme

Language

en

Pages

[7] + 66 + [4]

Series

Abstract

Security of information systems is an increasingly important issue in a world in which networks of IT systems are becoming more common. The risk spectrum for security vulnerabilities of IT systems is wide and varied. Security problems can lead to annoyance for customers, loss of sensitive information, loss of income, damage to company reputation and even risk to human lives. The thesis was done in a Finnish IT company. The goal of the thesis is to investigate security issues within one of the company's products. The biggest security risk for the product is downtime. The research was performed as action research, where the researcher collaborates with practitioners to solve problems. The research proceeded by first performing a security risk analysis for downtime causing errors reported by the customer. Second, a root cause analysis is performed on the most important problems found in the error reports. The investigation of the downtime causing errors between 2007-2009 revealed robustness issues as the largest category of security problems. Out of the robustness issues, the largest problem set was issues where high load caused an error and downtime. The problems chosen for root cause analysis were cases where there were insufficient logs from the system available to determine the cause of the error and procedural issues that caused an error. The root cause for these two problems was found to be lack of competence of support personnel and lack of competence transfer to support personnel.

IT-järjestelmien tietoturva on yhä tärkeämpi asia maailmassa, jossa verkottuneet IT järjestelmät ovat yleistymässä. Tietoturvahaavoittuvuuksien riskiskaala on laaja ja monipuolinen. Tietoturvaongelmista voi aiheutua harmia asiakkaille, arkaluontoisen tiedon katoamista, tulojen menetystä, vahinkoa yrityksen maineelle ja jopa riskejä ihmishengille. Tämä diplomityö on tehty suomalaisessa IT yrityksessä. Diplomityön tavoite on tutkia tietoturvaongelmia eräässä yrityksen tuotteessa. Suurin tietoturvariski tälle tuotteelle on seisokkiaika. Tutkimusmenetelmänä käytettiin toimintatutkimusta, missä tutkija tekee yhteistyötä ammatinharjoittajien kanssa jonkin ongelman ratkaisemiseksi. Tutkimus on kaksivaiheinen. Ensin tehdään riskianalyysi asiakkaan raportoimille virheille, joista on aiheutunut seisokkiaikaa. Tämän jälkeen tehdään juurisyyanalyysi tärkeimmille ongelmille, jotka on tunnistettu asiakkaan raportoimista seisokkiaikaa aiheuttaneista virheistä. Tutkimusaineistona oli vuosien 2007 - 2009 välisenä aikana raportoidut seisokkiaikaa aiheuttaneet virheet. Tutkimuksen tuloksena todettiin, että suurin tietoturvavirheluokka oli vikasietoisuusongelmat. Vikasietoisuusongelmien joukosta suurin osa virheistä oli aiheutunut liian suuren kuorman aiheuttamasta virheestä ja seisokkiajasta. Juurisyyanalyysillä tutkittiin kahta ongelmaa. Ensimmäinen löytynyt ongelma oli suuri määrä tapauksia, joissa virheiden syytä ei saatu selville, koska järjestelmästä saadut lokit olivat puutteellisia. Toinen ongelma oli menettelytapavirheet, jotka aiheuttivat seisokkiaikaa. Näille kahdelle ongelmalle löydettiin juurisyyksi tukihenkilöstön osaamisen puute ja tiedonsiirron puute tukihenkilöstölle.

Description

Supervisor

Lassenius, Casper

Thesis advisor

Waller, Gabriel

Keywords

action research, toimintatutkimus, security, tietoturva, root cause analysis, juurisyyanalyysi, availability, saatavuus

Other note

Citation