Thoracic disease classification from X-ray images with transfer learning

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

School of Electrical Engineering | Bachelor's thesis

Department

Mcode

Language

en

Pages

24

Series

Abstract

X-ray imaging has a long history in medicine, and it remains one of the most common imaging methods for detecting diseases. A key challenge is that reliable classification and diagnosis of these images require professional expertise. Lack of expertise is a major issue in the healthcare systems of many developing countries, where resources are insufficient to diagnose everyone. The lack of qualified personnel also contributes to the relatively small size of labeled medical imaging datasets, which complicates the development of reliable computer-aided diagnosis (CAD) systems. This thesis is a literature review that examines how transfer learning can improve the automated classification of chest X-ray images and the detection of thoracic diseases. Pneumonia is one of the most typical thoracic diseases, causing more than 2 million deaths annually. CAD systems can identify potentially latent conditions in chest radiographs more efficiently than before. Such technology would reduce the burden on healthcare and enable accurate diagnosis in regions where it has previously not been feasible. The literature indicates that it is already possible to build machine learning models with transfer learning that surpass human performance. Thus, the approach not only eases pressure on healthcare but can also be more accurate than human expertise. In addition to enabling highly accurate models, transfer learning allows rapid optimization of the models because they do not need to be trained from scratch.

Röntgenkuvia on hyödynnetty pitkän aikaa lääketieteessä niiden käytännöllisyyden, edullisuuden ja verrattain nopean kuvantamisen vuoksi. Rintakehän röntgenkuvista pystytään havaitsemaan useita alueella ilmeneviä sairauksia, joista yleisin on keuhkokuume. Yhteensä eri alahengitystieinfektioihin kuolee vuosittain yli 2 miljoonaa ihmistä, joista huomattava osuus on nuoria lapsia. Kuolleisuus alahengitystieinfektioihin on yleisintä kehittyvissä maissa, joissa ei ole tarpeeksi resursseja keuhkokuvien käsittelyyn. Keuhkokuvien tulkinta on usein haasteellista, minkä vuoksi niiden luokitteluun tarvitaan ammatillinen pätevyys. Tietokoneavusteisen diagnostiikan (engl. computer-aided diagnosis, CAD) avulla kyetään automaattisesti luokittelemaan röntgenkuvia sairauksien mukaan. Näiden CAD-järjestelmien haasteena on kuitenkin puutteellisen koulutusdatan (engl. training data) määrä. CAD-järjestelmät tarvitsevat optimointiin valtavan määrän koulutusdataa, jotta niistä pystytään kouluttamaan riittävän tarkkoja. Siirto-oppimisen (engl. transfer learning) avulla pystytään siirtämään olemassa olevaa tietoa yhdestä tehtävästä toiseen tehtävään, koulutusdatan ollessa puutteellista. Koulutusdatan puute tulee ilmi keuhkokuvatiedostojen verrattain pienestä koosta. Kuvien luokittelussa käytettyjen konvoluutioneuroverkkojen (engl. convolutional neural network, CNN) esikoulutuksessa (engl. pretraining) voidaan hyödyntää luonnollisia kuvia, vaikka malli olisi suunniteltu lääketieteellisten kuvien luokitteluun. Luonnollisia kuvia on runsaasti saatavilla, ja ne omaavat keuhkokuvien kanssa samankaltaiset matalantason piirteet. Esikoulutettujen mallien käyttäminen on myös ajallisesti tehokasta, sillä alusta asti koulutetun mallin optimoimiseen voi kulua useita viikkoja. Siirto-oppimisessa täytyy tehdä useita valintoja, kuten mitä konvoluutioneuroverkkoa hyödyntää ja minkälaisilla kuvilla mallia koulutetaan. Monesti ei ole etukäteen tiedossa, mitkä valinnat johtavat parhaimpaan lopputulokseen, joten usein mallien suorituskykyjä vertaillaan erilaisilla valinnoilla. Parhaimmillaan siirto-oppimisen avulla pystytään luomaan tarkkoja CAD-järjestelmiä lääketieteellisten kuvien luokitteluun, mutta pahimmillaan siirto-oppiminen voi negatiivisesti vaikuttaa mallin kykyyn luokitella kuvia. Tällöin on kyse negatiivisesta siirrosta (engl. negative transfer), joka johtuu mallin kyvyttömyydestä hyödyntää siirrettyä tietoa. Alan kirjallisuus osoittaa koneoppimisen suuren potentiaalin lääketieteellisten kuvien luokittelussa. Nykyisin pystytään jo kehittämään malleja, jotka kykenevät luokittelemaan keuhkokuvia ihmistä paremmin. Lisäksi siirto-oppimisen avulla kehitettiin koronapandemian aikana malli, joka pystyi keuhkokuvista tunnistamaan koronavirustartunnan. Tämän tekniikan yleistäminen ja leviäminen alueilla, jossa on pulaa ammattiosaamisesta, edistäisi tasa-arvoa ja parantaisi kyseisten alueiden terveydenhuoltoa. Tarkemmalla ja tehokkaammalla diagnosoinnilla pystytään kohottamaan elämänlaatua ja pelastamaan ihmishenkiä.

Description

Supervisor

Turunen, Markus

Thesis advisor

Mińkowski, Marcin

Other note

Citation