Transfer Learning in Histopathological Image Analysis

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

Perustieteiden korkeakoulu | Master's thesis

Date

2023-01-16

Department

Major/Subject

Complex Systems

Mcode

SCI3060

Degree programme

Master’s Programme in Life Science Technologies

Language

en

Pages

36+1

Series

Abstract

A histopathological analysis is the main diagnostic tool for many diseases, and because of the aging population, the shortage of pathologists has been a concern in many countries. The use of deep learning has become popular in the field of histopathology, as it can speed up the diagnosis process and decrease the workload of pathologists. Histopathological data has typically a lot of variation due to differing practices and tools used in laboratories and hospitals, making the development process of neural networks often time consuming and expensive. Thus better methods for developing neural networks are needed. Neural networks trained with histopathological images generalize poorly for images from different scanners. Thus, adding new data to a project usually requires adding more training data, and training a new AI model. Transfer learning is a machine learning method, that can be used to speed up the training of the model and decrease the required amount of data. This thesis aimed to find out, how and when transfer learning should be used in the training of neural networks for histopathological image analysis. The goal is to speed up the development process in a situation where data from different scanners is added to a project. Prostate cancer microarray images with epithelium annotations were used for the study. Transfer learning does not always improve the model performance, but it speeds up the training of a neural network. The smaller the training data set is, the more transfer learning can improve the model performance. The results were similar both with overlapping and not overlapping source and target data sets. Consecutive use of transfer learning, "chaining", did not have a negative effect on the model performance either.

Monien tautien päädiagnosointityökalu on histopatologinen analyysi, minkä vuoksi ikääntyvä populaatio on monissa maissa herättänyt huolta patologien riittävyydestä. Syväoppiminen on yleistynyt histopatologian alalla, sillä se voi nopeuttaa diagnosointia sekä pienentää patologien työmäärää. Histopatologisessa datassa on tyypillisesti paljon variaatiota, sillä käytännöt ja työkalut vaihtelevat laboratorioiden ja sairaaloiden välillä, minkä vuoksi neuroverkkojen kehittäminen on usein aikaa vievää ja kallista. Siksi neuroverkkojen kehittämiseen tarvitaan parempia menetelmiä. Histopatologisilla kuvilla opetetut neuroverkkomallit yleistyvät huonosti esimerkiksi eri skannereilla luoduille kuville, jonka vuoksi uuden datan lisääminen projektiin vaatii usein opetusdatan lisäämistä sekä uuden mallin opetusta. Siirto-oppiminen on koneoppimismenetelmä, jota voidaan käyttää nopeuttamaan neuroverkkojen opetusta, sekä pienentämään opetukseen tarvittavan datan määrää. Tämän diplomityön tavoite oli selvittää, miten ja milloin siirto-opetusta tulisi käyttää histopatologisessa kuva-analyysissä. Tavoite oli nopeuttaa neuroverkkomallin kehittämistä tilanteessa, jossa projektiin lisätään eri skannereilla saatua dataa. Tutkimuksessa käytettiin eturauhassyöpäkudosmatriisikuvia, joihin oli annotoitu epiteelialueet. Siirto-opetus ei aina paranna mallin suorituskykyä, mutta se nopeuttaa neuroverkon opetusta. Mitä pienempi opetuksessa käytetty datasetti on, sitä enemmän siirto-opetus voi parantaa mallin suorituskykyä. Tulokset olivat samankaltaisia sekä päällekkäisillä, että täysin eriävillä lähde- ja kohdedataseteillä. Myöskään siirto-opetusten ketjuttaminen ei huonontanut mallin suorituskykyä.

Description

Supervisor

Kivelä, Mikko

Thesis advisor

Häme, Yrjö

Keywords

transfer learning, histopathology, deep learning, image analysis

Other note

Citation