Utilizing deep learning for nuclear pleomorphism scoring in the histological grading of breast cancer

No Thumbnail Available
Journal Title
Journal ISSN
Volume Title
Kemian tekniikan korkeakoulu | Master's thesis
Date
2024-06-11
Department
Major/Subject
Biotechnology
Mcode
CHEM3022
Degree programme
Master's Programme in Chemical, Biochemical and Materials Engineering
Language
en
Pages
55 + 5
Series
Abstract
Breast cancer is the most common cancer in women. The Nottingham Histological Grading method evaluates the malignancy and prognosis of breast tumors by assigning a score from one to three for three histological features: tubule formation, mitotic count and nuclear pleomorphism (NP). NP evaluates the variability in size, shape, and appearance of the tumor nuclei. Out of the scored histological features, NP has shown the weakest reproducibility, and the current subjective scoring criteria of NP causes disagreements between pathologists. Thus, the automatization by using artificial intelligence (AI) could provide more objective scoring. The aim of this thesis was to develop two AI models and select the most suitable one to automate the scoring of NP. 77 digitalized whole slide images of breast cancer biopsies stained with hematoxylin and eosin were used for the development and testing of two supervised AI models. The AI models utilize instance segmentation and multiclass object detection neural network architectures. The automatic scoring by the AI models was compared to the scoring by three pathologists using kappa statistics. The AI model utilizing multiclass object detection reached fair to moderate agreement with the pathologists scoring (ĸ = 0.22 – 0.46) and performed better than the AI model utilizing instance segmentation. The instance segmentation model reached only slight agreement (ĸ = 0.13 – 0.14). The most suitable AI model was the multiclass object detection with thresholds of 5% and 15% for nuclei representing score one and score three pleomorphism. This AI model reached a fair agreement with the pathologists on a larger dataset. The AI model utilizing multiclass object detection showed promising results for automatizing the scoring of NP in the histological grading of breast cancer. However, a larger data set which includes more data representing score one nuclear pleomorphism, is needed to improve the performance of the AI model.

Rintasyöpä on maailmanlaajuisesti yleisin syöpä naisilla. Nottinghamin histologinen gradeeraus on yksi tapa arvioida rintasyövän pahanlaatuisuutta sekä ennustetta pisteyttämällä kolme histologista piirrettä yhdestä kolmeen: tubulusten muodostuminen, mitoosien määrä, sekä tumapleomorfia. Tumapleomorfia arvioi syöpäsolujen tumien koon, muodon ja ulkonäön vaihtelevuutta. Kolmesta histologisesta piirteestä tumapleomorfian pisteytys on vähiten toistettava. Nykyisen pisteytyksen haasteena on subjektiivisuus, joka aiheuttaa erimielisyyksiä patologien välillä. Automatisoitu pisteytys tekoälyn avulla mahdollistaisi objektiivisemman pisteytyksen. Tämän työn tarkoituksena oli kehittää kaksi tekoälymallia, ja valita paras automatisoimaan tumapleomorfian pisteytys. Yhteensä 77 rintasyövän kokolasinäytettä värjättynä hematoksyliini-eosiinilla käytettiin tekoälymallien kehittämiseen ja testaamiseen. Tekoälymallit kehitettiin hyödyntäen eri neuroverkkoarkkitehtuureja: instanssisegmentaatiota, sekä moniluokkaista objektitunnistinta. Tekoälymallien toimintaa verrattiin kolmen patologin pisteytystuloksiin, ja vertailuun käytettiin kappastatistiikkaa. Tekoälymalli, joka hyödynsi moniluokkaista objektitunnistinta, pääsi kohtalaisesta keskinkertaiseen yksimielisyyteen (ĸ = 0,22–0,46) patologien pisteytyksen kanssa. Tämä tekoälymalli pärjäsi paremmin, kuin instanssisegmentaatiota hyödyntävä, joka pääsi vain heikkoon yksimielisyyteen (ĸ = 0,13–0,14). Kaikista sopivin tekoälymalli oli moniluokkainen objektitunnistin, joka käytti viiden ja viidentoista prosentin kynnysarvoja soluluokille, jotka vastasivat tumapleomorfian pisteitä yksi ja kolme. Tämä malli saavutti kohtalaisen yksimielisyyden patologien kanssa, kun yksimielisyyttä tutkittiin suuremmalla näytemäärällä. Tekoälymalli, joka hyödynsi moniluokkaista objektitunnistinta, osoitti lupaavia tuloksia tumapleomorfian automatisoinnille rintasyövän histologisessa gradeerauksessa. Kuitenkin tekoälymallin parantamiseen tarvitaan suurempia näytemääriä, jotka sisältävät riittävästi pisteen yksi tumapleomorfiaa edustavia piirteitä.
Description
Supervisor
Jouhten, Paula
Thesis advisor
Blom, Sami
Keywords
breast cancer, deep learning, nuclear pleomorphism, image analysis, digital pathology, histological grading
Other note
Citation