aalto1 untyped-item.component.html
Improvements in drug-target interaction prediction with multimodal deep learning
Loading...
URL
Journal Title
Journal ISSN
Volume Title
School of Science |
Master's thesis
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Authors
Date
Department
Mcode
Language
en
Pages
64
Series
Abstract
Drug-target interaction (DTI) prediction is an important topic of research in the field of computational chemistry with applications in drug discovery and repurposing. This thesis investigates whether integrating predicted 3D structures of drug-target complexes with sequence-based representations improves DTI prediction accuracy. A bimodal deep learning ensemble, BimodalDTI, is introduced. It consists of three components: two graph neural networks operating on complex structures predicted by the Boltz-1 diffusion model, and a sequence-based model that integrates the ChemBERTa and ProtT5 language models. DTI prediction is formulated as a regression task predicting interaction strength. The models are evaluated in bioactivity imputation and new drug scenarios. BimodalDTI consistently outperforms all its individual components and other baseline models. These results indicate that combining predicted structural information with sequence-based representations improves DTI prediction accuracy.
Lääkeaineen ja lääkekohteen välisen vuorovaikutuksen (DTI) ennustaminen on tärkeä laskennallisen kemian tutkimusala, jolla on sovellutuksia sekä lääkekehityksessä että lääkkeiden uudelleenkohdentamisessa. Tässä diplomityössä selvitetään, voidaanko DTI-ennusteiden tarkkuutta parantaa yhdistämällä molekyylikompleksin ennustettu 3D-rakenne molekyylien sekvenssipohjaisten esitysten kanssa. Diplomityössä esitellään uusi syväoppimiseen perustuva bimodaalinen yhdistelmämalli, BimodalDTI. Se koostuu kolmesta komponentista: kahdesta graafineuroverkosta, jotka käsittelevät Boltz-1-diffuusiomallin ennustamia kompleksirakenteita sekä sekvenssipohjaisesta mallista, joka hyödyntää ChemBERTa- ja ProtT5-kielimalleja. DTI-ennustaminen on muotoiltu regressiotehtäväksi, jossa pyritään ennustamaan molekyylien välisen vuorovaikutuksen voimakkuutta. Mallien tarkkuutta arvioidaan kahdessa eri asetelmassa. Ensimmäisessä testidata sisältää sekä lääkeaineita että lääkekohteita, jotka mallit ovat nähneet jo koulutuksen aikana. Toisessa asetelmassa kaikki testidatan sisältämät lääkeaineet ovat malleille entuudestaan tuntemattomia. BimodalDTI suoriutuu molemmissa asetelmissa kaikkia yksittäisiä komponenttejaan ja muita vertailukohtina käytettyjä malleja paremmin. Tulokset osoittavat bimodaalisen lähestymistavan parantavan DTI-ennusteiden tarkkuutta.
Description
Supervisor
Rousu, JuhoThesis advisor
Li, AnchenArmah-Sekum, Robert Ebo