Deep learning architecture comparison for semantic segmentation of forest roads

dc.contributorAalto-yliopistofi
dc.contributorAalto Universityen
dc.contributor.advisorEl Issaoui, Aimad
dc.contributor.advisorTaher, Josef
dc.contributor.advisorHyyppä, Juha
dc.contributor.authorLukkari, Teemu
dc.contributor.schoolPerustieteiden korkeakoulufi
dc.contributor.schoolSchool of Scienceen
dc.contributor.supervisorGarg, Vikas
dc.date.accessioned2025-06-16T17:01:47Z
dc.date.available2025-06-16T17:01:47Z
dc.date.issued2025-05-26
dc.description.abstractDigitizing forest roads enhances efficiency in road monitoring, maintenance, and standardized condition assessment. A key step in this digitization process is the semantic segmentation of forest road scenes. In this thesis, we compare six supervised deep learning architectures for the semantic segmentation of forest roads. The selected architectures process data represented as sets, graphs, or grids, and include differently designed group equivariant (G-equivariant) and coarsening layers. We annotated 9.7 km of forest roads for training, validating, and testing the neural networks. The trained models were evaluated based on their semantic segmentation accuracy, geometric stability, and computational performance. Our results show that the two models with the highest semantic segmentation accuracy are Omni-Adaptive CNN (OACNN), which operates on voxels, and Point Transformer v3 (PTv3), which operates on graphs. Specifically, OACNN achieves a mean IoU of 91.81% for road and 79.28% for on-road vegetation. PTv3 achieves a mean IoU of 91.74% for road and 78.07% for on-road vegetation. Additionally, our analysis revealed major differences in models’ geometric stability. RandLA-Net was the most robust to non-rigid deformations of input point clouds, while OACNN was the most robust with respect to point cloud orientation. Finally, models operating on structured input grids had the shortest forward pass times. These findings contribute to more accurate, robust, and efficient forest road digitization.en
dc.description.abstractMetsäteiden digitointi tehostaa teiden monitorointia, ylläpitoa ja standardisoitua laatuarviointia. Keskeinen askel digitointiprosessissa on metsätieympäristön semanttinen segmentointi. Tässä työssä vertailemme kuutta ohjattua syväoppimisarkkitehtuuria metsäteiden semanttisessa segmentoinnissa. Valitut arkkitehtuurit prosessoivat dataa joko pistejoukkona, graafina tai rasterina, ja niillä on erilaiset ryhmäekvivariantti- (G-ekvivariantti) ja koontikerrokset. Annotoimme 9,7 km metsätietä neuroverkkojen kouluttamiseen, validointiin ja testaamiseen. Koulutetut mallit arvioitiin semanttisen segmentoinnin tarkkuudessa, geometrisessa stabiilisuudessa ja laskennallisessa suorituskyvyssä. Tuloksemme osoittavat, että segmentointitarkkuudessa kaksi parasta mallia olivat Omni-Adaptive CNN (OACNN), joka operoi vokseleilla, ja Point Transformer v3 (PTv3), joka operoi graafeilla. OACNN:n keskimääräinen IoU-metriikka oli tielle 91,81% ja tiekasvillisuudelle 79,28%. Vastaavasti PTv3:n keskimääräinen IoU-metriikka oli tielle 91,74% ja tiekasvillisuudelle 78,07%. Lisäksi analyysimme paljasti selkeitä eroja mallien geometrisessa stabiilisuudessa. RandLA-Net oli robustein sisääntulevien pistepilvien ei-jäykille muutoksille, kun taas OACNN oli robustein pistepilvien orientaation suhteen. Lisäksi mallit, jotka operoivat strukturoiduilla rastereilla, saavuttivat lyhyimmät eteenpäin kulkuajat. Nämä havainnot myötävaikuttavat tarkempaan, robustimpaan ja tehokkaampaan metsäteiden digitointiin.fi
dc.format.extent71
dc.format.mimetypeapplication/pdfen
dc.identifier.urihttps://aaltodoc.aalto.fi/handle/123456789/136461
dc.identifier.urnURN:NBN:fi:aalto-202506164709
dc.language.isoenen
dc.programmeMaster's Programme in Life Science Technologiesen
dc.programme.majorComplex Systemsen
dc.subject.keyworddeep learningen
dc.subject.keywordgeometric deep learningen
dc.subject.keywordpoint clouden
dc.subject.keywordmobile laser scanningen
dc.subject.keywordforest roaden
dc.subject.keywordsemantic segmentationen
dc.titleDeep learning architecture comparison for semantic segmentation of forest roadsen
dc.titleSyväoppimisarkkitehtuurien vertailu metsäteiden semanttisessa segmentoinnissafi
dc.typeG2 Pro gradu, diplomityöfi
dc.type.ontasotMaster's thesisen
dc.type.ontasotDiplomityöfi
local.aalto.electroniconlyyes
local.aalto.openaccessno

Files