Pedestrian Detection with Deep Convolutional Neural Networks

 |  Login

Show simple item record

dc.contributor Aalto-yliopisto fi
dc.contributor Aalto University en
dc.contributor.advisor Kutila, Matti
dc.contributor.advisor Lehtinen, Jaakko
dc.contributor.author Sintonen, Henri
dc.date.accessioned 2018-04-03T13:26:30Z
dc.date.available 2018-04-03T13:26:30Z
dc.date.issued 2018-03-19
dc.identifier.uri https://aaltodoc.aalto.fi/handle/123456789/30535
dc.description.abstract The thesis studied the classic computer vision problem of pedestrian detection, where an algorithm attempts to locate the humans present in the input data. The problem is all the more relevant due to the increasing need for such a system as autonomous vehicles are going to be introduced to the consumer market in the future. It was set about to be solved by implementing and training from scratch a combination of two convolutional neural networks. One had a good track record on visual tasks and the second had concentrated on fast run-time performance, which is a practical concern in the context of this problem. In the first experiment, where the novel network was asked to just determine whether pedestrians were present in the input images, it showed acceptable train­ing progress, but with only 29 epochs completed by the large network, the training did not converge and it had a misclassification rate of 0.44. The second experi­ment was a proper localization task, but due to lacking training time and poor testing of the hyperparameters and the cost function the network did not manage to converge and did not produce acceptable results. In a field comprised of best practices built by trial and error based development, this work can be seen as an error that can be drawn upon and serves as a start­ing point for further research. No fundamental problem with the approach was found, so more training time and a more exhaustive testing on the different hyperparameters and cost function variations are recommended as the path to a good working solution. As part of the work, a new dataset with many additional sensors was collected both in winter and summer conditions, but it was never used, as the lacking ground true values for the locations of the pedestrians were not able to be produced. en
dc.description.abstract Työssä tutkittiin klassista konenäon piiriin kuuluvaa jalankulkijoiden tunnistamisen ongelmaa, jossa algoritmi pyrkii paikantamaan ihmisten sijainnin syötekuvista. Ongelma on yhä oleellisempi markkinoille tulevaisuudessa tulevien autonomisten ajoneuvojen myötä. Se pyrittiin ratkaisemaan implementoimalla ja opettamalla alusta alkaen kahden konvolutiivisen neuroverkon yhdistelmä. Toinen näistä oli osoittautunut hyväksi visuaalisten ongelmien ratkaisussa ja toinen oli keskittynyt nopeaan ajonaikaiseen suorituskykyyn, mikä on tärkeä käytännön huolenaihe tässä kontekstissa. Ensimmäisessä kokeessa, jossa tätä uudenlaista neuroverkkoa pyydettiin vain ennustamaan onko kuvassa ihmisiä, sen oppimisen eteneminen vaikutti hyvältä alulta, mutta näin isolle verkolle vain 29 eepokin ajo ei riittänyt konvergoitumiseen, joten sen luokitteluvirhe jäi 0.44:aan. Toinen koe oli varsinainen paikannuskoe, mutta lyhyen opetusajan ja puutteellisen hyperparametrien ja kustannusfunktion testaamisen myötä verkkoa ei saatu konvergoitumaan sellaiseksi, että se olisi tuottanut hyväksyttäviä tuloksia. Tutkimuksen alalla, joka koostuu joukosta parhaita käytäntöjä, jotka on luotu yrityksen ja erehdyksen kautta, tämä työ voidaan nähdä yhtenä erehdyksenä, josta voi oppia ja joka toimii hyvänä lähtökohtana tulevissa tutkimuksissa. Mitään perustavanlaatuista ongelmaa lähestymistavassa ei havaittu, joten isommalla määrällä opetusaikaa ja perusteellisemmalla hyperparametrien ja kustannusfunk­tioiden testaamisella voitaisiin hyvin toimiva ratkaisu saada luotua. Osana työtä kerättiin myös uusi aineisto sekä kesä- että talviolosuhteissa suuremmalla määrällä erilaisia antureita, mutta sitä ei päästy hyödyntämään, kun puuttuvia oikeita jalankulkijoiden sijainteja ei saatu luotua. fi
dc.format.extent 92
dc.format.mimetype application/pdf en
dc.language.iso en en
dc.title Pedestrian Detection with Deep Convolutional Neural Networks en
dc.title Jalankulkijoiden havainnointi syvillä konvoluutioneuroverkoilla fi
dc.type G2 Pro gradu, diplomityö fi
dc.contributor.school Perustieteiden korkeakoulu fi
dc.subject.keyword convolutional en
dc.subject.keyword neural networks en
dc.subject.keyword pedestrian detection en
dc.subject.keyword localization en
dc.subject.keyword computer vision en
dc.subject.keyword autonomous vehicles en
dc.identifier.urn URN:NBN:fi:aalto-201804031999
dc.programme.major Computer Science fi
dc.programme.mcode SCI3042 fi
dc.type.ontasot Master's thesis en
dc.type.ontasot Diplomityö fi
dc.contributor.supervisor Lehtinen, Jaakko
dc.programme Master’s Programme in Computer, Communication and Information Sciences fi
local.aalto.electroniconly yes
local.aalto.openaccess yes


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search archive


Advanced Search

article-iconSubmit a publication

Browse