Neuraaliverkkojen käyttö optimisäädössä

No Thumbnail Available

URL

Journal Title

Journal ISSN

Volume Title

Helsinki University of Technology | Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author

Date

1997

Major/Subject

Säätötekniikka

Mcode

Aut-74

Degree programme

Language

fi

Pages

51

Series

Abstract

Vain hyvin harvoin optimisäätöongelma voidaan ratkaista analyyttisesti, lähinnä lineaarisen systeemidynamiikan ja neliöllisen kustannusfunktion tapauksessa. Käytännön ongelmissa systeemiyhtälö on kuitenkin usein epälineaarinen, jolloin analyyttistä ratkaisua ei ole, vaan ongelma on ratkaistava numeerisesti esimerkiksi dynaamisella optimoinnilla. Tällöin saadaan ensimmäisen kertaluvun välttämättömät stationääriehdot, jotka optimaalinen tila ja ohjaus toteuttavat. Ehdot johtavat kahden pisteen reuna-arvotehtävään, joka pitää ratkaista jokaiselle alkutilalle erikseen. Tässä työssä tarkastellaan diskreettiaikaisen Bolza-ongelman muotoon formuloitua optimisäätötehtävää, jossa ohjaus lasketaan neuraaliverkon avulla. Jokaisen ajanhetken ohjaussignaali saadaan samasta myötäkytketystä monikerroksisesta neuraaliverkosta, jonka sisääntulo on kyseisen hetken systeemin tila. Koska neuraaliverkot pystyvät approksimoimaan mielivaltaisen tarkasti jatkuvia funktioita, voidaan niitä käyttää myös säätiminä. Hyvin opetettu neuraaliverkko kykenee antamaan opetusalueensa ulkopuolisiinkin alkutiloihin liittyvät optimiohjaukset tai riittävän hyvät ohjaukset huomattavasti perinteisiä numeerisia menetelmiä nopeammin ja pienemmällä laskennalla. Aikaisemmat optimisäätötehtävien neuraaliverkkosäätimien opetusalgoritmit kaikki perustuvat stokastiseen gradienttimenetelmään, jossa painoja päivitetään satunnaiseen alkutilaan liittyvällä hetkellisellä gradientilla. Tässä työssä esitellään uusi opetusalgoritmi TOBPTTMA (time-optimal-backpropagation-through time with momentum and adaptive learning rate) neuraaliverkkosäätimen painojen päivitykseen. Algoritmiin on otettu mukaan momenttisuodatin sekä adaptiivinen opetuskertoimen muutos opetuksen edistyessä. Lisäksi painoja päivitetään gradientilla, joka liittyy riittävän suureen osaan alkuperäisen optimisäätötehtävän kustannusfunktiossa mukana olevista alkutiloista. Tuloksena on yleistys aikaisemmista algoritmeista, joka takaa stabiilimman konvergoitumisen ja suuremman kyvyn välttää kustannusfunktion lokaalit minimit.

Description

Supervisor

Koivo, Heikki

Thesis advisor

Koivo, Heikki

Keywords

optimal control, optimisäätö, neural networks, neuraaliverkot

Other note

Citation