Työssä tutkitaan luokittelijoina tunnettujen menetelmien sopivuutta tuotannonaikaisen datan mallinnukseen ja analysoimiseen laadun näkökulmasta.
Tarkoituksena on selvittää, miten hyvin luokittimet pystyvät ennustamaan tuotteen laatua.
Toinen päämäärä on tutkia menetelmän kykyä tunnistaa laadun kannalta olennaiset muuttujat, ja sitä, miten opetusdatan määrä vaikuttaa algoritmien tarkkuuteen.
Työ on tehty VTI Technologies Oy:lle.
Suorituskykyä testataan muutaman sopivan luokittelualgoritmin avulla ensin suurella, usean tuhannen näytteen joukolla ja lopuksi pienemmillä, 500:n ja 1000 näytteen joukoilla.
Tutkimusta varten toteutettiin luokittelualgoritmit Matlab-ohjelmistolla.
Tutkimuksessa käytettiin VTI:n tuotannosta generoitunutta, puolijohdeprosessointiin liittyvää ja laadunvalvonnan tarpeisiin tallennettua dataa.
Testeissä kävi ilmi, että luokittelualgoritmit pystyivät löytämään laatuluokituskriteereitä' prosessidatasta ja että jotkin menetelmistä pystyivät ennustamaan prosessierän laatuluokan suhteellisen tarkasti.
Vielä parempiin tuloksiin olisi mahdollista päästä tarkemmalla kysymyksenasettelulla ja laajemmalla datan esikäsittelyllä ja valinnalla.
Oleellisten muuttujien tunnistamisessa luokitusmenetelmät eivät suoriutuneet yhtä hyvin, ja voidaan sanoa olevan olemassa muita tehokkaampia menetelmiä merkitsevien tekijöiden löytämiseen prosessointihistoriasta.