Data driven modelling for viscose quality characterisation: a machine learning approach

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Kemian tekniikan korkeakoulu | Master's thesis
Date
2019-03-12
Department
Major/Subject
Chemical and Process Engineering
Mcode
CHEM3043
Degree programme
Master's Programme in Chemical, Biochemical and Materials Engineering
Language
en
Pages
58
Series
Abstract
Demand for textile fibers is increasing, and cellulosic man-made fibers can be utilized as an alternative substance for oil-based end products in textile industry. To compete with oil-based products, a more accessible quality characterization could be helpful. The aim of this study is to examine the possibilities of a machine learning method called Random Forest in the viscose fiber production and to find out, if the machine learning method Random Forest is applicable for the viscose quality modelling. This is due to traditional regression methods such linear regression not having been successfully applied for the quality characterisation. The study consists of literature review and an applied part. The literature review considers dissolving pulp and viscose production as well as machine learning and more precisely an algorithm called Random Forest. The applied part consists of data analysis, data handling and other methods required in order to achieve the most accurate Random Forest model. The study shows, that the Random Forest algorithm has a potential to model the quality behaviour, especially in comparison to traditional linear regression. The Random Forest model can predict with 95% confidence if the viscose quality classifies as good or bad, but the numerical prediction for the quality parameter has a large error margin for the 95% confidence. It is suggested, that the error margin could be lower, if the utilized data was whole and the number of data points was larger.

Tekstiilikuitujen tarve on kasvussa, ja selluloosapohjaisia kuituja voitaisiin käyttää korvaavana raaka-aineena tekstiiliteollisuuden öljypohjaisille tuotteille. Kilpaillakseen öljypohjaisten tuotteiden kanssa, paremmin saatavilla oleva mallintaminen tekstiilikuitujen laadulle voisi olla hyödyllistä. Tämän tutkimuksen tarkoituksena on tutkia koneoppimismenetelmän “Random Forest” mahdollisuuksia viskoosikuitujen valmistuksessa ja selvittää, voiko Random Forest menetelmää käyttää viskoosin laadun mallintamiseen. Viskoosin laatua ei ole pystytty mallintamaan perinteisillä lineaarisen mallintamisen keinoilla, ja tästä syystä lähestyminen koneoppimisen kautta on valittu. Tämä tutkimus koostuu kirjallisuuskatsauksesta ja soveltavasta osiosta. Kirjallisuuskatsauksessa käsitellään liukosellun ja viskoosin tuotantoa, sekä koneoppimista ja erityisesti Random Forest- algoritmia. Soveltava osa koostuu data-analyysistä, datan käsittelyn keinoista ja muista metodeista, joita tarvitaan tarkan Random Forest mallin luomiseen. Tutkimuksen tulos osoittaa, että Random Forest- algoritmilla on potentiaalia viskoosin laadun mallintamiseen. Random Forest malli pystyy ennustamaan 95% varmuudella, onko viskoosin laatu hyvä tai huono, mutta numeerisella ennusteella on suhteellisen suuri virhemarginaali. Virhemarginaalia voisi saada pienennettyä, mikäli käytettävä data olisi eheämpää ja datapisteitä olisi enemmän.
Description
Supervisor
Alopaeus, Ville
Thesis advisor
Kahala, Jarmo
Keywords
machine learning, random forest, viscose, dissolving pulp
Other note
Citation