Forecasting silicon wafer sales using machine learning and statistical models

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

School of Science | Master's thesis

Department

Mcode

Language

en

Pages

73

Series

Abstract

Sales forecasting plays a crucial role in allowing businesses to anticipate demand and support budgeting. The aim of this thesis, conducted in collaboration with Okmetic, is to examine whether statistical and machine learning (ML) models can provide meaningful and reliable forecasts to help shift their approach from predominantly qualitative to a more data-driven, quantitative one. To explore this, several statistical and ML models were implemented and evaluated, and the potential value of including exogenous variables was examined. In addition, a customer analysis was conducted, assessing forecast performance metrics and applying clustering techniques to identify whether patterns exist between customer groups. The results show that all tested models outperform Okmetic's existing forecasting approach when properly tuned, with SARIMA and SARIMAX achieving the strongest performance. Although exogenous variables show promise for further improving the accuracy of forecasts, practical implementation challenges limit their value. The Customer analysis did not provide clear and actionable insights, but highlighted the need to approach current forecasts critically. These findings indicate that data-driven, quantitative forecasting can meaningfully strengthen Okmetic's sales and demand planning process. However, a full switch from qualitative to quantitative is not recommended, as human input is still valuable to provide domain expertise and validate forecasts. The models provide a strong foundation that can be expanded further with more data, improved feature engineering, and testing. Applying the models to support the current process represents a promising next step toward more accurate forecasting.

Försäljningsprognoser spelar en avgörande roll för att företag ska kunna förutse efterfråga och stöda budgetering. Målet med denna avhandling, som genomförts i samarbete med Okmetic, är att undersöka ifall statistiska modeller och maskininlärningsmodeller (ML) kan ge meningsfulla och pålitliga prognoser för att hjälpa förändra deras främst kvalitativta analyser till mer datadrivna och kvantitativa. För att utforska detta implementerades och utvärderades flera statistiska och ML modeller, och det potentiella värdet av att inkludera exogena variabler undersöktes. Dessutom genomfördes en kundanalys, där deras prognoser utvärderades och klustertekniker tillämpades för att identifiera om det finns mönster mellan kundgrupperna. Resultaten visade att alla testade modeller presterade bättre än Okmetics nuvarande prognosmetod, förutsatt att de är korrekt justerade, där SARIMA och SARIMAX presterade bäst. Även om exogena variabler visade lovande resultat för att ytterligare förbättra prognosernas noggrannhet, begränsar praktiska implementeringsutmaningar deras värde. Kundanalysen gav inte tydliga och användbara insikter, men lyfte fram behovet av att kritiskt utvärdera nuvarande prognoser. Dessa resultat tyder på att datadrivna, kvantitativa prognoser på ett meningsfullt sätt kan stärka Okmetics försäljnings- och efterfrågeplaneringsprocess. En fullständig övergång från kvalitativ till kvantitativ rekommenderas dock inte, eftersom mänsklig insats fortfarande är värdefullt för att ge domänexpertis och bekräfta prognoserna. Modellerna ger en stark grund som kan utökas ytterligare med mer data, förbättrad "feature engineering" och testning. Att tillämpa modellerna för att stöda den nuvarande processen representerar ett lovande nästa steg mot mer exakta prognoser.

Description

Supervisor

Mannila, Heikki

Thesis advisor

Autio, Kati

Other note

Citation