Redes neurais do tipo Long Short-Term Memory aplicadas em previsões de demanda no mercado varejista

Fukai, Fernanda Mayumi (2024)

dissertacao_mestrado

A previsão de vendas é um componente crítico na indústria do varejo, essencial para decisões estratégicas, planejamento operacional e manutenção da estabilidade finan- ceira, promovendo o crescimento dos negócios. Métodos estatísticos tradicionais têm sido amplamente utilizados para análise de séries temporais, mas frequentemente enfrentam dificuldades com relações complexas, não lineares e dinâmicas de alta dimensionalidade. Nesse contexto, redes Long Short-Term Memory (LSTM) ofere- cem vantagens significativas devido à sua capacidade de reter informações ao longo de longos períodos, tornando-as adequadas para lidar com interações dinâmicas e complexas nos dados. Esta dissertação avalia o desempenho de três redes neurais baseadas em variações da arquitetura LSTM: Vanilla LSTM, Conv1D-LSTM e Multiscale CNN-LSTM, aplicadas à previsão de vendas futuras. Para uma análise comparativa robusta, os modelos Average, XGBoost e LightGBM também são empregados como benchmarks, com desempenho avaliado por métricas como Erro Absoluto Médio (MAE), Raiz do Erro Quadrático Médio (RMSE) e Erro Absoluto Escalado Médio (MASE). A otimização de hiperparâmetros foi realizada para melhorar os resultados. Os resultados indicam que a arquitetura Conv1D-LSTM consistentemente supera os outros modelos LSTM em quase todas as métricas, alcançando o maior R2 e os menores valores de MAE, RMSE e MASE após a otimização Bayesiana. No entanto, modelos como LightGBM e XGBoost demonstraram desempenho superior aos modelos LSTM, com custos computacionais significativamente menores, tornando-os alternativas eficientes para previsão de vendas, especialmente em cenários com recursos computacionais limitados. Embora os modelos baseados em LSTM, particularmente o Conv1D-LSTM, sejam altamente eficazes para lidar com a complexidade dos dados de séries temporais, modelos como LightGBM e XGBoost permanecem competitivos, oferecendo um equilíbrio valioso entre desempenho e eficiência computacional.

ABSTRACT Sales forecasting is a critical component of the retail industry, essential for strategic decision-making, operational planning, and maintaining financial stability while promoting business growth. Traditional statistical methods have been widely used for time series analysis but often struggle with complex, nonlinear relationships and highdimensional dynamics among variables. In this context, Long Short-Term Memory (LSTM) networks offer significant advantages due to their ability to retain information over long periods, making them particularly suited to handle the complex and dynamic interactions inherent in the data. This dissertation evaluates the performance of three neural networks based on variations of the LSTM architecture: Vanilla LSTM, Conv1DLSTM, and Multiscale CNN-LSTM, applied to future sales forecasting. To provide a more robust comparative analysis, the Average, XGBoost, and LightGBM models are also employed as benchmarks. Model performance is assessed using metrics such as Mean Absolute Error (MAE), Root Mean Squared Error (RMSE), and Mean Absolute Scaled Error (MASE). Additionally, hyperpa- rameter tuning is conducted to optimize the models’ results. The results indicate that the Conv1D-LSTM architecture consistently outperforms other LSTM models across nearly all evaluation metrics, achieving the highest R 2 value and the lowest MAE, RMSE, and MASE after Bayesian optimization of a hyperparameter set. However, models like LightGBM and XGBoost demonstrated superior performance compared to LSTM-type model’s, while offering the advantage of significantly lower computational costs. This makes them highly efficient alternatives for sales forecasting, especially in scenarios where computational resources are limited. Overall, the study concludes that while LSTM-based models, particularly Conv1D-LSTM, are highly effective at navigating the complexities of time series data (in our context) and identifying intricate patterns over long periods, traditional models like LightGBM and XGBoost remain competitive, providing a valuable balance between performance and computational efficiency. Keywords: LSTM, Convolutional Neural Networks, Deep Learning, Sales Forecasting, Retail


Collections: