Trần Thanh Ngọc *

* Tác giả liên hệ (tranthanhngoc@iuh.edu.vn)

Abstract

This paper proposes an algorithm flowchart to evaluate the impact of parameters in the Bayesian Optimization using the Gaussian Process (BO-GP) algorithm on the LightGBM model for short-term load forecasting. The investigated hyperparameters include learning_rate, n_estimators, max_depth, subsample, and colsample_bytree. The performance of the BO-GP algorithm is assessed based on two primary parameters: the number of optimization iterations (n_iter) and the number of folds in cross-validation (k-fold). To assess the model's stability, the coefficient of dispersion (CD%) is calculated by repeating the BO-GP process n = 30 times. The study utilizes daily peak load data from Victoria, Australia. The experiments revealed that the optimal n_iter value was 80, compared to the default of 50. Similarly, optimal performance for k-fold was observed at values of 4, 6, and 7, while the default was 3. The study highlights the importance of selecting appropriate parameters of the BO-GP algorithm to optimize the LightGBM model for load forecasting.

Keywords: Load forecasting, LightGBM model, BO-GP algorythm

Tóm tắt

Lưu đồ giải thuật được đề xuất trong bài báo nhằm đánh giá ảnh hưởng của các tham số trong giải thuật Bayesian Optimization với Gaussian Process (BO-GP) đối với mô hình LightGBM trong bài toán dự báo phụ tải ngắn hạn. Các siêu tham số được khảo sát bao gồm: learning_rate, n_estimators, max_depth, subsample và colsample_bytree. Hiệu suất của giải thuật BO-GP được đánh giá dựa trên hai tham số chính: số vòng lặp tối ưu hóa (n_iter) và số lần chia tập dữ liệu huấn luyện (k-fold). Để kiểm tra độ ổn định của mô hình, hệ số phân tán CD% được tính toán bằng cách lặp lại BO-GP n = 30 lần. Tập dữ liệu phụ tải đỉnh hàng ngày từ bang Victoria, Úc được sử dụng trong nghiên cứu. Kết quả thực nghiệm cho thấy, giá trị tối ưu của n_iter là 80, trong khi giá trị mặc định là 50. Tương tự, k-fold đạt hiệu suất tốt nhất tại 4, 6 và 7, trong khi giá trị mặc định là 3. Tầm quan trọng của việc lựa chọn tham số phù hợp được nhấn mạnh trong nghiên cứu nhằm tối ưu hóa mô hình LightGBM khi áp dụng vào dự báo phụ tải.

Từ khóa: Dự báo phụ, mô hình LightGBM, giải thuật BO-GP

Article Details

Tài liệu tham khảo

Brown, C. E. (1998). Applied multivariate statistics in geohydrology and related sciences. Springer Berlin Heidelberg.
https://doi.org/10.1007/978-3-642-80328-4

Davtyan, A., Rodin, A., Muchnik, I., & Romashkin, A. (2020). Oil production forecast models based on sliding window regression. Journal of Petroleum Science and Engineering, 195, 107916.
https://doi.org/10.1016/j.petrol.2020.107916

Dwi, U., Fathoni, D., & Sivi, N. A. (2025). Analisis Pengaruh Bayesian Optimization Terhadap Kinerja SVM Dalam Prediksi Penyakit Diabetes. Infotek: Jurnal Informatika Dan Teknologi, 8(1), 140–150.
https://doi.org/10.29408/jit.v8i1.28468

Fan, S., & Hyndman, R. J. (2010). Short-term load forecasting based on a semi-parametric additive model. IEEE Transactions on Power Systems, 25(3), 1475–1483.
https://doi.org/10.1109/TPWRS.2009.2036017

Kahraman, E., & Akay, O. (2023). Comparison of exponential smoothing methods in forecasting global prices of main metals. Mineral Economics, 36, 427–435.
https://doi.org/10.1007/s13563-022-00354-y

Kien, D. T., Huong, P. D., & Minh, N. D. (2023). Application of SARIMA model in load forecasting in Hanoi City. International Journal of Energy Economics and Policy, 13(3), 164–170. https://doi.org/10.32479/ijeep.14121

Liang, S., Peng, J., Xu, Y., & Ye, H. (2021). Passive fetal movement recognition approaches using hyperparameter tuned LightGBM model and Bayesian optimization. Computational Intelligence and Neuroscience, 2021, 6252362. https://doi.org/10.1155/2021/6252362

Le, T. N., Pham, V. H., & Nguyen, M. H. (2019). Application of artificial neural networks for power output forecasting of thermal power plants. Journal of Science and Technology – The University of Danang, 17(3), 29–33.
https://jst-ud.vn/jst-ud/article/view/1906

Papadopoulos, D. N., Javan, F. D., Najafi, B., Mamaghani, A. H., & Rinaldi, F. (2023). Handling complete short-term data logging failure in smart buildings: Machine learning-based forecasting pipelines with sliding-window training scheme. Energy and Buildings, 301, 113694.
https://doi.org/10.1016/j.enbuild.2023.113694

Tran, T. N., & Nguyen, Q. D. (2024). Research on the influence of genetic algorithm parameters on XGBoost in load forecasting. Engineering, Technology & Applied Science Research, 14(6), 18849–18854.
https://doi.org/10.48084/etasr.8863

Tran, T. N., Nguyen, Q. D., & Lam, B. M. (2024). Impact of kernel functions on support vector machine models in classification and regression problems. In Proceedings of the International Conference on Sustainable Energy Technologies (ICSET) (pp. 813–820). Springer. https://doi.org/10.1007/978-981-97-1868-9_80

Vu, N. H. M., Khanh, N. T. P., Cuong, V. V., & Binh, P. T. T. (2017). Forecast on Vietnam electricity consumption to 2030. In Proceedings of the 2017 International Conference on Electrical Engineering and Informatics (ICELTICs 2017), 72–77).
https://doi.org/10.1109/ICELTICS.2017.8253238

Vuong, T. C., & Pham, H. H. (2023). Application of the LightGBM algorithm in land cover classification of Ly Son Island District, Vietnam. Journal of Geodesy and Cartography Science, 56, 51–57.
https://doi.org/10.54491/jgac.2023.56.685

Wang, C., Li, X., Shi, Y., Jiang, W., Song, Q., & Li, X. (2024). Load forecasting method based on CNN and extended LSTM. Energy Reports, 12, 2452–2461.
https://doi.org/10.1016/j.egyr.2024.07.030

Yang, L., & Shami, A. (2020). On hyperparameter optimization of machine learning algorithms: Theory and practice. Neurocomputing, 415, 295–316.
https://doi.org/10.1016/j.neucom.2020.07.061

Starukhin, Y., & Diukarev, V. (2024). AUTOMATION OF TEXT DATA PROCESSING USING NLP. The American Journal of Engineering and Technology, 6(07), 24–39.
https://doi.org/10.37547/tajet/Volume06Issue07-04

Zhang, D., & Gong, Y. (2020). The comparison of LightGBM and XGBoost coupling factor analysis and prediagnosis of acute liver failure. IEEE Access, 8, 220990–221003.
https://doi.org/10.1109/ACCESS.2020.3042848

Zwolle, M. G. B. (2022). Analysing environmental ratings’ ability to model firms’ emission behaviour. Econometrie.
http://hdl.handle.net/2105/62071