Do Thanh Nghi * , Van Pham Dang Tri , Nguyen Nhi Gia Vinh and Pham Nguyen Khang

* Corresponding author (dtnghi@ctu.edu.vn)

Abstract

In recent years, climate change is one of the environmental problems that needs to be studied in the Mekong Delta of Vietnam, especially those in conjunction with temperature and rainfall. As temperature and rainfall changes directly affect agriculture and aquaculture activities - driving factors of the delta?s development, the raising question is if such changes could be forecasted with acceptable level of uncertainties. This paper presents algorithms and models of adjusting the forecasted rainfall data obtained from climate data of the SEA-START. A comparison of these forecast models is conducted by forecast error analysis. A case study is experimented by using rainfall data in Can Tho city - Vietnam. The results show that the linear regression model has the greatest forecast error while the non-linear forecast models give better results. The diversity of these forecast models can be applied to solve environmental problems in practice.
Keywords: Rainfall forecast, linear regression, k nearest neighbors, decision trees, bagging, random forests, support vector machines

Tóm tắt

Trong những năm gần đây, biến đổi khí hậu là một trong những vấn đề môi trường cần được nghiên cứu ở vùng đồng bằng sông Cửu Long - Việt Nam, đặc biệt là những vấn đề liên quan đến các yếu tố nhiệt độ và lượng mưa. Do sự thay đổi nhiệt độ và lượng mưa ảnh hưởng trực tiếp đến các hoạt động nông nghiệp và nuôi trồng thủy sản - những yếu tố chính dẫn đến sự phát triển của vùng đồng bằng Sông Cửu Long, câu hỏi được đặt ra là liệu những thay đổi về nhiệt độ và lượng mưa có thể được dự báo với độ không chắc chắn ở mức có thể chấp nhận được hay không. Bài báo này trình bày các giải thuật và mô hình dự báo lượng mưa từ nguồn dữ liệu khí hậu của SEA-START. Các mô hình dự báo này được so sánh với nhau bằng phương pháp phân tích lỗi dự báo. Các kết quả trong bài báo này cho thấy mô hình hồi qui tuyến tính có lỗi dự báo cao nhất trong khi các mô hình dự báo phi tuyến cho kết quả dự báo tốt hơn. Tính đa dạng của những mô hình dự báo này có thể được ứng dụng để giải các bài toán môi trường trong thực tiễn.
Từ khóa: Dự báo lượng mưa, hồi qui tuyến tính, k láng giềng, cây quyết định, bagging, rừng ngẫu nhiên, máy học véc-tơ hỗ trợ

Article Details

References

P. Aksornsingchai, C. Srinilta. Statistical Downscaling for Rainfall and Temperature Prediction in Thailand. Proc. of the Intl. MultiConference of Engineers and Computer Scientists, pp. 356-361, (2011).

A. Anandhi, V.V. Srinivas, R.S. Nanjundiah, D.N. Kumar. Downscaling precipitation to river basin in India for IPCC SRES scenarios using support vector machine. International Journal of Climatology, vol. 28(3):401–420, (2008).

A. Bárdossy and E.J. Plate. Space-time model for daily rainfall using atmospheric circulation patterns. Water Resources Research 28: doi: 10.1029/91WR02589. ISSN: 0043-1397, (1992).

A. Bárdossy. Downscaling from GCMs to local climate through stochastic linkages. Journal of Environmental Management, vol. 49(1): 7-17, (1997).

T.A. Buishand and T. Brandsma. Multisite simulation of daily precipitation and temperature in the Rhine basin by nearest-neighbor resampling. Journal Water Resources Research, Vol.37(11):2761-2776, (2001).

Bộ Tài nguyên và Môi trường. Kịch bản biến đổi khí hậu và nước biển dâng cho Thành phố Cần Thơ. Báo cáo kỹ thuật, Bộ Tài nguyên và Môi trường, Hà Nội, (2011).

L. Breiman, J.H. Friedman, R.A. Olshen and C. Stone. Classification and Regression Trees. Wadsworth International, (1984).

L. Breiman. Bagging predictors. Machine Learningvol. 24(2):123–140, (1996).

L. Breiman. Random forests. Machine Learningvol. 45(1):5–32, (2001).

C.C. Chang and C.J. Lin. LIBSVM - a library for support vector machines. (2011).

S.T. Chen, P.S. Yu, Y.H. Tang. Statistical downscaling of daily precipitation using support vector machines and multivariate analysis. Journal of Hydrology385:13–22, (2010).

C.T. Dhanya, D.N. Kumar. Multivariate nonlinear ensemble prediction of daily chaotic rainfall with climate inputs. Journal of Hydrology, Elsevier, vol.403(3-4):292-306, (2011).

C.T. Dhanya, D.N. Kumar. Data Mining for Evolving Fuzzy Association Rules for Predicting Monsoon Rainfall of India. Journal of Intelligent Systems, Freund & Pettman, UK, vol.18(3):193-209, (2010).

K. McKuffie and A. Henderson-Sellers, A Climate Modeling Primer, John Wiley & Sons Ltd., UK, ISBN 0-470-85750-1, (2005).

E. Fix, J. Hodges. Discriminatoiry Analysis: Small Sample Performance. Technical Report 21-49-004, USAF School of Aviation Medicine, Randolph Field, USA, (1952).

S. Ghosh, P.P. Mujumdar. Statistical downscaling of GCM simulations to streamflow using relevance vector machine. Advances in Water Resources, vol. 31(1):132-146, (2008).

S. Ghosh. SVM-PGSL coupled approach for statistical downscaling to predict rainfall from GCM output. Journal of Geophysical Research: Atmospheres, vol.115(D22):1984-2012, (2010).

M.K. Goyal, C.S.P. Ojha. Evaluation of Various Linear Regression Methods for Downscaling of Mean Monthly Precipitation in Arid Pichola Watershed. Natural Resources, vol.1(1):11-18, (2010).

M.Z. Hashmi, A.Y. Shamseldin, B.W. Melville. Statistical downscaling of precipitation: state-of-the-art and application of bayesian multi-model approach for uncertainty assessment. Hydrology and Earth System Sciences Discuss.(6):6535-6579, (2009).

R. Ihaka, R. Gentleman. R: A language for data analysis and graphics. Journal of Computational and Graphical Statistics, vol.5(3):299-314, (1996).

J. Murphy. Predictions of climate change over Europe using statistical and dynamical downscaling techniques. Intl Journal of Climatology, Vol.20(5):489-501, (2000).

J.P. Palutikof, C.M. Goodess, S.J. Watkins and T. Holt. Generating Rainfall and Temperature Scenarios at Multiple Sites: Examples from the Mediterranean. Journal of Climate, Vol.15(24): 3529-3548, (2002).

A. Pasini. Neural NetworkModeling in Climate Change Studies. In Artificial Intelligence Methods in the Environmental Sciences, S. E. Haupt et al. (eds.), pp. 235-254, (2009).

J.R. Quinlan. C4.5: Programs for Machine Learning. Morgan Kaufmann, (1993).

D. Raje, P.P. Mujumdar. A comparison of three methods for downscaling daily precipitation in the Punjab region. Hydrological Processes, vol.25(23):3575–3589, (2011).

J.S. Selker and D.A. Haith. Development and testing of single-parameter precipitation distributions. Water Resources Research 26: doi: 10.1029/90WR01648. ISSN: 0043-1397, (1990).

S. Tripathi, V.V. Srinivasa, R.S. Nanjundiahb. Downscaling of precipitation for climate change scenarios: a support vector machine approach. Journal of Hydrology 330:621–640, (2006).

C.P. Tung and D.A. Haith. Global-warming effects on New York streamflows. Journal of Water Resources Planning and Management, 121(2), pp. 216-225, (1995).

V. Vapnik. The Nature of Statistical Learning Theory. Springer-Verlag, (1995).

H. Von Storch, E. Zorita and U. Cubasch. Downscaling of climate change estimates to regional scales: An application to winter rainfall in the Iberian Peninsula. Journal of Climate 6: 1161-1171, (1993).

X.Wu and V. Kumar. Top 10 Algorithms in Data Mining. Chapman & Hall/CRC, (2009).

H. Yu, S.C. Liu and R.E. Dickinson. Radiative effects of aerosols on the evolution of the atmospheric boundary layer. Journal of Geophysical Research: Atmospheres, 107(D12), 4142, doi:10.1029/2001JD000754, (2002).