Võ Văn Tài * Nguyễn Trang Thảo

* Tác giả liên hệ (vvtai@ctu.edu.vn)

Abstract

This article presents some conceptions, theoretical results and algorithms for building clusters of the probability density functions. With programs written by Matlab, we solve the computing problem of clustering probability density functions. This technique can illustrate the real discrete data about the extra-practicing and studying marks of the students from CONS (College of Naturel Science), Can Tho University.

Keywords: cluster width, hierarchical method, non?hierarchical method

Tóm tắt

Bài báo trình bày một số khái niệm, kết quả lý thuyết và thuật toán để xây dựng chùm các hàm mật độ xác suất. Với các chương trình được viết bằng Matlab, chúng tôi giải bài toán với máy tính để xây dựng chùm các hàm mật độ xác suất. Kỹ thuật này có thể minh giải các dữ liệu rời rạc thực tế về điểm rèn luyện và điểm học tập của sinh viên Khoa Khoa học Tự Nhiên, Trường Đại học Cần Thơ.
Từ khóa: Chùm, độ rộng chùm, phương pháp thứ bậc, phương pháp không thứ bậc

Article Details

Tài liệu tham khảo

Defays, D. (1977), "An efficient algorithm for a complete link method”, Computer Journal,

20(4), pp.354–366.

Fukunaga, K., (1990), Introduction to statistical pattern recognition, 2nd Ed., Academic

Press, New York.

Glick, N., (1973), "Separation and probability of correct classification among two or more

distributions", Annals Inst. Stat Math. 25, pp.373–382.

Martinez, W.L. and Martinez, A.R., (2008), Computational statistics handbook with Matlab,

Chapman & Hall/CRC, Boca Raton.

Matusita, K. (1967), "On the notion of affinity of several distributions and some of its

applications", Ann. Inst. Statist. Math. 19, pp.181–192.

Pham–Gia, T. Turkkan, N. and Tai, Vovan., (2008), "The maximum function in statistical

discrimination analysis",Commun. in Stat–Simulation computation 37(2), pp. 320 – 336.

Rohlf. F.J., (1982), "Single – link clustering algorithms", in P.R. Krishnaiah and L.N. Kanal, eds, Handbook of Statistics, North Holland, Amsterdam, vol.2, pp. 267–284.

Scott, David W. (1992), Mutivariate density estimation: theory, practice and visualization, John Wiley & Son, New York.

Sibson, R., "Slink: an optimally efficient algorithm for the single – link cluster method", Computer Journal 16(1), pp. 20–34.

Tai, VoVan., Pham – Gia,T., (2010), "Clustering probability distributions", Journal of applied statistics, 37(11), pp. 1891-1910.

Toussaint G.T., (1972), "Some inequalities between distance measures for feature evaluation", I.E.E.E Trans. Comput. 21, pp.409-429.

Webb, A., (2002), Statistical pattern recognition, 2nd Ed., John Wiley & Sons, New York.

PHỤ LỤC

Bảng kết quả chọn mẫu điểm học tập và điểm rèn luyện của 20 sinh viên được chọn ngẫu nhiên từ các lớp của Khoa Khoa học Tự nhiên, Trường Đại học Cần Thơ

X: điểm học tâp.

Y: điểm rèn luyện.