Võ Văn Tài * Đổng Yến Nghi

* Tác giả liên hệ (vvtai@ctu.edu.vn)

Abstract

This paper presents methods of classifying Fisher, logistic, SVM, Bayes and their calculating problems. The article also solves real application problem from discrete data of these methods by programs which are built on Matlab software including programs to estimate probability density function, to classify an element and to compute Bayes error. A real application in medicine is presented in detail: Finding the suitable model  for assessing hypertensive patient from variables. The result shows that Bayesian method is always the best model. This application is not only as an illustration of the presented theories, to test the logic of the established programs but also to show the application potential of the studied problem.
Keywords: Classification, Fisher, logistic, Bayes, error

Tóm tắt

Bài báo trình bày các phương pháp trong phân loại Fisher, logistic, SVM, Bayes và vấn đề tính toán của chúng. Bài báo cũng giải quyết vấn đề ứng dụng thực tế từ số liệu rời rạc của các phương pháp này bằng các chương trình được xây dựng trên phần mềm Matlab. Đó là chương trình ước lượng hàm mật độ xác suất, phân loại một phần tử và tính sai số Bayes. Một ứng dụng thực tế trong y học được trình bày chi tiết: Tìm mô hình thích hợp trong đánh giá bệnh cao huyết áp từ các biến. Kết quả thực hiện cho thấy phương pháp Bayes luôn cho mô hình tốt nhất. Áp dụng này không những minh họa cho những lý thuyết đã trình bày, kiểm tra sự hợp lý của các chương trình được thiết lập, mà còn cho thấy tiềm năng ứng dụng của vấn đề nghiên cứu.
Từ khóa: Phân loại, Fisher, logistic, Bayes, sai số

Article Details

Tài liệu tham khảo

Devijver P. A and Kittler K., 1982. Pattern recognition, a statistical approach. Prentice Hall, London.

Fukunaga K., 1990. Introduction to statistical pattern recognition. Academic Press, New York.

Hand D. J., 1982. Discriminant and classification. John Wiley & Sons, New York.

Hand D. J., 1982. Kernel discriminant analysis. Letchworth, London.

Inman H. F. and Bradley E. L., 1989. The overlapping coefficient as a measure of agreement between probability distributions and point estimation of the overlap of two normal densities. Commun Statist Theory Method. 18: 3851-3871.

Martinez W. L. and Martinez A. R., 2008. Computational statistics handbook with Matlab. Chapman & Hall/CRC, Boca Raton.

McLachlan G. J. and Basford K., 1988. Mixture models. Marcel Dekker, New York.

G.Miller et al, 2011. Baysian prior probability distributions for internal dosimetry. Radiat. Prot. Dosim. 94(4): 347-352.

Pham-Gia T. et al, 2006. Baysian analysis in the L1– norm of the mixing proportion using discriminant analysis. Metrika. 64(1):1-22.

Pham–Gia T. et al, 2006. Bounds for the Bayes error in classification: A Bayesian approach using discriminant analysis. Statistical Methods and Applications. 16: 7- 26.

Pham–Gia T. et al, 2008. The maximum function in statistical discrimination analysis. Commun.in Stat–Simulation computation. 37(2): 320-336.

Scott D. W., 1992. Mutivariate density estimation: Theory, practice and visualization. John Wiley & Son, New York.

Webb A., 2000. Statistical pattern recognition. John Wiley & Sons, New York.