Nguyễn Kim Ngân , Võ Thị Cẩm Tiên , Lê Thanh Tâm , Nguyễn Phúc Bảo , Nguyễn Thị Mỹ Trâm , Lê Thị Huỳnh Như , Nguyễn Thị Yến Nhi , Thái Minh Trọng Lê Đại Nghiệp *

* Tác giả liên hệ (ldnghiep@nctu.edu.vn)

Abstract

This study proposes a classification algorithm for probability density functions (PDFs) which is then applied to image data. The proposed algorithm is detailed step-by-step and illustrated using a specific set of PDFs. For application to image data, the study extracts color features using four basic colors represented as one-dimensional PDFs. Next, the method for finding prior probabilities based on fuzzy cluster analysis techniques is built. Finally, the quasi-Bayesian classification principle is established. Application on a specific set of images shows good classification results and demonstrates significant potential for practical applications across various fields.

Keywords: Probability density function, classification, Bayesian method, extracting image

Tóm tắt

Nghiên cứu này đề xuất một thuật toán phân loại cho các hàm mật độ xác suất (PDF) để từ đó áp dụng cho dữ liệu ảnh. Thuật toán đề nghị được trình bày chi tiết các bước thực hiện và được minh hoạ trên một tập PDF cụ thể. Để áp dụng cho dữ liệu ảnh, nghiên cứu trích xuất đặc trưng màu sắc với 4 màu cơ bản thành các PDF một chiều đại diện. Sau đó, phương pháp tìm xác suất tiên nghiệm dựa trên kỹ thuật phân tích chùm mờ được xây dựng. Cuối cùng, nguyên tắc phân loại tựa Bayes được thiết lập.  Ứng dụng trên tập ảnh cụ thể cho thấy kết quả phân loại tốt và có nhiều tiềm năng trong áp dụng thực tế của nhiều lĩnh vực khác nhau.

Từ khóa: Hàm mật độ xác suất, phân loại, phương pháp Bayes, trích xuất ảnh

Article Details

Tài liệu tham khảo

Cinar, I. A. (2022). Identification of rice varieties using machine learning algorithms. Journal of Agricultural Sciences, 28(2), 307-325. https://doi.org/10.15832/ankutbd.862482

Che-Ngoc, H., Nguyen-Trang, T., Huynh-Van, H. (2023). Improving Bayesian classifier using vine copula and fuzzy clustering Technique. Annal of Data Science, 11, 709–732. https://doi.org/10.1007/s40745-023-00490-4

Dan, N. T. & Tai, V. V. (2024). Classifying for interval and applying for image based on the extracted texture feature. Granular Computing, 9(29), 1-18. https://doi.org/10.1007/s41066-024-00450-0

Dinh, P. T. & Tai, V. V. (2021). Automatic fuzzy genetic algorithm in clustering for images based on the extracted intervals. Multimedia Tools and Applications, 80(28), 35193-35215. https://doi.org/10.1007/s11042-020-09975-3

Dinh, P. T. & Tai, V. V. (2023). Improving the genetic algorithm in fuzzy cluster analysis for numerical data and its applications. Iranian Journal of Fuzzy Systems, 20(5), 171-187. https://doi: 10.22111/ijfs.2023.7834

Fisher, R. A. (1938). The statistical utilization of multiple measurements. Annals of Eugenics, 8(4), 376–386. https://doi.org/10.1007/s11042-020-09975-3

Ha, C. N., Thao, N. T., Bao, T. N. Trung, N. T. & Tai, V. V. (2020). A new approach for face detection using the maximum function of probability density functions. Annals of Operations Research. https://doi.org/10.1007/s10479-020-03823-1

Huang, S., N., Cai, P., Pacheco, P., Narrandes, S., Wang, Y. & Xu, W. (2018). Applications of support vector machine (SVM) learning in cancer geometrics. Cancer Genomics-Proteomics, 15(1), 41–51. https:// doi.org/10.21873/cgp.20063

Imandoust, S. B. & Bolandraftar, M. (2013). Application of k-nearest neighbor (KNN) approach for predicting economic events: Theoretical background. International Journal of Engineering Research and Applications, 3(5), 605-610.

Katarzyna, S. (2017). Evaluation of classifiers: current methods and future research directions. Computer Science and Information Systems, 12, 37–40. https://doi.org/10.15439/2017F530 ISSN 2300-5963

Koklu, M. C. (2021). Classification of rice varieties with deep learning methods. Computers and Electronics in Agriculture, 187, 106285. https://doi.org/10.1016/j.compag.2021.106285

Ngoc, L. T. K., Tuan, L. H. & Tai, V. V. (2021). Automatic clustering algorithm for interval data based on overlap distance. Communications in Statistics - Simulation and Computation. https://doi.org//10.1080/03610918.2021.1900248

Ngoc, L.T.K, Thao, N. T. & Tai, V. V. (2022). A new image classification method using interval texture feature and improved Bayesian classifier. Multimedia Tools and Applications. https://doi.org/10.1007/s11042-022-13531-6

Pham, B. T., Pradhan, B., Bui, D. T., Prakash, I. & Dholakia, M. (2016). A comparative study of different machine learning methods for landslide susceptibility assessment: A case study of uttarakhand area (India). Environmental Modelling & Software, 84, 240–250. https://doi.org/10.1016/j.envsoft.2016.07.005

Pham-Gia, T., Turkkan, N. & Vovan, T. (2000). Statistical discrimination analysis using the maximum function. Communications in Statistics - Simulation and Computation 37(2), 320–336. https://doi.org/10.1080/03610910701790475

Philipp, L., Lukas, R., Robert, A. V., Billy J. F., Marius, K. & Klaus-Robert M. (2021). Explainable deep one-class classification. The conference ICLR 2021. https://arxiv.org/abs/2007.01760

Tai V. V., Ha, C. N., Nghiep, L. D. & Thao, N. T. (2022). A new strategy for short-term stock in vestment using Bayesian approach. Computational Economics. https://doi.org/10.1007/s10614-021- 10115-8

Thao, N. T. & Tai, V. V. (2017). A new approach for determining the prior probabilities in the classification problem by Bayesian method. Advances in Data Analysis and Classification, 11(3), 629–643. https://doi.org/10.1080/1351847X.2017.1419273

Thao, N. T., Tai, V. V. & Ha, C. N. (2023). An efficient automatic clustering algorithm for probability density functions and its applications in surface material classification. Satistica Neerlandica, 78(1), 244-260. https://doi.org/10.1111/stan.12315

Zhu, X., Yang, J. & Waibel, A. (2000). Segmenting hands of arbitrary color in automatic face and gesture recognition. The International Conference on Automatic Face and Gesture Recognition. IEEE. https://doi.org/ 10.1109/AFGR.2000.84067