Trương Minh Lượng , Nguyễn Kim Ngân , Nguyễn Hồng Chi , Nguyễn Như Huỳnh Võ Văn Tài *

* Tác giả liên hệ (vvtai@ctu.edu.vn)

Abstract

In many fields, dividing images into clusters can help us classify, identify objects in the images, and detect anomalies. This study proposes a clustering analysis algorithm for images based on the probability density function (PDF) estimated from extracted features. First, any image is converted into four basic colors (red, green, blue, and gray) to extract pixel features at each point. Next, the PDFs representing the extracted features will be estimated to represent the image in recognition. Finally, a fuzzy clustering algorithm for the PDFs is proposed. The algorithm is presented step by step and applied to specific image sets. Numerical results showed that the proposed algorithm is effective and stable, applicable to various fields of reality.

Keywords: Clustering, distance, extracting images, probability density function

Tóm tắt

Trong nhiều lĩnh vực, việc phân chia hình ảnh thành các chùm có thể giúp chúng ta phân loại, nhận dạng các đối tượng trong ảnh cũng như phát hiện được những yếu tố bất thường. Nghiên cứu này đề xuất một thuật toán phân tích chùm cho ảnh dựa vào hàm mật độ xác suất (PDF) được ước lượng từ đặc trưng trích xuất. Đầu tiên, ta đưa một ảnh bất kỳ về 4 màu cơ bản (đỏ, xanh lục, xanh lam, xám) để trích xuất đặc trưng pixel tại mỗi điểm ảnh. Tiếp theo, các PDF đại diện cho đặc trưng trích xuất sẽ được ước lượng để đại diện cho ảnh trong nhận dạng. Cuối cùng, một thuật toán phân tích chùm mờ cho các PDF được đề xuất. Thuật toán đề nghị được trình bày từng bước và được áp dụng trên những tập ảnh cụ thể. Các kết quả số cho thấy thuật toán đề nghị hiệu quả và ổn định, có thể ứng dụng cho nhiều lĩnh vực khác nhau của thực tế.

Từ khóa: Hàm mật độ xác suất, khoảng cách, phân tích chùm, trích xuất ảnh

Article Details

Tài liệu tham khảo

Bowman, A. W., & Azzalini, A. (1997). Applied smoothing techniques for data analysis: The kernel approach with S-plus illustrations (Vol. 18). Oxford, England: OUP.

Chen, J., Chang, Y., & Hung, W. (2018). A robust automatic clustering algorithm for probability density functions with application to categorizing color images. Communications in Statistics-Simulation and Computation, 47(7), 2152–2168.

Chen, J. H., & Hung, W. L. (2021). A jackknife entropy-based clustering algorithm for probability density functions. Journal of Statistical Computation and Simulation, 91(5), 861–875.

Hung, W. L., & Yang, J. H. (2015). Automatic clustering algorithm for fuzzy data. Journal of Applied Statistics, 42(7), 1503–1518.

Izakian, Z., Mesgari, M. S., & Abraham, A. (2016). Automated clustering of trajectory data using a particle swarm optimization. Computers, Environment and Urban Systems, 55, 55–65.

Montanari, A., & Calò, D. G. (2013). Model-based clustering of probability density functions. Advances in Data Analysis and Classification, 7(3), 301–319.

Nguyen-Trang, T., Nguyen-Thoi, T., Nguyen-Thi, K. N., & Vo-Van, T. (2023). Balance-driven automatic clustering for probability density functions using metaheuristic optimization. International Journal of Machine Learning and Cybernetics, 14(4), 1063–1078.

Nguyen-Trang, T., Nguyen-Thoi, T., & Vo-Van, T. (2023). Globally automatic fuzzy clustering for probability density functions and its application for image data. Applied Intelligence, 53, 18381–18397.

Qi, X., Li, C. G., Zhao, G., Hong, X., & Pietikäinen, M. (2016). Dynamic texture and scene classification by transferring deep image features. Neurocomputing, 171, 1230–1241.

Rand, W. M. (1971). Objective criteria for the evaluation of clustering methods. Journal of the American Statistical Association, 66(336), 846–850.

Rao, C., & Liu, Y. (2020). Three-dimensional convolutional neural network (3D-CNN) for heterogeneous material homogenization. Computational Materials Science, 184, 109850.

Strehl, A., & Ghosh, J. (2002). Cluster ensembles—A knowledge reuse framework for combining multiple partitions. Journal of Machine Learning Research, 3((Dec)), 583–617.

Vo-Van, T., & Nguyen-Trang, T. (2018). Similar coefficient for cluster of probability density functions. Communica- tions in Statistics-Theory and Methods, 47(8), 1792–1811.

Vo-Van, T., & Nguyen-Trang, T. (2018). Similar coefficient of cluster for discrete elements. Sankhya B, 80(1), 19–36.

Wang, X., Zhao, Y., & Pourpanah, F. (2020). Recent advances in deep learning. International Journal of Machine Learning and Cybernetics, 11, 747–750.

Wu, X., Zhu, X., Wu, G. Q., & Ding, W. (2013). Data mining with big data. IEEE Transactions on Knowledge and Data Engineering, 26(1), 97–107.

Xu, L., Hu, Q., Hung, E., Chen, B., Tan, X., & Liao, C. (2015). Large margin clustering on uncertain data by considering probability distribution similarity. Neurocomputing, 158, 81–89.

Zhu, Y., Deng, Q., Huang, D., Jing, B., & Zhang, B. (2021). Clustering based on Kolmogorov–Smirnov statistic with application to bank card transaction data. Journal of the Royal Statistical Society Series C: Applied Statistics, 70(3), 558–578.