Võ Văn Tài * , Lê Thị Kim Cương Châu Ngọc Thơ

* Tác giả liên hệ (vvtai@ctu.edu.vn)

Abstract

Image recognition plays a very important role in the current digital revolution because it is the foundation of many practical applications. This research proposes the image recognition problem by two-dimensional interval extracted from the texture feature. Based on the overlap distance and the extracted interval feature, a fuzzy clustering algorithm for the image is proposed. This algorithm can determine the appropriate number of clusters for the image set, the particular images in each cluster, and the probability of belonging to the clusters of each image. The proposed algorithm is detailed step-by-step in theory, and illustrated by the numerical example. Applying on a specific image set, the proposed algorithm gives the best result in comparison with others. This research can be deployed to many practical problems related to image recognition.

Keywords: Clustering algorithm, image data, interval data, overlap distance

Tóm tắt

Nhận dạng ảnh có vai trò rất quan trọng trong cuộc cách mạng số hiện nay vì nó là nền tảng của nhiều ứng dụng thực tế. Nghiên cứu này đề nghị việc nhận dạng ảnh bởi khoảng hai chiều được trích xuất từ đặc trưng kết cấu. Dựa vào khoảng cách chồng lấp và đặc trưng khoảng được trích xuất, một thuật toán phân tích chùm mờ cho ảnh được đề nghị. Thuật toán này có thể xác định số chùm thích hợp phải chia cho một tập ảnh, những ảnh cụ thể trong mỗi chùm và xác suất thuộc vào các chùm của mỗi ảnh. Thuật toán đề nghị được trình bày chi tiết từng bước về mặt lý thuyết và được minh hoạ bởi ví dụ số. Thực hiện trên một tập ảnh cụ thể, thuật toán đề nghị đã cho kết quả tốt nhất trong so sánh với các thuật toán gần đây. Nghiên cứu này có thể triển khai cho nhiều vấn đề thực tế liên quan đến nhận dạng ảnh.

Từ khóa: Dữ liệu ảnh, dữ liệu khoảng, khoảng cách chồng lấp, thuật toán xây dựng chùm

Article Details

Tài liệu tham khảo

Arivazhagan S., Shebiah, R. N., Nidhyanandhan, S. S. & Ganesan, L. (2010). Fruit recognition using color and texture features. Journal of Emerging Trends in Computing and Information Sciences, 1(2), 90-94.

Cabanes, G., Bennani, Y., Destenay, R., & Hardy, A. (2013). A new topological clustering algorithm for interval data. Pattern Recognition, 46(11), 3030-3039. https://doi.org/10.1016/j.patcog.2013.03.023

De Carvalho, F. D. A., Pimentel, J. T. & Bezerra, L. X. (2007). Clustering of symbolic interval data based on a single adaptive L1 distance. 2007 International Joint Conference on Neural Networks (pp. 224-229). IEEE. https://doi.org/

10.1109/IJCNN.2007.4370959.

Eleyan, A., & Demirel, H. (2011). Co-occurrence matrix and its statistical features as a new approach for face recognition. Turkish Journal of Electrical Engineering & Computer Sciences, 19(1), 97–107. https://doi.org/10.3906/elk-0906-27

Engin, M. A., & Cavusoglu, B. (2019). Rotation invariant curvelet based image retrieval & classification via Gaussian mixture model and co-occurrence features. Multimedia Tools and Applications, 78(6), 6581- 6605. https://doi.org/10.1007/s11042-018-6368-8

Fadl, S., Megahed, A., Han, Q., & Qiong, L. (2020). Frame duplication and shuffling for gery detection technique in surveillance videos based on temporal average and gray level coccurrence matrix. Multimedia Tools and Applications, 79, 17619-17643. https://doi.org/10.1007/s11042-019-08603-z

Hung, W. L., Yang, J. H., & Shen, K. F. (2016). Self-updating clustering algorithm for interval-valued data. IEEE International Conference on Fuzzy Systems (pp. 1494-1500). IEEE. https://doi.org/doi:10.1109/FUZZ.IEEE.2016.7737867.

Hubert, L. (1977). Nominal scale response agreement as a generalized correlation. British Journal of Mathematical and Statistical Psychology, 30(1), 98-103. https://doi.org/10.1111/j.2044-8317.1977.tb00728.x

Kabir, S., Wagner, C., Havens, T. C., Anderson, D. T., & Aickelin, U. (2017). Novel similarity measure for interval valued data based on overlapping ratio. IEEE International Conference on Fuzzy Systems, (pp. 1-6). IEEE. https://doi.org/doi:10.1109/FUZZIEEE.2017.8015623.

Marina, M. (2007). Comparing clusterings—an information based distance. Journal of Multivariate Analysis, 98(5), 873-895. https://doi.org/10.1016/j.jmva.2006.11.013.

Montanari, A., & Calo, D. G. (2013). Model-based clustering of probability density functions. Advances in Data Analysis and Classification, 7(3), 301–319. https://doi.org/10.1007/s11634-013-0140-8

Rand, W. M. (1971). Objective criteria for the evaluation of clustering methods. Journal of the American Statistical Association, 66(336), 846-850. https://doi.org/10.2307/2284239

Ren, Y., Liu, Y. H. , Rong, J., & Dew, R. (2009). Clustering interval-valued data using an over- lapped interval divergence. In Paul, J. K., Kok, L. O. & Peter, C. (Eds), The eighth Australasian data mining conference 101(9) (pp. 35–42). Melbourne.

Setia, L., Teynor, A., Halawani, A., & Burkhardt, H. (2006). Image classification using cluster cooccurrencematrices of local relational features. In: The 8th ACM international workshop on Multimedia information retrieval, (pp. 173-182). ACM. https://doi.org/10.1145/1178677.1178703

Tai, V. V., & Thao, N. T. (2018a). Similar coefficient for cluster of probability density functions. Communications in Statistics-Theory and Methods, 47(8), 1792-1811. https://doi.org/10.1080/03610926.2017.1327075

Tai, V. V., & Thao, N. T. (2018b). Similar coefficient of cluster for discrete elements. Sankhya B, 80(1), 19-36. https://doi.org/10.1007/s13571-018-0159-0

Tai, V. V., Trung, N. T., Vo-Duy. T., Vinh, N. V., & Thao, N. T. (2017). Modified genetic algorithm-based clustering for probability density functions. Journal of Statistical Computation and Simulation, 87(10), 1964-1979. https://doi.org/10.1080/00949655.2017.1300663

Tai, V. V., Dinh, P. T., & Dung, T. T. (2019). Automatic genetic algorithm in clustering for discrete elements. Communications in Statistics-Simulation and Computation, 50(6), 1679-1694. https://doi.org/10.1080/03610918.2019.1588305