Võ Văn Tài * , Lâm Minh Huy Danh Ngọc Thắm

* Tác giả liên hệ (vvtai@ctu.edu.vn)

Abstract

The overlap distance to build the fuzzy clustering analysis algorithm for interval data was used in this study that can determine the number of clusters, the specific elements of cluster, and the probability to belong to clusters of each element at the same time. The proposed algorithm is presented specifically step by step about theory, and illustrated by the numerical example. This research also considers the texture characteristics of an image to become the two dimensions interval for recognizing and applying the proposed algorithm. The numerical example and the applications show the advantage of the proposed algorithm in comparing to many the popular others throughout the statistical parameters.

Keywords: Distance, image, interval data, fuzzy clustering analysis

Tóm tắt

Việc sử dụng khoảng cách chồng lấp để xây dựng thuật toán phân tích chùm mờ cho dữ liệu khoảng được đề nghị trong bài viết, trong đó việc xác định số chùm, những phần tử cụ thể trong chùm và xác suất thuộc vào chùm của mỗi phần tử được thực hiện cùng lúc. Thuật toán đề nghị được trình bày cụ thể từng bước về mặt lý thuyết và được minh hoạ cụ thể bởi ví dụ số. Nghiên cứu cũng xem xét việc trích xuất đặc trưng kết cấu của ảnh thành khoảng hai chiều để nhận dạng và áp dụng thuật toán đề nghị. Ví dụ số và áp dụng cho thấy ưu điểm của thuật toán đề nghị so với nhiều thuật toán phổ biến hiện nay qua các tham số thống kê.

Từ khóa: Dữ liệu khoảng, khoảng cách, hình ảnh, phân tích chùm mờ

Article Details

Tài liệu tham khảo

Arivazhagan, S., Shebiah, R. N., Nidhyanandhan, S. S., & Ganesan, L. (2010). Fruit recognition using color and texture features. Journal of Emerging Trends in Computing and Information Sciences, 1(2), 90-94.

Chen, J. H. & Hung, W. L. (2016). An automatic clustering algorithm for probability density functions. Journal of Statistical Computation and Simulation85(15), 3047-3063.

De Souza, R. M., De Carvalho, F. D. A. & Silva, F. C. (2004). Clustering of interval-valued data using adaptive squared Euclidean distances. In: Pal N.R., Kasabov N., Mudi R.K., Pal S., Parui S.K., Neural Information Processing. Springer, Berlin.DOI:10.1007/978-3-540- 30499-9_119

Dinh P. T. & Tai V. V. (2020). Automatic fuzzy genetic algorithm in clustering for images based on the extracted intervals. Multimedia Tools and Applications https://doi.org/10.1007/s11042-020-09975-3.

Jeng, J. T., Chen, C. M., Chang, S. C. & Chuang, C. C. (2019). Clustering algorithm under Euclidean and Hausdorff (2019) distance measure for symbolic interval data. International Journal of Fuzzy Systems, 21, 2102-2119.

Hubert, L. & Arabie, P. (1985). Comparing partitions. Journal of Classification2(1), 193-218.

Kabi, S., Wagner, C., Havens, T.C., Anderson, D.T. & Aickelin, U (2017). Novel similarity measure for interval-valued data based on overlapping ratio. In: 2017 IEEE International
Conference on Fuzzy Systems. DOI:10.1109/FUZZ-IEEE.2017.8015623.

Peng, W. & Li, T. (2006). Interval data clustering with applications. In 2006 18th IEEE International Conference on Tools with Artificial Intelligence, 355-362. DOI: 10.1109/ICTAI.2006.71

Pal, N. R. & Bezdek, J. C. (1995). On cluster validity for the fuzzy c-means model. Fuzzy Systems, 3, 370–379.

Sara, I. R. R. & Francisco, A. T. C.. (2019). A new fuzzy clustering algorithm for interval-valued data based on City-block distance. In 2019 IEEE International Conference on Fuzzy Systems, 1-6, DOI: 10.1109/FUZZ-IEEE.2019.8859017.

Souza, R. M. & Carvalho, F. D. A. (2004). Clustering of interval data based on city–block distances. Pattern Recognition Letters, 25(3), 353–365.

Ren, Y., Liu, Y. H., Rong, J. & Dew, R. (2009).  Clustering interval-valued data using an overlapped interval divergence. In the Eighth Australasian Data Mining Conference.
https://vuir.vu.edu.au/id/eprint/35243

Tai, V. V. & Pham-Gia, T. (2010). Clustering probability distributions. Journal of Applied Statistics, 37, 1891 – 1910.

Tai, V. V. & Thao, N. T. (2018a). Similar coefficient for cluster of probability density functions. Communications in Statistics-Theory and Methods, 47(8), 1792-1811.

Tai, V. V. & Thao, N. T. (2018b). Similar coefficient of cluster for discrete elements. Sankhya B, 80(1), 19-36.

Tai, V.V., Dinh, P. T. & Dung, T. T. T. (2019). Automatic genetic algorithm in clustering for discrete elements. Communications in Statistics: Simulation and Computation. https://doi.org/10.1080/03610918.2019.1588305.