Vo Van Tai * , Nguyen Trang Thao , Huynh Van Hieu , Tran Thanh Tien and Chau Ngoc Tho

* Corresponding author (vvtai@ctu.edu.vn)

Abstract

This study proposes a new concept to evaluate the similarity of cluster for discrete elements called the Cluster Similar Index (CSI). CSI is also used as a criterion to establish the algorithms in building the fuzzy and non-fuzzy clusters, and the algorithm used to determine the suitable number of clusters. The established algorithms can be quickly performed by the Matlab procedures. The numerical examples illustrate the proposed algorithms and show its benefits overcome the others. Analyzing the cluster of images from the proposed algorithm shows potential in the practical application of this research.
Keywords: Algorithm, cluster analysis, distance, similar index

Tóm tắt

Nghiên cứu này đề nghị một khái niệm mới để đánh giá mức độ gần nhau của các phần tử rời rạc gọi là chỉ số tương tự chùm (CSI). CSI được sử dụng như một tiêu chuẩn để xây dựng các thuật toán phân tích chùm mờ, không mờ và xác định số chùm thích hợp. Các thuật toán được thiết lập có thể thực hiện nhanh chóng bởi những chương trình được thiết lập trên phần mềm Matlab. Những ví dụ số minh họa các thuật toán đề nghị và cho thấy thuận lợi của nó so với một số thuật toán khác. Phân tích chùm các hình ảnh từ thuật toán đề nghị cho thấy tiềm năng trong áp dụng thực tế của vấn đề được nghiên cứu.
Từ khóa: Chỉ số tương tự, khoảng cách, phân tích chum, thuật toán

Article Details

References

Brodatz, P., 1966. Textures: A photographic Album for Artists and Designers. New York: Dover Publications, 432 pages.

Dunn, J. C., 1973. A fuzzy relative of the ISODATA process and its use in detecting compact well-separated clusters. Journal of Cybernetics 3(3): 32 - 57

Ester, M., Kriegel, H.P., Sander, J. and Xu, X., 1996. A density-based algorithm for discovering clusters in large spatial databases with noise. In KDD (Vol. 96, No. 34, pp. 226-231

Ganti, V., Gehrke, J. and Ramakrishnan, R., 1999. Clustering categorical data using summaries. In: Proceedings of the fifth ACM SIGKDD international conference on Knowledge discovery and data mining. ACM 2: 73–83

Haralick, R. M., 1979. Statistical and structural approaches to texture. Proceedings of the IEEE 67: 786–804

Lauritzen, S.L., 1995. The EM algorithm for graphical association models with missing data. Computational Statistics & Data Analysis 19:191–201.

Li, J. and Wang, J. Z., 2008. Real-time computerized annotation of pictures. IEEE transactions on pattern analysis and machine intelligence 30: 985–1002.

Pal, N. R. and Bezdek, J. C., 1995. On cluster validity for the fuzzy c-means model. Fuzzy Systems, IEEE Transactions on 3: 370–379.

Rand, W. M., 1971. Objective criteria for the evaluation of clustering methods. Journal of the American Statistical association 66: 846–850.

Tai, V. V., Pham-Gia, T., 2010. Clustering probability distributions. Journal of Applied Statistics 37: 1891–1910.

Tai, V.V. and Thao, N.T., 2017. Communication in Statistics - Theory andMethods 47: 1792 - 1811.

Tai, V. V. and Thao, N.T., 2018. Similar coefficient of cluster for disdrete elements. Sankhya B. The Indian Journal of Statistics, 80(1): 19-36.

Wen, L. H. and Jenn, H. Y., 2015. Automatic clustering algorithm for fuzzy data. Journal of Applied Statistics 42(7):1503–1518

Xie, X. L. and Beni, G., 1991. A validity measure for fuzzy clustering. IEEE Transactions on Pattern Analysis & Machine Intelligence 841–847.