Võ Văn Tài * , Lê Thị Kim Ngọc Bành Văn Viên

* Tác giả liên hệ (vvtai@ctu.edu.vn)

Abstract

This research is to proposed a new measure to evaluate the similarity of cluster for discrete elements called the cluster similar index (CSI). CSI is used as criterion to build the algorithms to analyze fuzzy and non-fuzzy cluster and to determine the suitable number of clusters. CSI is also used to evaluate the quality of established clusters and compare them together. These established algorithms can be quickly performed by the Matlab procedures. The numerical examples illustrate the proposed algorithms and show their benefits compared to existing algorithms. Finally, analyzing the cluster of images from the proposed algorithm shows potential in the practical application of this research.
Keywords: Cluster, distance, image, hierarchical, similar index

Tóm tắt

Nghiên cứu này đề nghị một độ đo mới để đánh giá sự tương tự chùm của các phần tử rời rạc được gọi là chỉ số tương tự chùm (CSI). CSI được sử dụng làm tiêu chuẩn để xây dựng các thuật toán phân tích chùm mờ, không mờ và xác định số chùm thích hợp. CSI cũng được sử dụng để đánh giá chất lượng của các chùm được thiết lập cũng như so sánh chúng với nhau. Các thuật toán được thiết lập có thể thực hiện nhanh chóng bởi những chương trình được viết trên phần mềm Matlab. Những ví dụ số minh họa các thuật toán đề nghị và cho thấy thuận lợi của chúng so với các thuật toán khác. Phân tích chùm các hình ảnh từ thuật toán đề nghị cho thấy tiềm năng trong áp dụng thực tế của vấn đề được nghiên cứu.
Từ khóa: Chỉ số tương tự, chùm, hình ảnh, khoảng cách, phương pháp thứ bậc

Article Details

Tài liệu tham khảo

Babuška, R., 2012. Fuzzy modeling for control. Science & Business Media. NewYork, 345 pages.

Bora, D. J. and Gupta, A. K., 2014. Impact of exponent parameter value for the partition matrix on the performance of fuzzy C means Algorithm. ArXiv. 109: 1-17.

Brodatz, P., 1996. Textures: A Photographic Album for Artists and Designers. Dover Publications. New York, 525 pages.

Celebi, E. and Alpkocak, A., 2000. Clustering of texture features for content-based image retrieval. Advances in Information Systems. 1901: 216-225.

Chen, J. H. and Hung, W. L., 2015. An automatic clustering algorithm forprobability density functions.Journal of Statistical Computation and Simulation. 85(15): 3047-3063.

Dunn, J. C., 1973. A fuzzy relative of the ISODATA process and its use in detecting compact well-separated clusters. Journal of Cybernetics.3(3): 32-57.

Goh, A. and Vidal R., 2008. Unsupervised Riemannian clustering of probability density functions.Machine Learning and Knowledge Discovery in Databases. 11: 377-392.

Haralick, R. M., 1979. Statistical and structural approaches to texture. Proceedings of the IEEE. 67(5): 786-804.

Hubert, L. and Arabie, P., 1985. Comparing partitions. Journal of classification.2(1): 193-218.

Hung, W. L. and Yang, J.H., 2015. Automatic clustering algorithm for fuzzy data. Journal of Applied Statistics. 42(7): 1503-1518.

Li, J. and Wang, J. Z., 2008. Real-time computerized annotation of pictures. IEEE transactions on pattern analysis and machine intelligence.30(6): 985-1002.

Pal, N. R. and Bezdek, J. C., 1995. On cluster validity for the fuzzy c-means model. Fuzzy Systems, IEEE Transactions. 3(3): 370-379.

Tai, V. V. and Pham-Gia T., 2010. Clustering probability distributions. Journal of Applied Statistics. 37(11): 1891-1910.

Tai, V. V. and Thao N. T., 2017a. Fuzzy clustering of probability density function. Journal of Applied Statistics. 44(4): 583-601.

Tai, V. V. and Thao, N. T., 2017b. Similar Coefficient for Cluster of Probability Density Functions. Communications in Statistics - Theory and Methods. 47(8): 1792-1811.

Webb, A. R., 2003. Statistical pattern recognition. John Wiley & Sons. London, 725 pages.

Xie, X. L. and Beni, G., 1991. A validity measure for fuzzy clustering. IEEE Transactions on Pattern Analysis & Machine Intelligence. 13(8): 841-847.