Võ Văn Tài * , Nguyễn Thị Hoa Tiên , Đặng Thị Phương Trang Trần Nam Hưng

* Tác giả liên hệ (vvtai@ctu.edu.vn)

Abstract

This study proposes an image classification method based on the extracted interval features from the gray level co-occurrence matrix with s improvements. Firstly, each image was represented by a two-dimensional interval whose values were established from the texture feature of  image. Then, the  priori probability for the image was found based on the fuzzy cluster analysis problem for interval data. Next, the classified image was measured for its proximity to the groups based on the overlapping distance of the representative intervals. Finally, based on the above improvements, a new classification principle was proposed. The proposed method was detailed and illustrated by the specific set of images. It was also applied in face recognition, a problem that had many applications and challenges today. This application showed that the proposed method had completely correct classification for the training set while other popular methods had the error rate from 20% to 40%.

Keywords: Classification, image data, priori probability, overlap distance

Tóm tắt

Phương pháp phân loại ảnh dựa vào đặc trưng khoảng được trích xuất từ ma trận đồng hiện mức xám với một số cải tiến được thực hiện trong nghiên cứu này. Đầu tiên, mỗi ảnh được đại diện bởi một khoảng hai chiều mà các giá trị của nó được thiết lập từ đặc trưng kết cấu của ảnh. Sau đó xác suất tiên nghiệm cho ảnh được tìm dựa vào bài toán phân tích chùm mờ cho dữ liệu khoảng. Tiếp theo ảnh cần phân loại được đo mức độ gần nhau với các nhóm dựa vào khoảng cách chồng lấp của các khoảng đại diện. Cuối cùng, dựa vào các cải tiến trên, một phương pháp phân loại mới được đề xuất. Phương pháp này được trình bày chi tiết các bước thực hiện và được minh hoạ bởi một tập ảnh cụ thể. Nó cũng được áp dụng trong nhận diện khuôn mặt, một vấn đề có nhiều ứng dụng và thách thức hiện nay. Kết quả nghiên cứu cho thấy phương pháp này đã phân loại đúng hoàn toàn cho tập huấn luyện trong khi các phương pháp phổ biến khác...

Từ khóa: Dữ liệu ảnh, khoảng cách chồng lấp, phân loại, xác suất tiên nghiệm

Article Details

Tài liệu tham khảo

Cabanes, G., Bennani, Y., Destenay, R., & Hardy A. (2013). A new topological clustering algorithm for interval data. Pattern Recognition, 46(11), 3030-3039. https://doi.org/10.1016/j.patcog.2013.03.023

Chen, Y., Liu, C., Chou, K., & Wang, S. (2016). Real-time and low memory multi face detection system design based on naive Bayes classifier using FPGA. In: International Automatic Control Conference (pp. 7-12). https://doi.org/ 10.1109/CACS.2016.7973875

Dinh, P. T., & Tai, V. V. (2021a). Building fuzzy time series model from unsupervised learning

technique and genetic algorithm. Neural Computing and Applications. https://doi.org/ 10.1007/s00521-021-06485-7.

Dinh, P. T., & Tai, V. V. (2021b). Automatic fuzzy genetic algorithm in clustering for images based on the extracted intervals. Multimedia Tools and Applications, 80(28), 35193-35215.

Fisher, R. A. (1938). The statistical utilization of multiple measurements. Annals of Eugenics, 8(4), 376–386. https://doi.org/10.1007/s11042-020-09975-3

Ha, C. N., Thao, N. T., Bao, T. N. Trung, N. T., & Tai, V. V. (2020). A new approach for face detection using the maximum function of probability density functions. Annals of Operations Research. https://doi.org/10.1007/s10479-020-03823-1

Huang, S., N., Cai, P., Pacheco, P., Narrandes, S., Wang, Y., & Xu, W. (2018). Applications of support vector machine (SVM) learning in cancer geometrics. Cancer Genomics-Proteomics, 15(1), 41–51. https://10.21873/cgp.20063

Kung, J. Y., Wu, C. C., Hsu, S. Y., Lee, S., & Yang, C. W. (2010). Application of logistic regression analysis of home mortgage loan prepayment and default risk. ICIC Express Letters, 4(2), 325–331.

Miller, G., Inkret, W., Little, T., Martz, H., & Schillaci, M. (2001). Bayesian prior probability distributions for internal dosimetry. Radiation Protection Dosimetry, 94(4), 347–352.

Nhu, V. H., Zandi, D., Shahabi, H., Chapi, K., Shirzadi, A. V., Singh, S. K. Dou, J., & Nguyen, H. (2020). Comparison of support vector machine, Bayesian logistic regression, and alternating decision tree algorithms for shallow landslide susceptibility mapping along a mountainous road in the west of Iran. Applied Sciences, 10(15), 5047. https://doi.org/ 10.1093/oxfordjournals.rpd.a006509

Pham, B. T., Pradhan, B., Bui, D. T., Prakash, I., & Dholakia, M. (2016). A comparative study of different machine learning methods for landslide susceptibility assessment: A case study of uttarakhand area (India). Environmental Modelling & Software, 84, 240–250. https://doi.org/10.1016/j.envsoft.2016.07.005

Pham, G, T., Turkkan, N., & Tai, V. V. (2008). Statistical discrimination analysis using the maximum function. Communications in Statistics—Simulation and Computation, 37(2), 320–336. https://doi.org/10.1080/03610910701790475

Tai, V. V. (2017). L1– distance and classification problem by Bayesian method. Journal of Applied Statistics, 44(3), 385 – 401. https://doi.org/10.1080/02664763.2016.1174194

Tai, V. V., Loc, T. P., & Ha, C. N. (2018). Classifying two populations by Bayesian method and applications. Communications in Mathematics and Statistics, 7, 141 – 161. https://doi.org/10.1007/s40304-018-0139-8

Tai, V. V. (2019). Some results of classification problem by Bayesian method and application in credit operation. Statistical Theory and Related Fields, 2(2), 150 – 157. https://doi.org/10.1080/24754269.2018.1528420

Tai V. V., Ha, C. N., Nghiep, L. D., & Thao, N. T. (2021). A new strategy for short-term stock in vestment using Bayesian approach. Computational Economics. https://doi.org/10.1007/s10614-021- 10115-8.

Tan, W. R., Chan, C. S., Yogarajah, P., & Condell, J. (2011). A fusion approach for efficient human skin detection. IEEE Transactions on Industrial Informatics, 8(1), 138–147. https://doi.org/ 10.1109/TII.2011.2172451.

Thao, N. T., & Tai, V. V. (2017). A new approach for determining the prior probabilities in the classification problem by Bayesian method. Advances in Data Analysis and Classification, 11(3), 629–643. https://doi.org/10.1080/1351847X.2017.1419273

Zhang, D., & Yan., M. (2018). Financial stress relationships among euro area countries: an R-vine copula approach. The European Journal of Finance, 24(17), 1587–1608. https://doi.org/10.1080/1351847X.2017.1419273

Zhu, X., Yang, J., & Waibel, A. (2000). Segmenting hands of arbitrary color in automatic face and gesture recognition. The International Conference on Automatic Face and Gesture Recognition. IEEE. https://doi.org/ 10.1109/AFGR.2000.840673.