Nguyễn Minh Trung * , Nguyen Ngoc Hung Đỗ Thanh Nghị

* Tác giả liên hệ (trungnguyen@ctu.edu.vn)

Abstract

In this paper, we paper presents a novel approach to detect pornographic images based on the combination of the Scale-invariant feature transform method (SIFT), the bag-of-visual-words (BoVW) and the Arcx4 of random multinomial naive Bayes (Arcx4-rMNB). At the preprocessing step, we propose to use the Scale-invariant feature transform method (SIFT) which is locally based on the appearance of the object at particular interest points, invariant to image scale, rotation and also robust to changes in illumination, noise, occlusion. And then, the representation of the image that we use for classification is the bag-of-visual-words (BoVW), which is constructed from the local descriptors and the counting of the occurrence of visual words in a histogram like fashion. The pre-processing step brings out datasets with a very large num-ber of dimensions. And then, we propose a new algorithm called Arcx4 of random multinomial naive Bayes (Arcx4-rMNB) that is suited for classifying very-high-dimensional datasets. We do setup experiment with two real datasets to evaluate performances. Our approach has achieved an accuracy of 91.75% for a small dataset and 87.93% for other large one.
Keywords: SIFT, BoVW, Arcx4-rMNB, SVM, C4.5

Tóm tắt

Trong bài này, chúng tôi giới thiệu một phương pháp mới phát hiện những ảnh khiêu dâm dựa trên sự kết hợp giữa phương pháp biểu diễn ảnh bằng các nét đặc trưng không đổi với những biến đổi tỉ lệ (Scale-invariant feature transform ? SIFT), mô hình túi từ trực quan (the bag-of-visual-words (BoVW) và giải thuật ArcX4 của Bayes thơ ngây ngẫu nhiên (the Arcx4 of random multinomial naive Bayes ( Arcx4-rMNB)). ở bước tiền xử lý, chúng tôi sử dụng phương pháp biểu diễn ảnh bằng các nét đặc trưng không đổi được thực hiện dựa trên đặc trưng cục bộ, không bị thay đổi trước những biến đổi tỉ lệ ảnh, tịnh tiến, phép quay, không bị thay đổi một phần đối với phép biến đổi hình học affine (thay đổi góc nhìn) và mạnh với những thay đổi về độ sáng, sự nhiễu và che khuất. Kế tiếp, mô hình túi từ trực quan được sử dụng để biểu diễn nội dung ảnh. Sau bước tiền xử lý, ảnh được biểu diễn bởi một véc-tơ có số chiều rất lớn, chúng tôi đề nghị một giải thuật mới ArcX4 của Bayes thơ ngây ngẫu nhiên cho phép phân lớp hiệu quả dữ liệu có số chiều lớn. Để đánh giá hiệu quả của phương pháp đề xuất, chúng tôi thực nghiệm với tập dữ liệu thực tế và kết quả phương pháp của chúng tôi đạt được chính xác 91.75% cho tập dữ liệu nhỏ và 87.93% cho tập dữ liệu lớn.
Từ khóa: SIFT, BoVW, Arcx4-rMNB, SVM, C4.5

Article Details

Tài liệu tham khảo

Bosch, A., Zisserman, A., Munoz, X.: Scene classification via pLSA. In: Proceedings of the European Conference on Computer Vision, pp. 517–530 (2006).

Breiman, L.: Arcing classifiers. The annals of statistics 26(3), 801–849 (1998)

Breiman, L.: Random forests. Machine Learning 45(1), 5–32 (2001).

Chang, C.C., Lin, C.J.: LIBSVM – a library for support vector machines (2001). http://www.csie.ntu.edu.tw/~cjlin/libsvm

Deselaers, T., Pimenidis, L., Ney, H.: Bag-of-visual-words models for adult image classification and filtering. In: Proceeding of The 19th International Conference on Pattern Recognition, pp. 1–4 (2008).

Duan, L., Cui, G., Gao, W., Zhang, H.: Adult image detection method base-on skin colormodel and support vector machine. In: Proceeding of The 5th Asian Conference on Computer Vision, pp. 797–800 (2002).

Fleck, M., Forsyth, D., Bregler, C.: Finding naked people. In: Proceedings of the European Conference on Computer Vision, vol. 2, pp. 592–602 (1996).

Forsyth, D., Fleck, M.: Identifying nude pictures. In: Proceedings of the IEEE Workshop on the Applications of Computer Vision, pp. 103–108 (1996)

Freund, Y., Schapire, R.: A decision-theoretic generalization of on-line learning and an application to boosting. In: Computational Learning Theory: Proceedings of the Second EuropeanConference, pp. 23–37 (1995).

Jeong, C., Kim, J., Hong, K.: Appearance-based nude image detection. In: Proceedings of The 17th International Conference on Pattern Recognition, pp. 467–470 (2004).

Lewis, D., Gale, W.: A sequential algorithm for training text classifiers. In: Proceedings of SIGIR (1994).

Lopes, A., Avila, S., Peixoto, A., Oliveira, R., Coelho, M., Araujo, A.: Nude detection in videousing bag-of-visual-feature. In: Proceedings of The 22th Brazilian Symposium on Computer Graphics and Image Processing, pp. 224–231 (2009).

Lowe, D.: Object recognition from local scale invariant features. In: Proceedings of the 7th International Conference on Computer Vision, pp. 1150–1157 (1999).

Lowe, D.: Distinctive image features from scale invariant keypoints. International Journal of Computer Vision pp. 91–110 (2004).

MacQueen, J.: Some methods for classification and analysis of multivariate observations. Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability, Berkeley, University of California Press Vol.1, pp. 281-297 (1967).

Mikolajczyk, K., Schmid, C.: Scale and affine invariant interest point detectors. International Journal of Computer Vision 60(1), 63–86 (2004)

Quinlan, J.R.: C4.5: Programs for Machine Learning. Morgan Kaufmann, San Mateo, CA (1993).

Van Rijsbergen, C.V.: Information Retrieval. Butterworth (1979).

Schettini, R., Brambilla, C., Cusano, C., Ciocca, G.: On the detection of pornographic digital images. In: Proceedings of Society of Photo-Optical Instrumentation Engineers (SPIE) Conference, pp. 2105–2113 (2003).

Sebastiani, F.: Machine learning in automated text categorization. ACM Computing Surveys 34(1), 1–47 (1999).

Vapnik, V.: The Nature of Statistical Learning Theory. Springer-Verlag (1995).

Wang, Y., Wang, W., Gao, W.: Research on the discrimination of pornographic and bikiniimages. In: Proceedings of the Seventh IEEE International Symposium on Multimedia, pp. 558–564 (2005).

Witten, I., Frank, E.: DataMining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann (2005).

Zheng, H., Daoudi, M.: Blocking adult images based on statistical skin detection. Electronic Letters on Computer Vision and Image Analysis 4(2), 1–14 (2004).

Grove, A.J. and Schuurmans, D.: Boosting in the limit: Maximizing the margin of learned ensembles. In Proceedings of the Fifteenth National Conference on Artificial Intelligence (AAAI-98), pp. 692–699 (1998).

Friedman, J., Hastie, T. and Tibshirani, R.: Response to Mease and Wyner, Evidence Contrary to the Statistical View of Boosting. Journal Machine Learning Research Vol. 9, pp. 175-180 (2008).