Tran Thi Hong An * , Tran Minh Tan and Pham Nguyen Khang

* Corresponding author (tthan@ctu.edu.vn)

Abstract

This paper presented a model using object tracking techniques to categorize the activities of customers in the supermarket. Then, the number of customers, who were interested in the booth, were determined to evaluate the display efficiency. With the image obtained from the surveillance camera, the system can identify most of the objects entering the observation area, tracking them to obtain the trajectory and time of observation. Trajectory was segmented, and representative coordinates were used, thus using a support vector learning algorithm to classify customer activity including booth attendance and drop-in options or other activities. Also, this article proposed the improvements of the speed of object tracking algorithms in the case of tracking multiple objects at the same time. Experimentally, it found that the proposed speed improvements were significantly effective, averaging 2.8 times higher than the original, while accuracy was not changed. Data for detecting was collected from internet sources and surveillance camera data located at a large supermarket in Soc Trang province.
Keywords: Activity analysis, behavior recognition, object tracking, video surveillance

Tóm tắt

Chúng tôi trình bày mô hình sử dụng các kỹ thuật theo dõi đối tượng để phân loại hoạt động của khách hàng trong siêu thị; từ đó xác định số lượng khách hàng quan tâm đến gian hàng và đánh giá hiệu quả trưng bày. Với hình ảnh thu được từ camera giám sát, hệ thống có thể nhận dạng được hầu hết các đối tượng là người đi vào vùng quan sát, theo dõi họ để có được quỹ đạo đường đi và thời gian lưu lại vùng quan sát. Quỹ đạo được phân đoạn và lấy tọa độ đại diện, sau đó dùng giải thuật máy học véc-tơ hỗ trợ để phân loại hoạt động của khách hàng gồm có quan tâm đến gian hàng và ghé vào lựa chọn hoặc là các hoạt động còn lại. Ngoài ra, trong bài báo, chúng tôi đề xuất các cải tiến nhằm cải thiện tốc độ của giải thuật theo dõi đối tượng trong trường hợp theo dõi nhiều đối tượng cùng lúc. Qua thực nghiệm, chúng tôi nhận thấy các đề xuất cải thiện tốc độ có hiệu quả đáng kể, trung bình tăng 2,8 lần so với ban đầu, trong khi độ chính xác không thay đổi. Dữ liệu nhận dạng người và nhận dạng hoạt động của khách hàng ở siêu thị được thu thập từ nguồn internet và dữ liệu thu được của camera giám sát đặt tại một siêu thị lớn ở tỉnh Sóc Trăng.
Từ khóa: Nhận dạng hành vi, phân tích hoạt động, theo dõi đối tượng, video giám sát

Article Details

References

CSL_BIBLIOGRAPHY }Lavee, G., Rivlin, E., & Rudzsky, M. (2009). Understanding video events: A survey of methods for automatic interpretation of semantic occurrences in video. IEEE Transactions on Systems, Man, and Cybernetics, Part C (Applications and Reviews), 39(5), 489–504.

Leutenegger, S., Chli, M., & Siegwart, R. Y. (2011). BRISK: Binary robust invariant scalable keypoints. In 2011 International conference on computer vision (pp. 2548–2555). IEEE.

Lucas, B. D., Kanade, T., & others. (1981). An iterative image registration technique with an application to stereo vision. In IJCAI (Vol. 81, pp. 674–679).

Naotoshi Seo. (2014). ImageClipper. C++.

Nebehay, G., & Pflugfelder, R. (2014). Consensus-based matching and tracking of keypoints for object tracking. In IEEE Winter Conference on Applications of Computer Vision (pp. 862–869). IEEE.

Nebehay, G., & Pflugfelder, R. (2015). Clustering of static-adaptive correspondences for deformable object tracking. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (pp. 2784–2791).

Ragland, K., & Tharcis, P. (2014). A survey on object detection, classification and tracking methods. Int. J. Eng. Res. Technol, 3(11).

Rosten, E., & Drummond, T. (2006). Machine learning for high-speed corner detection. Computer Vision–ECCV 2006, 430–443.

Rublee, E., Rabaud, V., Konolige, K., & Bradski, G. (2011). ORB: An efficient alternative to SIFT or SURF. In Computer Vision (ICCV), 2011 IEEE international conference on (pp. 2564–2571). IEEE.

Viola, P., & Jones, M. (2001). Rapid object detection using a boosted cascade of simple features. In Computer Vision and Pattern Recognition, 2001. CVPR 2001. Proceedings of the 2001 IEEE Computer Society Conference on (Vol. 1, pp. I–I). IEEE.