Mã Trường Thành * , Châu Ngân Khánh , Thạch Minh Hớn , Phạm Xuân Hiền Phan Bích Chung

* Tác giả liên hệ (mtthanh@ctu.edu.vn)

Abstract

Conservation and dissemination of the cultural values inherent in culinary traditions constitute a persistent challenge requiring continuous preservation within each nation. There is a limited focus on research and AI (Artificial intelligence) applications in this domain, with most studies centering around image classification and lacking specific dish-related information. Realizing the significance of core knowledge and detailed insights into dishes that tourists seek, this article introduces an AI framework for Vietnamese cuisine. Specifically, it presents a specialized ontology for storing pertinent information regarding Vietnamese specialty dishes alongside a model for image classification. The essential contribution lies in achieving a dish image classification accuracy of over 96% and providing corresponding cooking recipes from the ontology.

Keywords: Artificial intelligence, convolutional neural network, description logic, ontology, specialty dishes

Tóm tắt

Việc bảo tồn và phổ biến các giá trị của truyền thống văn hóa ẩm thực luôn là một thách thức không ngừng và cần được giữ gìn của mỗi quốc gia. Nhìn chung, có rất ít nghiên cứu và ứng dụng trí tuệ nhân tạo AI (Artificial intelligence) tập trung vào lĩnh vực này, hầu hết những nghiên cứu chỉ tập trung vào phân lớp hình ảnh và thiếu thông tin toàn diện của từng món ăn. Nhận thấy được tầm quan trọng của kiến thức cốt lõi và thông tin chi tiết của từng món ăn, đề xuất về khung AI cho các món ăn Việt Nam được giới thiệu trong bài báo này. Cụ thể, một bản thể luận (ontology) món ăn đặc sản Việt Nam để lưu trữ thông tin liên quan và mô hình phân lớp hình ảnh các món ăn đặc sản được trình bày. Đóng góp chính là phân lớp ảnh chụp món ăn với trên 96% và cung cấp các công thức nấu ăn tương ứng từ ontology.

Từ khóa: Ẩm thực, bản thể học, mạng học sâu, mô tả logic, trí tuệ nhân tạo

Article Details

Tài liệu tham khảo

An, H. W., & Moon, N. (2019). Design of recommendation system for tourist spot using sentiment analysis based on CNN-LSTM. Journal of Ambient Intelligence and Humanized Computing, 1-11. 10.1007/s12652-019-01521-w.

Kim, D. K., Shyn, S. K., Kim, D., Jang, S., & Kim, K. (2021, December). A daily tourism demand prediction framework based on multi-head attention CNN: The case of the foreign entrant in South Korea. In 2021 IEEE SSCI (pp. 01-10). IEEE.

Schroeder, V., Evans, E. D., Wu, Y. C. M., Voll, C. C. A., McDonald, B. R., Savagatrup, S., & Swager, T. M. (2019). Chemiresistive sensor array and machine learning classification of food. ACS sensors, 4(8), 2101-2108. DOI: 10.1021/acssensors.9b00825

Shen, Z., Shehzad, A., Chen, S., Sun, H., & Liu, J. (2020). Machine learning based approach on food recognition and nutrition estimation. Procedia Computer Science, 174, 448-453. DOI: 10.1016/j.procs.2020.06.113

Tai, T. T., Thanh, D. N. H., & Hung, N. Q. (2022). A dish recognition framework using transfer learning. IEEE Access, 10, 7793-7799. DOI: 10.1109/ACCESS.2022.3143119

He, Y., Xu, C., Khanna, N., Boushey, C. J., & Delp, E. J. (2013, July). Food image analysis: Segmentation, identification and weight estimation. In 2013 IEEE international conference on multimedia and expo (pp. 1-6). IEEE. DOI: 10.1109/ICME.2013.6607548

Wang, H., Sahoo, D., Liu, C., Shu, K., Achananuparp, P., Lim, E. P., & Hoi, S. C. (2021). Cross-modal food retrieval: learning a joint embedding of food images and recipes with semantic consistency and attention mechanism. IEEE Transactions on Multimedia, 24, 2515-2525. DOI: 10.1109/TMM.2021.3083109

Giovany, S., Putra, A., Hariawan, A. S., & Wulandhari, L. A. (2017). Machine learning and SIFT approach for Indonesian food image recognition. Procedia computer science, 116, 612-620. DOI: 10.1016/j.procs.2017.10.020

Tran, Q. L., Lam, G. H., Le, Q. N., Tran, T. H., & Do, T. H. (2021, July). A comparison of several approaches for image recognition used in food recommendation system. In 2021 COMNETSAT (pp. 284-289). IEEE. DOI: 10.1109/COMNETSAT53002.2021.9530793

Ung, H. T., Dang, T. X., Thai, P. V., Nguyen, T. T., & Nguyen, B. T. (2020). Vietnamese food recognition system using convolutional neural networks-based features. In Computational Collective, pp. 479-490. Springer International Publishing. DOI: 10.1007/978-3-030-63007-2_37

Razali, M. N., Moung, E. G., Yahya, F., Hou, C. J., Hanapi, R., Mohamed, R., & Hashem, I. A. T. (2021). Indigenous food recognition model based on various convolutional neural network architectures for gastronomic tourism business analytics. Information, 12(8). DOI: 322. 10.3390/info12 080322

Vajirakachorn, T., & Chongwatpol, J. (2017). Application of business intelligence in the tourism industry: A case study of a local food festival in Thailand. Tourism Management Perspectives, 23, 75-86.

Jin, R., Dou, Y., Wang, Y., & Niu, X. (2017, August). Confusion Graph: Detecting Confusion Communities in Large Scale Image Classification. In IJCAI (pp. 1980-1986). DOI: 10.24963/ijcai.2017/275

Xue, W., & Wang, W. (2020, April). One-shot image classification by learning to restore prototypes. In Proceedings of the AAAI Conference on Artificial Intelligence (Vol. 34, No. 04, pp. 6558-6565). DOI: 10.1609/aaai.v34i04.6130

Sakata, W., Shibata, T., Tanaka, R., & Kurohashi, S. (2019, July). FAQ retrieval using query-question similarity and BERT-based query-answer relevance. In Proceedings of the 42nd International ACM SIGIR. pp. 1113-1116. DOI: 10.1145/3331184.3331326

Nguyen, D. Q., & Nguyen, A. T. (2020). PhoBERT: Pre-trained language models for Vietnamese. arXiv preprint arXiv:2003.00744.

Peters, E. J. (2011). Appetites and aspirations in Vietnam: Food and drink in the long nineteenth century. Rowman Altamira.

Heaton, J. (2020). Applications of deep neural networks. arXiv preprint arXiv:2009.05673.

Baader, F., Brandt, S., & Lutz, C. (2005). Pushing the EL envelope (pp. 364-369). Technische Universität Dresden.

Kriegel, F. (2020). Most specific consequences in the description logic EL. Discrete Applied Mathematics, 273, 172-204.

Lu, D., & Weng, Q. (2007). A survey of image classification methods and techniques for improving classification performance. International Journal of Remote Sensing, 28(5), 823-870. DOI: 10.1080/01431160600746456

Chollet, F. (2021). Deep learning with Python. Simon and Schuster.

Nguyen, T. T., Nguyen, T. Q., Vo, D., Nguyen, V., Ho, N., Vo, N. D., & Nguyen, K. (2021, August). VinaFood21: A novel dataset for evaluating Vietnamese food recognition. In 2021- RIVF (pp. 1-6). IEEE.

Lowe, G. (2004). Sift-the scale invariant feature transform. Int. J, 2(91-110), 2.

Hearst, M. A., Dumais, S. T., Osuna, E., Platt, J., & Scholkopf, B. (1998). Support vector machines. IEEE Intelligent Systems and their applications, 13(4), 18-28.

Vapnik.: The Nature of Statistical Learning Theory, Springer-Verlag, 1995.

Boiman O, E. Shechtman and M. Irani.In Defense of Nearest-Neighbor Based Image Classification. Proceedings of the IEEE conference on Computer Vision and Pattern Recognition - CVPR, 2008, pp. 1-8.

Pham, N. K., Nguyen, M., & Do, T. N. (2017). Điểm danh bằng mặt người với đặc trưng gist và máy học véctơ hỗ trợ. 10.15625/vap.2017.00019.

Do, T. N., Pham, T. P., Pham, N. K., Nguyen, H. H., & Benferhat, S. (2019). Stacking of SVMS for classifying intangible cultural heritage images. International Conference on Computer Science, Applied Mathematics and Applications.

Trần, Q. V., & Nguyễn, T. B. (2010). Văn hoá ẩm thực Việt Nam nhìn từ lý luận và thực tiễn. Từ điển Bách khoa & Viện văn hoá.