Nguyễn Chí Ngôn * , Trần Thanh Hùng , Trương Thị Thanh Tuyền Nguyễn Thái Nghe

* Tác giả liên hệ (ncngon@ctu.edu.vn)

Abstract

This paper presents a neural networks-based method for a robot control system using Vietnamese voice commands. A STFT-based method for formant estimation is used to extract important features of recorded waveforms to generate the training data. A multi-layer feed-forward neural network is trained to recognize four words of any speakers, which are ?Trái?, ?Phải?, ?Tới?, and ?Lui?. Testing our system to control a wireless car shows the stability, accuracy of approximately 90% and ability to extend the system.
Keywords: Speech recognition, Pitch period, Formant detection, Micro-controller, Control system

Tóm tắt

Bài báo đề cập đến một giải pháp ứng dụng mạng nơ-ron nhân tạo (Artificial neural networks) để điều khiển thiết bị bằng giọng nói tiếng Việt. Phép biến đổi Fourier thời gian ngắn - STFT (Short time Fourier Transform) được áp dụng để trích các đặc trưng cơ bản của tín hiệu tiếng nói. Một mạng nơ-ron nhân tạo được huấn luyện để nhận dạng giọng nói tiếng Việt của bất kỳ người nào, khi họ đọc một trong bốn từ lệnh ?Trái?, ?Phải?, ?Tới? và ?Lui? (áp dụng để điều khiển robot). Kết quả nghiên cứu được kiểm chứng thông qua việc điều khiển từ xa một xe vô tuyến. éộ chính xác được ước lượng xấp xi? 90% và khả năng mở rộng tập lệnh điều khiển là rất cao.
Từ khóa: Mạng nơ-ron nhân tạo, nhận dạng tiếng nói, chu kì cao độ, trích các formant, vi điều khiển, hệ thống điều khiển

Article Details

Tài liệu tham khảo

Demuth, H. and M. Beale, 2005. Neural Network Toolbox – User’s Guide®. MathWorks, Inc.

Nelson, M. M. and W. T. Illingworth. 1991. A Practical Guide to Neural Nets. Addison-Wesley Publishing Company, ISBN 0-201-52376-0.

Nguyen Chi Ngon ,Tran Thanh Hung , Truong Thi Thanh Tuyen and Nguyen Thai Nghe 2005. A method of control system by Vietnamese speech using Neural Networks. In: Proceedings of Int. Conf. in Computer Science – RIVR’05, February, 21-24, 2005. Can Tho University, Vietnam, pp. 314-317.

Nguyễn Hoàng Phương, Bùi Công Cường, Nguyễn Doãn Phước, Phan Xuân Minh và Chu Văn Hỉ, 1998. Hệ mờ và ứng dụng. Hà nội, Nhà Xuất Bản Khoa Học Kỹ Thuật.

Nguyễn Chí Ngôn, Trịnh Hữu Phúc, 2002. Bước đầu nghiên cứu ứng dụng mạng nơ-ron để điều khiển thiết bị bằng tiếng nói. Trong: Tạp chí Automation Today. Hội KHCN tự động VN, 28:30-32.

Nguyễn Chí Ngôn và Dương Hoài Nghĩa, 2001. Ðiều khiển dùng mô hình nội mạng Neuron áp dụng vào robot SCARA. Trong: Tạp chí Phát triển KHCN, ÐHQG Tp. HCM, Vol. 4, 8&9:65-71.

Rich, E. and K. Knight. 1991. Artificial Intelligence. Mc-Graw-Hill Inc., 2nd edition, ISBN 0-07-100894-2.

Tran Thanh Hung, Q.P. Ha, G. Dissanayake, 2004. New wavelet-based pitch detection method for human-robot voice interface. accepted by the 2004 IEEE/RSJ Int. Conf. on Intelligent Robots and Systems (IROS 2004, September 28 - October 2, Sendai International Center, Sendai, Japan).

Tran Thanh Hung, Q.P. Ha, G. Dissanayake, 2005. New A wavelet-and neural network -Based voice interface system for wheelchair control, accepted to the Int. J. of Intelligent Systems Technologies and Applications (IJISTA), Special Issue on Biorobotics and Biomechatronics in Australasia.