ỨNG DỤNG MÔ HÌNH MARKOV ẨN ĐỂ NHẬN DẠNG TIẾNG NÓI TRÊN FPGA
* Tác giả liên hệ (ncqui@ctu.edu.vn)
Abstract
Hidden Markov Model (HMM) is a statistical model, well suited for pattern recognition: speech, image, handwriting,... HMM has widely used in the last several years because of the two reasons. First it can perform with high accuracy in a wide range of application, second the model structure can be changed easily to fit practical applications. This paper focused on studying of HMM for speech recognition and installing it on FPGA. HMM has many parameters, so choosing appropriate parameters of the model for the FPGA is included in the project. The selection is very important and must balance between time and accuracy.
Keywords:
Speech recognition, hidden Markov model, FPGA
Tóm tắt
Mô hình Markov ẩn (HMM) là một mô hình thống kê, thích hợp ứng dụng trong việc nhận dạng mẫu: tiếng nói, hình ảnh và chữ viết? HMM được ứng dụng rộng rãi trong những năm gần đây vi hai lý do. Thứ nhất, mô hình có độ chính xác cao trong nhiều ứng dụng; Thứ hai, cấu trúc mô hình có thể thay đổi dễ dàng cho phù hợp với từng ứng dụng cụ thể. Bài báo này tập trung nghiên cứu mô hình Markov ẩn theo hướng ứng dụng nhận dạng tiếng nói và cài đặt mô hình này lên chip FPGA. HMM có nhiều tham số, vì vậy việc lựa chọn tham số sao cho tốt nhất cũng được thực hiện trong đề tài. Việc lựa chọn này rất quan trọng, nó phải đạt được sự cân bằng giữa tốc độ xử lý và độ chính xác. Hệ thống nhận dạng này được cài đặt trên FPGA để nhận dạng các từ đơn, số lượng từ trong bộ từ vựng có thể thay đổi nhờ khả năng có thể huấn luyện của HMM. Do hệ thống nhận dạng này được cài đặt trên FPGA nên nó chiếm khoảng không nhỏ, thích hợp ứng dụng trong giao tiếp người-máy, robot, điều khiển bằng tiếng nói hay hỗ trợ người khuyết tật?
Từ khóa:
Nhận dạng, tiếng nói, mô hình Markov Ẩn, FPGA
Article Details
Tài liệu tham khảo
B.H. Juang and L.R. Rabiner, 1991, Hidden Markov Models for Speech Recognition, Technometrics, Vol.33, NO.3.
Jeff Bilmes, 2002, What HMMs Can Do, Dept of EE, University of Washington.
Joseph W. Picone, 1993, Signal Modeling Techniques in Speech Recognition, IEEE.
Lawrence R. Rabiner, 1980, A Tutorial on Hidden Markov Models and Selected Application in Speech Recognition, Proceedings of the IEEE, Vol.77, No.2.
L. R. Rabimer and R. W. Schafer, 1979, Digital Processing of Speech Signals, Prentice - Hall Inc.
S J Melnikoff, S F Quigley & M J Russell, 2002, Implementing a Simple Continuous Speech Recognition System on an FPGA, IEEE.