Lê Thanh Trúc * Phạm Nguyên Khang

* Tác giả liên hệ (lethanhtruc_toasoanctu@gmail.com)

Abstract

Automatic form recognition is a problem attracting attention and investment of many researchers around the word. It plays an important role in data inputting and processing in practice. The study, “Handwriting scores recognition on transcripts” isderived from the actual need of Department of Academic Affairs and the other faculties at Tay Do University. This research is carried out through many phases such as noise reducing, de-skewing, rebuilding the table, locating columns in table, and recognizing handwrittingby using Gist and SVM. Methodology for researching is to combine theory and practice for commenting and appraising the result. The research has given some highlights: a) positioning and building tables can be implemented without using any learning machines, without knowing about the logical position of the table in the form; b) locating any column as well as cell in the table without marking or color accents on the form is easily;c) the cost for form handling is low. The "Handwriting scores recognition on transcripts" system is developed successfully from the research. It allows loading the transcript from the list of transcripts image, recognizing and exporting the result to any file with the accuracy up to 97.30% on 187 transcripts.
Keywords: Handwriting scores, table detection, cells detection, form recognition, Handwriting scores recognition

Tóm tắt

Nhận dạng biểu mẫu tự động đang là bài toán thu hút nhiều sự chú ý và đầu tư nghiên cứu của nhiều người trên thế giới. Sự cần thiết của nhận dạng biểu mẫu đóng vai trò quan trọng trong nhập và xử lý dữ liệu tự động cũng như hiệu quả và lợi ích nó mang lại trong thực tế. Nghiên cứu “Nhận dạng điểm số viết tay trên bảng điểm” được xuất phát từ nhu cầu thực tế của Phòng Đào tạo cũng như các khoa tại Trường Đại học Tây Đô. Bài toán này được nghiên cứu thực hiện qua nhiều công đoạn như khử nhiễu, khử nghiêng, xây dựng lại bảng, định vị cột và cuối cùng là nhận dạng điểm số viết tay trong cột định vị bằng cách sử dụng GIST và SVM. Để giải quyết bài toán này, nghiên cứu thực hiện phương pháp kết hợp lý thuyết và thực nghiệm, sau đó nhận xét và đánh giá chương trình. Phương pháp nghiên cứu đưa ra có một số điểm nổi bật như sau:thứ nhất làđịnh vị và xây dựng bảng không cần dùng bất kỳ máy học nào cũng như không cần biết trước vị trí logic của bảng trong biểu mẫu;thứ hai là dễ dàng định vị cột cũng như ô bất kỳ trong bảng mà không cần đánh dấu hay điểm nhấn màu sắc nào trên biểu mẫu;cuối cùng là chi phí xử lý biểu mẫu là thấp. Sản phẩm cuối cùng nghiên cứu đạt được là xây dựng thành công phần mềm “Nhận dạng điểm số viết tay trên bảng điểm” với phiên bản 1.0. Phần mềm này cho phép tải bảng điểm, sau đó, nhận dạng điểm và xuất kết quả nhận dạng sang file bất kỳvới độ chính xác lên đến 97,30% trên 187 bảng điểm.
Từ khóa: Điểm viết tay, phát hiện bảng, phát hiện các ô, nhận dạng biểu mẫu, nhận dạng điểm viết tay

Article Details

Tài liệu tham khảo

Đỗ Thanh Nghị: Khai mỏ dữ liệu – Minh họa bằng ngôn ngữ R, NXB Đại học Cần Thơ, trang 44-52 (2011).

Phạm Anh Phương, Áp dụng một số chiến lược SVM đa lớp cho bài toán nhận dạng chữ viết tay hạn chế, Tạp chí khoa học Đại học Huế, ISSN 1859-1388, số 45, (2008), 109-118.

Cao Bá Thành: Nghiên cứu ứng dụng đường cong tham số B-SPLINE vào nhận dạng chữ số viết tay. Luận văn thạc sĩ Trường Đại học Đà Nẵng (2012).

António R.: Image representation, sampling and quantization, ECE 6962-Fall (2008).

Bradski G. and Kaehler A.: Learning OpenCV. Published by O’Reilly Media, Inc., 1005 Gravenstein Highway North, Sebastopol, CA95472, (2008).

Cesarini S., Marinai S., Sardi L. and Sorda G.: Trainable table location in document images, Proc. Intl. Conf. Patt. Recog., pp. 236-240 (2002).

Chaudhuri D., Samal A.: A simple method for fitting of bounding rectangle to close regions, Pattern Recognition 40 , pp. 1981–1989 (2007).

Chih-Chung C. and Chil-Jen L., LIBSVM: a Library for Support Vector Machines, NationalTaiwanUniversity (2004).

Cristianini N. and Shawe-Taylor J. An Introduction to Support Vector Machines and Other Kernel-based Learning Methods.CambridgeUniversity Press (2000).

Dennis S., John P.: A Linear Time Algorithm for the Minimum Area Rectangle Enclosing a Convex Polygon. Computer Science Technical Reports, page 382 (1983).

Gatos B., Danatsas D., PratikakisI. and Perantonis S.: Automatic table detection in document images, Proc. Intl. Conf. Advances Patt. Recog., pp. 609-618 (2005).

Ghassan H., Karin A. and Rafeef . – Gharbieh: Automatic Line Detection Using Hough Transform (1999).

Illingworth J. and Kittler J.: A survey of the Hough Transform. Computer Vision, Graphics and Image Processing, 44: pp. 87–116 (1988).

Kieninger T. and Dengel A.: Applying the T-Recs Table Recognition System to the Business Letter Domain. Proc. of the 6th International Conference on Document Analysis & Recognition, Seattle, pp. 518-522, (2001).

Neves L. and Facon J.: Methodology of Automatic extraction of Table-Form Cells. IEEE Proc. of the XIII Brazilian Symposium on Computer Graphics and Image Processing (SIBGRAPI’00), pp. 15-21 (2000).

Olivier B.: Digital Image Processing, Prentice Hall. (3th Ed.). IMESI–2009.

Ramesh J., Rangachar K. and Brian S.: Machine Vision. Published byMcGraw-Hill, Inc., ISBN 0-07-032018-7 (1995).

Ranjitha S.: Enhancing the Autonomous Robotic Person Detection and Following Using Modified Hough Transforms (2013).

Reza S. and Shahram K.: Document skew detection using minimum area bounding rectangle, Proc. Intl. Conf. Coding and Computer, pp. 253-258 (2000).

Richard O. and Peter E.: Use of the Hough Transformation To Detect Lines and Curves in Pictures. Communication of the ACM, 15, 1, January 1972, pp. 11-15.

Tai-Sin Lee, Image representation using 2D Gabor wavelets, IEEE Trans. Pattern Analysis and Machine Intelligence, VOL. 18, NO. 10 (1996).

Trucco and Jain: Using Hough Transform to detect lines. Chapter 5.

Wei-lun C.: Gabor wavelet transform and its application. Unpublished report.

Wu X. and Kumar V.: Top 10 Algorithms in Data Mining. Chapman & Hall/CRC (2009).

Zanibbi R., Blostein D. and Cordy J.: A survey of table recognition. International Journal of Document Analysis and Recogntion (IJDAR), vol. 7, pp. 1-16, (2004).

Zheng Y., Liu C., Ding X., Pan S.: Form Frame Line Detection with Directional Single - Connected Chain. Proc. of the 6th Int. Conf. on Doc. Anal. &Recognition, pp. 699-703 (2001).