Web filtering is used to prevent access to black web pages (web pages have desirable content or images). In this paper, we apply classification method with Support vector machine learning (SVM) to build a web filtering tool that is integrated with 2 filters: text filter – use text classification method and image filter – use image classification method. With two filters, this tool can prevent user access to desirable content web pages or remove desirable images when web page is displayed on the browser.

Keywords: Web filtering, Support vector machine learning, text classification, image classification

Tóm tắt

Công cụ lọc web (web filtering) được sử dụng để ngăn chặn việc truy cập đến các trang web đen (trang web mang nội dung hoặc hình ảnh không mong muốn). Trong bài báo này, chúng tôi ứng dụng phương pháp phân lớp với Máy học vector hỗ trợ (SVM) để xây dựng một công cụ lọc web được tích hợp 2 bộ lọc: bộ lọc văn bản  phân lớp văn bản (text classification) và bộ lọc image - phân lớp hình ảnh (image classification). Với hai bộ lọc này, công cụ có thể cấm người dùng truy cập đến trang web có nội dung văn bản không mong muốn hoặc loại bỏ các hình ảnh không mong muốn khi hiển thị web lên trình duyệt.
Từ khóa: Lọc web, Máy học vector hỗ trợ (SVM), phân lớp văn bản, phân lớp hình Ảnh

