Huỳnh Xuân Hiệp * Fabrice Guillet

* Tác giả liên hệ (hxhiep@ctu.edu.vn)

Abstract

The creation of the interestingness measures for evaluating the quality or the degree of interesting of the knowledge in the form of association rules play an important role in the postprocessing of association rules the Knowledge Discovery from Databases (KDD). Along with the more interestingness measures are proposed on both subjective assessment (subjective interestingness measures) and objective assessment (objective interestingness measures), the study of the properties or attributes on the interestingness measures will play an important role in understanding the nature of the objective interestingness measures interested. In this paper, we focus primarily on the objective interestingness measures to have a general view on the recent researches on the nature of the objective interestingness measures and at the same time to complete a new classification on the 40 selected objective interestingness measures on the properties studied/founded.      
Keywords: subjective interestingness measures, objective interestingness measures, classification, property/criterion of interestingness measures, aasociation rules

Tóm tắt

Việc hình thành các độ đo hâ?p dâ?n (interestingness measures, quality measures) nhằm đánh giá chất lượng của tri thức dưới dạng luật kết hợp (association rules) đóng một vai trò rất quan trọng trong giai đoạn hậu xử lý (postprocessing) các luật kết hợp của tiến trình khai phá tri thức từ dữ liệu (Knowledge Discovery from Databases - KDD). Cùng với việc ngày càng có nhiều độ đo hâ?p dâ?n được đề xuất trên cả hai tiếp cận đánh giá chủ quan (subjective interestingness measures) và khách quan (objective interestingness measures), việc nghiên cứu các tính chất hay thuộc tính (properties) có được trên các độ đo hâ?p dâ?n sẽ đóng vai trò quan trọng trong việc hiểu được bản chất của những độ đo hâ?p dâ?n khách quan cần quan tâm. Trong bài viết này, chúng tôi tập trung chủ yếu trên các độ đo hâ?p dâ?n khách quan nhằm hệ thống hóa lại một cách tương đối đầy đủ những nghiên cứu gần đây trên các tính chất của các độ đo hâ?p dâ?n khách quan đồng thời hoàn chỉnh một hướng phân lớp mới với khoảng 40 độ đo hâ?p dâ?n khách quan trên cơ sở các tính chất đã nghiên cứu.
Từ khóa: Kha?m phá tri thức từ dữ liệu (KDD), độ đo hâ?p dâ?n chu? quan, độ đo hâ?p dâ?n khách quan, phân lớp độ đo hâ?p dâ?n khách quan, tính chất/thuộc tính của độ đo hâ?p dâ?n, luật kết hợp

Article Details

Tài liệu tham khảo

A. Jalalvand and B. Minaei and G. Atabaki and S. Jalalvand, “A new interestingness measure for associative rules based on the geometric context”, The Third 2008 International Conference on Convergence and Hybrid Information Technology, pp.199-203, 2008.

A. R. Omiecinski, “Alternative interest measures for mining associations in databases”, IEEE Transactions on Knowledge and Data Engineering 15(1), pp. 57-96, 2003.

A. Silberschatz and A. Tuzhilin, “On subjective measures of interestingness in knowledge discovery”, KDD'95 - Proceedings of the First International Conference on Knowledge Discovery and Data Mining, pp. 275-281, 1995.

A. Silberschatz and A. Tuzhilin, “What makes patterns interesting in knowledge discovery systems”, IEEE Transactions on Knowledge and Data Engineering 8(6), pp. 970-974, 1996.

B. Liu and W. Hsu and L.-F. Mun and H.-Y. Lee, “Finding interesting patterns using user expectations”, IEEE Transactions on Knowledge and Data Engineering 11(6), pp. 817-832, 1999.

F. Guillet and H. J. Hamilton. (Eds.), Quality Measures in Data Mining - Series in Computational Intelligence (43), Springer-Verlag, 2007.

G. Piatetsky-Shapiro and C. J. Matheus, “The interestingness of deviations”, AAAI'94 - Knowledge Discovery in Databases Workshop, pp. 25-36, 1994.

G. Piatetsky-Shapiro, “Discovery, analysis, and presentation of strong rules”, Knowledge Discovery in Databases, pp. 229-248, 1991.

H. X. Huynh and F. Guillet and J. Blanchard and P. Kuntz and R. Gras and H. Briand, “A graph-based clustering approach to evaluate interestingness measures : a tool and a comparative study (Chapter 2)”, Quality Measures in Data Mining, Springer-Verlag, pp. 25-50, 2007.

H. X. Huynh and N. C. Lam and F. Guillet, “On interestingness interaction”, RIVF’08 - IEEE International Conference on Research, Innovation and Vision for the Future (2), pp.161-166, 2008.

I.N.M. Shaharanee and F. Hadzic and T.S. Dillon, “Interestingness measures for associattion rules based on statistical validity”, Knowledge-Based Systems 24, pp.386-392, 2011.

J. Weng and E.-P. Lim and Q. He and C. W.-K. Leung, “What do people want in microblogs? Measuring interestingness of hashtags in Twitter”, 2010 IEEE International Conference on Data Mining, pp.1121-1126, 2010.

K. McGarry, “A survey of interestingness measures for knowledge discovery”, Knowledge Engineering Review Journal 20(1), pp. 39-61, 2005.

L. Geng and H. J. Hamilton, “Interestingness measures for data mining: A survey”, ACM Computing Surveys 38(3), pp. 1-32, 2006.

M. McGrane and S. K. Poon, “Interaction as an interestingness measures”, 2010 IEEE International Conference on Data Mining Workshops, pp.726-731, 2010.

P.-N. Tan and V. Kumar and J. Srivastava, “Selecting the right objective measure for association analysis”, Information Systems 29(4), pp. 293-313, 2004.

R. Agrawal and R. Srikant, “Fast algorithms for mining association rules”, VLDB'94 - Proceedings of the 20th International Conference on Very Large Data Bases, pp. 487-499, 1994.

R. J. Hilderman and H. J. Hamilton, Knowledge Discovery and Measures of Interestingness, Kluwer Academic Publishers, 2001.

R. J. Jr. Bayardo and R. Agrawal, “Mining the most interestingness rules”, KDD'99 - Proceedings of the 5th ACM SIGKDD International Confeference on Knowledge Discovery and Data Mining, pp. 145-154, 1999.

R. Tamir and Y. Singer, “On a confidence gain measure for association rule discovery and scoring”, The International Journal on Very Large Data Bases 15(1), pp. 40-52, 2006.

S. Lallich and B. Vaillant and P. Lenca, “Parametrised measures for the evaluation of association rule interestingnes”, ASMDA'05 - Proceedings of the 11th International Symposium on Applied Stochastic Models and Data Analysis, pp. 220-229, 2005.

S. Lallich and O. Teytaud, “Evaluation et validation de l'intérêt des règles d'association”, Mesures de Qualité pour la Fouille de Données, RNTI-E-1, pp. 193-217, 2004 (in French).

S. Sahar and Y. Mansour, “Empirical evaluation of interest-level criteria”, SPIE'99 - Proceedings of SPIE - DMKD: Theory, Tools and Technology (3695), pp. 63-74, 1999.

U. M. Fayyad and G. Piatetsky-Shapiro and P. Smyth, “From data mining to knowledge discovery”, Advances in Knowledge Discovery and Data Mining, pp. 1-34, 1996.