Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Với giá trị độ hỗ trợ tối thiểu minsup = 50 % thì tập mục phổ biến là:<br />
TT Tập các mục phổ biến Độ hỗ trợ tƣơng ứng<br />
1 Bánh mì 50 %<br />
2 Bơ 100 %<br />
3 Trứng 50 %<br />
4 Bánh mì, Bơ 50 %<br />
5 Bơ, Trứng 50 %<br />
45<br />
Nếu cho độ tin cậy tối thiểu là mincon = 60 % thì ta có các luật sau:<br />
TT Luật Độ tin cậy Thoả mãn ≥ 60%<br />
1 Bánh mì => Bơ 100 % Có<br />
2 Bơ => Bánh mì 50 % Không<br />
3 Bơ =>Trứng 50 % Không<br />
4 Trứng => Bơ 100 % Có<br />
Bảng 2.1. Minh hoạ bài toán phát hiện luật kết hợp<br />
4.4. Phát hiện luật kết hợp dựa trên hệ thông tin nhị phân<br />
4.4.1. Các định nghĩa hình thức trên hệ thông tin nhị phân<br />
Định nghĩa 2.2.3.1: Hệ thông tin nhị phân<br />
Cho các tập sau:<br />
O ={o 1 , o 2 , …, o n } là một tập hữu hạn gồm n đối tượng,<br />
D = {d 1 , d 2 , …, d m } là một tập hữu hạn gồm m chỉ báo,<br />
B = {0, 1}<br />
Hệ thông tin nhị phân được định nghĩa là S B = (O, D, B, ) trong đó là ánh xạ :O x D →<br />
B, (o,d) = 1 nếu đối tượng o có chỉ báo d và (o,d) = 0 nếu ngược lại.<br />
Định nghĩa 2.2.3.2: Các ánh xạ thông tin nhị phân<br />
Cho hệ thông tin nhị phân S B = (O, D, B, ). Cho P(O) là các tập con của O, P(D) là các tập<br />
con của D. Các ánh xạ thông tin nhị phân B và B được định nghĩa như sau:<br />
B : P(D) P(O) với ý nhĩa:<br />
cho S D, B (S) = {o O| d S, (o, d) = 1}<br />
B : P(O) P(D) với ý nhĩa:<br />
cho X O, B (X) = {d D| o X, (o, d) = 1}<br />
Định nghĩa 2.2.3.3: Tập chỉ báo phổ biến nhị phân<br />
Cho hệ thông tin nhị phân S B = (O, D, B, ) và một ngưỡng (0, 1).<br />
Cho S D, S là tập chỉ báo phổ biến nhị phân với ngưỡng nếu: